BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 4) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

Koko: px
Aloita esitys sivulta:

Download "BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 4) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos"

Transkriptio

1 BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 4) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy 005

2 Ristiintaulukkoanalyysit...3 Laatueroasteikollinen R x C taulukko 4 Fisherin tarkka testi (r x r) taulukoille 8 Korrelaatio...9 Pearsonin korrelaatiokerroin 9 Spearmanin järjestyskorrelaatiokerroin 13 Kendallin Tau ja Somerin D..14 Biostatistiikkaa esimerkkien avulla Janne Pitkäniemi, syksy 005

3 Ristiintaulukkoanalyysit Tähän kappaleeseen on koottu tavallisimmat luokitellun tiedon käsittelyssä käytettävät perustestit. Monia niistä on käsitelty ja esimerkein havainnollistettu jo aiemmin tässä monisteessa. Käyttötilanne: Halutaan tutkia luokiteltujen ( categorical ) muuttujien välisiä yhteyksiä. Luokitellut muuttujat voivat olla joko laatueroasteikollisia (esim. HLA tyyppi tai silmien väri) tai järjestysasteikollisia (esim. lääkeannos: matala, keskimääräinen, korkea tai vastaavasti esim. numeerisina arvoina ilmaistuna: 00 mg, 400 mg, 1600 mg). Oletetaan, että muuttujat tarkasteltavat muuttujat x ja y ovat luokiteltuja siten, että x:ssä on R luokkaa ja y:ssä C luokkaa ja että muuttujien välisen yhteyden tutkimiseksi on muodostettu R x C kontingenssitaulukko ( contigency table ): Muuttuja x Muuttuja y 1 j C 1 i f m j R n 1 n j N Taulukossa f tarkoittaa i. rivin ja j. sarakkeen frekvenssilukua. Tälle lokerofrekvenssille saadaan odotettu arvo kaavalla: E(f ) = m i n j /N, kun oletetaan, että x:n ja y:n välillä ei olisi mitään riippuvuutta keskenään. Tämä merkitsee, että rivi /sarakejakaumat eivät poikkea toisistaan, jolloin erot havaitussa frekvenssitaulukossa johtuvat sattumasta. Nimitys kontingenssi tarkoittaa sattumaa. Huom. Lokerokohtaiset odotusarvot ja havaittujen arvojen poikkeamat odotus arvoista kannattaa laskea, sillä niiden perusteella voi alustavasti tarkastella x:n ja y:n välisen riippuvuuden luonnetta. Tilastopaketit tulostavat nämä suureet pyydettäessä. Testattavat hypoteesit: Nollahypoteesi (H 0 ): taulukon rivit ja sarakkeet eivät riipu toinen toisistaan, ts. x:llä ja y:llä (riveillä ja sarakkeilla) ei ole yhdysvaikutusta ( interaction ) keskenään. Biostatistiikkaa esimerkkien avulla 3 Janne Pitkäniemi, syksy 005

4 Vaihtoehtoinen hypoteesi (H A ): taulukon rivien ja sarakkeiden välillä on riippuvuutta. Tarkastellaan tilastopakettien tarjoamia testivaihtoehtoja seuraaviin tilanteisiin: 1. Molemmat R x C taulukon muuttujista x ja y ovat laatueroasteikollisia,. Toinen muuttujista on laatueroasteikollinen ja toinen järjestysasteikollinen, jolloin kyseessä on yhteen suuntaan järjestetty taulukko, 3. Molemmat muuttujista x ja y ovat järjestysasteikollisia, eli taulukko on kahteen suuntaan järjestetty. Tilastopaketit tarjoavat näihin testaustilanteisiin useita eri testivaihtoehtoja ja lisäksi yleensä kunkin vaihtoehdon sisällä on valittavana kolme eri tapaa P arvon laskemiseksi: a) asymptoottinen, b) Monte Carlo ja c) eksakti laskentatapa. Kaikki nämä laskentatavat tuottavat asymptoottisesti saman tuloksen. Asymptoottinen menetelmä asymptotic method on mikä tahansa menetelmä, joka perustuu approksimaatioon, eli likimäämäisarviointiin, Normaalakaumalla tai jollain muulla todennäköisyysjakaumalla siten, että käytetty arvio tarkentuu, kun aineistokoko n kasvaa. Synonyymi asymptoottiselle menetelmälle on suurten otosten menetelmä large sample method ja vaihtoehto on tarkka menetelmä exact method. Monte Carlo menetelmät Monte Carlo methods ovat tietokonesimulaatiota käyttäviä ratkaisumenetelmiä matemaattisiin ja tilastollisiin ongelmiin. Simulaatiossa imitoidaan tilastollisia malleja satunnaislukujen avulla. Laatueroasteikollinen R x C taulukko Käytettävissä olevat testit: a) Pearsonin Khi heterogeenisuustesti: χ = R C i= 1 j= 1 (f E(f E(f ) )) Kaavassa f :t ovat taulukon havaitut lukumäärät ja E(f ):t ovat niiden odotusarvot. Huom. Khi testi on erittäin herkkä pienille odotusarvoille; Suhteellinen virhe tulee tällöin suureksi, koska odotusarvot ovat testisuureen nimittäjässä. b) G testi, uskottavuussuhde ( likelihood ratio ) testi: Biostatistiikkaa esimerkkien avulla 4 Janne Pitkäniemi, syksy 005

5 G = R C i= 1 j= 1 f f loge( ) E(f ) G testi on yleisimmin käytetty testi taulukkoanalyyseissä (Esim. loglineaariset mallit). Se ei ole yhtä herkkä kuin Khi testi pienille odotusarvoille log muunnoksesta johtuen. Vapausasteiden määrä on df = (R 1) (C 1) m, missä m = odotusarvojen laskemisessa tarvittavien estimoitujen parametrien määrä. Tavallisesti m = 0. Sekä khi että G testiin voidaan tilastopaketeista kohdasta options pyytää myös lisäykset testisuureen arvoon lokeroittain: (f E(f )) χ = ja E(f ) G = f log e f E(f ) Näiden suureiden perusteella voi todeta lokerokohtaiset lisäykset testisuureen arvoon ja todeta missä lokerossa tai lokeroissa on eniten poikkeamaa riippumattomuusoletuksesta. Sekä khi että G testisuureet ovat aineiston koosta riippuvaisia eivätkä siten anna hyvää käsitystä riippuvuuden voimakkuudesta. Niiden perusteella voidaan kuitenkin laskea normitettuja riippuvuuden mittoja; kontingenssikertoimia. SPSS:ssä polun Analyze Descriptive statistics Crosstabs Statistics päästä löytyy mm. vaihtoehdot: Kontingenssikerroin, Phi kerroin ja Cramerin V. Kaikkien näiden kerrointen vaihtelualue on: 0 1 (ei assosiaatiota täydellinen assosiaatio). Niiden avulla voidaan verrata mm. assosiaation voimakkuutta eri dimensioisissa (R x C) taulukoissa, mutta lääketieteellisissä julkaisuissa niitä käytetään erittäin harvoin. Esimerkki: Tutka on kiinnostunut iän ja kolesterolin riippuvuudesta esimerkki aineistossamme datasetb. Tätä varten hän luo uuden muuttujan ikäryhmiä varten SPSS:llä compute > transform ageg=(age1950>=30)+(age1950>=40)+(age1950>=50)+( age1950>=60). Voimme tarkastella jakaumaa SPSS:llä Analyze Descriptive statistics frequencies ageg Cumulative Frequency Percent Valid Percent Percent Valid age< ,0 8,0 8,0 30<=age< ,0 19,0 7,0 40<=age< ,0 34,0 61,0 50<=age< ,5 7,5 88,5 age>= ,5 11,5 100,0 Total ,0 100,0 Biostatistiikkaa esimerkkien avulla 5 Janne Pitkäniemi, syksy 005

6 Tämä komento luo siis uuden muuttujan joka saa arvot 0 kun ikä on alle 30, 1 kun ikä on suurempi tai yhtäsuuri kuin 30 ja alle 40 jne. Tutka haluaa luokitella kolesteroli neljään luokkaa käyttäen aineiston kolesterolakauman prosenttipisteitä 5 %, 50 % ja 75 %. Tämä löytyy SPSS:llä Analyze Descriptive statistics frequencies Statistics valitaan quartiles. Statistics Serum cholesterol (mmol/l) N Valid 00 Missing 0 Percentiles 5 1, , ,3900 Näin saadaan luokittelumuuttujan tekemistä varten luokkarajat. Luodaan uusi muuttujan muuttuja kolestoroliryhmiä varten SPSS:llä: compute > transform ja sen jakauma frequencies valikosta cholg=(chol1950>=1.)+(chol1950>=13.89)+(chol1950>=16.39). cholg Cumulative Frequency Percent Valid Percent Percent Valid <1, 40 0,0 0,0 0,0 1,<=chol1950<13, ,0 7,0 47,0 13,89<=chol1950<16, ,5 7,5 74,5 >=16, ,5 5,5 100,0 Total ,0 100,0 Nyt voimme ristiintaulukoida ikäryhmän ja kolesterolitason: Analyze Descriptive statistics crosstabs valitaan Statistics ja chi square sekä Cells ja expected, row, column, total. Näin saadaan seuraava taulukko sekä khiitoiseen homogeenisuustesti: Biostatistiikkaa esimerkkien avulla 6 Janne Pitkäniemi, syksy 005

7 ageg * cholg Crosstabulation cholg Total <1, 1,<=chol 1950<13,89 13,89<=chol 1950<16,39 >=16,39 ageg age<30 Count Expected Count 3, 4,3 4,4 4,1 16,0 % within ageg 5,0% 31,3% 18,8% 5,0% 100,0% % within cholg 10,0% 9,3% 5,5% 7,8% 8,0% % of Total,0%,5% 1,5%,0% 8,0% 30<=age< Count Expected Count 7,6 10,3 10,5 9,7 38,0 % within ageg 18,4% 8,9% 1,1% 31,6% 100,0% % within cholg 17,5% 0,4% 14,5% 3,5% 19,0% % of Total 3,5% 5,5% 4,0% 6,0% 19,0% 40<=age< Count Expected Count 13,6 18,4 18,7 17,3 68,0 % within ageg 19,1% 7,9% 36,8% 16,% 100,0% % within cholg 3,5% 35,% 45,5% 1,6% 34,0% % of Total 6,5% 9,5% 1,5% 5,5% 34,0% 50<=age< Count Expected Count 11,0 14,9 15,1 14,0 55,0 % within ageg 18,% 18,% 9,1% 34,5% 100,0% % within cholg 5,0% 18,5% 9,1% 37,3% 7,5% % of Total 5,0% 5,0% 8,0% 9,5% 7,5% age>=60 Count Expected Count 4,6 6, 6,3 5,9 3,0 % within ageg 6,1% 39,1% 13,0% 1,7% 100,0% % within cholg 15,0% 16,7% 5,5% 9,8% 11,5% % of Total 3,0% 4,5% 1,5%,5% 11,5% Total Count Expected Count 40,0 54,0 55,0 51,0 00,0 % within ageg 0,0% 7,0% 7,5% 5,5% 100,0% % within cholg 100,0% 100,0% 100,0% 100,0% 100,0% % of Total 0,0% 7,0% 7,5% 5,5% 100,0% Chi Square Tests Value df Asymp. Sig. ( sided) Pearson Chi Square 13,515(a) 1,333 Biostatistiikkaa esimerkkien avulla 7 Janne Pitkäniemi, syksy 005

8 Likelihood Ratio 13,981 1,30 Linear by Linear Association,003 1,959 N of Valid Cases 00 a 5 cells (5,0%) have expected count less than 5. The minimum expected count is 3,0. Testin perusteella nollahypoteesia ei hylätä 5 % merkitsevyystasolla, joten kolesterolitason ja ikäryhmien välillä ei ole tilastollisesti merkitsevää riippuvuutta tässä aineistossa. Fisherin tarkka testi (r x r) taulukoille Käyttötilanne: heterogeenisuuden testaaminen tarkasteltava muuttuja laatueroasteikollinen kaksi vertailtavaa ryhmää Esim. Onko mahahaavan ja ABO veriryhmän välillä tilastollisesti merkitsevä yhteys? (Varis K, Salmi H, ym., julkaisematon) Ryhmä ABO Total O A B AB Aktiivinen mahahaava Muut ylävatsaoireiset Total SPSS: Valikot: Analyze Descriptive Statistics Crosstabs Määritellään taulukon rivit ja sarakkeet ja klikataan kohdasta Statistics Chi square ja kohdasta Exact Exact. Chi Square Tests Value df Asymp. Sig. ( sided) Exact Sig. ( sided) Pearson Chi Square 17,57(a) 3,0005,0003 Likelihood Ratio 19,935 3,000,0003 Fisher's Exact Test 18,101,0003 (a) cells (5,0%) have expected count less than 5. The minimum expected count is 3,3. Tulkinta: ABO veriryhmäjakaumissa on eroa vertailtavien ryhmien välillä, ts ABOveriryhmän ja ryhmän välillä on tilastollisesti merkitsevä yhteys. Biostatistiikkaa esimerkkien avulla 8 Janne Pitkäniemi, syksy 005

9 Korrelaatio Pearsonin korrelaatiokerroin Pearsonin korrelaatiokerroin, Pearson s correlation coefficient (r x, y ) Siitä käytetään myös nimitystä tulo momentti korrelaatiokerron. Se on parametrinen lineaarisen riippuvuuden mitta kvantitatiivisten suureiden x ja y välillä. Parametrinen tarkoittaa, että tarkasteltavien muuttujien x ja y yhteisjakauman tulisi olla likimain normaalinen. Muussa tapauksessa esim. poikkeavilla havaintoarvoilla voi olla suuri vaikutus r:n arvoon. r voi saada minkä tahansa arvon väliltä [ 1, +1], ja r = 1 merkitsee täydellistä lineaarista negatiivista (käänteistä) ja +1 positiivista riippuvuutta. r = 0 merkitsee, ettei x:n ja y:n välillä ole ollenkaan lineaarista riippuvuutta. r = 0 ei merkitse, ettei niiden välillä voisi jotain muunlaista epälineaarista riippuvuutta. Huom. Pearsonin korrelaatiokerrointa ylikäytetään, väärinkäytetään ja myös tulkitaan usein väärin lääketieteellisissä artikkeleissa. Esim. korrelaatiokertoimet voivat olla harhaanjohtavia mikäli aineistossa on selvästi muista arvoista poikkeavia havaintoarvoja kuvat A ja B) tai mikäli aineisto muodostuu osaryhmistä, joiden tiedetään eroavan keskiarvotasolla molempien korreloitavien muuttujien suhteen (kuva C). Biostatistiikkaa esimerkkien avulla 9 Janne Pitkäniemi, syksy 005

10 Käyttö: Jotta r olisi validi assosiaation mitta, niin seuraavat vaatimukset tulisi täyttyä: muuttujien x ja y yhteisjakauman tulisi olla normaalinen (ellei vaatimus täyty edes pitäisi turvautua parametrittomiin korrelaatioihin) muuttujien x ja y välillä ei saa olla teknisiä riippuvuuksia, jotka säätelevät muuttujien yhteisvaihtelua kustakin henkilöstä saa olla vain yksi havaintopari aineistossa, josta korrelaatio lasketaan, esim. jos 30 henkilöstä on 3 toistomittausta, niin korrelaatiota ei saa laskea siten, että havaintoarvoja olisi 90! (toistomittausten tapauksessa pitää käyttää toistomittausanalyysejä) Pearsonin korrelaatiokerroin ja sen keskivirhe lasketaan kaavoilla: Testi: xy n i= 1 n i= 1 (x (x i i x) (y x) n i= 1 i (y y) r =, SE(r) = i y) 1 r n Biostatistiikkaa esimerkkien avulla 10 Janne Pitkäniemi, syksy 005

11 Korrelaatiokertoimen tilastollista merkitsevyyttä voidaan arvioida testisuureella: t = r SE(r) = r n 1 Testisuure noudattaa Studentin t jakaumaa vapausastein (n ). r Esim. Tutkitaan kolesterolin ja iän riippuvuutta esimerkkiaineistossamme käyttäen jatkuvia muuttujia chol1950 ja age1950. Piirretään ensin hajontakuvio SPSS:llä: Graph Scatter Simple. Valitaan x axis Age1950 ja y axis chol ,00 5,00 Serum cholesterol (mmol/l) 0,00 15,00 10,00 5,00 0,0 30,0 40,0 50,0 60,0 70,0 Age in 1950 Jo pelkästään kuvaa katsomalla lienee selvää ettei ainakaan mitään voimakasta suoraviivaista riippuvuutta ole. Testataan asia kuitenkin tilastollisesti SPSS:llä: Analyze Correlate Bivariate ja valitaan kiinnostavat muuttujat chol1950 ja age1950. Biostatistiikkaa esimerkkien avulla 11 Janne Pitkäniemi, syksy 005

12 Correlations Age in 1950 Serum cholesterol (mmol/l) Serum cholesterol Age in 1950 (mmol/l) Pearson Correlation 1,070 Sig. ( tailed),35 N Pearson Correlation,070 1 Sig. ( tailed),35 N Johtopäätös: Iän vuonna 1950 ja kolesterolin välillä ei ole tilastollisesti merkitsevää korrelaatiota (5% merkitsevyystasolla). Nollahypoteesia ei hylätä joten Pearsonin korrelaatiokerroin (r) on nolla. Korrelatiivisia menetelmiä, esimerkiksi tavallista lineaarista regressiota, käytetään usein, kun osa muuttujista on järjestysasteikollisia. Tällöin tulisi kuitenkin olla erityisen varovainen, sillä järjestysasteikollisten ja jatkuvien muuttujien väliset korrelaatiot saattavat helposti vääristyä, koska harvoin järjestysasteikollisten muuttujien arvojoukko on tasavälinen. Jatkuvien muuttujien ja dikotomisten muuttujien välisissä korrelaatioissa ei sen saan ole mitään laskennallista ongelmaa. Sen saan testaamisen suhteen on, sillä yllä oleva testisuure toimii tällöin vain likimääräisesti. Huom. Korrelaatiokertoimia tulkittaessa kannattaa muistaa seuraavat asiat: korrelaatiokerroin on tulkinnallisesti eri asia kuin regressiokerroin korrelaatio on symmetrinen assosiaation mitta, r xy = r yx korrelaatio ja kausaliteetti ovat eri asioita; voimakas korrelaatio ei takaa kausaalista riippuvuutta tilastollisesti merkitsevä korrelaatio on eri asia kuin kliinisesti merkittävä korrelaatio Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy 005

13 Spearmanin järjestyskorrelaatiokerroin Spearmanin korrelaatiokerroin, (r s ) Spearman's rho on parametriton assosiaation mitta kvantitatiivisen tai järjestysasteikollisen suureen x ja y välillä. Mitta saa arvoja väliltä ( 1,1). Sitä käytetään erityisesti pienissä aineistoissa. Se lasketaan siten, että aineisto lajitellaan x:n ja y:n suhteen ja annetaan havaintoarvoille järjestysluvut ranks ja lasketaan Pearsonin korrelaatiokerroin näiden järjestyslukujen perusteella. Käyttö: Spearmanin korrelaatiokerrointa r s ( Spearman's rho ) käytetään järjestysasteikollisten muuttujien välisenä assosiaation mittana. Se on yleisesti käytetty mitta kliinisissä tutkimuksissa, koska se ei edellytä normaalisuutta, eikä ole herkkä poikkeaville havaintoarvoille, joita yleisesti tutkimusaineistoissa esiintyy. Ongelmana on, että monimuuttuja analyyseissa sillä ei ole käyttöä. Spearmanin korrelaatiokerroin lasketaan kaavalla: 6 rs = 1 3 n n i= 1 d n i missä d i on i. henkilön järjestyslukujen erotus korreloitavilla suureilla x ja y. Samojen lukuarvojen tapauksessa järjestyslukuna käytetään niitä vastaavien järjestyslukujen keskiarvoa. Yllä oleva laskentakaava on alunperin johdettu siten, että Pearsonin kaavaan on soitettu alkuperäisten x:n ja y:n lukuarvojen paikalle järjestysluvut. Spearmanin korrelaatioiden tilastollisen merkitsevyyden arvioimiseksi pienillä aineistoilla (n < 10) tulisi käyttää eksakteja testejä (esim. StatXact 6 tai erityistaulukoita). Kun aineistokoko on välillä voidaan käyttää Monte Carlo menetelmiä ja sitä suuremmilla aineistoilla Pearsonin korrelaatiokertoimen t testiä. Esim. Lasketaan nyt Spearmanin korrelaatio kerroin ja testataan sitä vuoden 1950 kolesterolille ja iälle. Correlations Serum cholesterol Age in 1950 (mmol/l) Spearman's rho Age in 1950 Correlation Coefficient 1,000,06 Sig. ( tailed).,38 N Serum Correlation Coefficient cholesterol,06 1,000 (mmol/l) Sig. ( tailed),38. N Johtopäätös on sama kuin edellä (r s =0.06, p=0.383). Biostatistiikkaa esimerkkien avulla 13 Janne Pitkäniemi, syksy 005

14 Kendallin Tau ja Somerin D Kendallin tau Kendall's tau on parametriton assosiaation mitta kvantitatiivisen tai järjestysasteikollisen suureen x ja y välillä. Mitta saa arvoja väliltä ( 1,1). Sitä käytetään erityisesti pienissä aineistoissa, kuten Spearmanin korrelaatiokerrointakin. Kendallin tau:n avulla, toisin kuin Spearmanin kertoimella voidaan laskea myös osittaiskorrelaatioita r xy.z, missä z on muuttuja, jonka vaikutus halutaan x:n ja y:n välisestä assosiaatiosta puhdistaa. Somerin D, Somer's D Parametriton assosiaation mitta kvantitatiivisten tai järjestysasteikollisten suureiden x ja y välillä. Mitta saa arvoja väliltä ( 1,1). Se on kilpaileva mitta Kendallin tau:lle. Käyttö: Kendallin tau ja Somerin D ovat vaihtoehtoisia mittoja Spearmanin korrelaatiokertoimelle järjestysasteikollisten muuttujien x ja y välisiä riippuvuussuhteita tarkasteltaessa. Näiden mittojen laskentatapa on erilainen kuin Spearmanin korrelaatiokertoimessa. Siksi ne saattavat antaa hyvinkin erilaisen arvon kuin Spearman, yleensä numeerisesti pienemmän. Molemmat mitat perustuvat konkordanttien (sama tulos) ja diskordanttien (eri tulos) parien määriin eikä samalla tavalla järjestyslukuihin kuten Spearmanin korrelaatiokerroin. Kendallin Tau soveltuu käytettäväksi myös silloin, kun on tarve laskea osittaiskorrelaatioita, eli puhdistaa korrelaatiosta jonkun tai joidenkin muuttujien vaikutus. Somerin D on epäsymmetrinen assosiaation mitta toisin kuin Spearman ja Kendall. Se tarkoittaa, että toista assosioitavista muuttujista tarkastellaan riippuvana ja toista riippumattomana muuttujana. Biostatistiikkaa esimerkkien avulla 14 Janne Pitkäniemi, syksy 005

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 3) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 3) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 3) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy 005

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on? Tilastollinen tietojenkäsittely / SPSS Harjoitus 4 Tarkastellaan ensin aineistoa KUNNAT. Koska kyseessä on kokonaistutkimus, riittää, että tutkit tunnuslukujen arvoja ja teet niiden perusteella päätelmiä.

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 Luento 2 Kuvailevat tilastolliset menetelmät Käytetyimmät tilastolliset menetelmät käyttäjäkokemuksen

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Harjoittele tulkintoja

Harjoittele tulkintoja Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

KAHDEN RYHMÄN VERTAILU

KAHDEN RYHMÄN VERTAILU 10.3.2015 KAHDEN RYHMÄN VERTAILU Jouko Miettunen Center for Life-Course and Systems Epidemiology jouko.miettunen@oulu.fi Luennon sisältö Luokitellut muuttujat Ristiintaulukko, prosentit Khiin neliötesti

Lisätiedot

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9

Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9 Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9 1.1 PARAMETRITTOMIEN MENETELMIEN LYHYT HISTORIA 11 1.2 PARAMETRITTOMAT MENETELMÄT IHMISTIETEISSÄ

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 2. Tehtävät 2-4 sekä 6 10 liittyvät keväällä 2002 suoritettuun ammattikorkeakoulusta

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 2) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 2005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

SPSS ohje. Metropolia Business School/ Pepe Vilpas

SPSS ohje. Metropolia Business School/ Pepe Vilpas 1 SPSS ohje Page 1. Perusteita 2 2. Frekvenssijakaumat 3 3. Muuttujan luokittelu 4 4. Kaaviot 5 5. Tunnusluvut 6 6. Tunnuslukujen vertailu ryhmissä 7 9. Ristiintaulukointi ja Chi-testi 8 10. Hajontakaavio

Lisätiedot

Tutkimus peliohjaimen käytöstä Super Smash Bros. Melee pelissä. Aleksanteri Karanka

Tutkimus peliohjaimen käytöstä Super Smash Bros. Melee pelissä. Aleksanteri Karanka Tutkimus peliohjaimen käytöstä Super Smash Bros. Melee pelissä Aleksanteri Karanka Sisällysluettelo Johdanto... 3 Aikaisemmat tutkimukset... 3 Tutkimuksen toteutus... 3 Taitotaso-ongelma... 3 Tutkimustulokset...

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista. Mat-2.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille Hypoteesi, Mannin ja Whitneyn testi (Wilcoxonin

Lisätiedot

SPSS-ohjeita. Metropolia Pertti Vilpas

SPSS-ohjeita. Metropolia Pertti Vilpas 1 Metropolia Pertti Vilpas SPSS-ohjeita Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta 4 Riippuvuus 1 Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta x 2 = sisaruksien luku- Tarkastellaan äidin ja lapsen pituuden välistä riippuvuutta havaintomatriisilla, joka on

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

SPSS OPAS. Metropolia Liiketalous

SPSS OPAS. Metropolia Liiketalous 1 Metropolia Liiketalous SPSS OPAS Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio 8 8.Korrelaatio

Lisätiedot

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle] Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Ilman Ruotsia: r = 0.862 N Engl J Med 2012; 367:1562-1564. POIKKEAVAN HAVAINNON VAIKUTUS PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla

Lisätiedot

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori

Lisätiedot

Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op)

Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op) Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (.5 op) Taina I. Lehtinen PL 9 Siltavuorenpenger 3A (. kerros), 00014 Helsingin yliopisto E-mail:Taina.Lehtinen@Helsinki.FI Valokuva: Ida Pimenoff 1 Kuvaus

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

Tutkimusmenetelmät I

Tutkimusmenetelmät I Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op) Taina I. Lehtinen PL 9 Siltavuorenpenger 3A (2. kerros), 00014 Helsingin yliopisto E-mail:Taina.Lehtinen@Helsinki.FI Valokuva: Ida Pimenoff 1

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012 Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. 9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko Moimuuttujameetelmät Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Mikko Mattila 009 1 Yhde muuttuja meetelmät (uivariate statistics): keskiluvut ja hajotaluvut Moimuuttujameetelmät:

Lisätiedot

Ratkaisuja luvun 15 tehtäviin

Ratkaisuja luvun 15 tehtäviin Tarja Heikkilä 1. Luettele hyvän tutkimuksen perusvaatimukset ja riskitekijät. Katso Hyvän tutkimuksen perusvaatimukset luvusta 1 ja Tutkimusraporttien arviointi luvusta 4. Esimerkkejä riskitekijöistä

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Genetiikan perusteet 2009

Genetiikan perusteet 2009 Genetiikan perusteet 2009 Malli selittää, mutta myös ennustaa ja ennusteen voi testata kokeella. Mendel testasi F 2 -mallinsa tuottamalla itsepölytyksellä F 3 -polven Seuraava sukupolvi tai toinen, riippumaton

Lisätiedot

Muuttujien väliset riippuvuudet esimerkkejä

Muuttujien väliset riippuvuudet esimerkkejä Tarja Heikkilä Muuttujien väliset riippuvuudet esimerkkejä Sisältö MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN TILASTOLLINEN TESTAUS MERKITSEVYYSTASO MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN SPSS-OHJELMALLA

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas RIIPPUVUUS ALARYHMISSÄ Riippuvuus saattaa olla erilaista jos samassa aineistossa on esim. tutkittavia molemmista sukupuolista Yhteys saattaa olla erilaista

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla Raija Leppälä Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla TAMPEREEN YLIOPISTO INFORMAATIOTIETEIDEN YKSIKÖN RAPORTTEJA 55/2017 TAMPERE 2017 TAMPEREEN YLIOPISTO

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Tehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset

Tehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset 12.05.2009 Tehtävä 1 (a) x

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot