BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 4) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos
|
|
- Leena Laaksonen
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 4) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy 005
2 Ristiintaulukkoanalyysit...3 Laatueroasteikollinen R x C taulukko 4 Fisherin tarkka testi (r x r) taulukoille 8 Korrelaatio...9 Pearsonin korrelaatiokerroin 9 Spearmanin järjestyskorrelaatiokerroin 13 Kendallin Tau ja Somerin D..14 Biostatistiikkaa esimerkkien avulla Janne Pitkäniemi, syksy 005
3 Ristiintaulukkoanalyysit Tähän kappaleeseen on koottu tavallisimmat luokitellun tiedon käsittelyssä käytettävät perustestit. Monia niistä on käsitelty ja esimerkein havainnollistettu jo aiemmin tässä monisteessa. Käyttötilanne: Halutaan tutkia luokiteltujen ( categorical ) muuttujien välisiä yhteyksiä. Luokitellut muuttujat voivat olla joko laatueroasteikollisia (esim. HLA tyyppi tai silmien väri) tai järjestysasteikollisia (esim. lääkeannos: matala, keskimääräinen, korkea tai vastaavasti esim. numeerisina arvoina ilmaistuna: 00 mg, 400 mg, 1600 mg). Oletetaan, että muuttujat tarkasteltavat muuttujat x ja y ovat luokiteltuja siten, että x:ssä on R luokkaa ja y:ssä C luokkaa ja että muuttujien välisen yhteyden tutkimiseksi on muodostettu R x C kontingenssitaulukko ( contigency table ): Muuttuja x Muuttuja y 1 j C 1 i f m j R n 1 n j N Taulukossa f tarkoittaa i. rivin ja j. sarakkeen frekvenssilukua. Tälle lokerofrekvenssille saadaan odotettu arvo kaavalla: E(f ) = m i n j /N, kun oletetaan, että x:n ja y:n välillä ei olisi mitään riippuvuutta keskenään. Tämä merkitsee, että rivi /sarakejakaumat eivät poikkea toisistaan, jolloin erot havaitussa frekvenssitaulukossa johtuvat sattumasta. Nimitys kontingenssi tarkoittaa sattumaa. Huom. Lokerokohtaiset odotusarvot ja havaittujen arvojen poikkeamat odotus arvoista kannattaa laskea, sillä niiden perusteella voi alustavasti tarkastella x:n ja y:n välisen riippuvuuden luonnetta. Tilastopaketit tulostavat nämä suureet pyydettäessä. Testattavat hypoteesit: Nollahypoteesi (H 0 ): taulukon rivit ja sarakkeet eivät riipu toinen toisistaan, ts. x:llä ja y:llä (riveillä ja sarakkeilla) ei ole yhdysvaikutusta ( interaction ) keskenään. Biostatistiikkaa esimerkkien avulla 3 Janne Pitkäniemi, syksy 005
4 Vaihtoehtoinen hypoteesi (H A ): taulukon rivien ja sarakkeiden välillä on riippuvuutta. Tarkastellaan tilastopakettien tarjoamia testivaihtoehtoja seuraaviin tilanteisiin: 1. Molemmat R x C taulukon muuttujista x ja y ovat laatueroasteikollisia,. Toinen muuttujista on laatueroasteikollinen ja toinen järjestysasteikollinen, jolloin kyseessä on yhteen suuntaan järjestetty taulukko, 3. Molemmat muuttujista x ja y ovat järjestysasteikollisia, eli taulukko on kahteen suuntaan järjestetty. Tilastopaketit tarjoavat näihin testaustilanteisiin useita eri testivaihtoehtoja ja lisäksi yleensä kunkin vaihtoehdon sisällä on valittavana kolme eri tapaa P arvon laskemiseksi: a) asymptoottinen, b) Monte Carlo ja c) eksakti laskentatapa. Kaikki nämä laskentatavat tuottavat asymptoottisesti saman tuloksen. Asymptoottinen menetelmä asymptotic method on mikä tahansa menetelmä, joka perustuu approksimaatioon, eli likimäämäisarviointiin, Normaalakaumalla tai jollain muulla todennäköisyysjakaumalla siten, että käytetty arvio tarkentuu, kun aineistokoko n kasvaa. Synonyymi asymptoottiselle menetelmälle on suurten otosten menetelmä large sample method ja vaihtoehto on tarkka menetelmä exact method. Monte Carlo menetelmät Monte Carlo methods ovat tietokonesimulaatiota käyttäviä ratkaisumenetelmiä matemaattisiin ja tilastollisiin ongelmiin. Simulaatiossa imitoidaan tilastollisia malleja satunnaislukujen avulla. Laatueroasteikollinen R x C taulukko Käytettävissä olevat testit: a) Pearsonin Khi heterogeenisuustesti: χ = R C i= 1 j= 1 (f E(f E(f ) )) Kaavassa f :t ovat taulukon havaitut lukumäärät ja E(f ):t ovat niiden odotusarvot. Huom. Khi testi on erittäin herkkä pienille odotusarvoille; Suhteellinen virhe tulee tällöin suureksi, koska odotusarvot ovat testisuureen nimittäjässä. b) G testi, uskottavuussuhde ( likelihood ratio ) testi: Biostatistiikkaa esimerkkien avulla 4 Janne Pitkäniemi, syksy 005
5 G = R C i= 1 j= 1 f f loge( ) E(f ) G testi on yleisimmin käytetty testi taulukkoanalyyseissä (Esim. loglineaariset mallit). Se ei ole yhtä herkkä kuin Khi testi pienille odotusarvoille log muunnoksesta johtuen. Vapausasteiden määrä on df = (R 1) (C 1) m, missä m = odotusarvojen laskemisessa tarvittavien estimoitujen parametrien määrä. Tavallisesti m = 0. Sekä khi että G testiin voidaan tilastopaketeista kohdasta options pyytää myös lisäykset testisuureen arvoon lokeroittain: (f E(f )) χ = ja E(f ) G = f log e f E(f ) Näiden suureiden perusteella voi todeta lokerokohtaiset lisäykset testisuureen arvoon ja todeta missä lokerossa tai lokeroissa on eniten poikkeamaa riippumattomuusoletuksesta. Sekä khi että G testisuureet ovat aineiston koosta riippuvaisia eivätkä siten anna hyvää käsitystä riippuvuuden voimakkuudesta. Niiden perusteella voidaan kuitenkin laskea normitettuja riippuvuuden mittoja; kontingenssikertoimia. SPSS:ssä polun Analyze Descriptive statistics Crosstabs Statistics päästä löytyy mm. vaihtoehdot: Kontingenssikerroin, Phi kerroin ja Cramerin V. Kaikkien näiden kerrointen vaihtelualue on: 0 1 (ei assosiaatiota täydellinen assosiaatio). Niiden avulla voidaan verrata mm. assosiaation voimakkuutta eri dimensioisissa (R x C) taulukoissa, mutta lääketieteellisissä julkaisuissa niitä käytetään erittäin harvoin. Esimerkki: Tutka on kiinnostunut iän ja kolesterolin riippuvuudesta esimerkki aineistossamme datasetb. Tätä varten hän luo uuden muuttujan ikäryhmiä varten SPSS:llä compute > transform ageg=(age1950>=30)+(age1950>=40)+(age1950>=50)+( age1950>=60). Voimme tarkastella jakaumaa SPSS:llä Analyze Descriptive statistics frequencies ageg Cumulative Frequency Percent Valid Percent Percent Valid age< ,0 8,0 8,0 30<=age< ,0 19,0 7,0 40<=age< ,0 34,0 61,0 50<=age< ,5 7,5 88,5 age>= ,5 11,5 100,0 Total ,0 100,0 Biostatistiikkaa esimerkkien avulla 5 Janne Pitkäniemi, syksy 005
6 Tämä komento luo siis uuden muuttujan joka saa arvot 0 kun ikä on alle 30, 1 kun ikä on suurempi tai yhtäsuuri kuin 30 ja alle 40 jne. Tutka haluaa luokitella kolesteroli neljään luokkaa käyttäen aineiston kolesterolakauman prosenttipisteitä 5 %, 50 % ja 75 %. Tämä löytyy SPSS:llä Analyze Descriptive statistics frequencies Statistics valitaan quartiles. Statistics Serum cholesterol (mmol/l) N Valid 00 Missing 0 Percentiles 5 1, , ,3900 Näin saadaan luokittelumuuttujan tekemistä varten luokkarajat. Luodaan uusi muuttujan muuttuja kolestoroliryhmiä varten SPSS:llä: compute > transform ja sen jakauma frequencies valikosta cholg=(chol1950>=1.)+(chol1950>=13.89)+(chol1950>=16.39). cholg Cumulative Frequency Percent Valid Percent Percent Valid <1, 40 0,0 0,0 0,0 1,<=chol1950<13, ,0 7,0 47,0 13,89<=chol1950<16, ,5 7,5 74,5 >=16, ,5 5,5 100,0 Total ,0 100,0 Nyt voimme ristiintaulukoida ikäryhmän ja kolesterolitason: Analyze Descriptive statistics crosstabs valitaan Statistics ja chi square sekä Cells ja expected, row, column, total. Näin saadaan seuraava taulukko sekä khiitoiseen homogeenisuustesti: Biostatistiikkaa esimerkkien avulla 6 Janne Pitkäniemi, syksy 005
7 ageg * cholg Crosstabulation cholg Total <1, 1,<=chol 1950<13,89 13,89<=chol 1950<16,39 >=16,39 ageg age<30 Count Expected Count 3, 4,3 4,4 4,1 16,0 % within ageg 5,0% 31,3% 18,8% 5,0% 100,0% % within cholg 10,0% 9,3% 5,5% 7,8% 8,0% % of Total,0%,5% 1,5%,0% 8,0% 30<=age< Count Expected Count 7,6 10,3 10,5 9,7 38,0 % within ageg 18,4% 8,9% 1,1% 31,6% 100,0% % within cholg 17,5% 0,4% 14,5% 3,5% 19,0% % of Total 3,5% 5,5% 4,0% 6,0% 19,0% 40<=age< Count Expected Count 13,6 18,4 18,7 17,3 68,0 % within ageg 19,1% 7,9% 36,8% 16,% 100,0% % within cholg 3,5% 35,% 45,5% 1,6% 34,0% % of Total 6,5% 9,5% 1,5% 5,5% 34,0% 50<=age< Count Expected Count 11,0 14,9 15,1 14,0 55,0 % within ageg 18,% 18,% 9,1% 34,5% 100,0% % within cholg 5,0% 18,5% 9,1% 37,3% 7,5% % of Total 5,0% 5,0% 8,0% 9,5% 7,5% age>=60 Count Expected Count 4,6 6, 6,3 5,9 3,0 % within ageg 6,1% 39,1% 13,0% 1,7% 100,0% % within cholg 15,0% 16,7% 5,5% 9,8% 11,5% % of Total 3,0% 4,5% 1,5%,5% 11,5% Total Count Expected Count 40,0 54,0 55,0 51,0 00,0 % within ageg 0,0% 7,0% 7,5% 5,5% 100,0% % within cholg 100,0% 100,0% 100,0% 100,0% 100,0% % of Total 0,0% 7,0% 7,5% 5,5% 100,0% Chi Square Tests Value df Asymp. Sig. ( sided) Pearson Chi Square 13,515(a) 1,333 Biostatistiikkaa esimerkkien avulla 7 Janne Pitkäniemi, syksy 005
8 Likelihood Ratio 13,981 1,30 Linear by Linear Association,003 1,959 N of Valid Cases 00 a 5 cells (5,0%) have expected count less than 5. The minimum expected count is 3,0. Testin perusteella nollahypoteesia ei hylätä 5 % merkitsevyystasolla, joten kolesterolitason ja ikäryhmien välillä ei ole tilastollisesti merkitsevää riippuvuutta tässä aineistossa. Fisherin tarkka testi (r x r) taulukoille Käyttötilanne: heterogeenisuuden testaaminen tarkasteltava muuttuja laatueroasteikollinen kaksi vertailtavaa ryhmää Esim. Onko mahahaavan ja ABO veriryhmän välillä tilastollisesti merkitsevä yhteys? (Varis K, Salmi H, ym., julkaisematon) Ryhmä ABO Total O A B AB Aktiivinen mahahaava Muut ylävatsaoireiset Total SPSS: Valikot: Analyze Descriptive Statistics Crosstabs Määritellään taulukon rivit ja sarakkeet ja klikataan kohdasta Statistics Chi square ja kohdasta Exact Exact. Chi Square Tests Value df Asymp. Sig. ( sided) Exact Sig. ( sided) Pearson Chi Square 17,57(a) 3,0005,0003 Likelihood Ratio 19,935 3,000,0003 Fisher's Exact Test 18,101,0003 (a) cells (5,0%) have expected count less than 5. The minimum expected count is 3,3. Tulkinta: ABO veriryhmäjakaumissa on eroa vertailtavien ryhmien välillä, ts ABOveriryhmän ja ryhmän välillä on tilastollisesti merkitsevä yhteys. Biostatistiikkaa esimerkkien avulla 8 Janne Pitkäniemi, syksy 005
9 Korrelaatio Pearsonin korrelaatiokerroin Pearsonin korrelaatiokerroin, Pearson s correlation coefficient (r x, y ) Siitä käytetään myös nimitystä tulo momentti korrelaatiokerron. Se on parametrinen lineaarisen riippuvuuden mitta kvantitatiivisten suureiden x ja y välillä. Parametrinen tarkoittaa, että tarkasteltavien muuttujien x ja y yhteisjakauman tulisi olla likimain normaalinen. Muussa tapauksessa esim. poikkeavilla havaintoarvoilla voi olla suuri vaikutus r:n arvoon. r voi saada minkä tahansa arvon väliltä [ 1, +1], ja r = 1 merkitsee täydellistä lineaarista negatiivista (käänteistä) ja +1 positiivista riippuvuutta. r = 0 merkitsee, ettei x:n ja y:n välillä ole ollenkaan lineaarista riippuvuutta. r = 0 ei merkitse, ettei niiden välillä voisi jotain muunlaista epälineaarista riippuvuutta. Huom. Pearsonin korrelaatiokerrointa ylikäytetään, väärinkäytetään ja myös tulkitaan usein väärin lääketieteellisissä artikkeleissa. Esim. korrelaatiokertoimet voivat olla harhaanjohtavia mikäli aineistossa on selvästi muista arvoista poikkeavia havaintoarvoja kuvat A ja B) tai mikäli aineisto muodostuu osaryhmistä, joiden tiedetään eroavan keskiarvotasolla molempien korreloitavien muuttujien suhteen (kuva C). Biostatistiikkaa esimerkkien avulla 9 Janne Pitkäniemi, syksy 005
10 Käyttö: Jotta r olisi validi assosiaation mitta, niin seuraavat vaatimukset tulisi täyttyä: muuttujien x ja y yhteisjakauman tulisi olla normaalinen (ellei vaatimus täyty edes pitäisi turvautua parametrittomiin korrelaatioihin) muuttujien x ja y välillä ei saa olla teknisiä riippuvuuksia, jotka säätelevät muuttujien yhteisvaihtelua kustakin henkilöstä saa olla vain yksi havaintopari aineistossa, josta korrelaatio lasketaan, esim. jos 30 henkilöstä on 3 toistomittausta, niin korrelaatiota ei saa laskea siten, että havaintoarvoja olisi 90! (toistomittausten tapauksessa pitää käyttää toistomittausanalyysejä) Pearsonin korrelaatiokerroin ja sen keskivirhe lasketaan kaavoilla: Testi: xy n i= 1 n i= 1 (x (x i i x) (y x) n i= 1 i (y y) r =, SE(r) = i y) 1 r n Biostatistiikkaa esimerkkien avulla 10 Janne Pitkäniemi, syksy 005
11 Korrelaatiokertoimen tilastollista merkitsevyyttä voidaan arvioida testisuureella: t = r SE(r) = r n 1 Testisuure noudattaa Studentin t jakaumaa vapausastein (n ). r Esim. Tutkitaan kolesterolin ja iän riippuvuutta esimerkkiaineistossamme käyttäen jatkuvia muuttujia chol1950 ja age1950. Piirretään ensin hajontakuvio SPSS:llä: Graph Scatter Simple. Valitaan x axis Age1950 ja y axis chol ,00 5,00 Serum cholesterol (mmol/l) 0,00 15,00 10,00 5,00 0,0 30,0 40,0 50,0 60,0 70,0 Age in 1950 Jo pelkästään kuvaa katsomalla lienee selvää ettei ainakaan mitään voimakasta suoraviivaista riippuvuutta ole. Testataan asia kuitenkin tilastollisesti SPSS:llä: Analyze Correlate Bivariate ja valitaan kiinnostavat muuttujat chol1950 ja age1950. Biostatistiikkaa esimerkkien avulla 11 Janne Pitkäniemi, syksy 005
12 Correlations Age in 1950 Serum cholesterol (mmol/l) Serum cholesterol Age in 1950 (mmol/l) Pearson Correlation 1,070 Sig. ( tailed),35 N Pearson Correlation,070 1 Sig. ( tailed),35 N Johtopäätös: Iän vuonna 1950 ja kolesterolin välillä ei ole tilastollisesti merkitsevää korrelaatiota (5% merkitsevyystasolla). Nollahypoteesia ei hylätä joten Pearsonin korrelaatiokerroin (r) on nolla. Korrelatiivisia menetelmiä, esimerkiksi tavallista lineaarista regressiota, käytetään usein, kun osa muuttujista on järjestysasteikollisia. Tällöin tulisi kuitenkin olla erityisen varovainen, sillä järjestysasteikollisten ja jatkuvien muuttujien väliset korrelaatiot saattavat helposti vääristyä, koska harvoin järjestysasteikollisten muuttujien arvojoukko on tasavälinen. Jatkuvien muuttujien ja dikotomisten muuttujien välisissä korrelaatioissa ei sen saan ole mitään laskennallista ongelmaa. Sen saan testaamisen suhteen on, sillä yllä oleva testisuure toimii tällöin vain likimääräisesti. Huom. Korrelaatiokertoimia tulkittaessa kannattaa muistaa seuraavat asiat: korrelaatiokerroin on tulkinnallisesti eri asia kuin regressiokerroin korrelaatio on symmetrinen assosiaation mitta, r xy = r yx korrelaatio ja kausaliteetti ovat eri asioita; voimakas korrelaatio ei takaa kausaalista riippuvuutta tilastollisesti merkitsevä korrelaatio on eri asia kuin kliinisesti merkittävä korrelaatio Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy 005
13 Spearmanin järjestyskorrelaatiokerroin Spearmanin korrelaatiokerroin, (r s ) Spearman's rho on parametriton assosiaation mitta kvantitatiivisen tai järjestysasteikollisen suureen x ja y välillä. Mitta saa arvoja väliltä ( 1,1). Sitä käytetään erityisesti pienissä aineistoissa. Se lasketaan siten, että aineisto lajitellaan x:n ja y:n suhteen ja annetaan havaintoarvoille järjestysluvut ranks ja lasketaan Pearsonin korrelaatiokerroin näiden järjestyslukujen perusteella. Käyttö: Spearmanin korrelaatiokerrointa r s ( Spearman's rho ) käytetään järjestysasteikollisten muuttujien välisenä assosiaation mittana. Se on yleisesti käytetty mitta kliinisissä tutkimuksissa, koska se ei edellytä normaalisuutta, eikä ole herkkä poikkeaville havaintoarvoille, joita yleisesti tutkimusaineistoissa esiintyy. Ongelmana on, että monimuuttuja analyyseissa sillä ei ole käyttöä. Spearmanin korrelaatiokerroin lasketaan kaavalla: 6 rs = 1 3 n n i= 1 d n i missä d i on i. henkilön järjestyslukujen erotus korreloitavilla suureilla x ja y. Samojen lukuarvojen tapauksessa järjestyslukuna käytetään niitä vastaavien järjestyslukujen keskiarvoa. Yllä oleva laskentakaava on alunperin johdettu siten, että Pearsonin kaavaan on soitettu alkuperäisten x:n ja y:n lukuarvojen paikalle järjestysluvut. Spearmanin korrelaatioiden tilastollisen merkitsevyyden arvioimiseksi pienillä aineistoilla (n < 10) tulisi käyttää eksakteja testejä (esim. StatXact 6 tai erityistaulukoita). Kun aineistokoko on välillä voidaan käyttää Monte Carlo menetelmiä ja sitä suuremmilla aineistoilla Pearsonin korrelaatiokertoimen t testiä. Esim. Lasketaan nyt Spearmanin korrelaatio kerroin ja testataan sitä vuoden 1950 kolesterolille ja iälle. Correlations Serum cholesterol Age in 1950 (mmol/l) Spearman's rho Age in 1950 Correlation Coefficient 1,000,06 Sig. ( tailed).,38 N Serum Correlation Coefficient cholesterol,06 1,000 (mmol/l) Sig. ( tailed),38. N Johtopäätös on sama kuin edellä (r s =0.06, p=0.383). Biostatistiikkaa esimerkkien avulla 13 Janne Pitkäniemi, syksy 005
14 Kendallin Tau ja Somerin D Kendallin tau Kendall's tau on parametriton assosiaation mitta kvantitatiivisen tai järjestysasteikollisen suureen x ja y välillä. Mitta saa arvoja väliltä ( 1,1). Sitä käytetään erityisesti pienissä aineistoissa, kuten Spearmanin korrelaatiokerrointakin. Kendallin tau:n avulla, toisin kuin Spearmanin kertoimella voidaan laskea myös osittaiskorrelaatioita r xy.z, missä z on muuttuja, jonka vaikutus halutaan x:n ja y:n välisestä assosiaatiosta puhdistaa. Somerin D, Somer's D Parametriton assosiaation mitta kvantitatiivisten tai järjestysasteikollisten suureiden x ja y välillä. Mitta saa arvoja väliltä ( 1,1). Se on kilpaileva mitta Kendallin tau:lle. Käyttö: Kendallin tau ja Somerin D ovat vaihtoehtoisia mittoja Spearmanin korrelaatiokertoimelle järjestysasteikollisten muuttujien x ja y välisiä riippuvuussuhteita tarkasteltaessa. Näiden mittojen laskentatapa on erilainen kuin Spearmanin korrelaatiokertoimessa. Siksi ne saattavat antaa hyvinkin erilaisen arvon kuin Spearman, yleensä numeerisesti pienemmän. Molemmat mitat perustuvat konkordanttien (sama tulos) ja diskordanttien (eri tulos) parien määriin eikä samalla tavalla järjestyslukuihin kuten Spearmanin korrelaatiokerroin. Kendallin Tau soveltuu käytettäväksi myös silloin, kun on tarve laskea osittaiskorrelaatioita, eli puhdistaa korrelaatiosta jonkun tai joidenkin muuttujien vaikutus. Somerin D on epäsymmetrinen assosiaation mitta toisin kuin Spearman ja Kendall. Se tarkoittaa, että toista assosioitavista muuttujista tarkastellaan riippuvana ja toista riippumattomana muuttujana. Biostatistiikkaa esimerkkien avulla 14 Janne Pitkäniemi, syksy 005
Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?
Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus
Lisätiedotvoidaan hylätä, pienempi vai suurempi kuin 1 %?
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS
Lisätiedotvoidaan hylätä, pienempi vai suurempi kuin 1 %?
[TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine
LisätiedotBIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 3) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos
BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 3) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy 005
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
LisätiedotTulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?
Tilastollinen tietojenkäsittely / SPSS Harjoitus 4 Tarkastellaan ensin aineistoa KUNNAT. Koska kyseessä on kokonaistutkimus, riittää, että tutkit tunnuslukujen arvoja ja teet niiden perusteella päätelmiä.
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 Luento 2 Kuvailevat tilastolliset menetelmät Käytetyimmät tilastolliset menetelmät käyttäjäkokemuksen
LisätiedotMTTTP1, luento KERTAUSTA
25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotMTTTP1, luento KERTAUSTA
26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
Lisätiedot1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi
Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotTUTKIMUSOPAS. SPSS-opas
TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
LisätiedotMTTTP1, luento KERTAUSTA
19.3.2019/1 MTTTP1, luento 19.3.2019 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotHarjoittele tulkintoja
Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
LisätiedotKAHDEN RYHMÄN VERTAILU
10.3.2015 KAHDEN RYHMÄN VERTAILU Jouko Miettunen Center for Life-Course and Systems Epidemiology jouko.miettunen@oulu.fi Luennon sisältö Luokitellut muuttujat Ristiintaulukko, prosentit Khiin neliötesti
LisätiedotSisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9
Sisällysluettelo SISÄLLYSLUETTELO...6 LYHYT SANASTO VASTA-ALKAJILLE...7 1. JOHDATUS PARAMETRITTOMIIN MENETELMIIN...9 1.1 PARAMETRITTOMIEN MENETELMIEN LYHYT HISTORIA 11 1.2 PARAMETRITTOMAT MENETELMÄT IHMISTIETEISSÄ
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi
LisätiedotKvantitatiiviset tutkimusmenetelmät maantieteessä
Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotTilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä
Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti
Lisätiedot1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?
1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 2. Tehtävät 2-4 sekä 6 10 liittyvät keväällä 2002 suoritettuun ammattikorkeakoulusta
LisätiedotVALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
LisätiedotRISTIINTAULUKOINTI JA Χ 2 -TESTI
RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN
LisätiedotBIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos
BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 2) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 2005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy
LisätiedotOhjeita kvantitatiiviseen tutkimukseen
1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotSisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4
Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156
LisätiedotTilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit
Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
LisätiedotSPSS ohje. Metropolia Business School/ Pepe Vilpas
1 SPSS ohje Page 1. Perusteita 2 2. Frekvenssijakaumat 3 3. Muuttujan luokittelu 4 4. Kaaviot 5 5. Tunnusluvut 6 6. Tunnuslukujen vertailu ryhmissä 7 9. Ristiintaulukointi ja Chi-testi 8 10. Hajontakaavio
LisätiedotTutkimus peliohjaimen käytöstä Super Smash Bros. Melee pelissä. Aleksanteri Karanka
Tutkimus peliohjaimen käytöstä Super Smash Bros. Melee pelissä Aleksanteri Karanka Sisällysluettelo Johdanto... 3 Aikaisemmat tutkimukset... 3 Tutkimuksen toteutus... 3 Taitotaso-ongelma... 3 Tutkimustulokset...
LisätiedotTilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
LisätiedotMediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.
Mat-2.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille Hypoteesi, Mannin ja Whitneyn testi (Wilcoxonin
LisätiedotSPSS-ohjeita. Metropolia Pertti Vilpas
1 Metropolia Pertti Vilpas SPSS-ohjeita Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
Lisätiedot¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.
10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn
LisätiedotJos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan
17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten
Lisätiedot4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta
4 Riippuvuus 1 Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta x 2 = sisaruksien luku- Tarkastellaan äidin ja lapsen pituuden välistä riippuvuutta havaintomatriisilla, joka on
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5
MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotJos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen
LisätiedotSPSS OPAS. Metropolia Liiketalous
1 Metropolia Liiketalous SPSS OPAS Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio 8 8.Korrelaatio
LisätiedotData-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]
Data-analyysi II [Type the document subtitle] Simo Kolppo 26.3.2014 Sisällysluettelo Johdanto... 1 Tutkimuskysymykset... 1 Aineistojen esikäsittely... 1 Economic Freedom... 1 Nuorisobarometri... 2 Aineistojen
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy
LisätiedotTilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle
Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen
LisätiedotTilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin
Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
Lisätiedot10. laskuharjoituskierros, vko 14, ratkaisut
10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset
LisätiedotTA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET
TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen
LisätiedotIlkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset
LisätiedotTeema 9: Tilastollinen merkitsevyystestaus
Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Ilman Ruotsia: r = 0.862 N Engl J Med 2012; 367:1562-1564. POIKKEAVAN HAVAINNON VAIKUTUS PAIRWISE VAI LISTWISE? Kun aineistossa on muuttujia, joilla
LisätiedotTilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi
Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien
Lisätiedotχ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut
Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
LisätiedotJohdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle
LisätiedotTavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.
Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,
LisätiedotLumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I
Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori
LisätiedotTutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op)
Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (.5 op) Taina I. Lehtinen PL 9 Siltavuorenpenger 3A (. kerros), 00014 Helsingin yliopisto E-mail:Taina.Lehtinen@Helsinki.FI Valokuva: Ida Pimenoff 1 Kuvaus
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotMTTTP5, luento Luottamusväli, määritelmä
23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A
LisätiedotSisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen
LisätiedotTutkimusmenetelmät I
Tutkimusmenetelmät I Määrällisen tutkimuksen osuus (2.5 op) Taina I. Lehtinen PL 9 Siltavuorenpenger 3A (2. kerros), 00014 Helsingin yliopisto E-mail:Taina.Lehtinen@Helsinki.FI Valokuva: Ida Pimenoff 1
LisätiedotTilastollisia peruskäsitteitä ja Monte Carlo
Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia
LisätiedotKorrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012
Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170
LisätiedotJohdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
LisätiedotValitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.
9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2
LisätiedotTestit järjestysasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten
LisätiedotSELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko
Moimuuttujameetelmät Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Mikko Mattila 009 1 Yhde muuttuja meetelmät (uivariate statistics): keskiluvut ja hajotaluvut Moimuuttujameetelmät:
LisätiedotRatkaisuja luvun 15 tehtäviin
Tarja Heikkilä 1. Luettele hyvän tutkimuksen perusvaatimukset ja riskitekijät. Katso Hyvän tutkimuksen perusvaatimukset luvusta 1 ja Tutkimusraporttien arviointi luvusta 4. Esimerkkejä riskitekijöistä
LisätiedotTilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle
Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu
LisätiedotGenetiikan perusteet 2009
Genetiikan perusteet 2009 Malli selittää, mutta myös ennustaa ja ennusteen voi testata kokeella. Mendel testasi F 2 -mallinsa tuottamalla itsepölytyksellä F 3 -polven Seuraava sukupolvi tai toinen, riippumaton
LisätiedotMuuttujien väliset riippuvuudet esimerkkejä
Tarja Heikkilä Muuttujien väliset riippuvuudet esimerkkejä Sisältö MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN TILASTOLLINEN TESTAUS MERKITSEVYYSTASO MUUTTUJIEN VÄLISTEN YHTEYKSIEN TUTKIMINEN SPSS-OHJELMALLA
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas RIIPPUVUUS ALARYHMISSÄ Riippuvuus saattaa olla erilaista jos samassa aineistossa on esim. tutkittavia molemmista sukupuolista Yhteys saattaa olla erilaista
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
LisätiedotRaija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla
Raija Leppälä Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla TAMPEREEN YLIOPISTO INFORMAATIOTIETEIDEN YKSIKÖN RAPORTTEJA 55/2017 TAMPERE 2017 TAMPEREEN YLIOPISTO
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
LisätiedotTehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset
JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset 12.05.2009 Tehtävä 1 (a) x
LisätiedotTilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1
Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
Lisätiedot