Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012



Samankaltaiset tiedostot
Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Aki Taanila TILASTOLLINEN PÄÄTTELY

Harjoitus 7: NCSS - Tilastollinen analyysi

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Aki Taanila TILASTOLLINEN PÄÄTTELY

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Mat Tilastollisen analyysin perusteet, kevät 2007

Väliestimointi (jatkoa) Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Sovellettu todennäköisyyslaskenta B

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

HAVAITUT JA ODOTETUT FREKVENSSIT

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

10. laskuharjoituskierros, vko 14, ratkaisut

Matemaatikot ja tilastotieteilijät

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Testejä suhdeasteikollisille muuttujille

031021P Tilastomatematiikka (5 op) viikko 5

Testit laatueroasteikollisille muuttujille

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Mat Tilastollisen analyysin perusteet, kevät 2007

dx=5&uilang=fi&lang=fi&lvv=2014

Otoskoko 107 kpl. a) 27 b) 2654

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Aki Taanila VARIANSSIANALYYSI

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

2. TILASTOLLINEN TESTAAMINEN...

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Testit järjestysasteikollisille muuttujille

Mat Sovellettu todennäköisyyslasku A

Tilastotieteen jatkokurssi syksy 2003 Välikoe

Sovellettu todennäköisyyslaskenta B

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Määrällisen aineiston esittämistapoja. Aki Taanila

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Mat Tilastollisen analyysin perusteet, kevät 2007

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Luottamusvälit. Normaalijakauma johnkin kohtaan

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Teema 8: Parametrien estimointi ja luottamusvälit

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

MTTTP1, luento KERTAUSTA

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Aineistokoko ja voima-analyysi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

TILASTOLLINEN LAADUNVALVONTA

Estimointi. Otantajakauma

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTP1, luento KERTAUSTA

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Sovellettu todennäköisyyslaskenta B

Määrällisen aineiston esittämistapoja. Aki Taanila

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tutkimustiedonhallinnan peruskurssi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Hypoteesin testaus Alkeet

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

5 Hypoteesien testaamisesta

Transkriptio:

Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe

Otanta Tavoitteena edustava otos = perusjoukko pienoiskoossa Otos valitaan satunnaisesti (sattumaa hyväksikäyttäen) Apuna satunnaisotanta, systemaattinen otanta, ositettu otanta, ryväsotanta tai näiden yhdistelmä Otoksen perusteella voidaan tehdä päätelmiä perusjoukosta 3

Satunnaisotanta Perusjoukko Otos 4

Systemaattinen otanta Valitaan poimintaväli (esimerkiksi 5) Arvotaan ensimmäinen (esimerkiksi ensimmäisen 5 joukosta) Poimitaan arvotusta alkaen poimintavälin mukaisesti (esimerkiksi joka viides) 5

Ositettu otanta Perusjoukko 30-49 18-29 Halutaan taata otoksen edustavuus ryhmien suhteen -> suhteellinen kiintiöinti Otos Suhteellinen kiintiöinti 65+ 50-64 Tasainen kiintiöinti Halutaan vertailla ryhmiä -> tasainen kiintiöinti Otos 6

Ryväsotanta Jaetaan perusjoukko ryppäisiin (kouluja, kaupunginosia, ) Valitaan arpomalla mukaan otettavat ryppäät Valituista ryppäistä poimitaan otos tai tutkitaan valitut ryppäät kokonaan Otos 7

Näyte Tutkijalla sormensa pelissä, harkinnanvarainen otos Otos itse valikoituva, otokseen osallistuvat valitsevat itse itsensä Tyydytään saatavilla oleviin, esimerkiksi katuhaastattelu Näytteen perusteella ei yleensä voi tehdä päätelmiä perusjoukosta 8

Tilastollinen päättely Tilastollinen päättely on perusjoukkoa koskevien päätelmien tekemistä otoksen perusteella Tilastollisen päättelyn käyttöedellytyksenä on, että otos on satunnaisesti poimittu perusjoukosta 9

Otantavirhe Samasta perusjoukosta poimitut otokset antavat erilaisia tuloksia Tämä johtuu sattumasta Otos 1 keskiarvo 40,5 Perusjoukko keskiarvo 40,8 Otos 2 keskiarvo 40,3 Otos 3 keskiarvo 41,4 10

Virhemarginaali - Luottamusväli Keskiarvon virhemarginaali Prosenttiluvun virhemarginaali

Virhemarginaali - Luottamusväli Otoksesta laskettu tunnusluku on paras arvaus perusjoukon vastaavan tunnusluvun arvoksi Jos perusjoukon tunnusluku arvioidaan otoksesta lasketun tunnusluvun suuruiseksi, niin arvioon liittyy epävarmuutta Epävarmuus on seurausta otantavirheestä Epävarmuuden suuruus ilmaistaan virhemarginaalina Luottamusväli: tunnusluku ± virhemarginaali 12

Keskiarvon virhemarginaali 95 % virhemarginaali on likimain (s on otoksesta laskettu keskihajonta, n on otoskoko): 2 s n Jos perusjoukon keskihajonta on tiedossa, niin sitä käytetään otoksesta lasketun sijasta 95 % todennäköisyydellä luottamusväli otoskeskiarvo ± virhemarginaali sisältää todellisen perusjoukon keskiarvon 13

Keskiarvon virhemarginaali esimerkki Moottorien osien pituuden pitäisi olla 156,0 millimetriä Saapuneesta erästä otetaan 50 kappaleen otos. Otoksesta laskettu keskiarvo 156,30 millimetriä ja keskihajonta 0,34 millimetriä 95 % virhemarginaali 0,10 millimetriä 95 % luottamusväli 156,2 mm 156,4 mm Otoksen perusteella voidaan todeta, että moottorin osien pituus ei ilmeisesti ole tavoiteltu 156,0 mm 14

Prosenttiluvun virhemarginaali Prosenttiluvun 95 % virhemarginaali on likimain (p on otoksesta laskettu prosenttiluku, n on otoskoko): 2 p (1 p) n 95 % todennäköisyydellä luottamusväli otosprosenttiluku ± virhemarginaali sisältää todellisen perusjoukon prosenttiluvun 15

Prosenttiluvun virhemarginaali esimerkki Otoksesta (n=1800) laskettu viallisten tuotteiden osuus on 5,0 % ja virhemarginaali 1,0 prosenttiyksikköä 95 % luottamusväli viallisten osuudelle on 4,0 % - 6,0 %. 16

Hypoteesin testaus Nollahypoteesi Vaihtoehtoinen hypoteesi 2-suuntainen testaus 1-suuntainen testaus Hylkäämisvirhe P-arvo

Hypoteesi Hypoteesi on perusjoukkoa koskeva uskomus Uskon, että aamiaismuropakettien paino on keskimäärin 300 grammaa! 18

Nollahypoteesi ja vaihtoehtoinen hypoteesi Nollahypoteesi H 0 on perusolettamus, vallitseva käsitys, aiempi tilanne, valmistajan ilmoitus, vallitsevan teorian mukainen arvo,... Usein nollahypoteesi on muotoa ei eroa tai ei riippuvuutta Vaihtoehtoinen hypoteesi H 1 on kilpaileva käsitys Nollahypoteesia pidetään totena, kunnes löydetään todisteet sitä vastaan Jos otoksen tiedoista löydetään riittävät todisteet nollahypoteesia vastaan, niin nollahypoteesi hylätään ja vaihtoehtoinen hypoteesi astuu voimaan 19

Esimerkkejä hypoteeseista H 0 : Laakerinkuulien halkaisijan keskiarvo on 2,30 mm H 1 : Laakerinkuulien halkaisijan keskiarvo on eri kuin 2,30 mm H 0 : Ydinvoiman kannattajien osuus on 50 % H 1 : Ydinvoiman kannattajien osuus suurempi kuin 50 % H 0 : Miehet ja naiset tekevät keskimäärin yhtä paljon ylitöitä H 1 : Miehet ja naiset eivät tee yhtä paljon ylitöitä H 0 : Korkotason ja kullan hinnan välillä ei ole riippuvuutta H 1 : Korkotason ja kullan hinnan välillä on riippuvuus 20

2-suuntainen vai 1-suuntainen testi Testi on 2-suuntainen, jollei ole erityistä syytä 1- suuntaisuuteen 2-suuntaisessa tutkija on kiinnostunut poikkeamasta kumpaan tahansa suuntaan nollahypoteesista Tämä näkyy vaihtoehtoisessa hypoteesissa, joka on muotoa erisuuri kuin 1-suuntaisessa tutkijaa kiinnostaa ainoastaan poikkeama tiettyyn suuntaan nollahypoteesista Tämä näkyy vaihtoehtoisessa hypoteesissa, joka on muotoa pienempi kuin tai muotoa suurempi kuin 21

Hypoteesin testauksen ajatuskulku Perusjoukko J J J J J J J Vallitsevan käsityksen mukaan tuon joukon keskiarvoikä on 50 vuotta (nollahypoteesi). Hylkää nollahypoteesi! Otoshan osoittaa jotain aivan muuta. Otos Keskiarvo=45 J J 22

Erehtymisriski Syytön kunnes toisin osoitetaan Nollahypoteesi totta kunnes toisin osoitetaan Joskus käy niin, että syytön tuomitaan Hypoteesin testauksessakin saatetaan todeta nollahypoteesi vääräksi, vaikkei se oikeasti olekaan väärä (otantavirheestä seuraava erehtymisriski) 23

Vaihtoehdot Todellinen tilanne Testauksen tulos Nollahypoteesi on totta Nollahypoteesi ei ole totta Nollahypoteesi jää voimaan Nollahypoteesi hylätään Oikea päätös Hylkäämisvirhe Hyväksymisvirhe Oikea päätös Nollahypoteesi on perusolettamus ja se on syytä jättää voimaan ellei ole riittäviä todisteita sitä vastaan Hylkäämisvirhettä pidetään vakavana virheenä Hylkäämisvirheen todennäköisyyttä kutsutaan p-arvoksi 24

Hylkäämisvirheen todennäköisyys eli p-arvo Nollahypoteesi hylätään vain jos p-arvo on riittävän pieni Yleensä rajana käytetään 0,05 (5 %) P-arvo on aina ilmoitettava päättelyn perusteluna Toinen tapa tulkita p-arvo: p-arvo on todennäköisyys sille, että havaittu poikkeama nollahypoteesista on sattuman (otantavirheen) aiheuttama 25

Testauksen kulku 1. Muotoile nollahypoteesi ja vaihtoehtoinen hypoteesi 2. Kerää havainnot (satunnaisesti valittu otos!) 3. Laske hylkäämisvirheen todennäköisyys eli p- arvo 4. Päättelysääntö: Hylkää nollahypoteesi, jos p- arvo on pienempi kuin 0,05 (5 %). Muussa tapauksessa nollahypoteesi jää voimaan. Ilmoita p-arvo perusteluna 26

Testejä eri tarkoituksiin 1. Yhtä muuttujaa koskevia testejä 2. Kahden ryhmän vertailuun tarkoitettuja testejä 3. Useamman ryhmän vertailuun tarkoitettuja testejä (ei käsitellä tällä kurssilla) 4. Riippuvuuden testaamiseen tarkoitettuja testejä 27

Yhtä muuttujaa koskevia testejä Keskiarvo Prosenttiluku

Keskiarvon testaus Pullotuskoneen pitäisi pullottaa 1/3 litran pulloja Nollahypoteesi: Pullojen sisällön keskiarvo 1/3 litraa Vaihtoehtoinen hypoteesi: Pullojen sisällön keskiarvo eri suuri kuin 1/3 litraa 15 pullon otos antaa keskiarvoksi 0,3420 litraa ja keskihajonnaksi 0,0115 litraa Kaksisuuntaisen t-testin p-arvoksi saadaan noin 0,011 Nollahypoteesi hylätään, koska p-arvo alle 0,05 29

Prosenttiluvun testaus Puolueen kannatus oli aiemmin 22,8 % Nollahypoteesi: Puolueen kannatus on 22,8 % Vaihtoehtoinen hypoteesi: Puolueen kannatus on laskenut aiemmasta (pienempi kuin 22,8 %) Satunnaisesti valitussa 800 henkilön otoksessa puolueen kannattajia oli 166 Yksisuuntaisen testin p-arvoksi saadaan 0,076 Nollahypoteesi jää voimaan, koska p-arvo yli 0,05 30

Kahden ryhmän vertailu Kahden riippumattoman otoksen t-testi Kahden riippuvan otoksen t-testi

Kahden riippumattoman otoksen t-testi Lamppujen valmistaja valmistaa samantyyppisiä lamppuja kahdella eri menetelmällä Nollahypoteesi: Kestoiän keskiarvo on sama molemmissa menetelmissä Vaihtoehtoinen hypoteesi: Kestoiän keskiarvot ovat erisuuret eri menetelmissä 40 lampun otos kummastakin menetelmästä Kaksisuuntaisen t-testin p-arvoksi saadaan 0,006 Nollahypoteesi hylätään, koska p-arvo alle 0,05 32

Kahden riippuvan otoksen t-testi Testattiin erityisruokavalion vaikutusta painoon Nollahypoteesi: Keskiarvoissa ei eroa Vaihtoehtoinen hypoteesi: Keskiarvo ruokavalion jälkeen pienempi 16 koehenkilön otoksesta saadaan yksisuuntaisen testin p-arvoksi 0,000 Nollahypoteesi hylätään, koska p-arvo alle 0,05 33

Riippuvuuden testaaminen Korrelaatiokertoimen testaus Khiin neliö -riippumattomuustesti

Korrelaatiokertoimen testaus Nollahypoteesi: Asiakkaiden mielikuva toimitusnopeudesta ei ole yhteydessä asiakkaan yleiseen tyytyväisyyteen Vaihtoehtoinen hypoteesi: Asiakkaan mielikuva toimitusnopeudesta on positiivisessa yhteydessä yleiseen tyytyväisyyteen Kysely suoritettiin 100 asiakkaalle Korrelaatiokerroin 0,65 Yksisuuntaisen testin p-arvo 0,000 Nollahypoteesi hylätään, koska p-arvo alle 0,05 35

Khiin neliö -riippumattomuustesti Nollahypoteesi: Sukupuolen ja tyytyväisyyden välillä ei ole riippuvuutta Vaihtoehtoinen hypoteesi: Sukupuolen ja tyytyväisyyden välillä on riippuvuutta Työntekijöistä otettiin satunnainen otos ja suoritettiin kyselytutkimus. Kyselyssä selvitettiin vastaajan sukupuoli ja tyytyväisyys johtoon Khiin neliö -testin p-arvo on 0,017 Nollahypoteesi hylätään, koska p-arvo alle 0,05 36

Tiekartta Tarkoitus Yhtä muuttujaa koskeva päättely Määrällinen Keskiarvon luottamusväli Keskiarvon testaus Muuttujan mitta-asteikko Kategorinen Prosenttiluvun luottamusväli Prosenttiluvun testaus Kahden ryhmän vertailu Kahden muuttujan välinen riippuvuus Kaksi riippumatonta otosta: -Riippumattomien otosten t-testi Kaksi riippuvaa otosta: -Riippuvien otosten t-testi Korrelaatiokertoimen testaus Khiin neliö riippumattomuustesti Khiin neliö - riippumattomuustesti Yllä mainittujen lisäksi on olemassa monia muita testejä. 37