11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot

Samankaltaiset tiedostot
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

11.1 Nollahypoteesi, vastahypoteesi ja p-arvo

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Bayesläiset tilastolliset mallit

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujan odotusarvo ja laskusäännöt

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Väliestimointi (jatkoa) Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Satunnaismuuttujien summa ja keskiarvo

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujan odotusarvo ja laskusäännöt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien summa ja keskiarvo

Liite B. Suomi englanti-sanasto

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Harjoitus 7: NCSS - Tilastollinen analyysi

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Keskihajonta ja korrelaatio

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

30A02000 Tilastotieteen perusteet

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden käsite ja laskusäännöt

031021P Tilastomatematiikka (5 op) viikko 5

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Todennäköisyyden ominaisuuksia

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen aineisto Luottamusväli

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Estimointi. Vilkkumaa / Kuusinen 1

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 2: Matlab - Statistical Toolbox

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Satunnaismuuttujat ja jakaumat

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testejä suhdeasteikollisille muuttujille

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

Osa 2: Otokset, otosjakaumat ja estimointi

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Sovellettu todennäköisyyslaskenta B

,ܾ jaü on annettu niin voidaan hakea funktion

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

1. Tilastollinen malli??

Mat Sovellettu todennäköisyyslasku A

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Tilastolliset luottamusvälit

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

6. laskuharjoitusten vastaukset (viikot 10 11)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Testit laatueroasteikollisille muuttujille

riippumattomia ja noudattavat samaa jakaumaa.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

tilastotieteen kertaus

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

805306A Johdatus monimuuttujamenetelmiin, 5 op

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Stokastiikka ja tilastollinen ajattelu

Transkriptio:

Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 17. lokakuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot Datalähteen tuottamia arvoja mallinnetaan jakaumaa f(x θ) noudattavina satunnaismuuttujina, missä parametri θ on tuntematon. Tilastollisen estimoinnin tavoitteena on havaitun datajoukon (x 1,..., x n ) pohjalta määrittää parametrille paras arvaus joko piste-estimaattina tai väliestimaattina. Monissa käytännön tilanteissa pelkkä estimaatin määrittäminen ei riitä, vaan havaintojen pohjalta täytyy tehdä johtopäätös, pitääkö jokin parametria θ koskeva oletus paikkaansa vai ei. Tilastollinen testi on systemaattinen menetelmä laatia tämän tyyppisiä johtopäätöksiä. Tilastollisen testin lähtökohtana on nollahypoteesi H 0, joka kuvastaa datalähteen oletusarvoista käyttäytymistä. Stokastisen mallin avulla voidaan ennustaa, millaisia arvoja nollahypoteesin mukainen datalähde todennäköisesti tuottaa. Satunnaisvaihtelun takia havaitut arvot (x 1,..., x n ) aina poikkeavat jonkun verran ennusteesta. Jos nollahypoteesi pitää paikkansa, tulisi suurten poikkeamien kuitenkin olla harvinaisia. Mikäli havaitut poikkeamat ovat suuria, antaa tämä aihetta nollahypoteesin hylkäämiseen. Tilastollisessa testissä on myös tapana määritellä vastahypoteesi H 1. Yleensä vastahypoteesi on nollahypoteesin vastakohta. Joissain tilanteissa voidaan vastahypoteesia rajoittamalla rajata testin piiristä pois parametriarvoja, joista ei olla kiinnostuneita. Esimerkki 11.1 (Kolikko). Tasaiseksi väitettyä kolikkoa 50 kertaa heitettäessä saadaan heittosarja, joka sisältää 42 kruunaa. Kuuluuko havaittu tulos tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä kolikon tasaisuutta? 115

Koetilannetta vastaavan datalähteen tuottamia arvoja voidaan mallintaa binomijakaumaa Bin(50, θ) noudattavina satunnaismuuttujina, jolloin nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : θ = 0.5, H 1 : θ 0.5. Esimerkki 11.2 (Tiedonsiirtokanava). Kun tiedonsiirtokanavan yli lähetetään lukuarvoinen signaali µ, niin kohinan takia vastaanottaja havaitsee arvon X, joka noudattaa normaalijakaumaa odotusarvona µ ja keskihajontana 3. Eräänä päivänä lähettäjän uskotaan lähettävän arvon µ = 8. Kun vastaanotettu arvo on x 1 = 12.8, onko syytä epäillä, että lähetetyn signaalin arvo ei ollutkaan 8? Datalähteen tuottamia arvoja voidaan mallintaa normaalijakautuneina satunnaismuuttujina odotusarvona µ (tuntematon) ja keskihajontana 3. Nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : µ = 8, H 1 : µ 8. Esimerkki 11.3 (Laadunvalvonta). Tukkukauppias väittää, että sen toimittamista tomaateista enintään 5% on huonolaatuisia. Suuresta tilauserästä poimittiin satunnaisesti 50 tomaattia ja niistä 4 todettiin huonolaatuisiksi. Kuuluuko tehty havainto tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä tukkukauppiaan väitettä? Esimerkkien 11.1 ja 11.2 nollahypoteeseja kutsutaan yksinkertaisiksi, sillä ne määrittävät datalähteen jakauman yksiselitteisesti. Esimerkin 11.3 nollahypoteesi on yhdistetty, sillä se sisältää monta mahdollista parametrin arvoa. 11.2 Tilastollinen merkitsevyys ja p-arvo Ylläolevissa esimerkeissä datalähteestä tehdyt havainnot vaikuttivat poikkeavan nollahypoteesia vastaavista tyypillisistä arvoista. Havaitun datajoukon poikkeuksellisuutta voidaan analysoida laskemalla testisuure t(x) = t(x 1,..., x n ) käyttämällä funktiota t(x), joka sopivalla tavalla tiivistää havaitut datapisteet yhdeksi reaaliluvuksi. Tilastollisen testin p-arvo on todennäköisyys, jolla nollahypoteesin mukaisen datalähteen ennustetaan tuottavan poikkeavampia tai yhtä poikkeavia testisuureen arvoja kuin t(x). Mikäli p-arvo on lähellä nollaa, johtuu havaittu poikkeama hyvin epätodennäköisesti satunnaisvaihtelusta ja antaa aiheen epäillä nollahypoteesin pitävyyttä. Tällaista poikkeamaa kutsutaan tilastollisesti merkitseväksi. Useimmissa sovelluskonteksteissa voidaan p-arvojen kokoa luonnehtia seuraavien nyrkkisääntöjen avulla: p-arvo Tulkinta > 0.10 Havainto ei ole ristiriidassa H 0 :n kanssa 0.05 Havainto todistaa jonkun verran H 0 :aa vastaan < 0.01 Havainto todistaa vahvasti H 0 :aa vastaan 116

Esimerkki 11.4 (Kolikko). Tasaiseksi väitettyä kolikkoa 50 kertaa heitettäessä saadaan heittosarja, joka sisältää 42 kruunaa. Kuuluuko havaittu tulos tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä kolikon tasaisuutta? Datalähteen tuottamia testisuureen arvoja voidaan mallintaa binomijakaumaa Bin(50, θ) noudattavina satunnaismuuttujana T, jolloin nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : θ = 0.5, H 1 : θ 0.5. Nollahypoteesin vallitessa noudattaa kruunien lukumäärä T binomijakaumaa tiheysfunktiona ( ) ( ) t ( 50 1 f(t H 0 ) = 1 1 50 t, t = 0, 1,..., 50, t 2 2) ja odotusarvona 25. Havaittu testisuureen arvo poikkeaa odotusarvosta 17 yksikköä. Näin suuren tai vielä suuremman poikkeaman todennäköisyys on nollahypoteesin vallitessa P( T 25 17 H 0 ) = 8 50 f(t H 0 ) + f(t H 0 ) 1.2 10 6. t=0 Havaitun testisuureen p-arvo on siis suuruusluokkaa yksi miljoonasta, mikä antaa vahvan perusteen epäillä kolikon tasaisuutta ja hylätä nollahypoteesi. Esimerkki 11.5 (Tiedonsiirtokanava). Kun tiedonsiirtokanavan yli lähetetään lukuarvoinen signaali µ, niin kohinan takia vastaanottaja havaitsee arvon X, joka noudattaa normaalijakaumaa odotusarvona µ ja keskihajontana 3. Eräänä päivänä lähettäjän uskotaan lähettävän arvon µ = 8. Kun vastaanotettu arvo on x 1 = 12.8, onko syytä epäillä, että lähetetyn signaalin arvo ei ollutkaan 8? Vastaanotettua signaalia voidaan mallintaa normaalijakautuneina satunnaismuuttujana odotusarvona µ (tuntematon) ja keskihajontana 3. Nollahypoteesi ja vastahypoteesi voidaan esittää muodossa t=42 H 0 : µ = 8, H 1 : µ 8. Valitaan testisuureeksi keskihajonnalla normitettu poikkeama t(x) = x 8 3 = 1.6. Tällöin testisuureen arvoja mallintava satunnaismuuttuja T = t(x) noudattaa nollahypoteesin vallitessa normitettua normaalijakaumaa. Todennäköisyys, että nollahypoteesin vallitessa T poikkeaa odotusarvostaan 1.6 yksikköä tai enemmän, saadaan symmetrian perusteella normaalijakauman taulukoista P( T 1.6 H 0 ) = 2P(T 1.6 H 0 ) = 2(1 P(T 1.6 H 0 )) 0.11, Havaitun testisuureen p-arvo on siis noin 11%, joten havaittu poikkeama on selitettävissä tavanomaisella satunnaisvaihtelulla. Vastaanotettu signaalin arvo ei tarjoa syytä epäillä H 0 :n paikkansapitävyyttä. 117

11.3 Yhdistetty nollahypoteesi Seuraava esimerkki edustaa yhdistettyä nollahypoteesia, joka vaatii huolellisempaa analyysiä, sillä siinä nollahypoteesi ei yksiselitteisesti määritä datalähteen stokastisen mallin jakaumaa. Lisäksi poikkeavien arvojen määrittämisessä pitää ottaa huomioon, poikkeaako havaittu testisuureen arvo ylöspäin vai alaspäin tyypillisestä arvosta. Esimerkki 11.6 (Laadunvalvonta). Tukkukauppias väittää, että sen toimittamista tomaateista enintään 5% on huonolaatuisia. Suuresta tilauserästä poimittiin satunnaisesti 50 tomaattia ja niistä 4 todettiin huonolaatuisiksi. Valitaan testisuureeksi huonolaatuisten tomaattien lukumäärä t(x) = 4. Koska tarkastetut 50 tomaattia on poimittu satunnaisotannalla suuresta populaatiosta, noudattaa testisuureen arvoja mallintava satunnaismuuttuja T suurella tarkkuudella binomijakaumaa tiheysfunktiona f θ (t) = ( 50 t ) θ t (1 θ) 50 t, t = 0, 1,..., 50, missä θ on huonolaatuisten tomaattien osuus koko tilauserässä. Tutkittavaa väitettä kuvaava nollahypoteesi ja vastahypoteesi voidaan nyt esittää muodossa H 0 : θ 0.05, H 1 : θ > 0.05. Tällaisen yksisuuntaisen nollahypoteesin näkökulmasta poikkeavat havainnot ovat niitä, missä testisuureen arvo ylittää odotusarvonsa. Todennäköisyys, että nollahypoteesiä noudattava datalähde tuottaa havaittua testisuureen arvoa poikkeavampia tai yhtä poikkeavia testisuureen arvoja on siis ( ) P θ T E θ (T ) t(x) E θ (T ) = P θ (T 4) = 50 t=4 f θ (t). Ongelmana on, että tässä tapauksessa nollahypoteesi ei suoraan määritä datalähteen eikä sitä vastaavan testisuureen jakaumaa. Tällaisessa tilanteessa p-arvo määritellään kaavalla p-arvo = max P θ(t t(x)). θ 0.05 Koska ylläoleva todennäköisyys maksimoituu 1 arvolla θ = 0.05, saadaan p- arvoksi 50 50 ( ) 50 p-arvo = f 0.05 (t) = 0.05 t (1 0.50) 50 t 0.24, t t=4 mikä ei anna aihetta epäillä nollahypoteesin paikkansapitävyyttä. t=4 1 Yläraja voidaan perustella niin, että tulkitaan T kruunien lukumääräksi 50 kolikon heittosarjassa, jossa kruunan todennäköisyys on θ. Kun kruunan todennäköisyys kasvaa, kasvaa myös todennäköisyys että havaittujen kruunien lukumäärä ylittää kynnysarvon 4. 118

11.4 Testausvirheet Tietyissä tilanteissa vaaditaan testaajalta yksiselitteistä johtopäätöstä: testin pohjalta H 0 joko hyväksytään tai hylätään. Johtopäätöksen pohjaksi valitaan testin merkitsevyystaso α (0, 1) ja johtopäätös muodostetaan seuraavasti: Jos p-arvo α, nollahypoteesi hyväksytään (jätetään voimaan), Jos p-arvo < α, nollahypoteesi hylätään. Näin menetellessä mikään ei takaa, että tehty johtopäätös olisi oikea. Esimerkin 11.4 kolikonheitossa havaittiin 42 kruunaa p-arvona 10 6, joten nollahypoteesi (tasainen kolikko) hylätään merkitsevyystasolla α = 0.01. On kuitenkin periaatteessa mahdollista, että tasaisella kolikolla satuttiin tekemään äärimmäisen epätodennäköinen 42 kruunan heittosarja. Tällöin tehdään hylkäysvirhe. Esimerkin 11.5 tiedonsiirtokanavassa havaittiin virheen arvoksi 10.8 p- arvona 11%, joten nollahypoteesi (normaalijakautuneet arvot odotusarvona 0 ja keskihajontana 3) hyväksytään merkitsevyystasolla α = 0.01. On kuitenkin mahdollista, että havaittu virhe onkin mitattu kanavasta, jossa kohinan aiheuttamat virheet noudattavat normaalijakaumaa esim. odotusarvona 2 ja keskihajontana 3. Tällöin tehdään hyväksymisvirhe. Eri tavat tehdä oikea tai virheellinen johtopäätös voidaan taulukoida seuraavasti: Johtopäätös Totuus H 0 hyväksytään H 0 hylätään H 0 tosi Oikea päätös Hylkäysvirhe H 0 epätosi Hyväksymisvirhe Oikea päätös Seuraava keskeinen tulos (lause 11.7) takaa, että hylkäysvirheen todennäköisyys voidaan säätää pieneksi asettamalla riittävän pieni merkitsevyystaso. Tuloksen todistus (luku 11.6) yleisessä muodossa sisältää reaalianalyysin yksityiskohtia, jotka eivät ole tilastollisen päättelyn kannalta keskeisiä. Lause 11.7. Tilastollisen testin hylkäysvirheen todennäköisyys on korkeintaan testin merkitsevyystaso α. Hyväksymisvirheen todennäköisyyttä sen sijaan on yleisesti vaikea kontrolloida. Tästä syystä nollahypoteesi on syytä muotoilla niin, että se vastaa yleistä vallalla olevaa käsitystä tutkittavasta asiasta, tai niin että virheellisen nollahypoteesin hyväksymisellä ei ole vakavia seuraamuksia. 119

Esimerkki 11.8 (Rikosoikeus). Yksityishenkilön epäiltyä rikosta koskevassa oikeudenkäynnissä tulee päättää, onko syytetty henkilö syytön vai syyllinen saatavilla olevan datan perusteella. Tällöin nollahypoteesi voidaan esittää joko muodossa H 0 : Epäilty henkilö on syytön tai muodossa H 0: Epäilty henkilö on syyllinen Nollahypoteesiä H 0 vastaava hyväksymisvirhe vastaa syyllisen henkilön tuomitsematta jättämistä ja hylkäysvirhe syyttömän henkilön tuomitsemista. Hylkäysvirheen todennäköisyys saadaan lauseen 11.7 perusteella pieneksi valitsemalla testille riittävän pieni merkitsevyystaso. Hyväksymisvirheen todennäköisyyttä on sen sijaan vaikeampi kontrolloida. Jos nollahypoteesiksi valittaisiinkin H 0, niin tilastollisessa testissä ei syyttömien henkilöiden tuomitsemisen (H 0:n hyväksymisvirhe) riskiä voisi kunnolla kontrolloida, mikä olisi ristiriidassa yleisen oikeusperiaatteen kanssa. Esimerkki 11.9 (Tupakkatuote). Jos halutaan tutkia uudentyyppisen tupakkatuotteen vaikutusta terveyteen, voidaan nollahypoteesi esittää joko muodossa H 0 : Uudella tupakkatuotteella ei ole terveyttä edistäviä vaikutuksia tai muodossa H 0: Uudella tupakkatuotteella on terveyttä edistäviä vaikutuksia Nollahypoteesiä H 0 vastaavan hyväksymisvirheen tekeminen olisi tupakkatuotteen valmistajan kannalta haitallista, mutta hyväksymisvirheen yhteiskunnalliset vaikutukset eivät luultavasti olisi suuria. Nollahypoteesin H 0 hylkäysvirheellä saattaisi olla yhteiskunnalle hyvinkin haitalliset seuraukset. Hylkäysvirheen todennäköisyys saadaan lauseen 11.7 perusteella pieneksi valitsemalla testille riittävän pieni merkitsevyystaso. Jos nollahypoteesiksi valittaisiinkin H 0, niin merkitsevyystasoa pieneksi säätämällä voitaisiin kontrolloida tupakkavalmistajan epäreilun kohtelun (H 0:n hylkäysvirhe) riskiä, mutta ei yhteiskunnallisten terveyshaittojen (H 0:n hyväksymisvirhe) riskiä. Henkilö A, joka elämänsä aikana tekee suuren määrän hypoteesitestejä merkitsevyystasolla α = 5% on henkisesti varautunut siihen, että tietty osuus testien johtopäätöksistä on virheellisiä. Hän myös tietää, että pitkällä tähtäyksellä hänen hylkäämistään nollahypoteeseista enintään 5% on virheellisesti hylätty. (Hän ei kuitenkaan tiedä mitkä niistä.) 120

Henkilö B, joka tekee elämänsä aikana suuren määrän hypoteesitestejä merkitsevyystasolla α = 1% on myös varautunut siihen, että tietty osuus testipäätelmistä on virheellisiä. Hän tietää, että hänen hylkäämistään nollahypoteeseista enintään 1% on virheellisesti hylätty. Lisäksi hän tietää, että hänen hyväksymistään nollahypoteeseista on suurempi osuus virheellisiä kuin henkilöllä A. Henkilö B on taipuvaisempi harvemmin hylkäämään nollahypoteeseja, minkä johdosta hän tekee pitkällä tähtäyksellä harvemmin hylkäysvirheitä mutta useammin hyväksymisvirheitä. Esimerkki 11.10 (Tuntematon kolikko). Tasaiseksi väitettyä kolikkoa 10 kertaa heitettäessä (0=klaava, 1=kruuna) havaitaan data y = (0, 0, 1, 0, 0, 0, 0, 0, 0, 0). Testaa väitteen paikkansapitävyyttä 5% merkitsevyystasolla ja analysoi hylkäysja hyväksymisvirheiden todennäköisyyksiä. Testin nollahypoteesi ja vastahypoteesi ovat H 0 : θ = 0.5, H 1 : θ 0.5, missä θ on kruunan todennäköisyys. Valitaan testisuureeksi kruunien lukumäärä t(x) = x 1 + + x 10. Datalähteen tuottamia testisuureen arvoja mallintava satunnaismuuttuja t(x) noudattaa nollahypoteesin vallitessa binomijakaumaa tiheysfunktiona f H0 (t) = ( 10 t ) ( 1 2 ) t ( 1 1 2) 10 t, t = 0, 1,..., 10, ja odotusarvona 5. Havaittu testisuureen arvo t(y) = 1 poikkeaa odotusarvosta 4 yksikköä. Näin ollen p-arvoksi saadaan p(y) = P( t(x) 5 4 H 0 ) = 1 10 f H0 (t) + f H0 (t) 2.1%. Koska havaittu p-arvo alittaa valitun merkitsevyystason 5%, nollahypoteesi hylätään. Testausvirheiden analysoimiseksi määritetään ensiksi testin hylkäysalue eli nollahypoteesin hylkäämiseen johtavien testisuureen arvojen joukko. Toistamalla ylläolevat laskelmat eri testisuureen arvoille voidaan testin mahdolliset p- arvot taulukoida seuraavasti: Kruunien lkm 0 1 2 3 4 5 6 7 8 9 10 p-arvo (%) 0.2 2.1 10.9 34.4 75.4 100 75.4 34.4 10.9 2.1 0.2 Taulukon mukaan testin hylkäysalue 5% merkitsevyystasolla on joukko {0, 1, 9, 10}. Hylkäysvirheen todennäköisyys on siis t=0 k=9 P(t(X) {0, 1, 9, 10} H 0 ) = 1 10 f H0 (t) + f H0 (t) 2.1%. t=0 t=9 121

Hyväksymisvirheen todennäköisyyttä on hankalampi analysoida, sillä vastahypoteesi θ 0.5 ei yksiselitteisesti määritä datalähteen jakaumaa. Periaatteessa vastahypoteesin vallitessa voi kruunan todennäköisyys θ olla mielivaltaisen lähellä arvoa 0.5. Ääritilanteessa, jossa θ on hyvin lähellä arvoa 0.5, saadaan hyväksymisvirheen todennäköisyydeksi P( t(x) {2,..., 8} H 1 ) P( t(x) {2,..., 8} H 0 ) = 8 f H0 (t) 97.9%. Mikäli vastahypoteesi pitää paikkansa parametrin arvolla θ 0.5, testi päätyy siis virheellisesti hyväksymään nollahypoteesin hyvin suurella todennäköisyydellä. Esimerkki 11.11 (Kaksi kolikkoa). Tasaiseksi väitettyä kolikkoa 10 kertaa heitettäessä (0=klaava, 1=kruuna) havaitaan data y = (0, 0, 1, 0, 0, 0, 0, 0, 0, 0). Varmuudella tiedetään, että heitetylle kolikolle on kruunan todennäköisyys joko 0.5 tai 0.9. Testaa väitteen paikkansapitävyyttä 5% merkitsevyystasolla ja analysoi hylkäys- ja hyväksymisvirheiden todennäköisyyttä. Nollahypoteesi ja vastahypoteesi ovat H 0 : Kruunan tn θ = 0.5, H 1 : Kruunan tn θ = 0.9, ja testisuureeksi valitaan kruunien lukumäärä. Testin p-arvot, hylkäysalue ja hyväksymisalue ovat samat kuin esimerkissä 11.10, samoin havainnon y p-arvo 2.1%. Nollahypoteesi hylätään merkitsevyystasolla 5% havainnon y pohjalta. Hylkäysvirheen todennäköisyys on myös sama kuin esimerkissä 11.10 eli noin 2.1%. Vastahypoteesin vallitessa datalähteen tuottamia testisuureen arvoja mallintava satunnaismuuttuja t(x) noudattaa binomijakaumaa pistetodennäköisyysfunktiona ( ) 10 f H1 (t) = 0.9 t (1 0.9) 10 t, t = 0, 1,..., 10. t Hyväksymisvirheen todennäköisyys saadaan nyt kaavasta P( t(x) {2, 3,..., 8} H 1 ) = 8 t=2 t=2 ( ) 10 f H1 (t) 26%. t 11.5 Odotusarvon testi suurelle datajoukolle Tarkastellaan datalähdettä, jonka oletetaan tuottavan toisistaan riippumattomia ja samoin jakautuneita satunnaislukuja X 1, X 2,... odotusarvona µ ja keskihajontana σ > 0. Satunnaislukujen jakauma on tuntematon, jolloin myös µ ja σ ovat tuntemattomia. Halutaan testata nollahypoteesia H 0 : µ = µ 0, 122

missä µ 0 on oletettu odotusarvoparametrin µ arvo. Mikäli datalähteen arvojen jakaumasta ei tiedetä mitään, vaikuttaa mahdottomalta laatia toimivaa testiä ylläolevalle hypoteesille. Jos datalähteestä on saatu kerättyä suuri määrä dataa, voidaan toimiva testi kuitenkin muodostaa. Havaitusta suuresta datajoukosta x = (x 1,..., x n ) lasketaan ensiksi keskiarvo ja otoskeskihajonta kaavoilla m(x) = 1 n n x i ja s(x) = i=1 ( 1 n 1 1/2 n (x i m(x)) )) 2, ja sen jälkeen testisuureeksi määritellään datajoukon keskiarvon normitettu poikkeama väitetystä odotusarvosta t(x) = m(x) µ 0 s(x)/ n. Allaolevan tuloksen perusteella testin p-arvo suurilla n:n arvoilla on likimain i=1 P( t(x) t(x) H 0 ) P(Z t(x) ), missä Z noudattaa normitettua normaalijakaumaa. Testisuureen likiarvoiseksi p-arvoksi saadaan siis p(x) 2(1 Φ( t(x) ), missä Φ(t) on normitetun normaalijakauman kertymäfunktio. Fakta 11.12. Yllä kuvatun datalähteen tuottamia testisuureen arvoja mallintavan satunnaismuuttujan t(x) jakauma suppenee nollahypoteesin vallitessa kohti normitettua normaalijakaumaa, kun n. Todistus. Keskeisen raja-arvolauseen seurauksena todellisella keskihajontaparametrilla normitettu keskiarvon poikkeama m(x) µ 0 σ/ n on jakaumaltaan lähellä normitettua normaalijakaumaa. Suurten lukujen lakia soveltamalla satunnaislukuihin X 2 1, X 2 2,... voidaan lisäksi perustella, että nollahypoteesin vallitessa σ s(x) 1 suurella todennäköisyydellä, kun n. Väite seuraa näistä havainnosta käyttämällä nk. Slutskyn lemmaa [van der Vaart, 1998]. Esimerkki 11.13 (Kahviautomaatti). Kahviautomaatin on tarkoitus laskea jokaiseen kuppiin keskimäärin 10.0 cl kahvia. Laitteen toimintaa testattiin valuttamalla automaatista 30 kupillista ja mittaamalla kahvin määrät kupeissa. Mittauksessa havaittiin arvot (cl): 123

11.05 9.65 10.93 9.46 10.27 10.02 10.07 10.74 11.15 10.40 10.12 11.20 10.07 10.27 9.99 9.80 10.83 10.21 11.26 10.11 10.49 10.10 10.15 11.02 10.00 11.68 10.51 11.20 11.29 10.15 Onko kahviautomaatti oikein kalibroitu? Merkitään kahviautomaatin tuottamien kahvikupillisten keskiarvoa parametrilla µ (tuntematon) ja väitettyä keskiarvoa µ 0. Kysymys voidaan tulkita tilastollisena testinä, jossa nollahypoteesi ja vastahypoteesi ovat H 0 : µ = 10.0 H 1 : µ 10.0 Mittausdatan x keskiarvo on m(x) = 10.473 ja keskihajonta s(x) = 0.563. Havaitun datajoukon normitettu poikkeama on näin ollen t(x) = m(x) µ 0 s(x)/ n = 10.473 10.0 0.563/ 30 = 4.60. Koska n = 30 on kohtalaisen suuri luku, sovelletaan suuren datajoukon likiarvoista testiä, jolloin p-arvoksi saadaan p-arvo P( t(x) t(x) H 0 ) P( Z 4.60) 4.2 10 6. Näin pieni p-arvo puoltaa H 0 :n hylkäämistä, joten esim. yleisesti käytetyllä merkitsevyystasoilla 1% voidaan todeta, että kahviautomaatti on väärin kalibroitu. 11.6 Hylkäysvirheen todennäköisyyden analyysi Lauseen 11.7 todistuksen pohjaksi perustellaan ensiksi seuraava aputulos. Lemma 11.14. Jos S α = {s R : P(Z s) α} on niiden arvojen joukko, joita reaaliarvoinen satunnaismuuttuja Z saa enintään todennäköisyydellä α (0, 1), niin P(Z S α ) α. Todistus. Koska todennäköisyyden monotonisuuden perusteella funktio s P(Z s) on vähenevä, voidaan päätellä, että joukko S α on lukuväli muotoa [s α, ) tai (s α, ), missä luku s α on joukon S α suurin alaraja. (i) Tapauksessa S α = [s α, ) luku s α sisältyy joukkoon S α, joten joukon S α määritelmän mukaan P(Z S α ) = P(Z s α ) α. (ii) Tapauksessa S α = (s α, ) tehdään vastaoletus, että P(Z S α ) > α. Tällöin P(Z > s α ) > α. Todennäköisyyden jatkuvuuden perusteella tiedetään, että P(Z > s α ) = lim s sα P(Z s). Näin ollen P(Z s) > α jollain s > s α. Tästä seuraa että luku s ei kuulu joukkoon S α, joten s on kyseisen joukon alaraja. Tämä on looginen ristiriita, sillä s α määriteltiin joukon S α suurimmaksi alarajaksi. Vastaoletus on siis epätosi, ja pätee P(Z S α ) α. 124

Lauseen 11.7 todistus. Merkitään satunnaismuuttujalla T = t(x) nollahypoteesin mukaisen datalähteen tuottamasta datajoukosta laskettua testisuureen arvoa ennen datan havaitsemista. Olkoon t 0 = E H0 (T ) kyseisen testisuureen odotusarvo. Tällöin nollahypoteesi havaitulle datajoukolle x hylätään täsmälleen silloin, kun sitä vastaavan testisuureen poikkeama t(x) t 0 sisältyy joukkoon { } S α = s R : P H0 ( T t 0 s) < α. Merkitsemällä joukon S α sulkeumaa { } S α = s R : P H0 ( T t 0 s) α saadaan hylkäysvirheelle yläraja P H0 (H 0 hylätään) = P H0 ( T t 0 S α ) P H0 ( T t 0 S α ). Soveltamalla lemmaa 11.14 satunnaismuuttujaan T t 0, havaitaan että ylläolevan epäyhtälön oikea puoli on enintään α. 125

Hakemisto Bayesin kaava, 16, 97 Bernoulli-jakauma, 58 betajakauma, 101 binomijakauma, 58 binomikerroin, 19 bitti, 43 Chebyshevin epäyhtälö, 50 eksponenttijakauma, 26 entropia, 43 ergodinen, 46 erotus, 10 esiintyvyysharha, 16 estimaattori, 81 harhaton estimaattori, 82 hylkäysalue, 120 hyperparametri, 103 indikaattorifunktio, 27 jakauma, 22 diskreetti, 24 empiirinen, 71 jatkuva, 24 kertoma, 18 kertymäfunktio, 23 keskihajonta jakauman, 48 satunnaismuuttujan, 48 kombinatoriikka, 17 komplementti, 10 korrelaatio yhteisjakauman, 51 kovarianssi yhteisjakauman, 51 leikkaus, 10 lukumäärä listat, 18 osajoukot, 19 lukumäärä, järjestykset, 18 merkitsevyystaso, 118 mitallinen funktio, 34 joukko, 20 momentti, 42 multinomijakauma, 137 nollahypoteesi, 115 normaalijakauma normitettu, 63 osajoukko, 9 ositus, 9 osituskaava, 15 otoskeskihajonta, 74 otoskorrelaatio, 75 otoskovarianssi, 75 p-arvo, 116 perusjoukko, 8 pistemassafunktio, 24 pistetodennäköisyysfunktio, 24 Poisson-jakauma, 25, 68 posteriorijakauma, 97 priorijakauma, 97 reunajakauma diskreetti, 29 jatkuva, 29 reunatiheysfunktio diskreetti, 29 jatkuva, 29 riippumattomat satunnaismuuttujat, 31 130

tapahtumat, 13 satunnaismuuttuja, 21 diskreetti, 24 sigma-algebra, 20 suppeneminen stokastinen, 37 suurimman uskottavuuden estimaatti, 79 suurten lukujen laki, 37 vahva, 46 jatkuva, 27 tiheysfunktio, 28 tapahtuma, 8 poissulkevat, 9 tasajakauma diskreetti, 25 jatkuva, 25 tiheysfunktio, 24 empiirinen, 71 tilastollinen merkitsevyys, 116 tilastollinen testi, 115 todennäköisyys aksiooma, 11 ehdollinen, 13 frekvenssitulkinta, 39 jakauma, 11 mitta, 11 monotonisuus, 11 summasääntö, 11 tulosääntö, 13 todennäköisyysfunktio, 24 toteuma, 8 tulojoukko, 10 tyhjä joukko, 10 uskottavuusfunktio, 79, 97 logaritminen, 80 varianssi jakauman, 48 satunnaismuuttujan, 48 vastahypoteesi, 115 yhdiste, 10 yhteisjakauma, 26 diskreetti, 27 131

Kirjallisuutta [JP04] Jean Jacod and Philip Protter. Probability Essentials. Springer, second edition, 2004. [Kal02] Olav Kallenberg. Foundations of Modern Probability. Springer, second edition, 2002. [Wil91] David Williams. Probability with Martingales. Cambridge University Press, 1991. 132