MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai oletus, jota halutaan testata. Jotta oletusta voidaan testata tilastollisesti, oletus täytyy pukea tutkittavan perusjoukon ominaisuutta kuvaavaa tilastollista mallia (eli havaintojen todennäköisyysjakaumaa) koskevaksi hypoteesiksi. Esim. Yksinkertainen parametrinen testaus Satunnaismuuttuja X kuvaa jonkin ominaisuuden vaihtelua perusjoukossa Tilastollinen malli: X,, X n ~f(x ; ), tuntematon ypoteesi =, missä jokin parametrin arvo ypoteesi asetetaan koetteelle havaintojen x,, x n todennäköisyysjakaumasta f(x;) sisältämää informaatiota vastaan. Testausasetelmaa koskevat hypoteesit Testausasetelma kiinnitetään tekemällä kolme oletusta: Testausasetelmaa koskevat perusoletukset, joista pidetään kiinni testauksen aikana, muodostavat testin yleisen hypoteesin Oletukset perusjoukosta, käytetystä otantamenetelmästä, (jakaumasta) Testattavaa oletusta kutsutaan nollahypoteesiksi Vaihtoehtoinen hypoteesi on oletus, joka astuu voimaan, jos nollahypoteesi hylätään testissä uomioita: Yleisen hypoteesin oletuksista pidetään kiinni testauksen aikana testi on aina ehdollinen näiden oletusten suhteen. sta pidetään kiinni, elleivät havaintojen sisältämät todisteet sitä vastaan ole kyllin voimakkaita. Tilastollista testiä tehtäessä toivotaan usein, että nollahypoteesi voidaan hylätä ja vaihtoehtoinen hypoteesi hyväksyä (vrt. uusi informaatio tai tietämys) Testisuure Tilastollinen testi perustetaan johonkin sopivaan testisuureeseen (=satunnaismuuttuja), joka mittaa havaintojen ja nolla-hypoteesin yhteensopivuutta. Kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on havaittu, nollahypoteesin pätiessä? Todennäköisyyden laskemiseen tarvitaan testisuureen jakauma Testisuureen normaaliarvo on sen odotusarvo pätiessä Jos havaitusta otoksesta määrätty testisuureen arvo. on lähellä normaaliarvoa, havainnot ovat sopusoinnussa :n kanssa.. poikkeaa merkitsevästi testisuureen normaaliarvosta, havainnot sisältävät todisteita :a vastaan. Testin merkitsevyystaso ja hylkäysalue Testisuureen mahdollisten arvojen joukko jaetaan hylkäysalueeseen ja hyväksymisalueeseen Jos testisuureen havainnoista määrätty arvo joutuu. hylkäysalueelle, nollahypoteesi hylätään. hyväksymisalueelle, nollahypoteesi jätetään voimaan Testin merkitsevyystaso on todennäköisyys sille, että testisuureen havainnoista määrätty arvo joutuu hylkäysalueelle, jos nollahypoteesi pätee. ylkäys- ja hyväksymisalueet määrätään käytännössä kiinnittämällä testin merkitsevyystaso etukäteen =.: Testisuureen arvo (tai testin tulos) on melkein merkitsevä =.: Testisuureen arvo (tai testin tulos) on merkitsevä =.: Testisuureen arvo (tai testin tulos) on erittäin merkitsevä Esim. Ruuvikone (Yhden otoksen t-testi) Tuttu ruuvikone tuottaa ruuveja joiden pituudet vaihtelevat satunnaisesti X i ~N(, ) Toimitusjohtaja epäilee että koneen kalibrointi on pielessä, eli että ruuvien odotettu pituus ei ole enää tavoiteltu cm TJ haluaa sinun selvittävän onko kalibrointi pettänyt Käytät yhden otoksen t-testiä, merkitsevyystasolla % Nolla hypoteesi : = Ruuvien pituuksien luokiteltu Vaihtoehtoinen hypoteesi : frekvenssijakauma 7 Mittaat ruuvin satunnaisotoksen Pituuksien keskiarvo: =.9cm Otoskeskihajonta: = = ) =.8cm Frekvenssi 9.8 9.9..... Pituus (cm)
Esim. Ruuvikone (Yhden otoksen t-testi) t-testin testisuure on satunnaismuuttuja: = / (9) Eli noudattaa Studentin t-jakaumaa vapausastein 9 (olettaen että nollahypoteesi pätee) E(t) = t / (9) t / Mittaa havaittujen ruuvien pituuksien keskiarvon etäisyyttä cm:stä (suhteutettuna keskiarvon keskihajontaan) Koska : itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi ei päde. Kriittiset arvot t / ja +t / saadaan ehdosta Pr(t t / )=/=Pr(t +t / ) Nyt =. t / =t. =. Testin hylkäysalue on (,.)(., +) Esim. Ruuvikone (Yhden otoksen t-testi) Mittaat ruuvin satunnaisotoksen Pituuksien keskiarvo: =.9cm Otoskeskihajonta: = = ) =.8cm Lasketaan testisuureen arvo havainnoista: = / =.9.8/ =.79 osuu hylkäysalueelle, joten nollahypoteesi : =hylätään ja vaihtoehtoinen hypoteesi : astuu voimaan Frekvenssi 7 Ruuvien pituuksien luokiteltu frekvenssijakauma 9. 8 9.9..... Pituus (cm) (9)...9 -.. 7 8 Yhden otoksen t-testi (/) Yleinen hypoteesi : avainnot X,, X n ~N(, ) riippumattomia : Vaihtoehtoinen hypoteesi on yksi seuraavista: : -suuntaiset vaihtoehtoiset hypoteesit : : -suuntainen vaihtoehtoinen hypoteesi =, / missä = on aritmeettinen keskiarvo ja = ) on otoskeskihajonta Yhden otoksen t-testi (/) Jos vaihtoehtoinen hypoteesi on muotoa : >, niin t määrätään niin että Pr(t +t ) = : <, niin -t määrätään niin että Pr(t -t ) = :, niin -t / määrätään niin että Pr(t -t / ) = Pr(t +t / )=/ Vastaavasti hylkäysalue on muotoa: : : : tn ( ) tn ( ) tn ( ) t t t t / / 9 Yhden otoksen t-testi (/) Yhden otoksen t-testin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita. t-testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos havaintojen lukumäärä n on kyllin suuri. Testiä on melko turvallista käyttää, kun havaintojen lukumäärä n > ellei havaintojen jakauma ole kovin vino ja havaintojen joukossa ole poikkeavia havaintoja. Jos havaintojen lukumäärä n > testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille. Virheet testauksessa ylkäysvirhe: nollahypoteesi hylätään, kun se on tosi ylkäysvirheen todennäköisyys on Pr( hylätään on tosi) = Vastaavasti todennäköisyys hyväksyä nollahypoteesi silloin, kun se on tosi, on Pr( hyväksytään on tosi) = Tilastollisessa testauksessa noudatetaan tieteen yleistä varovaisuusperiaatetta: ypoteeseja ei pidä hylätä ilman riittäviä syitä pyritään tekemään mahdollisimman pieneksi (vrt..,.,.). yväksymisvirhe: jätetään voimaan, kun se ei ole tosi Sen todennäköisyys on Pr( jätetään voimaan ei ole tosi) = Todennäköisyyttä Pr( hylätään ei ole tosi) = kutsutaan testin voimakkuudeksi. yvä testi on voimakas ( on suuri), koska silloin hyväksymisvirheen todennäköisyys on pieni
Virheet testauksessa Tilastollisessa testauksessa pyritään ensisijaisesti varomaan ettei nollahypoteesi hylätä silloin, kun se on tosi ylkäysvirhettä kutsutaan usein ensimmäisen lajin virheeksi yväksymisvirhettä kutsutaan toisen lajin virheeksi Testin tulos jää voimaan hylätään pätee Oikea johtopäätös ylkäysvirhe Maailman tila ei päde yväksymisvirhe Oikea johtopäätös Tilastollisen testin suorittaminen (merkitsevyystasolla). Asetetaan testin hypoteesit: Yleinen hypoteesi Testauksen kohteena oleva nollahypoteesi Vaihtoehtoinen hypoteesi. Valitaan testiä varten testisuure Valitaan merkitsevyystaso konstruoidaan vastaavat hylkäys- ja hyväksymisalueet. Poimitaan otos niin, että yleisen hypoteesin oletukset pätevät. Määrätään valitun testisuureen arvo havainnoista.. Tehdään päätös :n hylkäämisestä: Jos testisuureen arvo on hylkäysalueelle, niin hylätään ja hyväksytään Muuten jätetään nollahypoteesi voimaan Testin p-arvo (/) Testin p-arvo on pienin merkitsevyystaso, jolla nollahypoteesi voidaan hylätä Tilastolliset ohjelmistot tulostavat nykyään lähes aina sovellettavan testin p-arvon Esim. Olkoon (yhden otoksen) t-testisuureelle laskettu havainnoista numeerinen arvo t : : : : tn ( ) tn ( ) tn ( ) p p p p p p p t t t t Testin p-arvo (/) Kun p-arvoksi saadaan pieni luku: Tällöin testisuure on saanut arvon, joka kuuluu nolla-hypoteesin pätiessä epätodennäköisten testisuureen arvojen joukkoon. Mitä pienempi on testin p-arvo, sitä vahvempia todisteita havainnot sisältävät nollahypoteesia vastaan ja sitä varmemmin voidaan hylätä Esim. Ruuvikone Testisuureen arvoksi laskimme = / = / =.79 P-arvo on Pr.79 + Pr.79 =. =. (9). -.79.79. Tilastollisen testin suorittaminen (p-arvolla). Asetetaan testin hypoteesit: Yleinen hypoteesi Testauksen kohteena oleva nollahypoteesi Vaihtoehtoinen hypoteesi. Valitaan testiä varten testisuure. Poimitaan otos niin, että yleisen hypoteesin oletukset pätevät.. Määrätään valitun testisuureen arvo havainnoista ja lasketaan sen p-arvo. Tehdään päätös :n hylkäämisestä: Jos testin p-arvo on kyllin pieni, hylätään nollahypoteesi ja hyväksytään vaihtoehtoinen hypoteesi. Jos testin p-arvo ei ole kyllin pieni, jätetään nollahypoteesi voimaan. Tilastollisia testejä Testit normaalijakauman parametreille Yhden otoksen t-testi (ks. aiemmin) Kahden riippumattoman otoksen t-testi t-testi pari vertailulle -testi varianssille Laatuerollisten muuttujien testit Testi suhteellisille osuuksille Suhteellisten osuuksien vertailu testi uomaa, että testejä saa ja on usein myös järkevää käyttää järjestys-, välimatka- ja suhde-asteikollisille muuttujille. Jakauma oletusten testaaminen 7 8
Normaalijakauman parametrien tilastolliset testit Yhden otoksen testit Testataan yksinkertaisia nollahypoteeseja, jotka koskevat normaalijakauman odotusarvo- tai varianssiparametria. Kahden otoksen testit Vertailutestejä, joilla verrataan kahden normaalijakauman odotusarvo- tai varianssi-parametreja toisiinsa Testejä normaalijakauman odotusarvolle käytetään usein vaikka havainnot eivät noudattaisi normaalijakaumaa Keskeisen raja-arvolauseen mukaan myös ei-normaalisten havaintojen aritmeettiset keskiarvot noudattavat tietyin ehdoin suurissa otoksissa - approksimatiivisesti normaalijakaumaa. Testit normaalijakauman varianssille eivät yleensä ole käyttökelpoisia ei-normaalisille havainnoille Edes suuri havaintojen lukumäärillä ei auta Kahden riippumattoman otoksen t-testi (/) Yleinen hypoteesi : avainnot =,, ( Otos ) avainnot =,, ( Otos ) avainnot,,,., riippumattomia : : : -suuntaiset vaihtoehtoiset hypoteesit : : -suuntainen vaihtoehtoinen hypoteesi N(, ) N(,) 9 Kahden riippumattoman otoksen t-testi (/) N(,) E(t A ) = Kahden riippumattoman otoksen t-testi (/) riippuu merkitsevyystasosta ja :stä: : : : = ~ (,) missä = ja = ) ovat otosten =,aritmeettiset keskiarvot ja otosvarianssit Mittaa otoksien ja aritmeettisten keskiarvojen tilastollista etäisyyttä suhteessa erotuksen havainnoista estimoituun standardipoikkeamaan Noudattaa ( : pätiessä) suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa Itseisarvoltaan suuret testisuureen arvot viittaavat siihen, että nollahypoteesi ei päde N(,) N(,) N(,) t t t / t : / : : p p p t t Matematiikan t t ja systeemianalyysin laitos p-arvo riippuu havainnoista lasketusta testisuureen arvosta t ja :stä: N(,) N(,) N(,) p p p p Kahden riippumattoman otoksen t-testi (/) Testi ei ole herkkä poikkeamille havaintojen normaalisuudesta: Testiä on melko turvallista käyttää kun n, n > ja suunnilleen yhtä suuret, havaintojen jakaumat eivät ole kovin vinoja, ei ole poikkeavia havaintoja. jopa selvästi vinoille havaintojen jakaumille jos n,n > Satterthwaiten approksimaatio Pienissä otoksissa saadaan testisuureen jakaumalle parempi approksimaatio käyttämällä Studentin t-jakaumaa vapausastein s s n n s s n n n n Tällöin testin hylkäysalue (tai p-arvo) määritetään siis Studentin t- jakaumasta samaan tapaan kuin yhden otoksen t-testissä t-testi parivertailuille (/) Parivertailuasetelma syntyy seuraavissa tilanteissa: Verrataan kahta mittaria mittaamalla molemmilla mittareilla samat kohteet samoissa olosuhteissa. Tutkitaan jonkin käsittelyn vaikutusta mittaamalla samat kohteet ennen käsittelyä ja käsittelyn jälkeen. Vertaillaan kahta perusjoukkoa mittaamalla saman muuttujan arvot perusjoukkojen alkioiden sovitetuissa pareissa avainnot muodostuvat mittaustuloksien pareista (X i, X i ), i =,,, n Tällaisissa parivertailuasetelmissa ei saa käyttää riippumattomien otoksien t-testiä, koska mittaus-tulokset X i ja X i eivät yleensä ole riippumattomia.
t-testi parivertailuille (/) Muodostetaan mittaustuloksien X i ja X i erotukset D,,,, i Xi Xi i n Mittaukset antavat keskimäärin saman tuloksen, jos erotukset D i saavat keskimäärin arvon nolla Parivertailussa tehdään yhden otoksen t-testi erotuksille D i Yleinen hypoteesi : avainnot D,, D n ~N( D, D )riippumattomia : = Vaihtoehtoinen hypoteesi: : <tai : >tai : Testisuure: =,missä = / ja = ) en tai p-arvon määrääminen tapahtuu kuten yhden otoksen t-testin tapauksessa. Yhden otoksen testi varianssille (/) Yleinen hypoteesi : avainnot X,, X n ~N(, ) riippumattomia : : : tai : tai : n = ) ( ) missä = ja = ) Noudattaa ( :n pätiessä) -jakaumaa vapausastein n Sekä pienet että suuret testisuureen arvot suhteessa normaaliarvoon E( )=n viittaavat siihen, että ei päde E( )=n Yhden otoksen testi varianssille (/) riippuu merkitsevyystasosta ja :stä: : ( n ) : ( n ) : ( n ) Testi suhteelliselle osuudelle (/) Testi suhteelliselle osuudelle on yhden otoksen testi Bernoulli(.8) p-arvo riippuu havainnoista lasketusta testisuureen arvosta ja :stä: : ( n ) : p p p p ( n ) Matematiikan ja systeemianalyysin laitos : p-arvo = min{pr,pr } 7 Yleinen hypoteesi : avainnot X,, X n ~Bernoulli(p) riippumattomia : : : : :.8... E(X i ) =p=.8 Var(X i ) =p(-p)=.8*.=. 8 Testi suhteelliselle osuudelle (/) = ~ )/ (,) missä suhteellinen frekvenssi = on p:n harhaton estimaattori Mittaa suhteellisen frekvenssin ja p :n erotusta suhteutettuna erotuksen standardipoikkeamaan Perustelu: Var Var = Var N(,) ( )/ Noudattaa ( : pätiessä) suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa Approksimaatio riittävän hyvä kun ja ( Itseisarvoltaan suuret testisuureen z arvot viittaavat siihen, että nollahypoteesi ei päde. P-arvot ja hylkäysalueet saadaan helposti N(,) jakaumasta Suhteellisten osuuksien vertailutesti (/) Suhteellisten osuuksien vertailutesti on kahden otoksen testi Yleinen hypoteesi : avainnot ), =,, ( Otos ) avainnot =,, ( Otos ) avainnot,,,., riippumattomia : : : : :.8... Bernoulli(.8) E(X i ) =p=.8 Var(X i ) =p(-p)=.8*.=. 9
Suhteellisten osuuksien vertailutesti (/) = )( ) ~ (,) missä = ovat otosten =,suhteelliset frekvenssit = suhteellinen frekvenssi yhdistetyssä otoksessa Noudattaa ( : pätiessä) suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(,) Riittävän hyvä approksimaatio kun ja (, =, Mittaa otoksista ja määrättyjen suhteellisten frekvenssien erotusta suhteutettuna erotuksen standardipoikkeamaan Itseisarvoltaan suuret z:n arvot viittaavat siihen, että ei päde. P-arvot ja hylkäysalueet saadaan helposti N(,) jakaumasta Jakaumaoletuksien testaaminen (/) Jakaumaoletuksia koskevia tilastollisia testejä kutsutaan tavallisesti yhteensopivuustesteiksi. Testataan ovatko havainnot sopusoinnussa tehdyn jakaumaoletuksen kanssa. Yleisenä yhteensopivuustestinä käytetään -testiä. Yleisin jakaumaoletus on että noudattavat normaalijakaumaa (vrt. t-testit) Oletuksen paikkansapitävyyttä voidaan tutkia yleisellä -yhteensopivuustestillä tai erityisesti normaalisuusoletuksen testaamista varten konstruoiduilla testeillä: Bowmanin ja Shentonin testi normaalisuudelle perustuu havaintojen vinouden ja huipukkuuden mittoihin. Wilkin ja Shapiron testi normaalisuudelle perustuu ns. rankit plot -kuvioon, jonka avulla havaintojen normaalisuutta voidaan tutkia graafisesti. Jakaumaoletuksien testaaminen (/) -homogeenisuustesti Oletetaan, että tilastollisen tutkimuksen kohteena oleva perusjoukko voidaan jakaa kahteen tai useampaan ryhmään. Testillä tutkikaan noudattaako tutkimuksen kohteena olevaa perusjoukon alkioiden ominaisuutta kuvaava muuttuja kaikissa ryhmissä samaa jakaumaa. Eli onko havaintoaineisto on tutkimuksen kohteena olevan perusjoukon ominaisuuden suhteen homogeeninen? -riippumattomuustesti Oletetaan, että tilastollisen tutkimuksen kohteena olevan perusjoukon alkiot voidaan luokitella ristiin kahden (tai usemman) faktorin eli tekijän A ja B suhteen. Tehtävänä on selvittää ovatko tekijät A ja B riippumattomia. Jakaumaoletuksien testaaminen (/) -testit yhteensopivuudelle, homogeenisuudelle ja riippumattomuudelle ovat jakaumista riippumattomia, ei-parametrisia testejä:. Testien yleiset hypoteesit eivät kiinnitä havaintojen jakaumaa.. Testeissä ei testata minkään todennäköisyysjakauman parametreja koskevia hypoteeseja.. Näitä testejä ei käydä läpi tällä kurssilla.