MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Samankaltaiset tiedostot
Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Väliestimointi (jatkoa) Heliövaara 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Testejä suhdeasteikollisille muuttujille

Mat Tilastollisen analyysin perusteet, kevät 2007

Testit laatueroasteikollisille muuttujille

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

Testit järjestysasteikollisille muuttujille

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Mat Sovellettu todennäköisyyslasku A

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

10. laskuharjoituskierros, vko 14, ratkaisut

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

11. laskuharjoituskierros, vko 15, ratkaisut

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

2. TILASTOLLINEN TESTAAMINEN...

Osa 2: Otokset, otosjakaumat ja estimointi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Tilastollinen aineisto Luottamusväli

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastolliset menetelmät: Tilastolliset testit

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

031021P Tilastomatematiikka (5 op) viikko 5

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Harjoitus 2: Matlab - Statistical Toolbox

Tilastollisia peruskäsitteitä ja Monte Carlo

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

riippumattomia ja noudattavat samaa jakaumaa.

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Normaalijakaumasta johdettuja jakaumia

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

9. laskuharjoituskierros, vko 12-13, ratkaisut

Regressioanalyysi. Vilkkumaa / Kuusinen 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Otoskoko 107 kpl. a) 27 b) 2654

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Todennäköisyyden ominaisuuksia

Transkriptio:

MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai oletus, jota halutaan testata. Jotta oletusta voidaan testata tilastollisesti, oletus täytyy pukea tutkittavan perusjoukon ominaisuutta kuvaavaa tilastollista mallia (eli havaintojen todennäköisyysjakaumaa) koskevaksi hypoteesiksi. Esim. Yksinkertainen parametrinen testaus Satunnaismuuttuja X kuvaa jonkin ominaisuuden vaihtelua perusjoukossa Tilastollinen malli: X,, X n ~f(x ; ), tuntematon ypoteesi =, missä jokin parametrin arvo ypoteesi asetetaan koetteelle havaintojen x,, x n todennäköisyysjakaumasta f(x;) sisältämää informaatiota vastaan. Testausasetelmaa koskevat hypoteesit Testausasetelma kiinnitetään tekemällä kolme oletusta: Testausasetelmaa koskevat perusoletukset, joista pidetään kiinni testauksen aikana, muodostavat testin yleisen hypoteesin Oletukset perusjoukosta, käytetystä otantamenetelmästä, (jakaumasta) Testattavaa oletusta kutsutaan nollahypoteesiksi Vaihtoehtoinen hypoteesi on oletus, joka astuu voimaan, jos nollahypoteesi hylätään testissä uomioita: Yleisen hypoteesin oletuksista pidetään kiinni testauksen aikana testi on aina ehdollinen näiden oletusten suhteen. sta pidetään kiinni, elleivät havaintojen sisältämät todisteet sitä vastaan ole kyllin voimakkaita. Tilastollista testiä tehtäessä toivotaan usein, että nollahypoteesi voidaan hylätä ja vaihtoehtoinen hypoteesi hyväksyä (vrt. uusi informaatio tai tietämys) Testisuure Tilastollinen testi perustetaan johonkin sopivaan testisuureeseen (=satunnaismuuttuja), joka mittaa havaintojen ja nolla-hypoteesin yhteensopivuutta. Kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on havaittu, nollahypoteesin pätiessä? Todennäköisyyden laskemiseen tarvitaan testisuureen jakauma Testisuureen normaaliarvo on sen odotusarvo pätiessä Jos havaitusta otoksesta määrätty testisuureen arvo. on lähellä normaaliarvoa, havainnot ovat sopusoinnussa :n kanssa.. poikkeaa merkitsevästi testisuureen normaaliarvosta, havainnot sisältävät todisteita :a vastaan. Testin merkitsevyystaso ja hylkäysalue Testisuureen mahdollisten arvojen joukko jaetaan hylkäysalueeseen ja hyväksymisalueeseen Jos testisuureen havainnoista määrätty arvo joutuu. hylkäysalueelle, nollahypoteesi hylätään. hyväksymisalueelle, nollahypoteesi jätetään voimaan Testin merkitsevyystaso on todennäköisyys sille, että testisuureen havainnoista määrätty arvo joutuu hylkäysalueelle, jos nollahypoteesi pätee. ylkäys- ja hyväksymisalueet määrätään käytännössä kiinnittämällä testin merkitsevyystaso etukäteen =.: Testisuureen arvo (tai testin tulos) on melkein merkitsevä =.: Testisuureen arvo (tai testin tulos) on merkitsevä =.: Testisuureen arvo (tai testin tulos) on erittäin merkitsevä Esim. Ruuvikone (Yhden otoksen t-testi) Tuttu ruuvikone tuottaa ruuveja joiden pituudet vaihtelevat satunnaisesti X i ~N(, ) Toimitusjohtaja epäilee että koneen kalibrointi on pielessä, eli että ruuvien odotettu pituus ei ole enää tavoiteltu cm TJ haluaa sinun selvittävän onko kalibrointi pettänyt Käytät yhden otoksen t-testiä, merkitsevyystasolla % Nolla hypoteesi : = Ruuvien pituuksien luokiteltu Vaihtoehtoinen hypoteesi : frekvenssijakauma 7 Mittaat ruuvin satunnaisotoksen Pituuksien keskiarvo: =.9cm Otoskeskihajonta: = = ) =.8cm Frekvenssi 9.8 9.9..... Pituus (cm)

Esim. Ruuvikone (Yhden otoksen t-testi) t-testin testisuure on satunnaismuuttuja: = / (9) Eli noudattaa Studentin t-jakaumaa vapausastein 9 (olettaen että nollahypoteesi pätee) E(t) = t / (9) t / Mittaa havaittujen ruuvien pituuksien keskiarvon etäisyyttä cm:stä (suhteutettuna keskiarvon keskihajontaan) Koska : itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi ei päde. Kriittiset arvot t / ja +t / saadaan ehdosta Pr(t t / )=/=Pr(t +t / ) Nyt =. t / =t. =. Testin hylkäysalue on (,.)(., +) Esim. Ruuvikone (Yhden otoksen t-testi) Mittaat ruuvin satunnaisotoksen Pituuksien keskiarvo: =.9cm Otoskeskihajonta: = = ) =.8cm Lasketaan testisuureen arvo havainnoista: = / =.9.8/ =.79 osuu hylkäysalueelle, joten nollahypoteesi : =hylätään ja vaihtoehtoinen hypoteesi : astuu voimaan Frekvenssi 7 Ruuvien pituuksien luokiteltu frekvenssijakauma 9. 8 9.9..... Pituus (cm) (9)...9 -.. 7 8 Yhden otoksen t-testi (/) Yleinen hypoteesi : avainnot X,, X n ~N(, ) riippumattomia : Vaihtoehtoinen hypoteesi on yksi seuraavista: : -suuntaiset vaihtoehtoiset hypoteesit : : -suuntainen vaihtoehtoinen hypoteesi =, / missä = on aritmeettinen keskiarvo ja = ) on otoskeskihajonta Yhden otoksen t-testi (/) Jos vaihtoehtoinen hypoteesi on muotoa : >, niin t määrätään niin että Pr(t +t ) = : <, niin -t määrätään niin että Pr(t -t ) = :, niin -t / määrätään niin että Pr(t -t / ) = Pr(t +t / )=/ Vastaavasti hylkäysalue on muotoa: : : : tn ( ) tn ( ) tn ( ) t t t t / / 9 Yhden otoksen t-testi (/) Yhden otoksen t-testin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita. t-testi ei kuitenkaan ole herkkä poikkeamille normaalisuudesta, jos havaintojen lukumäärä n on kyllin suuri. Testiä on melko turvallista käyttää, kun havaintojen lukumäärä n > ellei havaintojen jakauma ole kovin vino ja havaintojen joukossa ole poikkeavia havaintoja. Jos havaintojen lukumäärä n > testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille. Virheet testauksessa ylkäysvirhe: nollahypoteesi hylätään, kun se on tosi ylkäysvirheen todennäköisyys on Pr( hylätään on tosi) = Vastaavasti todennäköisyys hyväksyä nollahypoteesi silloin, kun se on tosi, on Pr( hyväksytään on tosi) = Tilastollisessa testauksessa noudatetaan tieteen yleistä varovaisuusperiaatetta: ypoteeseja ei pidä hylätä ilman riittäviä syitä pyritään tekemään mahdollisimman pieneksi (vrt..,.,.). yväksymisvirhe: jätetään voimaan, kun se ei ole tosi Sen todennäköisyys on Pr( jätetään voimaan ei ole tosi) = Todennäköisyyttä Pr( hylätään ei ole tosi) = kutsutaan testin voimakkuudeksi. yvä testi on voimakas ( on suuri), koska silloin hyväksymisvirheen todennäköisyys on pieni

Virheet testauksessa Tilastollisessa testauksessa pyritään ensisijaisesti varomaan ettei nollahypoteesi hylätä silloin, kun se on tosi ylkäysvirhettä kutsutaan usein ensimmäisen lajin virheeksi yväksymisvirhettä kutsutaan toisen lajin virheeksi Testin tulos jää voimaan hylätään pätee Oikea johtopäätös ylkäysvirhe Maailman tila ei päde yväksymisvirhe Oikea johtopäätös Tilastollisen testin suorittaminen (merkitsevyystasolla). Asetetaan testin hypoteesit: Yleinen hypoteesi Testauksen kohteena oleva nollahypoteesi Vaihtoehtoinen hypoteesi. Valitaan testiä varten testisuure Valitaan merkitsevyystaso konstruoidaan vastaavat hylkäys- ja hyväksymisalueet. Poimitaan otos niin, että yleisen hypoteesin oletukset pätevät. Määrätään valitun testisuureen arvo havainnoista.. Tehdään päätös :n hylkäämisestä: Jos testisuureen arvo on hylkäysalueelle, niin hylätään ja hyväksytään Muuten jätetään nollahypoteesi voimaan Testin p-arvo (/) Testin p-arvo on pienin merkitsevyystaso, jolla nollahypoteesi voidaan hylätä Tilastolliset ohjelmistot tulostavat nykyään lähes aina sovellettavan testin p-arvon Esim. Olkoon (yhden otoksen) t-testisuureelle laskettu havainnoista numeerinen arvo t : : : : tn ( ) tn ( ) tn ( ) p p p p p p p t t t t Testin p-arvo (/) Kun p-arvoksi saadaan pieni luku: Tällöin testisuure on saanut arvon, joka kuuluu nolla-hypoteesin pätiessä epätodennäköisten testisuureen arvojen joukkoon. Mitä pienempi on testin p-arvo, sitä vahvempia todisteita havainnot sisältävät nollahypoteesia vastaan ja sitä varmemmin voidaan hylätä Esim. Ruuvikone Testisuureen arvoksi laskimme = / = / =.79 P-arvo on Pr.79 + Pr.79 =. =. (9). -.79.79. Tilastollisen testin suorittaminen (p-arvolla). Asetetaan testin hypoteesit: Yleinen hypoteesi Testauksen kohteena oleva nollahypoteesi Vaihtoehtoinen hypoteesi. Valitaan testiä varten testisuure. Poimitaan otos niin, että yleisen hypoteesin oletukset pätevät.. Määrätään valitun testisuureen arvo havainnoista ja lasketaan sen p-arvo. Tehdään päätös :n hylkäämisestä: Jos testin p-arvo on kyllin pieni, hylätään nollahypoteesi ja hyväksytään vaihtoehtoinen hypoteesi. Jos testin p-arvo ei ole kyllin pieni, jätetään nollahypoteesi voimaan. Tilastollisia testejä Testit normaalijakauman parametreille Yhden otoksen t-testi (ks. aiemmin) Kahden riippumattoman otoksen t-testi t-testi pari vertailulle -testi varianssille Laatuerollisten muuttujien testit Testi suhteellisille osuuksille Suhteellisten osuuksien vertailu testi uomaa, että testejä saa ja on usein myös järkevää käyttää järjestys-, välimatka- ja suhde-asteikollisille muuttujille. Jakauma oletusten testaaminen 7 8

Normaalijakauman parametrien tilastolliset testit Yhden otoksen testit Testataan yksinkertaisia nollahypoteeseja, jotka koskevat normaalijakauman odotusarvo- tai varianssiparametria. Kahden otoksen testit Vertailutestejä, joilla verrataan kahden normaalijakauman odotusarvo- tai varianssi-parametreja toisiinsa Testejä normaalijakauman odotusarvolle käytetään usein vaikka havainnot eivät noudattaisi normaalijakaumaa Keskeisen raja-arvolauseen mukaan myös ei-normaalisten havaintojen aritmeettiset keskiarvot noudattavat tietyin ehdoin suurissa otoksissa - approksimatiivisesti normaalijakaumaa. Testit normaalijakauman varianssille eivät yleensä ole käyttökelpoisia ei-normaalisille havainnoille Edes suuri havaintojen lukumäärillä ei auta Kahden riippumattoman otoksen t-testi (/) Yleinen hypoteesi : avainnot =,, ( Otos ) avainnot =,, ( Otos ) avainnot,,,., riippumattomia : : : -suuntaiset vaihtoehtoiset hypoteesit : : -suuntainen vaihtoehtoinen hypoteesi N(, ) N(,) 9 Kahden riippumattoman otoksen t-testi (/) N(,) E(t A ) = Kahden riippumattoman otoksen t-testi (/) riippuu merkitsevyystasosta ja :stä: : : : = ~ (,) missä = ja = ) ovat otosten =,aritmeettiset keskiarvot ja otosvarianssit Mittaa otoksien ja aritmeettisten keskiarvojen tilastollista etäisyyttä suhteessa erotuksen havainnoista estimoituun standardipoikkeamaan Noudattaa ( : pätiessä) suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa Itseisarvoltaan suuret testisuureen arvot viittaavat siihen, että nollahypoteesi ei päde N(,) N(,) N(,) t t t / t : / : : p p p t t Matematiikan t t ja systeemianalyysin laitos p-arvo riippuu havainnoista lasketusta testisuureen arvosta t ja :stä: N(,) N(,) N(,) p p p p Kahden riippumattoman otoksen t-testi (/) Testi ei ole herkkä poikkeamille havaintojen normaalisuudesta: Testiä on melko turvallista käyttää kun n, n > ja suunnilleen yhtä suuret, havaintojen jakaumat eivät ole kovin vinoja, ei ole poikkeavia havaintoja. jopa selvästi vinoille havaintojen jakaumille jos n,n > Satterthwaiten approksimaatio Pienissä otoksissa saadaan testisuureen jakaumalle parempi approksimaatio käyttämällä Studentin t-jakaumaa vapausastein s s n n s s n n n n Tällöin testin hylkäysalue (tai p-arvo) määritetään siis Studentin t- jakaumasta samaan tapaan kuin yhden otoksen t-testissä t-testi parivertailuille (/) Parivertailuasetelma syntyy seuraavissa tilanteissa: Verrataan kahta mittaria mittaamalla molemmilla mittareilla samat kohteet samoissa olosuhteissa. Tutkitaan jonkin käsittelyn vaikutusta mittaamalla samat kohteet ennen käsittelyä ja käsittelyn jälkeen. Vertaillaan kahta perusjoukkoa mittaamalla saman muuttujan arvot perusjoukkojen alkioiden sovitetuissa pareissa avainnot muodostuvat mittaustuloksien pareista (X i, X i ), i =,,, n Tällaisissa parivertailuasetelmissa ei saa käyttää riippumattomien otoksien t-testiä, koska mittaus-tulokset X i ja X i eivät yleensä ole riippumattomia.

t-testi parivertailuille (/) Muodostetaan mittaustuloksien X i ja X i erotukset D,,,, i Xi Xi i n Mittaukset antavat keskimäärin saman tuloksen, jos erotukset D i saavat keskimäärin arvon nolla Parivertailussa tehdään yhden otoksen t-testi erotuksille D i Yleinen hypoteesi : avainnot D,, D n ~N( D, D )riippumattomia : = Vaihtoehtoinen hypoteesi: : <tai : >tai : Testisuure: =,missä = / ja = ) en tai p-arvon määrääminen tapahtuu kuten yhden otoksen t-testin tapauksessa. Yhden otoksen testi varianssille (/) Yleinen hypoteesi : avainnot X,, X n ~N(, ) riippumattomia : : : tai : tai : n = ) ( ) missä = ja = ) Noudattaa ( :n pätiessä) -jakaumaa vapausastein n Sekä pienet että suuret testisuureen arvot suhteessa normaaliarvoon E( )=n viittaavat siihen, että ei päde E( )=n Yhden otoksen testi varianssille (/) riippuu merkitsevyystasosta ja :stä: : ( n ) : ( n ) : ( n ) Testi suhteelliselle osuudelle (/) Testi suhteelliselle osuudelle on yhden otoksen testi Bernoulli(.8) p-arvo riippuu havainnoista lasketusta testisuureen arvosta ja :stä: : ( n ) : p p p p ( n ) Matematiikan ja systeemianalyysin laitos : p-arvo = min{pr,pr } 7 Yleinen hypoteesi : avainnot X,, X n ~Bernoulli(p) riippumattomia : : : : :.8... E(X i ) =p=.8 Var(X i ) =p(-p)=.8*.=. 8 Testi suhteelliselle osuudelle (/) = ~ )/ (,) missä suhteellinen frekvenssi = on p:n harhaton estimaattori Mittaa suhteellisen frekvenssin ja p :n erotusta suhteutettuna erotuksen standardipoikkeamaan Perustelu: Var Var = Var N(,) ( )/ Noudattaa ( : pätiessä) suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa Approksimaatio riittävän hyvä kun ja ( Itseisarvoltaan suuret testisuureen z arvot viittaavat siihen, että nollahypoteesi ei päde. P-arvot ja hylkäysalueet saadaan helposti N(,) jakaumasta Suhteellisten osuuksien vertailutesti (/) Suhteellisten osuuksien vertailutesti on kahden otoksen testi Yleinen hypoteesi : avainnot ), =,, ( Otos ) avainnot =,, ( Otos ) avainnot,,,., riippumattomia : : : : :.8... Bernoulli(.8) E(X i ) =p=.8 Var(X i ) =p(-p)=.8*.=. 9

Suhteellisten osuuksien vertailutesti (/) = )( ) ~ (,) missä = ovat otosten =,suhteelliset frekvenssit = suhteellinen frekvenssi yhdistetyssä otoksessa Noudattaa ( : pätiessä) suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(,) Riittävän hyvä approksimaatio kun ja (, =, Mittaa otoksista ja määrättyjen suhteellisten frekvenssien erotusta suhteutettuna erotuksen standardipoikkeamaan Itseisarvoltaan suuret z:n arvot viittaavat siihen, että ei päde. P-arvot ja hylkäysalueet saadaan helposti N(,) jakaumasta Jakaumaoletuksien testaaminen (/) Jakaumaoletuksia koskevia tilastollisia testejä kutsutaan tavallisesti yhteensopivuustesteiksi. Testataan ovatko havainnot sopusoinnussa tehdyn jakaumaoletuksen kanssa. Yleisenä yhteensopivuustestinä käytetään -testiä. Yleisin jakaumaoletus on että noudattavat normaalijakaumaa (vrt. t-testit) Oletuksen paikkansapitävyyttä voidaan tutkia yleisellä -yhteensopivuustestillä tai erityisesti normaalisuusoletuksen testaamista varten konstruoiduilla testeillä: Bowmanin ja Shentonin testi normaalisuudelle perustuu havaintojen vinouden ja huipukkuuden mittoihin. Wilkin ja Shapiron testi normaalisuudelle perustuu ns. rankit plot -kuvioon, jonka avulla havaintojen normaalisuutta voidaan tutkia graafisesti. Jakaumaoletuksien testaaminen (/) -homogeenisuustesti Oletetaan, että tilastollisen tutkimuksen kohteena oleva perusjoukko voidaan jakaa kahteen tai useampaan ryhmään. Testillä tutkikaan noudattaako tutkimuksen kohteena olevaa perusjoukon alkioiden ominaisuutta kuvaava muuttuja kaikissa ryhmissä samaa jakaumaa. Eli onko havaintoaineisto on tutkimuksen kohteena olevan perusjoukon ominaisuuden suhteen homogeeninen? -riippumattomuustesti Oletetaan, että tilastollisen tutkimuksen kohteena olevan perusjoukon alkiot voidaan luokitella ristiin kahden (tai usemman) faktorin eli tekijän A ja B suhteen. Tehtävänä on selvittää ovatko tekijät A ja B riippumattomia. Jakaumaoletuksien testaaminen (/) -testit yhteensopivuudelle, homogeenisuudelle ja riippumattomuudelle ovat jakaumista riippumattomia, ei-parametrisia testejä:. Testien yleiset hypoteesit eivät kiinnitä havaintojen jakaumaa.. Testeissä ei testata minkään todennäköisyysjakauman parametreja koskevia hypoteeseja.. Näitä testejä ei käydä läpi tällä kurssilla.