11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot
|
|
- Aarne Hakola
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 17. lokakuuta Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot Datalähteen tuottamia arvoja mallinnetaan jakaumaa f(x θ) noudattavina satunnaismuuttujina, missä parametri θ on tuntematon. Tilastollisen estimoinnin tavoitteena on havaitun datajoukon (x 1,..., x n ) pohjalta määrittää parametrille paras arvaus joko piste-estimaattina tai väliestimaattina. Monissa käytännön tilanteissa pelkkä estimaatin määrittäminen ei riitä, vaan havaintojen pohjalta täytyy tehdä johtopäätös, pitääkö jokin parametria θ koskeva oletus paikkaansa vai ei. Tilastollinen testi on systemaattinen menetelmä laatia tämän tyyppisiä johtopäätöksiä. Tilastollisen testin lähtökohtana on nollahypoteesi H 0, joka kuvastaa datalähteen oletusarvoista käyttäytymistä. Stokastisen mallin avulla voidaan ennustaa, millaisia arvoja nollahypoteesin mukainen datalähde todennäköisesti tuottaa. Satunnaisvaihtelun takia havaitut arvot (x 1,..., x n ) aina poikkeavat jonkun verran ennusteesta. Jos nollahypoteesi pitää paikkansa, tulisi suurten poikkeamien kuitenkin olla harvinaisia. Mikäli havaitut poikkeamat ovat suuria, antaa tämä aihetta nollahypoteesin hylkäämiseen. Tilastollisessa testissä on myös tapana määritellä vastahypoteesi H 1. Yleensä vastahypoteesi on nollahypoteesin vastakohta. Joissain tilanteissa voidaan vastahypoteesia rajoittamalla rajata testin piiristä pois parametriarvoja, joista ei olla kiinnostuneita. Esimerkki 11.1 (Kolikko). Tasaiseksi väitettyä kolikkoa 50 kertaa heitettäessä saadaan heittosarja, joka sisältää 42 kruunaa. Kuuluuko havaittu tulos tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä kolikon tasaisuutta? 115
2 Koetilannetta vastaavan datalähteen tuottamia arvoja voidaan mallintaa binomijakaumaa Bin(50, θ) noudattavina satunnaismuuttujina, jolloin nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : θ = 0.5, H 1 : θ 0.5. Esimerkki 11.2 (Tiedonsiirtokanava). Kun tiedonsiirtokanavan yli lähetetään lukuarvoinen signaali µ, niin kohinan takia vastaanottaja havaitsee arvon X, joka noudattaa normaalijakaumaa odotusarvona µ ja keskihajontana 3. Eräänä päivänä lähettäjän uskotaan lähettävän arvon µ = 8. Kun vastaanotettu arvo on x 1 = 12.8, onko syytä epäillä, että lähetetyn signaalin arvo ei ollutkaan 8? Datalähteen tuottamia arvoja voidaan mallintaa normaalijakautuneina satunnaismuuttujina odotusarvona µ (tuntematon) ja keskihajontana 3. Nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : µ = 8, H 1 : µ 8. Esimerkki 11.3 (Laadunvalvonta). Tukkukauppias väittää, että sen toimittamista tomaateista enintään 5% on huonolaatuisia. Suuresta tilauserästä poimittiin satunnaisesti 50 tomaattia ja niistä 4 todettiin huonolaatuisiksi. Kuuluuko tehty havainto tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä tukkukauppiaan väitettä? Esimerkkien 11.1 ja 11.2 nollahypoteeseja kutsutaan yksinkertaisiksi, sillä ne määrittävät datalähteen jakauman yksiselitteisesti. Esimerkin 11.3 nollahypoteesi on yhdistetty, sillä se sisältää monta mahdollista parametrin arvoa Tilastollinen merkitsevyys ja p-arvo Ylläolevissa esimerkeissä datalähteestä tehdyt havainnot vaikuttivat poikkeavan nollahypoteesia vastaavista tyypillisistä arvoista. Havaitun datajoukon poikkeuksellisuutta voidaan analysoida laskemalla testisuure t(x) = t(x 1,..., x n ) käyttämällä funktiota t(x), joka sopivalla tavalla tiivistää havaitut datapisteet yhdeksi reaaliluvuksi. Tilastollisen testin p-arvo on todennäköisyys, jolla nollahypoteesin mukaisen datalähteen ennustetaan tuottavan poikkeavampia tai yhtä poikkeavia testisuureen arvoja kuin t(x). Mikäli p-arvo on lähellä nollaa, johtuu havaittu poikkeama hyvin epätodennäköisesti satunnaisvaihtelusta ja antaa aiheen epäillä nollahypoteesin pitävyyttä. Tällaista poikkeamaa kutsutaan tilastollisesti merkitseväksi. Useimmissa sovelluskonteksteissa voidaan p-arvojen kokoa luonnehtia seuraavien nyrkkisääntöjen avulla: p-arvo Tulkinta > 0.10 Havainto ei ole ristiriidassa H 0 :n kanssa 0.05 Havainto todistaa jonkun verran H 0 :aa vastaan < 0.01 Havainto todistaa vahvasti H 0 :aa vastaan 116
3 Esimerkki 11.4 (Kolikko). Tasaiseksi väitettyä kolikkoa 50 kertaa heitettäessä saadaan heittosarja, joka sisältää 42 kruunaa. Kuuluuko havaittu tulos tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä kolikon tasaisuutta? Datalähteen tuottamia testisuureen arvoja voidaan mallintaa binomijakaumaa Bin(50, θ) noudattavina satunnaismuuttujana T, jolloin nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : θ = 0.5, H 1 : θ 0.5. Nollahypoteesin vallitessa noudattaa kruunien lukumäärä T binomijakaumaa tiheysfunktiona ( ) ( ) t ( 50 1 f(t H 0 ) = t, t = 0, 1,..., 50, t 2 2) ja odotusarvona 25. Havaittu testisuureen arvo poikkeaa odotusarvosta 17 yksikköä. Näin suuren tai vielä suuremman poikkeaman todennäköisyys on nollahypoteesin vallitessa P( T H 0 ) = 8 50 f(t H 0 ) + f(t H 0 ) t=0 Havaitun testisuureen p-arvo on siis suuruusluokkaa yksi miljoonasta, mikä antaa vahvan perusteen epäillä kolikon tasaisuutta ja hylätä nollahypoteesi. Esimerkki 11.5 (Tiedonsiirtokanava). Kun tiedonsiirtokanavan yli lähetetään lukuarvoinen signaali µ, niin kohinan takia vastaanottaja havaitsee arvon X, joka noudattaa normaalijakaumaa odotusarvona µ ja keskihajontana 3. Eräänä päivänä lähettäjän uskotaan lähettävän arvon µ = 8. Kun vastaanotettu arvo on x 1 = 12.8, onko syytä epäillä, että lähetetyn signaalin arvo ei ollutkaan 8? Vastaanotettua signaalia voidaan mallintaa normaalijakautuneina satunnaismuuttujana odotusarvona µ (tuntematon) ja keskihajontana 3. Nollahypoteesi ja vastahypoteesi voidaan esittää muodossa t=42 H 0 : µ = 8, H 1 : µ 8. Valitaan testisuureeksi keskihajonnalla normitettu poikkeama t(x) = x 8 3 = 1.6. Tällöin testisuureen arvoja mallintava satunnaismuuttuja T = t(x) noudattaa nollahypoteesin vallitessa normitettua normaalijakaumaa. Todennäköisyys, että nollahypoteesin vallitessa T poikkeaa odotusarvostaan 1.6 yksikköä tai enemmän, saadaan symmetrian perusteella normaalijakauman taulukoista P( T 1.6 H 0 ) = 2P(T 1.6 H 0 ) = 2(1 P(T 1.6 H 0 )) 0.11, Havaitun testisuureen p-arvo on siis noin 11%, joten havaittu poikkeama on selitettävissä tavanomaisella satunnaisvaihtelulla. Vastaanotettu signaalin arvo ei tarjoa syytä epäillä H 0 :n paikkansapitävyyttä. 117
4 11.3 Yhdistetty nollahypoteesi Seuraava esimerkki edustaa yhdistettyä nollahypoteesia, joka vaatii huolellisempaa analyysiä, sillä siinä nollahypoteesi ei yksiselitteisesti määritä datalähteen stokastisen mallin jakaumaa. Lisäksi poikkeavien arvojen määrittämisessä pitää ottaa huomioon, poikkeaako havaittu testisuureen arvo ylöspäin vai alaspäin tyypillisestä arvosta. Esimerkki 11.6 (Laadunvalvonta). Tukkukauppias väittää, että sen toimittamista tomaateista enintään 5% on huonolaatuisia. Suuresta tilauserästä poimittiin satunnaisesti 50 tomaattia ja niistä 4 todettiin huonolaatuisiksi. Valitaan testisuureeksi huonolaatuisten tomaattien lukumäärä t(x) = 4. Koska tarkastetut 50 tomaattia on poimittu satunnaisotannalla suuresta populaatiosta, noudattaa testisuureen arvoja mallintava satunnaismuuttuja T suurella tarkkuudella binomijakaumaa tiheysfunktiona f θ (t) = ( 50 t ) θ t (1 θ) 50 t, t = 0, 1,..., 50, missä θ on huonolaatuisten tomaattien osuus koko tilauserässä. Tutkittavaa väitettä kuvaava nollahypoteesi ja vastahypoteesi voidaan nyt esittää muodossa H 0 : θ 0.05, H 1 : θ > Tällaisen yksisuuntaisen nollahypoteesin näkökulmasta poikkeavat havainnot ovat niitä, missä testisuureen arvo ylittää odotusarvonsa. Todennäköisyys, että nollahypoteesiä noudattava datalähde tuottaa havaittua testisuureen arvoa poikkeavampia tai yhtä poikkeavia testisuureen arvoja on siis ( ) P θ T E θ (T ) t(x) E θ (T ) = P θ (T 4) = 50 t=4 f θ (t). Ongelmana on, että tässä tapauksessa nollahypoteesi ei suoraan määritä datalähteen eikä sitä vastaavan testisuureen jakaumaa. Tällaisessa tilanteessa p-arvo määritellään kaavalla p-arvo = max P θ(t t(x)). θ 0.05 Koska ylläoleva todennäköisyys maksimoituu 1 arvolla θ = 0.05, saadaan p- arvoksi ( ) 50 p-arvo = f 0.05 (t) = 0.05 t (1 0.50) 50 t 0.24, t t=4 mikä ei anna aihetta epäillä nollahypoteesin paikkansapitävyyttä. t=4 1 Yläraja voidaan perustella niin, että tulkitaan T kruunien lukumääräksi 50 kolikon heittosarjassa, jossa kruunan todennäköisyys on θ. Kun kruunan todennäköisyys kasvaa, kasvaa myös todennäköisyys että havaittujen kruunien lukumäärä ylittää kynnysarvon
5 11.4 Testausvirheet Tietyissä tilanteissa vaaditaan testaajalta yksiselitteistä johtopäätöstä: testin pohjalta H 0 joko hyväksytään tai hylätään. Johtopäätöksen pohjaksi valitaan testin merkitsevyystaso α (0, 1) ja johtopäätös muodostetaan seuraavasti: Jos p-arvo α, nollahypoteesi hyväksytään (jätetään voimaan), Jos p-arvo < α, nollahypoteesi hylätään. Näin menetellessä mikään ei takaa, että tehty johtopäätös olisi oikea. Esimerkin 11.4 kolikonheitossa havaittiin 42 kruunaa p-arvona 10 6, joten nollahypoteesi (tasainen kolikko) hylätään merkitsevyystasolla α = On kuitenkin periaatteessa mahdollista, että tasaisella kolikolla satuttiin tekemään äärimmäisen epätodennäköinen 42 kruunan heittosarja. Tällöin tehdään hylkäysvirhe. Esimerkin 11.5 tiedonsiirtokanavassa havaittiin virheen arvoksi 10.8 p- arvona 11%, joten nollahypoteesi (normaalijakautuneet arvot odotusarvona 0 ja keskihajontana 3) hyväksytään merkitsevyystasolla α = On kuitenkin mahdollista, että havaittu virhe onkin mitattu kanavasta, jossa kohinan aiheuttamat virheet noudattavat normaalijakaumaa esim. odotusarvona 2 ja keskihajontana 3. Tällöin tehdään hyväksymisvirhe. Eri tavat tehdä oikea tai virheellinen johtopäätös voidaan taulukoida seuraavasti: Johtopäätös Totuus H 0 hyväksytään H 0 hylätään H 0 tosi Oikea päätös Hylkäysvirhe H 0 epätosi Hyväksymisvirhe Oikea päätös Seuraava keskeinen tulos (lause 11.7) takaa, että hylkäysvirheen todennäköisyys voidaan säätää pieneksi asettamalla riittävän pieni merkitsevyystaso. Tuloksen todistus (luku 11.6) yleisessä muodossa sisältää reaalianalyysin yksityiskohtia, jotka eivät ole tilastollisen päättelyn kannalta keskeisiä. Lause Tilastollisen testin hylkäysvirheen todennäköisyys on korkeintaan testin merkitsevyystaso α. Hyväksymisvirheen todennäköisyyttä sen sijaan on yleisesti vaikea kontrolloida. Tästä syystä nollahypoteesi on syytä muotoilla niin, että se vastaa yleistä vallalla olevaa käsitystä tutkittavasta asiasta, tai niin että virheellisen nollahypoteesin hyväksymisellä ei ole vakavia seuraamuksia. 119
6 Esimerkki 11.8 (Rikosoikeus). Yksityishenkilön epäiltyä rikosta koskevassa oikeudenkäynnissä tulee päättää, onko syytetty henkilö syytön vai syyllinen saatavilla olevan datan perusteella. Tällöin nollahypoteesi voidaan esittää joko muodossa H 0 : Epäilty henkilö on syytön tai muodossa H 0: Epäilty henkilö on syyllinen Nollahypoteesiä H 0 vastaava hyväksymisvirhe vastaa syyllisen henkilön tuomitsematta jättämistä ja hylkäysvirhe syyttömän henkilön tuomitsemista. Hylkäysvirheen todennäköisyys saadaan lauseen 11.7 perusteella pieneksi valitsemalla testille riittävän pieni merkitsevyystaso. Hyväksymisvirheen todennäköisyyttä on sen sijaan vaikeampi kontrolloida. Jos nollahypoteesiksi valittaisiinkin H 0, niin tilastollisessa testissä ei syyttömien henkilöiden tuomitsemisen (H 0:n hyväksymisvirhe) riskiä voisi kunnolla kontrolloida, mikä olisi ristiriidassa yleisen oikeusperiaatteen kanssa. Esimerkki 11.9 (Tupakkatuote). Jos halutaan tutkia uudentyyppisen tupakkatuotteen vaikutusta terveyteen, voidaan nollahypoteesi esittää joko muodossa H 0 : Uudella tupakkatuotteella ei ole terveyttä edistäviä vaikutuksia tai muodossa H 0: Uudella tupakkatuotteella on terveyttä edistäviä vaikutuksia Nollahypoteesiä H 0 vastaavan hyväksymisvirheen tekeminen olisi tupakkatuotteen valmistajan kannalta haitallista, mutta hyväksymisvirheen yhteiskunnalliset vaikutukset eivät luultavasti olisi suuria. Nollahypoteesin H 0 hylkäysvirheellä saattaisi olla yhteiskunnalle hyvinkin haitalliset seuraukset. Hylkäysvirheen todennäköisyys saadaan lauseen 11.7 perusteella pieneksi valitsemalla testille riittävän pieni merkitsevyystaso. Jos nollahypoteesiksi valittaisiinkin H 0, niin merkitsevyystasoa pieneksi säätämällä voitaisiin kontrolloida tupakkavalmistajan epäreilun kohtelun (H 0:n hylkäysvirhe) riskiä, mutta ei yhteiskunnallisten terveyshaittojen (H 0:n hyväksymisvirhe) riskiä. Henkilö A, joka elämänsä aikana tekee suuren määrän hypoteesitestejä merkitsevyystasolla α = 5% on henkisesti varautunut siihen, että tietty osuus testien johtopäätöksistä on virheellisiä. Hän myös tietää, että pitkällä tähtäyksellä hänen hylkäämistään nollahypoteeseista enintään 5% on virheellisesti hylätty. (Hän ei kuitenkaan tiedä mitkä niistä.) 120
7 Henkilö B, joka tekee elämänsä aikana suuren määrän hypoteesitestejä merkitsevyystasolla α = 1% on myös varautunut siihen, että tietty osuus testipäätelmistä on virheellisiä. Hän tietää, että hänen hylkäämistään nollahypoteeseista enintään 1% on virheellisesti hylätty. Lisäksi hän tietää, että hänen hyväksymistään nollahypoteeseista on suurempi osuus virheellisiä kuin henkilöllä A. Henkilö B on taipuvaisempi harvemmin hylkäämään nollahypoteeseja, minkä johdosta hän tekee pitkällä tähtäyksellä harvemmin hylkäysvirheitä mutta useammin hyväksymisvirheitä. Esimerkki (Tuntematon kolikko). Tasaiseksi väitettyä kolikkoa 10 kertaa heitettäessä (0=klaava, 1=kruuna) havaitaan data y = (0, 0, 1, 0, 0, 0, 0, 0, 0, 0). Testaa väitteen paikkansapitävyyttä 5% merkitsevyystasolla ja analysoi hylkäysja hyväksymisvirheiden todennäköisyyksiä. Testin nollahypoteesi ja vastahypoteesi ovat H 0 : θ = 0.5, H 1 : θ 0.5, missä θ on kruunan todennäköisyys. Valitaan testisuureeksi kruunien lukumäärä t(x) = x x 10. Datalähteen tuottamia testisuureen arvoja mallintava satunnaismuuttuja t(x) noudattaa nollahypoteesin vallitessa binomijakaumaa tiheysfunktiona f H0 (t) = ( 10 t ) ( 1 2 ) t ( 1 1 2) 10 t, t = 0, 1,..., 10, ja odotusarvona 5. Havaittu testisuureen arvo t(y) = 1 poikkeaa odotusarvosta 4 yksikköä. Näin ollen p-arvoksi saadaan p(y) = P( t(x) 5 4 H 0 ) = 1 10 f H0 (t) + f H0 (t) 2.1%. Koska havaittu p-arvo alittaa valitun merkitsevyystason 5%, nollahypoteesi hylätään. Testausvirheiden analysoimiseksi määritetään ensiksi testin hylkäysalue eli nollahypoteesin hylkäämiseen johtavien testisuureen arvojen joukko. Toistamalla ylläolevat laskelmat eri testisuureen arvoille voidaan testin mahdolliset p- arvot taulukoida seuraavasti: Kruunien lkm p-arvo (%) Taulukon mukaan testin hylkäysalue 5% merkitsevyystasolla on joukko {0, 1, 9, 10}. Hylkäysvirheen todennäköisyys on siis t=0 k=9 P(t(X) {0, 1, 9, 10} H 0 ) = 1 10 f H0 (t) + f H0 (t) 2.1%. t=0 t=9 121
8 Hyväksymisvirheen todennäköisyyttä on hankalampi analysoida, sillä vastahypoteesi θ 0.5 ei yksiselitteisesti määritä datalähteen jakaumaa. Periaatteessa vastahypoteesin vallitessa voi kruunan todennäköisyys θ olla mielivaltaisen lähellä arvoa 0.5. Ääritilanteessa, jossa θ on hyvin lähellä arvoa 0.5, saadaan hyväksymisvirheen todennäköisyydeksi P( t(x) {2,..., 8} H 1 ) P( t(x) {2,..., 8} H 0 ) = 8 f H0 (t) 97.9%. Mikäli vastahypoteesi pitää paikkansa parametrin arvolla θ 0.5, testi päätyy siis virheellisesti hyväksymään nollahypoteesin hyvin suurella todennäköisyydellä. Esimerkki (Kaksi kolikkoa). Tasaiseksi väitettyä kolikkoa 10 kertaa heitettäessä (0=klaava, 1=kruuna) havaitaan data y = (0, 0, 1, 0, 0, 0, 0, 0, 0, 0). Varmuudella tiedetään, että heitetylle kolikolle on kruunan todennäköisyys joko 0.5 tai 0.9. Testaa väitteen paikkansapitävyyttä 5% merkitsevyystasolla ja analysoi hylkäys- ja hyväksymisvirheiden todennäköisyyttä. Nollahypoteesi ja vastahypoteesi ovat H 0 : Kruunan tn θ = 0.5, H 1 : Kruunan tn θ = 0.9, ja testisuureeksi valitaan kruunien lukumäärä. Testin p-arvot, hylkäysalue ja hyväksymisalue ovat samat kuin esimerkissä 11.10, samoin havainnon y p-arvo 2.1%. Nollahypoteesi hylätään merkitsevyystasolla 5% havainnon y pohjalta. Hylkäysvirheen todennäköisyys on myös sama kuin esimerkissä eli noin 2.1%. Vastahypoteesin vallitessa datalähteen tuottamia testisuureen arvoja mallintava satunnaismuuttuja t(x) noudattaa binomijakaumaa pistetodennäköisyysfunktiona ( ) 10 f H1 (t) = 0.9 t (1 0.9) 10 t, t = 0, 1,..., 10. t Hyväksymisvirheen todennäköisyys saadaan nyt kaavasta P( t(x) {2, 3,..., 8} H 1 ) = 8 t=2 t=2 ( ) 10 f H1 (t) 26%. t 11.5 Odotusarvon testi suurelle datajoukolle Tarkastellaan datalähdettä, jonka oletetaan tuottavan toisistaan riippumattomia ja samoin jakautuneita satunnaislukuja X 1, X 2,... odotusarvona µ ja keskihajontana σ > 0. Satunnaislukujen jakauma on tuntematon, jolloin myös µ ja σ ovat tuntemattomia. Halutaan testata nollahypoteesia H 0 : µ = µ 0, 122
9 missä µ 0 on oletettu odotusarvoparametrin µ arvo. Mikäli datalähteen arvojen jakaumasta ei tiedetä mitään, vaikuttaa mahdottomalta laatia toimivaa testiä ylläolevalle hypoteesille. Jos datalähteestä on saatu kerättyä suuri määrä dataa, voidaan toimiva testi kuitenkin muodostaa. Havaitusta suuresta datajoukosta x = (x 1,..., x n ) lasketaan ensiksi keskiarvo ja otoskeskihajonta kaavoilla m(x) = 1 n n x i ja s(x) = i=1 ( 1 n 1 1/2 n (x i m(x)) )) 2, ja sen jälkeen testisuureeksi määritellään datajoukon keskiarvon normitettu poikkeama väitetystä odotusarvosta t(x) = m(x) µ 0 s(x)/ n. Allaolevan tuloksen perusteella testin p-arvo suurilla n:n arvoilla on likimain i=1 P( t(x) t(x) H 0 ) P(Z t(x) ), missä Z noudattaa normitettua normaalijakaumaa. Testisuureen likiarvoiseksi p-arvoksi saadaan siis p(x) 2(1 Φ( t(x) ), missä Φ(t) on normitetun normaalijakauman kertymäfunktio. Fakta Yllä kuvatun datalähteen tuottamia testisuureen arvoja mallintavan satunnaismuuttujan t(x) jakauma suppenee nollahypoteesin vallitessa kohti normitettua normaalijakaumaa, kun n. Todistus. Keskeisen raja-arvolauseen seurauksena todellisella keskihajontaparametrilla normitettu keskiarvon poikkeama m(x) µ 0 σ/ n on jakaumaltaan lähellä normitettua normaalijakaumaa. Suurten lukujen lakia soveltamalla satunnaislukuihin X 2 1, X 2 2,... voidaan lisäksi perustella, että nollahypoteesin vallitessa σ s(x) 1 suurella todennäköisyydellä, kun n. Väite seuraa näistä havainnosta käyttämällä nk. Slutskyn lemmaa [van der Vaart, 1998]. Esimerkki (Kahviautomaatti). Kahviautomaatin on tarkoitus laskea jokaiseen kuppiin keskimäärin 10.0 cl kahvia. Laitteen toimintaa testattiin valuttamalla automaatista 30 kupillista ja mittaamalla kahvin määrät kupeissa. Mittauksessa havaittiin arvot (cl): 123
10 Onko kahviautomaatti oikein kalibroitu? Merkitään kahviautomaatin tuottamien kahvikupillisten keskiarvoa parametrilla µ (tuntematon) ja väitettyä keskiarvoa µ 0. Kysymys voidaan tulkita tilastollisena testinä, jossa nollahypoteesi ja vastahypoteesi ovat H 0 : µ = 10.0 H 1 : µ 10.0 Mittausdatan x keskiarvo on m(x) = ja keskihajonta s(x) = Havaitun datajoukon normitettu poikkeama on näin ollen t(x) = m(x) µ 0 s(x)/ n = / 30 = Koska n = 30 on kohtalaisen suuri luku, sovelletaan suuren datajoukon likiarvoista testiä, jolloin p-arvoksi saadaan p-arvo P( t(x) t(x) H 0 ) P( Z 4.60) Näin pieni p-arvo puoltaa H 0 :n hylkäämistä, joten esim. yleisesti käytetyllä merkitsevyystasoilla 1% voidaan todeta, että kahviautomaatti on väärin kalibroitu Hylkäysvirheen todennäköisyyden analyysi Lauseen 11.7 todistuksen pohjaksi perustellaan ensiksi seuraava aputulos. Lemma Jos S α = {s R : P(Z s) α} on niiden arvojen joukko, joita reaaliarvoinen satunnaismuuttuja Z saa enintään todennäköisyydellä α (0, 1), niin P(Z S α ) α. Todistus. Koska todennäköisyyden monotonisuuden perusteella funktio s P(Z s) on vähenevä, voidaan päätellä, että joukko S α on lukuväli muotoa [s α, ) tai (s α, ), missä luku s α on joukon S α suurin alaraja. (i) Tapauksessa S α = [s α, ) luku s α sisältyy joukkoon S α, joten joukon S α määritelmän mukaan P(Z S α ) = P(Z s α ) α. (ii) Tapauksessa S α = (s α, ) tehdään vastaoletus, että P(Z S α ) > α. Tällöin P(Z > s α ) > α. Todennäköisyyden jatkuvuuden perusteella tiedetään, että P(Z > s α ) = lim s sα P(Z s). Näin ollen P(Z s) > α jollain s > s α. Tästä seuraa että luku s ei kuulu joukkoon S α, joten s on kyseisen joukon alaraja. Tämä on looginen ristiriita, sillä s α määriteltiin joukon S α suurimmaksi alarajaksi. Vastaoletus on siis epätosi, ja pätee P(Z S α ) α. 124
11 Lauseen 11.7 todistus. Merkitään satunnaismuuttujalla T = t(x) nollahypoteesin mukaisen datalähteen tuottamasta datajoukosta laskettua testisuureen arvoa ennen datan havaitsemista. Olkoon t 0 = E H0 (T ) kyseisen testisuureen odotusarvo. Tällöin nollahypoteesi havaitulle datajoukolle x hylätään täsmälleen silloin, kun sitä vastaavan testisuureen poikkeama t(x) t 0 sisältyy joukkoon { } S α = s R : P H0 ( T t 0 s) < α. Merkitsemällä joukon S α sulkeumaa { } S α = s R : P H0 ( T t 0 s) α saadaan hylkäysvirheelle yläraja P H0 (H 0 hylätään) = P H0 ( T t 0 S α ) P H0 ( T t 0 S α ). Soveltamalla lemmaa satunnaismuuttujaan T t 0, havaitaan että ylläolevan epäyhtälön oikea puoli on enintään α. 125
12 Hakemisto Bayesin kaava, 16, 97 Bernoulli-jakauma, 58 betajakauma, 101 binomijakauma, 58 binomikerroin, 19 bitti, 43 Chebyshevin epäyhtälö, 50 eksponenttijakauma, 26 entropia, 43 ergodinen, 46 erotus, 10 esiintyvyysharha, 16 estimaattori, 81 harhaton estimaattori, 82 hylkäysalue, 120 hyperparametri, 103 indikaattorifunktio, 27 jakauma, 22 diskreetti, 24 empiirinen, 71 jatkuva, 24 kertoma, 18 kertymäfunktio, 23 keskihajonta jakauman, 48 satunnaismuuttujan, 48 kombinatoriikka, 17 komplementti, 10 korrelaatio yhteisjakauman, 51 kovarianssi yhteisjakauman, 51 leikkaus, 10 lukumäärä listat, 18 osajoukot, 19 lukumäärä, järjestykset, 18 merkitsevyystaso, 118 mitallinen funktio, 34 joukko, 20 momentti, 42 multinomijakauma, 137 nollahypoteesi, 115 normaalijakauma normitettu, 63 osajoukko, 9 ositus, 9 osituskaava, 15 otoskeskihajonta, 74 otoskorrelaatio, 75 otoskovarianssi, 75 p-arvo, 116 perusjoukko, 8 pistemassafunktio, 24 pistetodennäköisyysfunktio, 24 Poisson-jakauma, 25, 68 posteriorijakauma, 97 priorijakauma, 97 reunajakauma diskreetti, 29 jatkuva, 29 reunatiheysfunktio diskreetti, 29 jatkuva, 29 riippumattomat satunnaismuuttujat,
13 tapahtumat, 13 satunnaismuuttuja, 21 diskreetti, 24 sigma-algebra, 20 suppeneminen stokastinen, 37 suurimman uskottavuuden estimaatti, 79 suurten lukujen laki, 37 vahva, 46 jatkuva, 27 tiheysfunktio, 28 tapahtuma, 8 poissulkevat, 9 tasajakauma diskreetti, 25 jatkuva, 25 tiheysfunktio, 24 empiirinen, 71 tilastollinen merkitsevyys, 116 tilastollinen testi, 115 todennäköisyys aksiooma, 11 ehdollinen, 13 frekvenssitulkinta, 39 jakauma, 11 mitta, 11 monotonisuus, 11 summasääntö, 11 tulosääntö, 13 todennäköisyysfunktio, 24 toteuma, 8 tulojoukko, 10 tyhjä joukko, 10 uskottavuusfunktio, 79, 97 logaritminen, 80 varianssi jakauman, 48 satunnaismuuttujan, 48 vastahypoteesi, 115 yhdiste, 10 yhteisjakauma, 26 diskreetti,
14 Kirjallisuutta [JP04] Jean Jacod and Philip Protter. Probability Essentials. Springer, second edition, [Kal02] Olav Kallenberg. Foundations of Modern Probability. Springer, second edition, [Wil91] David Williams. Probability with Martingales. Cambridge University Press,
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
11.1 Nollahypoteesi, vastahypoteesi ja p-arvo
Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 4. joulukuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja p-arvo Aiemmissa luvuissa opittiin määrittämään piste-estimaatteja ja väliestimaatteja
Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017
Luku 1 Bayesläiset estimaattorit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 217 1.1 Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Bayesläiset tilastolliset mallit
Luku 9 Bayesläiset tilastolliset mallit Lasse Leskelä Aalto-yliopisto 8. lokakuuta 07 9. Priorijakauma ja posteriorijakauma Bayesläisen tilastollisen päättelyn lähtökohtana on päivittää satunnaisilmiöön
Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3
Luku 6 Datajoukkojen jakaumat, tunnusluvut ja kuvaajat Lasse Leskelä Aalto-yliopisto. lokakuuta 207 6. Datajoukko ja datakehikko Tässä monisteessa datajoukko tarkoittaa järjestettyä listaa keskenään samantyyppisiä
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden
Satunnaismuuttujan odotusarvo ja laskusäännöt
Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
Tilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
Väliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
Satunnaismuuttujien summa ja keskiarvo
Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 21. syyskuuta 2017 5.1 Satunnaismuuttujien summa Satunnaismuuttujien summa S n = X 1 + +X n ja keskiarvo n 1 S n ovat satunnaismuuttujia,
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
Satunnaismuuttujan odotusarvo ja laskusäännöt
Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 16. syyskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
Satunnaismuuttujien summa ja keskiarvo
Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 5.1 Satunnaismuuttujien summa Kahden satunnaismuuttujan summa X + Y on satunnaismuuttuja, jonka jakauma
Liite B. Suomi englanti-sanasto
Liite B Suomi englanti-sanasto Alla tässä monisteessa esiintynyttä sanastoa englanniksi käännettynä. Monet tähän aihepiiriin liittyvät termit eivät kuitenkaan ole täysin vakiintuneita kummassakaan kielessä.
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
Harjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Keskihajonta ja korrelaatio
Luku 4 Keskihajonta ja korrelaatio Lasse Leskelä Aalto-yliopisto 19. syyskuuta 2017 4.1 Jakauman varianssi ja keskihajonta Edellisessä luvussa opittiin, että satunnaismuuttujan odotusarvo on X:n jakauman
Mat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu
30A02000 Tilastotieteen perusteet
30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Todennäköisyyden käsite ja laskusäännöt
Luku 1 Todennäköisyyden käsite ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 1.1 Todennäköisyyden käsite Todennäköisyys on tapa kuvailla kvantitatiivisesti jonkin tapahtuman uskottavuutta,
031021P Tilastomatematiikka (5 op) viikko 5
031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
Todennäköisyyden ominaisuuksia
Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Tilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Kalle Kytölä, Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden
Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:
8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman
Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto
Matemaattinen tilastotiede Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Alkusanat Tämä moniste perustuu vuosina 2002-2004 pitämiini matemaattisen tilastotieteen luentoihin
Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1
Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen
MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1
Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
Estimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu
1. Tyhjentävä tunnusluku (sucient statistics ) Olkoon (P(X = x θ) : θ Θ) todennäköisyysmalli havainnolle X. Datan funktio T (X ) on Tyhjentävä tunnusluku jos ehdollinen todennäköisyys (ehdollinen tiheysfunktio)
Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko
ÌÓÒÒĐĐÓ ÝÝ ÔÖÙ ØØ Naiiveja määritelmiä Suhteellinen frekvenssi kun ilmiö toistuu Jos tehdas on valmistanut 1000000 kpl erästä tuotetta, joista 5013 ovat viallisia, niin todennäköisyys, että tuote on viallinen
Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
Harjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5
TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä
Satunnaismuuttujat ja jakaumat
Luku 2 Satunnaismuuttujat ja jakaumat Lasse Leskelä Aalto-yliopisto 2. syyskuuta 207 2. Satunnaismuuttujan käsite Käytännön tilanteissa ei yleensä olla kiinnostuneita satunnaisilmiön kaikista yksityiskohdista,
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5
MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai
Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta
MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi
Testejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?
6.10.2006 1. Keppi, jonka pituus on m, taitetaan kahtia täysin satunnaisesti valitusta kohdasta ja muodostetaan kolmio, jonka kateetteina ovat syntyneet palaset. Kolmion pinta-ala on satunnaismuuttuja.
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on
HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 018 Harjoitus B Ratkaisuehdotuksia Tehtäväsarja I 1 (Monisteen tehtävä 14) Olkoon f Y (y; θ) tilastollinen malli, jonka
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3
3.11.2006. ,ܾ jaü on annettu niin voidaan hakea funktion 0.1 0.2 0.3 0.4
Ü µ ½ ¾Ü¾µ Ü¾Ê 3.11.2006 1. Satunnaismuuttujan tiheysfunktio on ¼ ļ ܽ ܾ ÜÒµ Ä Ü½ ÜÒµ Ò Ä Ü½ ܾ ÜÒµ ܽ µ ܾ µ ÜÒ µ Ò missä tietenkin vaaditaan, että ¼. Muodosta :n ¾Ä ܽ ÜÒµ Ò ½¾ ܾ Ò ½ ¾Ü¾½µ ½ ¾Ü¾Òµ
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
Mat Sovellettu todennäköisyyslasku A
TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin
Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio
Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio
Tilastolliset luottamusvälit
Luku 8 Tilastolliset luottamusvälit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 8.1 Piste-estimaatti ja väliestimaatti Edellisessä luvussa opittii määrittämää parametreille estimaatteja suurimma uskottavuude
Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen
MAT-5 Todennäköisyyslaskenta Tentti.. / Kimmo Vattulainen Vastaa jokainen tehtävä eri paperille. Funktiolaskin sallittu.. a) P A). ja P A B).6. Mitä on P A B), kun A ja B ovat riippumattomia b) Satunnaismuuttujan
6. laskuharjoitusten vastaukset (viikot 10 11)
6. laskuharjoitusten vastaukset (viikot 10 11) 1. a) Sivun 102 hypergeometrisen jakauman määritelmästä saadaan µ µ 13 39 13! 13 12 11 10 9 µ 0! 8! 1! 2 2! 2 1 0 49 48! 47!! 14440 120 31187200 120 1287
MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu
ilastollinen päättely 5.. Johdanto Estimointi, Joukkoestimointi, Kriittinen alue, uottamusjoukko, uottamustaso, uottamusväli, Otos, Parametri, Peittotodennäköisyys, Piste-estimointi, Väliestimaatti, Väliestimaattori,
Testit laatueroasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten
riippumattomia ja noudattavat samaa jakaumaa.
12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta
Tilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita
tilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.
9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2
805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 2 Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden
Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset
Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 21. syyskuuta 2007 Antti Rasila () TodB 21. syyskuuta 2007 1 / 19 1 Satunnaismuuttujien riippumattomuus 2 Jakauman tunnusluvut Odotusarvo Odotusarvon ominaisuuksia
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle
Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman
Stokastiikka ja tilastollinen ajattelu
Stokastiikka ja tilastollinen ajattelu Versio 0.9 Lasse Leskelä Aalto-yliopisto 3. tammikuuta 208 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite...................... 5.2 Satunnaisilmiön