11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot
|
|
- Aarne Hakola
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 17. lokakuuta Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot Datalähteen tuottamia arvoja mallinnetaan jakaumaa f(x θ) noudattavina satunnaismuuttujina, missä parametri θ on tuntematon. Tilastollisen estimoinnin tavoitteena on havaitun datajoukon (x 1,..., x n ) pohjalta määrittää parametrille paras arvaus joko piste-estimaattina tai väliestimaattina. Monissa käytännön tilanteissa pelkkä estimaatin määrittäminen ei riitä, vaan havaintojen pohjalta täytyy tehdä johtopäätös, pitääkö jokin parametria θ koskeva oletus paikkaansa vai ei. Tilastollinen testi on systemaattinen menetelmä laatia tämän tyyppisiä johtopäätöksiä. Tilastollisen testin lähtökohtana on nollahypoteesi H 0, joka kuvastaa datalähteen oletusarvoista käyttäytymistä. Stokastisen mallin avulla voidaan ennustaa, millaisia arvoja nollahypoteesin mukainen datalähde todennäköisesti tuottaa. Satunnaisvaihtelun takia havaitut arvot (x 1,..., x n ) aina poikkeavat jonkun verran ennusteesta. Jos nollahypoteesi pitää paikkansa, tulisi suurten poikkeamien kuitenkin olla harvinaisia. Mikäli havaitut poikkeamat ovat suuria, antaa tämä aihetta nollahypoteesin hylkäämiseen. Tilastollisessa testissä on myös tapana määritellä vastahypoteesi H 1. Yleensä vastahypoteesi on nollahypoteesin vastakohta. Joissain tilanteissa voidaan vastahypoteesia rajoittamalla rajata testin piiristä pois parametriarvoja, joista ei olla kiinnostuneita. Esimerkki 11.1 (Kolikko). Tasaiseksi väitettyä kolikkoa 50 kertaa heitettäessä saadaan heittosarja, joka sisältää 42 kruunaa. Kuuluuko havaittu tulos tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä kolikon tasaisuutta? 115
2 Koetilannetta vastaavan datalähteen tuottamia arvoja voidaan mallintaa binomijakaumaa Bin(50, θ) noudattavina satunnaismuuttujina, jolloin nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : θ = 0.5, H 1 : θ 0.5. Esimerkki 11.2 (Tiedonsiirtokanava). Kun tiedonsiirtokanavan yli lähetetään lukuarvoinen signaali µ, niin kohinan takia vastaanottaja havaitsee arvon X, joka noudattaa normaalijakaumaa odotusarvona µ ja keskihajontana 3. Eräänä päivänä lähettäjän uskotaan lähettävän arvon µ = 8. Kun vastaanotettu arvo on x 1 = 12.8, onko syytä epäillä, että lähetetyn signaalin arvo ei ollutkaan 8? Datalähteen tuottamia arvoja voidaan mallintaa normaalijakautuneina satunnaismuuttujina odotusarvona µ (tuntematon) ja keskihajontana 3. Nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : µ = 8, H 1 : µ 8. Esimerkki 11.3 (Laadunvalvonta). Tukkukauppias väittää, että sen toimittamista tomaateista enintään 5% on huonolaatuisia. Suuresta tilauserästä poimittiin satunnaisesti 50 tomaattia ja niistä 4 todettiin huonolaatuisiksi. Kuuluuko tehty havainto tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä tukkukauppiaan väitettä? Esimerkkien 11.1 ja 11.2 nollahypoteeseja kutsutaan yksinkertaisiksi, sillä ne määrittävät datalähteen jakauman yksiselitteisesti. Esimerkin 11.3 nollahypoteesi on yhdistetty, sillä se sisältää monta mahdollista parametrin arvoa Tilastollinen merkitsevyys ja p-arvo Ylläolevissa esimerkeissä datalähteestä tehdyt havainnot vaikuttivat poikkeavan nollahypoteesia vastaavista tyypillisistä arvoista. Havaitun datajoukon poikkeuksellisuutta voidaan analysoida laskemalla testisuure t(x) = t(x 1,..., x n ) käyttämällä funktiota t(x), joka sopivalla tavalla tiivistää havaitut datapisteet yhdeksi reaaliluvuksi. Tilastollisen testin p-arvo on todennäköisyys, jolla nollahypoteesin mukaisen datalähteen ennustetaan tuottavan poikkeavampia tai yhtä poikkeavia testisuureen arvoja kuin t(x). Mikäli p-arvo on lähellä nollaa, johtuu havaittu poikkeama hyvin epätodennäköisesti satunnaisvaihtelusta ja antaa aiheen epäillä nollahypoteesin pitävyyttä. Tällaista poikkeamaa kutsutaan tilastollisesti merkitseväksi. Useimmissa sovelluskonteksteissa voidaan p-arvojen kokoa luonnehtia seuraavien nyrkkisääntöjen avulla: p-arvo Tulkinta > 0.10 Havainto ei ole ristiriidassa H 0 :n kanssa 0.05 Havainto todistaa jonkun verran H 0 :aa vastaan < 0.01 Havainto todistaa vahvasti H 0 :aa vastaan 116
3 Esimerkki 11.4 (Kolikko). Tasaiseksi väitettyä kolikkoa 50 kertaa heitettäessä saadaan heittosarja, joka sisältää 42 kruunaa. Kuuluuko havaittu tulos tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä kolikon tasaisuutta? Datalähteen tuottamia testisuureen arvoja voidaan mallintaa binomijakaumaa Bin(50, θ) noudattavina satunnaismuuttujana T, jolloin nollahypoteesi ja vastahypoteesi voidaan esittää muodossa H 0 : θ = 0.5, H 1 : θ 0.5. Nollahypoteesin vallitessa noudattaa kruunien lukumäärä T binomijakaumaa tiheysfunktiona ( ) ( ) t ( 50 1 f(t H 0 ) = t, t = 0, 1,..., 50, t 2 2) ja odotusarvona 25. Havaittu testisuureen arvo poikkeaa odotusarvosta 17 yksikköä. Näin suuren tai vielä suuremman poikkeaman todennäköisyys on nollahypoteesin vallitessa P( T H 0 ) = 8 50 f(t H 0 ) + f(t H 0 ) t=0 Havaitun testisuureen p-arvo on siis suuruusluokkaa yksi miljoonasta, mikä antaa vahvan perusteen epäillä kolikon tasaisuutta ja hylätä nollahypoteesi. Esimerkki 11.5 (Tiedonsiirtokanava). Kun tiedonsiirtokanavan yli lähetetään lukuarvoinen signaali µ, niin kohinan takia vastaanottaja havaitsee arvon X, joka noudattaa normaalijakaumaa odotusarvona µ ja keskihajontana 3. Eräänä päivänä lähettäjän uskotaan lähettävän arvon µ = 8. Kun vastaanotettu arvo on x 1 = 12.8, onko syytä epäillä, että lähetetyn signaalin arvo ei ollutkaan 8? Vastaanotettua signaalia voidaan mallintaa normaalijakautuneina satunnaismuuttujana odotusarvona µ (tuntematon) ja keskihajontana 3. Nollahypoteesi ja vastahypoteesi voidaan esittää muodossa t=42 H 0 : µ = 8, H 1 : µ 8. Valitaan testisuureeksi keskihajonnalla normitettu poikkeama t(x) = x 8 3 = 1.6. Tällöin testisuureen arvoja mallintava satunnaismuuttuja T = t(x) noudattaa nollahypoteesin vallitessa normitettua normaalijakaumaa. Todennäköisyys, että nollahypoteesin vallitessa T poikkeaa odotusarvostaan 1.6 yksikköä tai enemmän, saadaan symmetrian perusteella normaalijakauman taulukoista P( T 1.6 H 0 ) = 2P(T 1.6 H 0 ) = 2(1 P(T 1.6 H 0 )) 0.11, Havaitun testisuureen p-arvo on siis noin 11%, joten havaittu poikkeama on selitettävissä tavanomaisella satunnaisvaihtelulla. Vastaanotettu signaalin arvo ei tarjoa syytä epäillä H 0 :n paikkansapitävyyttä. 117
4 11.3 Yhdistetty nollahypoteesi Seuraava esimerkki edustaa yhdistettyä nollahypoteesia, joka vaatii huolellisempaa analyysiä, sillä siinä nollahypoteesi ei yksiselitteisesti määritä datalähteen stokastisen mallin jakaumaa. Lisäksi poikkeavien arvojen määrittämisessä pitää ottaa huomioon, poikkeaako havaittu testisuureen arvo ylöspäin vai alaspäin tyypillisestä arvosta. Esimerkki 11.6 (Laadunvalvonta). Tukkukauppias väittää, että sen toimittamista tomaateista enintään 5% on huonolaatuisia. Suuresta tilauserästä poimittiin satunnaisesti 50 tomaattia ja niistä 4 todettiin huonolaatuisiksi. Valitaan testisuureeksi huonolaatuisten tomaattien lukumäärä t(x) = 4. Koska tarkastetut 50 tomaattia on poimittu satunnaisotannalla suuresta populaatiosta, noudattaa testisuureen arvoja mallintava satunnaismuuttuja T suurella tarkkuudella binomijakaumaa tiheysfunktiona f θ (t) = ( 50 t ) θ t (1 θ) 50 t, t = 0, 1,..., 50, missä θ on huonolaatuisten tomaattien osuus koko tilauserässä. Tutkittavaa väitettä kuvaava nollahypoteesi ja vastahypoteesi voidaan nyt esittää muodossa H 0 : θ 0.05, H 1 : θ > Tällaisen yksisuuntaisen nollahypoteesin näkökulmasta poikkeavat havainnot ovat niitä, missä testisuureen arvo ylittää odotusarvonsa. Todennäköisyys, että nollahypoteesiä noudattava datalähde tuottaa havaittua testisuureen arvoa poikkeavampia tai yhtä poikkeavia testisuureen arvoja on siis ( ) P θ T E θ (T ) t(x) E θ (T ) = P θ (T 4) = 50 t=4 f θ (t). Ongelmana on, että tässä tapauksessa nollahypoteesi ei suoraan määritä datalähteen eikä sitä vastaavan testisuureen jakaumaa. Tällaisessa tilanteessa p-arvo määritellään kaavalla p-arvo = max P θ(t t(x)). θ 0.05 Koska ylläoleva todennäköisyys maksimoituu 1 arvolla θ = 0.05, saadaan p- arvoksi ( ) 50 p-arvo = f 0.05 (t) = 0.05 t (1 0.50) 50 t 0.24, t t=4 mikä ei anna aihetta epäillä nollahypoteesin paikkansapitävyyttä. t=4 1 Yläraja voidaan perustella niin, että tulkitaan T kruunien lukumääräksi 50 kolikon heittosarjassa, jossa kruunan todennäköisyys on θ. Kun kruunan todennäköisyys kasvaa, kasvaa myös todennäköisyys että havaittujen kruunien lukumäärä ylittää kynnysarvon
5 11.4 Testausvirheet Tietyissä tilanteissa vaaditaan testaajalta yksiselitteistä johtopäätöstä: testin pohjalta H 0 joko hyväksytään tai hylätään. Johtopäätöksen pohjaksi valitaan testin merkitsevyystaso α (0, 1) ja johtopäätös muodostetaan seuraavasti: Jos p-arvo α, nollahypoteesi hyväksytään (jätetään voimaan), Jos p-arvo < α, nollahypoteesi hylätään. Näin menetellessä mikään ei takaa, että tehty johtopäätös olisi oikea. Esimerkin 11.4 kolikonheitossa havaittiin 42 kruunaa p-arvona 10 6, joten nollahypoteesi (tasainen kolikko) hylätään merkitsevyystasolla α = On kuitenkin periaatteessa mahdollista, että tasaisella kolikolla satuttiin tekemään äärimmäisen epätodennäköinen 42 kruunan heittosarja. Tällöin tehdään hylkäysvirhe. Esimerkin 11.5 tiedonsiirtokanavassa havaittiin virheen arvoksi 10.8 p- arvona 11%, joten nollahypoteesi (normaalijakautuneet arvot odotusarvona 0 ja keskihajontana 3) hyväksytään merkitsevyystasolla α = On kuitenkin mahdollista, että havaittu virhe onkin mitattu kanavasta, jossa kohinan aiheuttamat virheet noudattavat normaalijakaumaa esim. odotusarvona 2 ja keskihajontana 3. Tällöin tehdään hyväksymisvirhe. Eri tavat tehdä oikea tai virheellinen johtopäätös voidaan taulukoida seuraavasti: Johtopäätös Totuus H 0 hyväksytään H 0 hylätään H 0 tosi Oikea päätös Hylkäysvirhe H 0 epätosi Hyväksymisvirhe Oikea päätös Seuraava keskeinen tulos (lause 11.7) takaa, että hylkäysvirheen todennäköisyys voidaan säätää pieneksi asettamalla riittävän pieni merkitsevyystaso. Tuloksen todistus (luku 11.6) yleisessä muodossa sisältää reaalianalyysin yksityiskohtia, jotka eivät ole tilastollisen päättelyn kannalta keskeisiä. Lause Tilastollisen testin hylkäysvirheen todennäköisyys on korkeintaan testin merkitsevyystaso α. Hyväksymisvirheen todennäköisyyttä sen sijaan on yleisesti vaikea kontrolloida. Tästä syystä nollahypoteesi on syytä muotoilla niin, että se vastaa yleistä vallalla olevaa käsitystä tutkittavasta asiasta, tai niin että virheellisen nollahypoteesin hyväksymisellä ei ole vakavia seuraamuksia. 119
6 Esimerkki 11.8 (Rikosoikeus). Yksityishenkilön epäiltyä rikosta koskevassa oikeudenkäynnissä tulee päättää, onko syytetty henkilö syytön vai syyllinen saatavilla olevan datan perusteella. Tällöin nollahypoteesi voidaan esittää joko muodossa H 0 : Epäilty henkilö on syytön tai muodossa H 0: Epäilty henkilö on syyllinen Nollahypoteesiä H 0 vastaava hyväksymisvirhe vastaa syyllisen henkilön tuomitsematta jättämistä ja hylkäysvirhe syyttömän henkilön tuomitsemista. Hylkäysvirheen todennäköisyys saadaan lauseen 11.7 perusteella pieneksi valitsemalla testille riittävän pieni merkitsevyystaso. Hyväksymisvirheen todennäköisyyttä on sen sijaan vaikeampi kontrolloida. Jos nollahypoteesiksi valittaisiinkin H 0, niin tilastollisessa testissä ei syyttömien henkilöiden tuomitsemisen (H 0:n hyväksymisvirhe) riskiä voisi kunnolla kontrolloida, mikä olisi ristiriidassa yleisen oikeusperiaatteen kanssa. Esimerkki 11.9 (Tupakkatuote). Jos halutaan tutkia uudentyyppisen tupakkatuotteen vaikutusta terveyteen, voidaan nollahypoteesi esittää joko muodossa H 0 : Uudella tupakkatuotteella ei ole terveyttä edistäviä vaikutuksia tai muodossa H 0: Uudella tupakkatuotteella on terveyttä edistäviä vaikutuksia Nollahypoteesiä H 0 vastaavan hyväksymisvirheen tekeminen olisi tupakkatuotteen valmistajan kannalta haitallista, mutta hyväksymisvirheen yhteiskunnalliset vaikutukset eivät luultavasti olisi suuria. Nollahypoteesin H 0 hylkäysvirheellä saattaisi olla yhteiskunnalle hyvinkin haitalliset seuraukset. Hylkäysvirheen todennäköisyys saadaan lauseen 11.7 perusteella pieneksi valitsemalla testille riittävän pieni merkitsevyystaso. Jos nollahypoteesiksi valittaisiinkin H 0, niin merkitsevyystasoa pieneksi säätämällä voitaisiin kontrolloida tupakkavalmistajan epäreilun kohtelun (H 0:n hylkäysvirhe) riskiä, mutta ei yhteiskunnallisten terveyshaittojen (H 0:n hyväksymisvirhe) riskiä. Henkilö A, joka elämänsä aikana tekee suuren määrän hypoteesitestejä merkitsevyystasolla α = 5% on henkisesti varautunut siihen, että tietty osuus testien johtopäätöksistä on virheellisiä. Hän myös tietää, että pitkällä tähtäyksellä hänen hylkäämistään nollahypoteeseista enintään 5% on virheellisesti hylätty. (Hän ei kuitenkaan tiedä mitkä niistä.) 120
7 Henkilö B, joka tekee elämänsä aikana suuren määrän hypoteesitestejä merkitsevyystasolla α = 1% on myös varautunut siihen, että tietty osuus testipäätelmistä on virheellisiä. Hän tietää, että hänen hylkäämistään nollahypoteeseista enintään 1% on virheellisesti hylätty. Lisäksi hän tietää, että hänen hyväksymistään nollahypoteeseista on suurempi osuus virheellisiä kuin henkilöllä A. Henkilö B on taipuvaisempi harvemmin hylkäämään nollahypoteeseja, minkä johdosta hän tekee pitkällä tähtäyksellä harvemmin hylkäysvirheitä mutta useammin hyväksymisvirheitä. Esimerkki (Tuntematon kolikko). Tasaiseksi väitettyä kolikkoa 10 kertaa heitettäessä (0=klaava, 1=kruuna) havaitaan data y = (0, 0, 1, 0, 0, 0, 0, 0, 0, 0). Testaa väitteen paikkansapitävyyttä 5% merkitsevyystasolla ja analysoi hylkäysja hyväksymisvirheiden todennäköisyyksiä. Testin nollahypoteesi ja vastahypoteesi ovat H 0 : θ = 0.5, H 1 : θ 0.5, missä θ on kruunan todennäköisyys. Valitaan testisuureeksi kruunien lukumäärä t(x) = x x 10. Datalähteen tuottamia testisuureen arvoja mallintava satunnaismuuttuja t(x) noudattaa nollahypoteesin vallitessa binomijakaumaa tiheysfunktiona f H0 (t) = ( 10 t ) ( 1 2 ) t ( 1 1 2) 10 t, t = 0, 1,..., 10, ja odotusarvona 5. Havaittu testisuureen arvo t(y) = 1 poikkeaa odotusarvosta 4 yksikköä. Näin ollen p-arvoksi saadaan p(y) = P( t(x) 5 4 H 0 ) = 1 10 f H0 (t) + f H0 (t) 2.1%. Koska havaittu p-arvo alittaa valitun merkitsevyystason 5%, nollahypoteesi hylätään. Testausvirheiden analysoimiseksi määritetään ensiksi testin hylkäysalue eli nollahypoteesin hylkäämiseen johtavien testisuureen arvojen joukko. Toistamalla ylläolevat laskelmat eri testisuureen arvoille voidaan testin mahdolliset p- arvot taulukoida seuraavasti: Kruunien lkm p-arvo (%) Taulukon mukaan testin hylkäysalue 5% merkitsevyystasolla on joukko {0, 1, 9, 10}. Hylkäysvirheen todennäköisyys on siis t=0 k=9 P(t(X) {0, 1, 9, 10} H 0 ) = 1 10 f H0 (t) + f H0 (t) 2.1%. t=0 t=9 121
8 Hyväksymisvirheen todennäköisyyttä on hankalampi analysoida, sillä vastahypoteesi θ 0.5 ei yksiselitteisesti määritä datalähteen jakaumaa. Periaatteessa vastahypoteesin vallitessa voi kruunan todennäköisyys θ olla mielivaltaisen lähellä arvoa 0.5. Ääritilanteessa, jossa θ on hyvin lähellä arvoa 0.5, saadaan hyväksymisvirheen todennäköisyydeksi P( t(x) {2,..., 8} H 1 ) P( t(x) {2,..., 8} H 0 ) = 8 f H0 (t) 97.9%. Mikäli vastahypoteesi pitää paikkansa parametrin arvolla θ 0.5, testi päätyy siis virheellisesti hyväksymään nollahypoteesin hyvin suurella todennäköisyydellä. Esimerkki (Kaksi kolikkoa). Tasaiseksi väitettyä kolikkoa 10 kertaa heitettäessä (0=klaava, 1=kruuna) havaitaan data y = (0, 0, 1, 0, 0, 0, 0, 0, 0, 0). Varmuudella tiedetään, että heitetylle kolikolle on kruunan todennäköisyys joko 0.5 tai 0.9. Testaa väitteen paikkansapitävyyttä 5% merkitsevyystasolla ja analysoi hylkäys- ja hyväksymisvirheiden todennäköisyyttä. Nollahypoteesi ja vastahypoteesi ovat H 0 : Kruunan tn θ = 0.5, H 1 : Kruunan tn θ = 0.9, ja testisuureeksi valitaan kruunien lukumäärä. Testin p-arvot, hylkäysalue ja hyväksymisalue ovat samat kuin esimerkissä 11.10, samoin havainnon y p-arvo 2.1%. Nollahypoteesi hylätään merkitsevyystasolla 5% havainnon y pohjalta. Hylkäysvirheen todennäköisyys on myös sama kuin esimerkissä eli noin 2.1%. Vastahypoteesin vallitessa datalähteen tuottamia testisuureen arvoja mallintava satunnaismuuttuja t(x) noudattaa binomijakaumaa pistetodennäköisyysfunktiona ( ) 10 f H1 (t) = 0.9 t (1 0.9) 10 t, t = 0, 1,..., 10. t Hyväksymisvirheen todennäköisyys saadaan nyt kaavasta P( t(x) {2, 3,..., 8} H 1 ) = 8 t=2 t=2 ( ) 10 f H1 (t) 26%. t 11.5 Odotusarvon testi suurelle datajoukolle Tarkastellaan datalähdettä, jonka oletetaan tuottavan toisistaan riippumattomia ja samoin jakautuneita satunnaislukuja X 1, X 2,... odotusarvona µ ja keskihajontana σ > 0. Satunnaislukujen jakauma on tuntematon, jolloin myös µ ja σ ovat tuntemattomia. Halutaan testata nollahypoteesia H 0 : µ = µ 0, 122
9 missä µ 0 on oletettu odotusarvoparametrin µ arvo. Mikäli datalähteen arvojen jakaumasta ei tiedetä mitään, vaikuttaa mahdottomalta laatia toimivaa testiä ylläolevalle hypoteesille. Jos datalähteestä on saatu kerättyä suuri määrä dataa, voidaan toimiva testi kuitenkin muodostaa. Havaitusta suuresta datajoukosta x = (x 1,..., x n ) lasketaan ensiksi keskiarvo ja otoskeskihajonta kaavoilla m(x) = 1 n n x i ja s(x) = i=1 ( 1 n 1 1/2 n (x i m(x)) )) 2, ja sen jälkeen testisuureeksi määritellään datajoukon keskiarvon normitettu poikkeama väitetystä odotusarvosta t(x) = m(x) µ 0 s(x)/ n. Allaolevan tuloksen perusteella testin p-arvo suurilla n:n arvoilla on likimain i=1 P( t(x) t(x) H 0 ) P(Z t(x) ), missä Z noudattaa normitettua normaalijakaumaa. Testisuureen likiarvoiseksi p-arvoksi saadaan siis p(x) 2(1 Φ( t(x) ), missä Φ(t) on normitetun normaalijakauman kertymäfunktio. Fakta Yllä kuvatun datalähteen tuottamia testisuureen arvoja mallintavan satunnaismuuttujan t(x) jakauma suppenee nollahypoteesin vallitessa kohti normitettua normaalijakaumaa, kun n. Todistus. Keskeisen raja-arvolauseen seurauksena todellisella keskihajontaparametrilla normitettu keskiarvon poikkeama m(x) µ 0 σ/ n on jakaumaltaan lähellä normitettua normaalijakaumaa. Suurten lukujen lakia soveltamalla satunnaislukuihin X 2 1, X 2 2,... voidaan lisäksi perustella, että nollahypoteesin vallitessa σ s(x) 1 suurella todennäköisyydellä, kun n. Väite seuraa näistä havainnosta käyttämällä nk. Slutskyn lemmaa [van der Vaart, 1998]. Esimerkki (Kahviautomaatti). Kahviautomaatin on tarkoitus laskea jokaiseen kuppiin keskimäärin 10.0 cl kahvia. Laitteen toimintaa testattiin valuttamalla automaatista 30 kupillista ja mittaamalla kahvin määrät kupeissa. Mittauksessa havaittiin arvot (cl): 123
10 Onko kahviautomaatti oikein kalibroitu? Merkitään kahviautomaatin tuottamien kahvikupillisten keskiarvoa parametrilla µ (tuntematon) ja väitettyä keskiarvoa µ 0. Kysymys voidaan tulkita tilastollisena testinä, jossa nollahypoteesi ja vastahypoteesi ovat H 0 : µ = 10.0 H 1 : µ 10.0 Mittausdatan x keskiarvo on m(x) = ja keskihajonta s(x) = Havaitun datajoukon normitettu poikkeama on näin ollen t(x) = m(x) µ 0 s(x)/ n = / 30 = Koska n = 30 on kohtalaisen suuri luku, sovelletaan suuren datajoukon likiarvoista testiä, jolloin p-arvoksi saadaan p-arvo P( t(x) t(x) H 0 ) P( Z 4.60) Näin pieni p-arvo puoltaa H 0 :n hylkäämistä, joten esim. yleisesti käytetyllä merkitsevyystasoilla 1% voidaan todeta, että kahviautomaatti on väärin kalibroitu Hylkäysvirheen todennäköisyyden analyysi Lauseen 11.7 todistuksen pohjaksi perustellaan ensiksi seuraava aputulos. Lemma Jos S α = {s R : P(Z s) α} on niiden arvojen joukko, joita reaaliarvoinen satunnaismuuttuja Z saa enintään todennäköisyydellä α (0, 1), niin P(Z S α ) α. Todistus. Koska todennäköisyyden monotonisuuden perusteella funktio s P(Z s) on vähenevä, voidaan päätellä, että joukko S α on lukuväli muotoa [s α, ) tai (s α, ), missä luku s α on joukon S α suurin alaraja. (i) Tapauksessa S α = [s α, ) luku s α sisältyy joukkoon S α, joten joukon S α määritelmän mukaan P(Z S α ) = P(Z s α ) α. (ii) Tapauksessa S α = (s α, ) tehdään vastaoletus, että P(Z S α ) > α. Tällöin P(Z > s α ) > α. Todennäköisyyden jatkuvuuden perusteella tiedetään, että P(Z > s α ) = lim s sα P(Z s). Näin ollen P(Z s) > α jollain s > s α. Tästä seuraa että luku s ei kuulu joukkoon S α, joten s on kyseisen joukon alaraja. Tämä on looginen ristiriita, sillä s α määriteltiin joukon S α suurimmaksi alarajaksi. Vastaoletus on siis epätosi, ja pätee P(Z S α ) α. 124
11 Lauseen 11.7 todistus. Merkitään satunnaismuuttujalla T = t(x) nollahypoteesin mukaisen datalähteen tuottamasta datajoukosta laskettua testisuureen arvoa ennen datan havaitsemista. Olkoon t 0 = E H0 (T ) kyseisen testisuureen odotusarvo. Tällöin nollahypoteesi havaitulle datajoukolle x hylätään täsmälleen silloin, kun sitä vastaavan testisuureen poikkeama t(x) t 0 sisältyy joukkoon { } S α = s R : P H0 ( T t 0 s) < α. Merkitsemällä joukon S α sulkeumaa { } S α = s R : P H0 ( T t 0 s) α saadaan hylkäysvirheelle yläraja P H0 (H 0 hylätään) = P H0 ( T t 0 S α ) P H0 ( T t 0 S α ). Soveltamalla lemmaa satunnaismuuttujaan T t 0, havaitaan että ylläolevan epäyhtälön oikea puoli on enintään α. 125
12 Hakemisto Bayesin kaava, 16, 97 Bernoulli-jakauma, 58 betajakauma, 101 binomijakauma, 58 binomikerroin, 19 bitti, 43 Chebyshevin epäyhtälö, 50 eksponenttijakauma, 26 entropia, 43 ergodinen, 46 erotus, 10 esiintyvyysharha, 16 estimaattori, 81 harhaton estimaattori, 82 hylkäysalue, 120 hyperparametri, 103 indikaattorifunktio, 27 jakauma, 22 diskreetti, 24 empiirinen, 71 jatkuva, 24 kertoma, 18 kertymäfunktio, 23 keskihajonta jakauman, 48 satunnaismuuttujan, 48 kombinatoriikka, 17 komplementti, 10 korrelaatio yhteisjakauman, 51 kovarianssi yhteisjakauman, 51 leikkaus, 10 lukumäärä listat, 18 osajoukot, 19 lukumäärä, järjestykset, 18 merkitsevyystaso, 118 mitallinen funktio, 34 joukko, 20 momentti, 42 multinomijakauma, 137 nollahypoteesi, 115 normaalijakauma normitettu, 63 osajoukko, 9 ositus, 9 osituskaava, 15 otoskeskihajonta, 74 otoskorrelaatio, 75 otoskovarianssi, 75 p-arvo, 116 perusjoukko, 8 pistemassafunktio, 24 pistetodennäköisyysfunktio, 24 Poisson-jakauma, 25, 68 posteriorijakauma, 97 priorijakauma, 97 reunajakauma diskreetti, 29 jatkuva, 29 reunatiheysfunktio diskreetti, 29 jatkuva, 29 riippumattomat satunnaismuuttujat,
13 tapahtumat, 13 satunnaismuuttuja, 21 diskreetti, 24 sigma-algebra, 20 suppeneminen stokastinen, 37 suurimman uskottavuuden estimaatti, 79 suurten lukujen laki, 37 vahva, 46 jatkuva, 27 tiheysfunktio, 28 tapahtuma, 8 poissulkevat, 9 tasajakauma diskreetti, 25 jatkuva, 25 tiheysfunktio, 24 empiirinen, 71 tilastollinen merkitsevyys, 116 tilastollinen testi, 115 todennäköisyys aksiooma, 11 ehdollinen, 13 frekvenssitulkinta, 39 jakauma, 11 mitta, 11 monotonisuus, 11 summasääntö, 11 tulosääntö, 13 todennäköisyysfunktio, 24 toteuma, 8 tulojoukko, 10 tyhjä joukko, 10 uskottavuusfunktio, 79, 97 logaritminen, 80 varianssi jakauman, 48 satunnaismuuttujan, 48 vastahypoteesi, 115 yhdiste, 10 yhteisjakauma, 26 diskreetti,
14 Kirjallisuutta [JP04] Jean Jacod and Philip Protter. Probability Essentials. Springer, second edition, [Kal02] Olav Kallenberg. Foundations of Modern Probability. Springer, second edition, [Wil91] David Williams. Probability with Martingales. Cambridge University Press,
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Lisätiedot11.1 Nollahypoteesi, vastahypoteesi ja p-arvo
Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 4. joulukuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja p-arvo Aiemmissa luvuissa opittiin määrittämään piste-estimaatteja ja väliestimaatteja
LisätiedotLuku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017
Luku 1 Bayesläiset estimaattorit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 217 1.1 Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotBayesläiset tilastolliset mallit
Luku 9 Bayesläiset tilastolliset mallit Lasse Leskelä Aalto-yliopisto 8. lokakuuta 07 9. Priorijakauma ja posteriorijakauma Bayesläisen tilastollisen päättelyn lähtökohtana on päivittää satunnaisilmiöön
LisätiedotOpiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3
Luku 6 Datajoukkojen jakaumat, tunnusluvut ja kuvaajat Lasse Leskelä Aalto-yliopisto. lokakuuta 207 6. Datajoukko ja datakehikko Tässä monisteessa datajoukko tarkoittaa järjestettyä listaa keskenään samantyyppisiä
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden
LisätiedotSatunnaismuuttujan odotusarvo ja laskusäännöt
Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotTilastollinen testaus. Vilkkumaa / Kuusinen 1
Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
LisätiedotSatunnaismuuttujien summa ja keskiarvo
Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 21. syyskuuta 2017 5.1 Satunnaismuuttujien summa Satunnaismuuttujien summa S n = X 1 + +X n ja keskiarvo n 1 S n ovat satunnaismuuttujia,
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotSatunnaismuuttujan odotusarvo ja laskusäännöt
Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 16. syyskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotSatunnaismuuttujien summa ja keskiarvo
Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 5.1 Satunnaismuuttujien summa Kahden satunnaismuuttujan summa X + Y on satunnaismuuttuja, jonka jakauma
LisätiedotLiite B. Suomi englanti-sanasto
Liite B Suomi englanti-sanasto Alla tässä monisteessa esiintynyttä sanastoa englanniksi käännettynä. Monet tähän aihepiiriin liittyvät termit eivät kuitenkaan ole täysin vakiintuneita kummassakaan kielessä.
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotKeskihajonta ja korrelaatio
Luku 4 Keskihajonta ja korrelaatio Lasse Leskelä Aalto-yliopisto 19. syyskuuta 2017 4.1 Jakauman varianssi ja keskihajonta Edellisessä luvussa opittiin, että satunnaismuuttujan odotusarvo on X:n jakauman
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu
Lisätiedot30A02000 Tilastotieteen perusteet
30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotTodennäköisyyden käsite ja laskusäännöt
Luku 1 Todennäköisyyden käsite ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 1.1 Todennäköisyyden käsite Todennäköisyys on tapa kuvailla kvantitatiivisesti jonkin tapahtuman uskottavuutta,
Lisätiedot031021P Tilastomatematiikka (5 op) viikko 5
031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen
LisätiedotTilastollisen analyysin perusteet Luento 2: Tilastolliset testit
Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja
LisätiedotTodennäköisyyden ominaisuuksia
Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Kalle Kytölä, Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden
LisätiedotOdotusarvoparien vertailu. Vilkkumaa / Kuusinen 1
Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotKäytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:
8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotYksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1
Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman
LisätiedotMatemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto
Matemaattinen tilastotiede Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Alkusanat Tämä moniste perustuu vuosina 2002-2004 pitämiini matemaattisen tilastotieteen luentoihin
LisätiedotTodennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1
Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
LisätiedotTilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1
Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet
LisätiedotVALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170
VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotP(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu
1. Tyhjentävä tunnusluku (sucient statistics ) Olkoon (P(X = x θ) : θ Θ) todennäköisyysmalli havainnolle X. Datan funktio T (X ) on Tyhjentävä tunnusluku jos ehdollinen todennäköisyys (ehdollinen tiheysfunktio)
LisätiedotOtosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko
ÌÓÒÒĐĐÓ ÝÝ ÔÖÙ ØØ Naiiveja määritelmiä Suhteellinen frekvenssi kun ilmiö toistuu Jos tehdas on valmistanut 1000000 kpl erästä tuotetta, joista 5013 ovat viallisia, niin todennäköisyys, että tuote on viallinen
LisätiedotJohdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
LisätiedotTilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5
TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä
LisätiedotSatunnaismuuttujat ja jakaumat
Luku 2 Satunnaismuuttujat ja jakaumat Lasse Leskelä Aalto-yliopisto 2. syyskuuta 207 2. Satunnaismuuttujan käsite Käytännön tilanteissa ei yleensä olla kiinnostuneita satunnaisilmiön kaikista yksityiskohdista,
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5
MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai
LisätiedotGripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta
MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
Lisätiedot(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?
6.10.2006 1. Keppi, jonka pituus on m, taitetaan kahtia täysin satunnaisesti valitusta kohdasta ja muodostetaan kolmio, jonka kateetteina ovat syntyneet palaset. Kolmion pinta-ala on satunnaismuuttuja.
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Lisätiedotl (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on
HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 018 Harjoitus B Ratkaisuehdotuksia Tehtäväsarja I 1 (Monisteen tehtävä 14) Olkoon f Y (y; θ) tilastollinen malli, jonka
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3
Lisätiedot3.11.2006. ,ܾ jaü on annettu niin voidaan hakea funktion 0.1 0.2 0.3 0.4
Ü µ ½ ¾Ü¾µ Ü¾Ê 3.11.2006 1. Satunnaismuuttujan tiheysfunktio on ¼ ļ ܽ ܾ ÜÒµ Ä Ü½ ÜÒµ Ò Ä Ü½ ܾ ÜÒµ ܽ µ ܾ µ ÜÒ µ Ò missä tietenkin vaaditaan, että ¼. Muodosta :n ¾Ä ܽ ÜÒµ Ò ½¾ ܾ Ò ½ ¾Ü¾½µ ½ ¾Ü¾Òµ
LisätiedotJohdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden
LisätiedotJos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden
1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella
Lisätiedot1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
LisätiedotMat Sovellettu todennäköisyyslasku A
TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin
LisätiedotIlkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio
Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio
LisätiedotTilastolliset luottamusvälit
Luku 8 Tilastolliset luottamusvälit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 8.1 Piste-estimaatti ja väliestimaatti Edellisessä luvussa opittii määrittämää parametreille estimaatteja suurimma uskottavuude
LisätiedotJohdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1
Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotMAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen
MAT-5 Todennäköisyyslaskenta Tentti.. / Kimmo Vattulainen Vastaa jokainen tehtävä eri paperille. Funktiolaskin sallittu.. a) P A). ja P A B).6. Mitä on P A B), kun A ja B ovat riippumattomia b) Satunnaismuuttujan
Lisätiedot6. laskuharjoitusten vastaukset (viikot 10 11)
6. laskuharjoitusten vastaukset (viikot 10 11) 1. a) Sivun 102 hypergeometrisen jakauman määritelmästä saadaan µ µ 13 39 13! 13 12 11 10 9 µ 0! 8! 1! 2 2! 2 1 0 49 48! 47!! 14440 120 31187200 120 1287
LisätiedotMTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)
21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.
LisätiedotTilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu
ilastollinen päättely 5.. Johdanto Estimointi, Joukkoestimointi, Kriittinen alue, uottamusjoukko, uottamustaso, uottamusväli, Otos, Parametri, Peittotodennäköisyys, Piste-estimointi, Väliestimaatti, Väliestimaattori,
LisätiedotTestit laatueroasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten
Lisätiedotriippumattomia ja noudattavat samaa jakaumaa.
12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
LisätiedotJohdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotValitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.
9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 2 Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
Lisätiedot806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
LisätiedotIlkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset
LisätiedotTutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)
1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 21. syyskuuta 2007 Antti Rasila () TodB 21. syyskuuta 2007 1 / 19 1 Satunnaismuuttujien riippumattomuus 2 Jakauman tunnusluvut Odotusarvo Odotusarvon ominaisuuksia
LisätiedotJohdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle
LisätiedotJohdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman
LisätiedotStokastiikka ja tilastollinen ajattelu
Stokastiikka ja tilastollinen ajattelu Versio 0.9 Lasse Leskelä Aalto-yliopisto 3. tammikuuta 208 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite...................... 5.2 Satunnaisilmiön
Lisätiedot