031021P Tilastomatematiikka (5 op) viikko 5

Koko: px
Aloita esitys sivulta:

Download "031021P Tilastomatematiikka (5 op) viikko 5"

Transkriptio

1 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division

2 Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen keskeisiä työskentelytapoja on asettaa hypoteeseja ja testata niiden sopivuus havainnoista. Koska havaintoihin sisältyy aina koe- ym. virheiden johdosta satunnaisvaihtelua, yleensä ei voida tehdä täysin varmoja päätelmiä. Puhdas sattumakin voi synnyttää näennäisesti merkitsevän tapahtuman, mikä on päätöksenteossa otettava huomioon. Sattuman mahdollisuutta voidaan arvioida todennäköisyyksien avulla, jolloin päättelyyn liittyvä epävarmuus voidaan kvantifioida. Jukka Kemppainen Mathematics Division 2 / 35

3 Hypoteesin testaus Tilastollinen hypoteesi formuloidaan usein niin, että se voidaan testata tekemällä huolellisesti suunniteltuja kokeita. Tilastollinen hypoteesi voi olla esimerkiksi jakauman parametreihin liittyvä olettamus. Tehdään kaksi hypoteesia, nollahypoteesi H 0 ja sille vaihtoehtoinen vastahypoteesi H 1. Hypoteesin testauksessa lähdetään tutkimaan tukevatko havainnot nollahypoteesin H 0 oikeellisuutta. Jos havainnot tukevat hypoteesia H 0, se hyväksytään tai todetaan, että havaintojen perusteella sitä ei ole syytä hylätä. Jos havainnot eivät tue hypoteesia H 0, hylätään H 0 ja hyväksytään vaihtoehtoinen hypoteesi H 1. Jukka Kemppainen Mathematics Division 3 / 35

4 Nollahypoteesi ja vaihtoehtoinen hypoteesi (1/2) Huomautus 11 Usein käytetään ilmaisua ei ole syytä/ei voi hylätä H 0 :aa sen sijaan, että sanottaisiin hyväksytään H 0. Huomautuksen perustelu: Hypoteesin H 0 väittämä edustaa tilaa status quo ja H 1 sille vaihtoehtoista väittämää. Koska testaukseen liittyy usein epävarmuutta, niin siitä, ettei meillä ole näyttöä nollahypoteesia vastaan, ei seuraa, että H 0 olisi totta. Edellistä kuvaa ehkä parhaiten esimerkki rikosoikeudenkäynnistä, jossa hypoteesit ovat H 0 : vastaaja on syytön, H 1 : vastaaja on syyllinen. Jukka Kemppainen Mathematics Division 4 / 35

5 Nollahypoteesi ja vaihtoehtoinen hypoteesi (2/2) Lähtökohtaisesti H 0 on totta (kunnes toisin todistetaan). Jos H 1 :stä tukeva näyttö on kiistaton, niin H 0 hylätään. Meillä voi olla näyttöä syytettyä vastaan, mutta välttämättä näyttö ei riitä tuomitsemiseen. Niinpä tuomari toteaa, että H 0 :aa ei voida hylätä (eli vastaajaa ei voi tuomita) sen sijaan, että H 0 hyväksytään (eli vastaaja on syytön). Jukka Kemppainen Mathematics Division 5 / 35

6 Esimerkki Tarkastellaan esimerkkinä lapsen syntymää. Testiongelmana voidaan tarkastella esimerkiksi syntyvän lapsen sukupuolta koskeva päätöksenteko. On kaksi mahdollisuutta, joko syntyvä lapsi on poika (P) tai tyttö (T). Intuitiivisesti tuntuu järkevältä, että molemmat tapahtumat ovat yhtä todennäköisiä. Kuitenkin kirjallisuudessa usein väitetään, että pojan syntymistodennäköisyys on jonkin verran suurempi kuin tytön. Halutaan testata, että missä määrin pojan syntymistodennäköisyys on suurempi kuin tytön. Jos merkitään, että pojan syntymistn. on p, valitaan nollahypoteesiksi H 0 : p = p 0 = 50%. Vastahypoteesiksi valitaan H 1 : p > p 0 = 50%. Hypoteesin testaukseen käytetään aineistoa, jonka mukaan 3000:sta lapsesta oli poikia Jos n = 3000 aineistossa on tyttöjä ja poikia suurin piirtein yhtä paljon, hyväksytään H 0. Jos taas poikia on riittävän paljon enemmän kuin tyttöjä, hylätään H 0 ja hyväksytään H 1. Jukka Kemppainen Mathematics Division 6 / 35

7 Esimerkki Esim. 35 Erään kaupungin työssäkäyvistä arvioidaan olevan korkeakoulutettuja 60 %. Muotoile sopivat testattavat hypoteesit, kun halutaan testata (a) onko korkeakoulutettuja 60 %. (b) onko korkeakoulutettuja vähintään 60 %. Jukka Kemppainen Mathematics Division 7 / 35

8 Hypoteesin testauksen terminologiaa Olkoon θ jakauman tuntematon parametri ja testataan hypoteesia H 0 : θ = θ 0. Vastahypoteesille H 1 on kolme mahdollisuutta 1. H 1 : θ > θ 0, 2. H 1 : θ < θ 0, 3. H 1 : θ θ 0. Kohtien 1. ja 2. hypoteeseja sanotaan yksisuuntaisiksi ja kohdan 3. hypoteesia kaksisuuntaiseksi. Hypoteesin testausta varten tarvitaan testimuuttuja Θ, joka on parametrin θ harhaton estimaattori, tai jokin sen muunnos. Yleisesti testisuure on otossuure Z = Z(X 1,...,X n ), jonka perusteella päätös tehdään. Z:n kaikkien mahdollisten arvojen joukko S jaetaan kahteen alueeseen, hyväksymisalueeseen S 0 ja hylkäysalueeseen S 1, missä S 0 S 1 = ja S 0 S 1 = S. Jukka Kemppainen Mathematics Division 8 / 35

9 Hypoteesin testauksen terminologiaa Testimuuttujan arvo z = z(x 1,...,x n ) lasketaan otoksesta (x 1,...,x n ), jonka mukaan joko H 0 hyväksytään tai hylätään. Jos z S 0, niin H 0 hyväksytään. Jos taas z S 1, niin H 0 hylätään ja hyväksytään vastahypoteesi H 1. Alueeseen S 1 kuuluvat arvot ovat kriittisiä H 0 :n kannalta, joten sitä kutsutaan myös kriittiseksi alueeksi. Kriittinen alue valitaan siten, että testisuure Z saa siitä arvon H 0 :n ollessa oikea enintään todennäköisyydellä α, missä α on jokin pieni luku. Yleensä α = 0.05 tai α = Lukua α sanotaan riskitasoksi tai merkitsevyystasoksi. Jukka Kemppainen Mathematics Division 9 / 35

10 Hypoteesin testauksen terminologiaa Jos esimerkiksi vastahypoteesi on H 1 : θ > θ 0, on kriittinen alue ]c, [, missä lukua c sanotaan kynnysarvoksi. Jos testimuuttujan arvo z c, hyväksytään H 0. Jos taas z > c, niin H 0 hylätään ja hyväksytään H 1. Tässä tapauksessa c valitaan siten, että P(Z > c H 0 : θ = θ 0 ) = α. Kaksisuuntaisen vastahypoteesin H 1 : θ θ 0 tapauksessa tarvitaan kaksi kynnysarvoa c 1 ja c 2. Kynnysarvot valitaan siten, että P(Z < c 1 H 0 ) = α 1 ja P(Z > c 2 H 0 ) = α 2, missä α 1 +α 2 = α. Yleensä α 1 = α 2. Jukka Kemppainen Mathematics Division 10 / 35

11 Hylkäysalueita eri hypoteeseille Väritetyn alueen x-koordinaatit muodostavat H 0 :n hylkäysalueen. Kuva : H 1 : θ 0 Kuva : H 1 : θ < 0 Kuva : H 1 : θ > 0 Huomaa, että jos yo. kuvien 1-suuntaisissa hypoteeseissa merkitsevyystaso on α, niin 2-suuntaisen hypoteesin merkitsevyystaso on 2α (pinta-ala on 2-kertainen). Jukka Kemppainen Mathematics Division 11 / 35

12 Testauksen virheistä Koska otoksen perusteella ei voida olla täysin varmoja koko populaatiota koskevissa päätelmissä, on mahdollisuus tehdä seuraavat virheet: 1. Hylätään oikea hypoteesi (tyypin I virhe). 2. Hyväksytään väärä hypoteesi (tyypin II virhe). Tarkastellaan hypoteesia H 0 : θ = θ 0 ja sen vastahypoteesia H 1 : θ > θ 0. Tyypin I virhe Hypoteesi H 0 on totta, mutta se hylätään, koska testimuuttuja Z saa arvon z > c. Virheen tn. on P(Z > c θ = θ 0 ) = α. Tyypin II virhe Hypoteesi H 0 ei ole totta, mutta se hyväksytään, koska testimuuttuja Z saa arvon z c. Virheen tn. on missä 0 < β < 1. P(Z c θ > θ 0 ) = β, Jukka Kemppainen Mathematics Division 12 / 35

13 Testauksen virheistä (1/2) Päätöksentekoa voidaan kuvata taulukolla Todellisuus Päätös H 0 tosi H 1 tosi H 0 oikea päätös II lajin virhe p = 1 α p = β H 1 I lajin virhe oikea päätös p = α p = 1 β Jukka Kemppainen Mathematics Division 13 / 35

14 Testauksen virheistä (2/2) Otetaan virheitä selventävä esimerkki jälleen oikeudesta. Esim. 36 Olkoot eräät nimeltä mainitsemattomat metsäyhtiöt syytteessä puukartellin järjestämisestä. (a) Mitä hypoteeseja testattiin, jos oikeus tekee I lajin virheen todetessaan metsäyhtiöt syyllisiksi? (b) Jos testattiin kohdan (a) hypoteeseja, niin mikä on II lajin virhe? (c) Kumpi virheistä on vakavampi? Jukka Kemppainen Mathematics Division 14 / 35

15 P-arvo Tilastolliset ohjelmistot tekevät päätöksenteon ns. p-arvon perusteella. Emme ole käyttäneet tällä kurssilla tätä menettelytapaa, sillä emme osaa laskea p-arvoa tärkeimmille tilastollisen testauksen jakaumille kuten χ 2 -, t- tai F-jakauma. Olkoon X testimuuttuja ja ˆx sen otoksessa saama arvo. P-arvo p tarkoittaa todennäköisyyttä p = P( X ˆx ), kun H 1 : θ θ 0 (2-suuntainen testi); p = P(X ˆx), kun H 1 : θ < θ 0 (1-suuntainen testi); p = P(X ˆx), kun H 1 : θ > θ 0 (1-suuntainen testi). Esimerkiksi χ 2 - ja F-testit ovat yksisuuntaisia testejä, joille p-arvo määrätään viimeisen kohdan perusteella. Jukka Kemppainen Mathematics Division 15 / 35

16 P-arvo Olkoon α testin merkitsevyystaso. Usein p-arvoa tulkitaan seuraavasti: Jos p α, niin H 0 :aa ei ole syytä hylätä merkitsevyystasolla α. Jos p < α, niin H 0 on syytä hylätä merkitsevyystasolla α. Siis mitä pienempi p-arvo on, niin sitä epätodennäköisempää on saada sattumalta havaittuja tai sitä harvinaisempia arvoja, jolloin havaintoja ei voi tulkita sattuman aiheuttamaksi. Jotkut käyttävät kiinteän rajan sijaan väljempää tulkintaa, mutta tärkeintä on ymmärtää p-arvon merkitys: P-arvo P-arvo antaa tn:n, että nollahypoteesin vallitessa saadaan havaittu tai sitä harvinaisempi arvo. Jukka Kemppainen Mathematics Division 16 / 35

17 P-arvo vs. kiinteä merkitsevyystaso Vaikka laskin usein ilmoittaa p-arvon ja se toisaalta voidaan laskimen avulla laskea numeerisesti integroimalla (useimpia testimuuttujia ei osata integroida analyyttisesti kuten tulemme näkemään), on hyvä osata päätöksenteko molemmilla tavoilla. Kiinteän merkitsevyystason käyttö on hieman vanhahtava tapa, mutta toisaalta tällä tavalla emme tarvitse niin suurta laskentakapasiteettia. Kuten aiemminkin on tullut todettua: Funktiolaskimella ja taulukoillakin pärjää. Jukka Kemppainen Mathematics Division 17 / 35

18 Yhden otoksen testejä Tarkastellaan seuraavassa yhteen otokseen perustuvia jakauman parametreja koskevia testejä. Testimenetelmät pohjautuvat normaalijakaumaan tai johonkin siitä johdettuun jakaumaan. Lisäksi, jos otoskoko on riittävän suuri, voidaan hyödyntää keskeistä raja-arvolausetta. Tällä kurssilla testattavat parametrit ovat odotusarvo, varianssi (tai keskihajonta). Jukka Kemppainen Mathematics Division 18 / 35

19 Z-testi Z-testi soveltuu normaalijakautuneelle satunnaismuuttujalle X, jonka hajonta σ X tunnetaan. Tyyppiesimerkiksi käy normaalijakautuneen satunnaismuuttujan X N(µ,σ 2 ) odotusarvon testaus. Olkoon (x 1,...,x n ) otos normaalijakaumasta N(µ,σ 2 ). Havaintojen x i voidaan katsoa olevan riippumattomien satunnaismuuttujien X i realisaatioita. Odotusarvon µ harhaton estimaattori on keskiarvo X = 1 n n i=1 X i, joka on normaalijakautunut odotusarvolla µ ja keskihajonnalla σ/ n. Tällöin Z = X µ N(0,1). σ n Jukka Kemppainen Mathematics Division 19 / 35

20 Z-testi Olkoon riskitaso α ja olkoon testattava hypoteesi H 0 : µ = µ 0 ja sen vastahypoteesi H 1 : µ < µ 0. Määrätään kynnysarvo r 0 siten, että P(Z r 0 ) = 1 α. Koska 1 α on lähellä ykköstä, on r 0 negatiivinen ja siten r 0 :aa ei löydy normaalijakauman taulukosta. Käyttämällä symmetriaominaisuutta P(Z r 0 ) = 1 α P(Z r 0 ) = Φ( r 0 ) = 1 α, saadaan luku r 0 luettua taulukosta ja siten r 0 tulee määrätyksi. Lasketaan otoksesta testimuuttujan z arvo x µ 0 σ/ n. Jos z > r 0, hyväksytään H 0 ja todetaan, että H 0 on tosi riskitasolla α. Muussa tapauksessa H 0 hylätään ja siten hyväksytään H 1. Jukka Kemppainen Mathematics Division 20 / 35

21 Esimerkki Esim. 37 Olkoon X normaalijakautunut satunnaismuuttuja, jonka varianssi on σ 2 = 9. Käyttämällä otoskokoa n = 10 ja keskiarvoa x testaa hypoteesi H 0 : µ = µ 0 = 24 riskitasolla α = 0.05, kun vastahypoteesi on (a) µ > µ 0, (b) µ < µ 0, (c) µ µ 0. Jukka Kemppainen Mathematics Division 21 / 35

22 Suhteellisen osuuden testi Z-testiä voidaan soveltaa myös suurilla aineistoilla satunnaismuuttujille, jotka eivät normaalijakautuneita. Perusteluna tälle on keskeinen raja-arvolause. Tarkastellaan esimerkkinä binomijakautuneen sm:n X Bin(n, p) parametrin p testausta. Parametrin p harhaton estimaattori on Θ = X n. Keskeisen raja-arvolauseen mukaan Θ on likimain normaalijakautunut, ( Θ N p, p(1 p) ) n likimain, kun n on riittävän suuri. Olkoon testattava hypoteesi H 0 : p = p 0 ja sen vastahypoteesi H 1 : p > p 0. Jukka Kemppainen Mathematics Division 22 / 35

23 Suhteellisen osuuden testi Valitaan testisuureeksi Z = X n p 0 p 0 (1 p 0 ) n N(0,1). Olkoon riskitaso α. Luetaan normaalijakauman taulukosta sellainen kynnysarvo r 0, että P(Z r 0 ) = Φ(r 0 ) = 1 α. Jos suhteellisen osuuden havaittu arvo on ˆp, niin testimuuttujan arvoksi saadaan z = ˆp p 0 p 0 (1 p 0 ) n Jos z r 0, niin H 0 hyväksytään. Jos taas z > r 0, hylätään H 0 ja hyväksytään H 1. Jukka Kemppainen Mathematics Division 23 / 35.

24 Esimerkkejä Esim. 38 Tarkastellaan poikien syntyvyyttä aineistossa, jossa n = 3000 ja poikien lukumäärä on Olkoon p poikien suhteellinen osuus syntyneistä lapsista. Valitse nollahypoteesiksi H 0 : p = 0.5. Voidaanko otoksen perusteella sanoa riskitasolla α = 0.01, että poikien suhteellinen osuus on suurempi kuin tyttöjen? Esim. 39 Testaa esimerkin 35 hypoteesit tapauksessa, jossa tutkittiin n = 200 työssäkäyvää, joista 132 oli korkeasti koulutettuja. Valitse riskitasoksi α = Jukka Kemppainen Mathematics Division 24 / 35

25 T-testi T-testi soveltuu normaalijakautuneelle satunnaismuuttujalle X, jonka hajontaa ei tunneta. Tyyppiesimerkkinä tarkastellaan normaalijakautuneen sm:n X N(µ,σ 2 ) odotusarvon testiä. Olkoon (x 1,...,x n ) satunnaisotos X:stä. Otoksesta saadaan odotusarvon ja varianssin harhattomat estimaatit x = 1 n n x i, i=1 s 2 = 1 n 1 n (x i x) 2. i=1 Olkoot X ja S 2 otostunnuslukuja vastaavat estimaattorit. Lauseen?? mukaan T = X µ S n t n 1. Jukka Kemppainen Mathematics Division 25 / 35

26 T-testi Olkoon riskitaso α ja olkoon testattava hypoteesi H 0 : µ = µ 0 ja sen vastahypoteesi H 1 : µ > µ 0. Luetaan t-jakauman taulukosta yksisuuntaisen testin kohdalta kynnysarvo r 0 siten, että P(T r 0 ) = 1 α. Lasketaan otoksesta testimuuttujan T arvo t = x µ 0 s/ n. Jos t r 0, hyväksytään H 0. Jos taas t > r 0, hylätään H 0 ja siten hyväksytään H 1. Kaksisuuntaisen testin tapauksessa hypoteesit ovat H 0 : µ = µ 0 ja H 1 : µ µ 0. Tällöin (symmetrisessä tapauksessa) luetaan t-jakauman taulukosta kynnysarvo r 0 siten, että P( r 0 T r 0 ) = 1 α. Jos testimuuttujan arvo t = x µ 0 s/ n [ r 0,r 0 ], hyväksytään H 0. Muussa tapauksessa H 0 hylätään ja siten hyväksytään H 1. Jukka Kemppainen Mathematics Division 26 / 35

27 Esimerkkejä Esim. 40 Valmistaja ilmoittaa erään monofiilisiiman vetolujuudeksi 8.0 [kg]. Testataan H 0 : µ = 8.0 vastaan H 1 : µ 8.0. Testiä varten otettiin n = 10 siimanäytettä ja määritettiin niistä vetolujuudet. Saatiin seuraavat tulokset 8.1; 7.8; 7.9; 8.3; 8.0; 8.5; 8.2; 8.1; 8.2; 8.4. Voidaanko aineiston perusteella luottaa valmistajan ilmoitukseen vetolujuudesta riskitasolla α = 0.05? Jukka Kemppainen Mathematics Division 27 / 35

28 Esimerkkejä Esim. 41 Eräässä supermarketissa myydään lihaa yhden paunan [lb] (1 lb 0.45 kg) pakkauksissa. Otettiin 35 pakkauksen satunnaisotanta, jonka perusteella otoskeskiarvo oli 1.01 ja otoskeskihajonta 0.18 paunaa. (a) Jos olisit laadusta vastaava johtaja ja haluaisit olla varma, että pakkauksen keskipaino on todella 1 paunan, mitä hypoteesia testaisit? (b) Testaa asettamasi hypoteesi sopivalla testillä. (c) Miten informoisit firman osakkaita saaduista tuloksista? Jukka Kemppainen Mathematics Division 28 / 35

29 Kahden otoksen testejä Tarkastellaan seuraavassa kahteen eri otokseen perustuvia jakauman parametreja koskevia testejä. Testimenetelmät pohjautuvat jälleen normaalijakaumaan tai johonkin siitä johdettuun jakaumaan. Lisäksi, jos otoskoko on riittävän suuri, voidaan hyödyntää keskeistä raja-arvolausetta. Käsitellään ainoastaan odotusarvojen vertailua toisiinsa. Otokset voivat olla joko riippumattomat tai riippuvia toisistaan (parittainen vertailu). Odotusarvojen vertailu tehdään odotusarvojen erotuksen avulla. Jukka Kemppainen Mathematics Division 29 / 35

30 Odotusarvojen erotuksen testi, hajonnat tunnetaan Odotusarvojen erotuksen testiä käytetään esimerkiksi tilanteessa, jossa halutaan vertailla kahden eri valmistusmenetelmän vaikutusta tuotteen laatuun. Olkoot X N(µ 1,σ1 2) ja Y N(µ 2,σ2 2 ) riippumattomia sm:ia sekä (x 1,...,x n1 ) ja (y 1,...,y n2 ) riippumattomat otokset X:stä ja Y :stä. Odotusarvojen vertailussa tarkastellaan erotusta µ 1 µ 2, jonka harhaton estimaattori on aritmeettisten keskiarvojen erotus X Y, joka noudattaa normaalijakaumaa X Y N(µ 1 µ 2, σ2 1 n 1 + σ2 2 n 2 ). Testataan H 0 : µ 1 µ 2 = 0 vastaan H 1 : µ 1 µ 2 0. Jukka Kemppainen Mathematics Division 30 / 35

31 Odotusarvojen erotuksen testi, σ 1 ja σ 2 tunnettu Testimuuttujaksi käy Z = X Y (µ 1 µ 2 ) σ 2 1 n 1 + σ2 2 n 2 N(0,1). Lasketaan otoksesta x = 1 n1 n 1 i=1 x i ja y = 1 n2 n 2 i=1 y i ja testimuuttujan arvo z = x y. σ 2 1 n 1 + σ2 2 n 2 Huomaa, että µ 1 µ 2 = 0 H 0 :n vallitessa. Asetetaan riskitaso α ja määrätään normaalijakauman taulukosta kynnysarvo r 0 siten, että P( Z r 0 ) = 1 α. Jos testimuuttujan arvo z [ r 0,r 0 ], niin H 0 hyväksytään. Muussa tapauksessa H 0 hylätään ja siten H 1 hyväksytään. Jukka Kemppainen Mathematics Division 31 / 35

32 Odotusarvojen erotuksen testi, σ 1 ja σ 2 tuntemattomia Jos σ 1 ja σ 2 ovat tuntemattomia, täytyy ne estimoida havaintoaineistosta. Voidaan osoittaa, että tässä tapauksessa T = X Y (µ 1 µ 2 ) 1 n (n1 1)s1 2+(n 2 1)s2 2 n 2 n 1 +n 2 2 t n1 +n 2 2. Lasketaan otoksesta kuten edellä x ja y sekä otosvarianssit s 2 1 = 1 n 1 1 s 2 2 = 1 n 2 1 n 1 i=1 n 2 (x i x) 2, (y i y) 2. i=1 Jukka Kemppainen Mathematics Division 32 / 35

33 Odotusarvojen erotuksen testi, σ 1 ja σ 2 tuntemattomia Testataan H 0 : µ 1 µ 2 = 0 vastaan H 1 : µ 1 µ 2 0 ja asetetaan riskitasoksi α. Määrätään t-jakauman taulukosta kaksisuuntaisen testin kohdalta kynnysarvo r 0 siten, että P( T r 0 ) = 1 α. Hypoteesin H 0 vallitessa testimuuttujan arvo on t = x y 1 n (n1 1)s1 2+(n 2 1)s2 2 n 2 n 1 +n 2 2 t n1 +n 2 2. Jos t r 0, niin H 0 hyväksytään. Jos taasen t > r 0, niin H 0 hylätään ja siten H 1 hyväksytään. Yksisuuntaisen testin tapauksessa vastahypoteesi on joko H 1 : µ 1 µ 2 > 0 tai H 1 : µ 1 µ 2 < 0. Analyysi tehdään samaan tapaan kuin edellä. Jukka Kemppainen Mathematics Division 33 / 35

34 Odotusarvojen erotuksen testi, σ 1 ja σ 2 tuntemattomia Edellä esitetty menetelmä pätee itse asiassa vain tapauksessa σ 1 = σ 2, eli joudumme olettamaan, että varianssit ovat samat. Menetelmä on kuitenkin suhteellisen joustava. Nyrkkisääntönä voidaan käyttää ehtoa max{s 2 1,s2 2 } min{s 2 1,s2 2 } 3. Jos ehto on voimassa, niin sovitaan, että edellä esitettyä menetelmää voidaan käyttää. Käytännössä itse asiassa voimme testata varianssien yhtäsuuruutta ja päättää sen perusteella kumpaa menetelmää käytetään. Ei puututa kuitenkaan tällä kurssilla tähän. Jukka Kemppainen Mathematics Division 34 / 35

35 Esimerkki Esim. 42 Testattiin kahden eri materiaalin abrasiivista kulumista. Materiaalista 1 testattiin 12 koepalaa ja materiaalista 2 testattiin 10 koepalaa. Materiaalin 1 otos antoi keskimääräiseksi (koodatuksi) kulumiseksi 85 yksikköä ja keskihajonnaksi 4 yksikköä. Materiaalin 2 otos antoi keskimääräiseksi kulumiseksi 81 yksikköä ja keskihajonnaksi 5 yksikköä. Testaa riskitasolla α = 5%, onko materiaalin 1 kuluminen suurempaa kuin materiaalin 2 kuluminen. Jukka Kemppainen Mathematics Division 35 / 35

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Hypoteesin testaus Alkeet

Hypoteesin testaus Alkeet Hypoteesin testaus Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Johdanto Kokeellinen tutkimus: Varmennetaan teoreettista olettamusta fysikaalisen systeemin käyttäytymisestä

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 4

031021P Tilastomatematiikka (5 op) viikko 4 031021P Tilastomatematiikka (5 op) viikko 4 Jukka Kemppainen Mathematics Division Tilastollinen aineisto Tilastolliset menetelmät ovat eräs keino tutkia numeerista havaintoaineistoa todennäköisyyslaskentaa

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Satunnaismuuttujien mittausasteikot 93

Satunnaismuuttujien mittausasteikot 93 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut Otos 90 Otosta tarvitaan, kun koko perusjoukon tutkiminen on mahdotonta esim. seuraavista syistä: joukko on ääretön tai erittäin

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5 TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014 1 MTTTP3 Tilastollisen päättelyn perusteet 2 Luennot 8.1.2015 ja 13.1.2015 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut 9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

2. Keskiarvojen vartailua

2. Keskiarvojen vartailua 2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 3

031021P Tilastomatematiikka (5 op) viikko 3 031021P Tilastomatematiikka (5 op) viikko 3 Jukka Kemppainen Mathematics Division Jakauman tunnusluvut Jakauman tärkeimmät tunnusluvut ovat odotusarvo ja varianssi. Odotusarvo ilmoittaa jakauman keskikohdan

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: 4.10.2016/1 MTTTP1, luento 4.10.2016 7.4 Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti: Samoin z /2 siten, että P(Z > z /2 ) = /2, graafisesti: 4.10.2016/2

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Kalle Kytölä, Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 31.03.2012 klo. 9.00-12.00 saleissa L1,L3 Jukka Kemppainen Mathematics

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

6. laskuharjoitusten vastaukset (viikot 10 11)

6. laskuharjoitusten vastaukset (viikot 10 11) 6. laskuharjoitusten vastaukset (viikot 10 11) 1. a) Sivun 102 hypergeometrisen jakauman määritelmästä saadaan µ µ 13 39 13! 13 12 11 10 9 µ 0! 8! 1! 2 2! 2 1 0 49 48! 47!! 14440 120 31187200 120 1287

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden 1 KERTAUSTA JA TÄYDENNYSTÄ Luento 30.9.2014 Olkoon satunnaisotos X 1, X 2,, X n normaalijakaumasta N(µ, σ 2 ), tällöin ~ N(µ, σ 2 /n), kaava (6). Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B Tilastollinen päättömyys, kevät 7 Harjoitus 6B Heikki Korpela 8. helmikuuta 7 Tehtävä. Monisteen teht. 6... Olkoot Y,..., Y 5 Nµ, σ, ja merkitään S 5 i Y i Y /4. Näytä, että S/σ on saranasuure eli sen

Lisätiedot

11. laskuharjoituskierros, vko 15, ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut 11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot