1 MTTTP3 Tilastollisen päättelyn perusteet 2 Luennot 8.1.2015 ja 13.1.2015 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014
2 2 Osaamistavoitteet Opiskelija ymmärtää estimoinnin ja hypoteesien testaukseen liittyvän teorian opintojaksolla esitetyssä laajuudessa. Esim. 1 Populaatiossa π % viallisia. Miten arvioidaan? Onko arvio luotettava? Esim. 2 Populaation odotusarvon µ arviointi. Miten arvioidaan? Onko arvio luotettava?
3 Esim. 3 Tarkastellaan kahdessa populaatiossa viallisten prosenttiosuuksia. Miten arvioidaan niiden yhtäsuuruutta? Onko arvio luotettava? Esim. 4 Tarkastellaan kahden populaation odotusarvoja. Miten arvioidaan niiden yhtäsuuruutta? Onko arvio luotettava?
Hän tunnistaa erilaiset estimointitilanteet, osaa valita tilanteeseen soveltuvan luottamusvälin sekä käyttää sitä tilastollisessa päättelyssä. Esim. 5 Puolueen kannatuksen arviointi. Esim. 6 Onko puolueen kannatus miesten ja naisten keskuudessa sama? Esim. 7 Hillopurkkien keskimääräisen painon arviointi. 4
Esim. 8 Tuottavatko koneet A ja B keskimäärin samanmittaisia tankoja? 5
6 Hän ymmärtää tilastollisen testauksen periaatteet ja osaa suorittaa tilastollisen testauksen annetussa empiirisessä tilanteessa. Esim. 9 Puolue väittää kannatuksensa olevan eli 18 %. Voitko uskoa väitteen? Esim. 10 Onko puolueen kannatus miesten ja naisten keskuudessa sama?
7 Esim. 11 Voidaanko uskoa, että hillopurkit painavat keskimäärin 340 g. Esim. 12 Tuottaako kone A keskimäärin 5 cm pidempiä tankoja kuin kone B? Hänellä on valmiudet todennäköisyyslaskennan ja tilastollisen päättelyn aineopintotasoiseen opiskeluun.
8 3 Opintojakson kotisivu http://www.uta.fi/sis/mtt/mtttp3/kevat_2015.html Opetus Kurssi-info (sisältö, tentit, harjoitushyvitys) Luennot, luentorunko (luvut 5 6, kaavat, taulukot) Harjoitukset, tehtävät, ohjeet (Moodle), ratkaisut Oheiskirjallisuutta Usein kysyttyä Linkkejä Palaute
9 4 Kertausta 4.1 Normaalijakauma s. 29 30 Jos X ~ N(µ, σ 2 ), niin Z = (X - µ)/σ ~ N(0, 1). P(X a) = Φ((a - µ)/σ) P(X a) = 1 P(X a) = 1 - Φ((a - µ)/σ) P(a X b) = P(X b) - P(X a) = Φ((b - µ)/σ) - Φ((a - µ)/σ)
10 4.2 Normaalijakaumaan liittyviä tuloksia s. 32 33 Jos X ~ N(μ, σ 2 ), niin ax + b ~ N(aμ + b, a 2 σ 2 ) Jos X 1, X 2,, X n ovat riippumattomia, X i ~ N(μ i, σ i 2 ), in X 1 + X 2 + + X n ~ N(μ 1 + μ 2 + + μ n, σ 1 2 + σ 2 2 + + σ n 2 )
Esim. 13 Poliklinikalla potilasta kohden käytetty aika (min) noudattaa normaalijakaumaa odotusarvoja 15 min ja keskihajontana 1,5 min. Lääkäri aloittaa työt kello 10. Viidennelle potilaalle on varattu aika kello 11.00. Millä todennäköisyydellä viides potilas pääsee vastaanotolle aikaisintaan kello 11.05? Kokonaisaika X = X 1 + X 2 + X 3 + X 4, missä X i ~ N(15, 1,5 2 ). X ~ N(15+15+15+15, 1,5 2 +1,5 2 +1,5 2 +1,5 2 ) P(X 65) = 1 P(X<65) = 1 Φ((65-60)/3) = 1 - Φ(1,67) = 1 0,9525 = 0,0475. 11
12 Jos X 1, X 2,, X n ovat riippumattomia ja E(X i ) = µ i Var(X i ) = σ i 2, niin X 1 + X 2 + + X n likimain ~ N(μ 1 + μ 2 + + μ n, σ 1 2 + σ 2 2 + + σ n 2 )
13 Jos X i ~ N(μ, σ 2 ), i = 1, 2,, n, ja X i : t riippumattomia, niin X = 1 n (X 1 + + X n ) ~N (μ, σ2 n )
Esim. 14 Hillopurkkien valmistaja väittää purkkien keskipainoksi 340 g. Tiedetään, että paino vaihtelee jonkin verran. Oletetaan, että vaihtelu on luonnehdittavissa normaalijakauman, jonka keskihajonta on 10 g, avulla. Tutkitaan valmistajan väitettä keskipainosta ja valitaan satunnaisesti 9 purkkia. Näiden purkkien keskipainoksi saadaan 336 g. Voitko uskoa valmistajan väitteen? 14
15 Jos valmistajan väite tosi, niin X ~N (340, 102 9 ). Tällöin 336 340 P(X 336) = Φ ( ) = Φ( 1,2) = 1 Φ(1,2) 10 3 = 1 0,8849 = 0,1151 Valmistajan väite voidaan uskoa, koska sen ollessa tosi, ei ole harvinaista saada otosta, jonka keskiarvo on alle 336. Siis laskettua todennäköisyyttä ei pidetä pienenä.
Esim. 15 Bill on käyttänyt tiettyä partakonetta. Parranajoon kuluva aika (sekunteina) on noudattanut normaalijakaumaa odotusarvona 240 s ja keskihajontana 20 s. Bill vaihtaa partakonetta. Hän ajaa päivittäin uudella koneella ja saa n päivän ajoaikojen keskiarvoksi 230 s. Hän päättelee 2,5 %:n riskitasolla, että uusi kone on nopeampi. Montako päivää hän oli käyttänyt uutta konetta? 16
17 Jos uusi kone toimii vanhan nopeudella, niin X ~N (240, 202 n ), joten P(X 230) = Φ ( 230 240 ) = Φ ( 10 n 20 20 ) n = 1 Φ ( n 2 ) = 0,025. Tästä saadaan Φ ( n 2 ) = 0,975, jolloin n 2 suurempi kuin 15. = 1,96. Otoskoko on ollut
Jos X 1, X 2, X n ovat riippumattomia, E(X i ) = μ, Var(X i ) = σ 2, niin 18 X = 1 n (X 1 + + X n ) likimain ~ N (μ, σ2 n ) Jos X ~ Bin(n, p), niin likimain X ~ N(np, np(1 p)), kun n suuri.
Esim. 16 Tutkitaan uuden menetelmän toimivuutta ihosairauden hoidossa. Vanhan menetelmän avulla 60 % potilaista parani. Valitaan satunnaisesti uudella menetelmällä hoidetuista potilaista 200. Heistä 144 parani. Onko uusi menetelmä vanhaa parempi? 19 Jos uusi menetelmä toimii vanhan tehokkuudella, niin parantuneiden lukumäärä X ~ Bin(200, 0,6). Tällöin E(X) = 200 0,6 = 120, Var(X) = 200 0,6 0,4 = 48.
20 Nyt X ~ N(120, 48), likimain. P(X 144) = 1 P(X 143) 1 - Φ(143 120)/ 48) = 1 - Φ(3,32) = 0,0005. Tämä harvinaista, joten ei toimi vanhan tehokkuudella. On siis parempi.
21 Esim. 17 Levykaupan omistaja arvioi, että 20 % asiakkaista suorittaa ostoksen. Laske todennäköisyys, että 180 asiakkaan joukosta ainakin 45 suorittaa ostoksen. X = ostosten suorittaneiden lukumäärä X ~ Bin( 180, 0,2), E(X) = 36, Var(X) = 28,8 X ~ N(36, 28,8), likimain P(X 45) = 1 P(X 44) 1 - Φ(44 36)/ 28,8) = 1 - Φ(1,49) = 0,0681.
22 4.3 Satunnaisotos, otossuure, otosjakauma, otossuureen keskivirhe s. 35 38 Olkoon X 1, X 2,..., X n satunnaismuuttujajono. Tätä jonoa sanotaan satunnaisotokseksi, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa.
23 Sanonta X 1, X 2,..., X n on satunnaisotos N(µ, σ 2 ):sta tarkoittaa sitä, että jokainen X i N(µ, σ 2 ) ja X i :t ovat riippumattomia. Satunnaisotoksen avulla määriteltyä funktiota kutsutaan otossuureeksi. Otossuureen todennäköisyysjakaumasta käytetään nimitystä otanta- tai otosjakauma.
24 Otossuureen keskihajontaa sanotaan otossuureen keskivirheeksi. Esillä olleiden otossuureiden jakaumia - Otoskeskiarvon jakauma: X ~N (μ, σ2 ), jos satunnaisotos n normaalijakaumasta. Esimerkit 14 & 15
25 - Otoskeskiarvojen erotuksen jakauma X Y ~N (μ 1 μ 2, σ 1 2 + σ 2 2 n m ), jos satunnaisotokset normaalijakaumista.
26 Esim. 19 Koneiden A ja B pitäisi valmistaa keskimäärin samanmittaisia tankoja. Molempien koneiden tuottamien tankojen pituuksissa X ja Y (cm) on jonkin verran vaihtelua, jota voidaan luonnehtia normaalijakaumalla, jonka varianssi on 0,20 cm 2. Laadunvalvonnassa seurataan koneiden toimintaa ja valitaan satunnaisesti koneen A tuotannosta 20 ja koneen B tuotannosta 10 tankoa. Koneen A tuotannosta valittujen tankojen keskipituus on 40,0 cm ja koneelta B valittujen 39,5 cm. Onko syytä epäillä, että A valmistaa keskimäärin pidempiä tankoja?
27 X Y ~ N (0, 0,2 20 + 0,2 ), jos tuottavat samanmittaisia 10 P(X Y > 40,0 39,5) = 1 P(X Y 40,0 39,5) = 1 Φ ( 0,5 0 ) = 1 Φ(2,89) = 1 0,9981 0,03 = 0,0019. On syytä epäillä. Jos tuottaisivat keskimäärin samanmittaisia, niin olisi harvinaista saada otokset, joiden keskiarvojen erotuksen olisi suurempi kuin 0,5 cm.
28 - Jos populaatiossa viallisia π %, niin viallisten lukumäärä otoksessa X ~ Bin(n, π). Tätä voidaan approksimoida normaalijakaumalla. Esimerkit 16 & 17
29 - Jos populaatiossa viallisia π %, niin viallisten prosenttiosuus otoksessa p ~N (π, π(100 π) ), likimain. n Perustelu: X = viallisten lukumäärä otoksessa X ~ Bin(n, π/100), E(X) =n π 100,
30 Var(X) = n π 100 (1- π 100 ) Viallisten prosenttiosuus p = 100X/n E(p) = E(100X/n) = 100 100 E(X) = n n n π 100 = π Var(p) = Var(100X/n) = ( 100 n )2 Var(X) = ( 100 n )2 n π 100 π (1 ) = π(100 π) 100 n
Koska X on likimain normaalisti jakautunut, niin myös 100X/n on likimain normaalijakautunut. 31