https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

Samankaltaiset tiedostot
/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

riippumattomia ja noudattavat samaa jakaumaa.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

&idx=2&uilang=fi&lang=fi&lvv=2015

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

&idx=2&uilang=fi&lang=fi&lvv=2015

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

dx=2&uilang=fi&lang=fi&lvv=2015

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

x=2&uilang=fi&lang=fi&lvv=2016

&idx=2&uilang=fi&lang=fi&lvv=2015

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

dx=2&uilang=fi&lang=fi&lvv=2015

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

&idx=2&uilang=fi&lang=fi&lvv=2015

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

Sovellettu todennäköisyyslaskenta B

Tilastollinen aineisto Luottamusväli

10. laskuharjoituskierros, vko 14, ratkaisut

Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Sovellettu todennäköisyyslaskenta B

Luottamusvälit. Normaalijakauma johnkin kohtaan

x=2&uilang=fi&lang=fi&lvv=2017

031021P Tilastomatematiikka (5 op) viikko 3

Jatkuvat satunnaismuuttujat

Osa 2: Otokset, otosjakaumat ja estimointi

g=fi&lvv=2018&uilang=fi#parents

9. laskuharjoituskierros, vko 12-13, ratkaisut

6. laskuharjoitusten vastaukset (viikot 10 11)

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1

Teema 8: Parametrien estimointi ja luottamusvälit

MTTTP5, luento Luottamusväli, määritelmä

Tutkimustiedonhallinnan peruskurssi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Sovellettu todennäköisyyslasku A

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Todennäköisyysjakaumia

30A02000 Tilastotieteen perusteet

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tilastollisen päättelyn perusteet, MTTTP5. Luentorunko, lukuvuosi

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Väliestimointi (jatkoa) Heliövaara 1

031021P Tilastomatematiikka (5 op) viikko 5

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 7: NCSS - Tilastollinen analyysi

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Sovellettu todennäköisyyslaskenta B

tilastotieteen kertaus

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4. laskuharjoituskierros, vko 7, ratkaisut

805306A Johdatus monimuuttujamenetelmiin, 5 op

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Parametrin estimointi ja bootstrap-otanta

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Otoskoko 107 kpl. a) 27 b) 2654

Todennäköisyyden ominaisuuksia

MTTTP1, luento KERTAUSTA

Sovellettu todennäköisyyslaskenta B

MTTTP1, luento KERTAUSTA

pisteet Frekvenssi frekvenssi Yhteensä

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

11 Raja-arvolauseita ja approksimaatioita

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Testejä suhdeasteikollisille muuttujille

V ar(m n ) = V ar(x i ).

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Sovellettu todennäköisyyslaskenta B

Transkriptio:

1 MTTTP3 Tilastollisen päättelyn perusteet 2 Luennot 8.1.2015 ja 13.1.2015 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=6909&i dx=5&uilang=fi&lang=fi&lvv=2014

2 2 Osaamistavoitteet Opiskelija ymmärtää estimoinnin ja hypoteesien testaukseen liittyvän teorian opintojaksolla esitetyssä laajuudessa. Esim. 1 Populaatiossa π % viallisia. Miten arvioidaan? Onko arvio luotettava? Esim. 2 Populaation odotusarvon µ arviointi. Miten arvioidaan? Onko arvio luotettava?

3 Esim. 3 Tarkastellaan kahdessa populaatiossa viallisten prosenttiosuuksia. Miten arvioidaan niiden yhtäsuuruutta? Onko arvio luotettava? Esim. 4 Tarkastellaan kahden populaation odotusarvoja. Miten arvioidaan niiden yhtäsuuruutta? Onko arvio luotettava?

Hän tunnistaa erilaiset estimointitilanteet, osaa valita tilanteeseen soveltuvan luottamusvälin sekä käyttää sitä tilastollisessa päättelyssä. Esim. 5 Puolueen kannatuksen arviointi. Esim. 6 Onko puolueen kannatus miesten ja naisten keskuudessa sama? Esim. 7 Hillopurkkien keskimääräisen painon arviointi. 4

Esim. 8 Tuottavatko koneet A ja B keskimäärin samanmittaisia tankoja? 5

6 Hän ymmärtää tilastollisen testauksen periaatteet ja osaa suorittaa tilastollisen testauksen annetussa empiirisessä tilanteessa. Esim. 9 Puolue väittää kannatuksensa olevan eli 18 %. Voitko uskoa väitteen? Esim. 10 Onko puolueen kannatus miesten ja naisten keskuudessa sama?

7 Esim. 11 Voidaanko uskoa, että hillopurkit painavat keskimäärin 340 g. Esim. 12 Tuottaako kone A keskimäärin 5 cm pidempiä tankoja kuin kone B? Hänellä on valmiudet todennäköisyyslaskennan ja tilastollisen päättelyn aineopintotasoiseen opiskeluun.

8 3 Opintojakson kotisivu http://www.uta.fi/sis/mtt/mtttp3/kevat_2015.html Opetus Kurssi-info (sisältö, tentit, harjoitushyvitys) Luennot, luentorunko (luvut 5 6, kaavat, taulukot) Harjoitukset, tehtävät, ohjeet (Moodle), ratkaisut Oheiskirjallisuutta Usein kysyttyä Linkkejä Palaute

9 4 Kertausta 4.1 Normaalijakauma s. 29 30 Jos X ~ N(µ, σ 2 ), niin Z = (X - µ)/σ ~ N(0, 1). P(X a) = Φ((a - µ)/σ) P(X a) = 1 P(X a) = 1 - Φ((a - µ)/σ) P(a X b) = P(X b) - P(X a) = Φ((b - µ)/σ) - Φ((a - µ)/σ)

10 4.2 Normaalijakaumaan liittyviä tuloksia s. 32 33 Jos X ~ N(μ, σ 2 ), niin ax + b ~ N(aμ + b, a 2 σ 2 ) Jos X 1, X 2,, X n ovat riippumattomia, X i ~ N(μ i, σ i 2 ), in X 1 + X 2 + + X n ~ N(μ 1 + μ 2 + + μ n, σ 1 2 + σ 2 2 + + σ n 2 )

Esim. 13 Poliklinikalla potilasta kohden käytetty aika (min) noudattaa normaalijakaumaa odotusarvoja 15 min ja keskihajontana 1,5 min. Lääkäri aloittaa työt kello 10. Viidennelle potilaalle on varattu aika kello 11.00. Millä todennäköisyydellä viides potilas pääsee vastaanotolle aikaisintaan kello 11.05? Kokonaisaika X = X 1 + X 2 + X 3 + X 4, missä X i ~ N(15, 1,5 2 ). X ~ N(15+15+15+15, 1,5 2 +1,5 2 +1,5 2 +1,5 2 ) P(X 65) = 1 P(X<65) = 1 Φ((65-60)/3) = 1 - Φ(1,67) = 1 0,9525 = 0,0475. 11

12 Jos X 1, X 2,, X n ovat riippumattomia ja E(X i ) = µ i Var(X i ) = σ i 2, niin X 1 + X 2 + + X n likimain ~ N(μ 1 + μ 2 + + μ n, σ 1 2 + σ 2 2 + + σ n 2 )

13 Jos X i ~ N(μ, σ 2 ), i = 1, 2,, n, ja X i : t riippumattomia, niin X = 1 n (X 1 + + X n ) ~N (μ, σ2 n )

Esim. 14 Hillopurkkien valmistaja väittää purkkien keskipainoksi 340 g. Tiedetään, että paino vaihtelee jonkin verran. Oletetaan, että vaihtelu on luonnehdittavissa normaalijakauman, jonka keskihajonta on 10 g, avulla. Tutkitaan valmistajan väitettä keskipainosta ja valitaan satunnaisesti 9 purkkia. Näiden purkkien keskipainoksi saadaan 336 g. Voitko uskoa valmistajan väitteen? 14

15 Jos valmistajan väite tosi, niin X ~N (340, 102 9 ). Tällöin 336 340 P(X 336) = Φ ( ) = Φ( 1,2) = 1 Φ(1,2) 10 3 = 1 0,8849 = 0,1151 Valmistajan väite voidaan uskoa, koska sen ollessa tosi, ei ole harvinaista saada otosta, jonka keskiarvo on alle 336. Siis laskettua todennäköisyyttä ei pidetä pienenä.

Esim. 15 Bill on käyttänyt tiettyä partakonetta. Parranajoon kuluva aika (sekunteina) on noudattanut normaalijakaumaa odotusarvona 240 s ja keskihajontana 20 s. Bill vaihtaa partakonetta. Hän ajaa päivittäin uudella koneella ja saa n päivän ajoaikojen keskiarvoksi 230 s. Hän päättelee 2,5 %:n riskitasolla, että uusi kone on nopeampi. Montako päivää hän oli käyttänyt uutta konetta? 16

17 Jos uusi kone toimii vanhan nopeudella, niin X ~N (240, 202 n ), joten P(X 230) = Φ ( 230 240 ) = Φ ( 10 n 20 20 ) n = 1 Φ ( n 2 ) = 0,025. Tästä saadaan Φ ( n 2 ) = 0,975, jolloin n 2 suurempi kuin 15. = 1,96. Otoskoko on ollut

Jos X 1, X 2, X n ovat riippumattomia, E(X i ) = μ, Var(X i ) = σ 2, niin 18 X = 1 n (X 1 + + X n ) likimain ~ N (μ, σ2 n ) Jos X ~ Bin(n, p), niin likimain X ~ N(np, np(1 p)), kun n suuri.

Esim. 16 Tutkitaan uuden menetelmän toimivuutta ihosairauden hoidossa. Vanhan menetelmän avulla 60 % potilaista parani. Valitaan satunnaisesti uudella menetelmällä hoidetuista potilaista 200. Heistä 144 parani. Onko uusi menetelmä vanhaa parempi? 19 Jos uusi menetelmä toimii vanhan tehokkuudella, niin parantuneiden lukumäärä X ~ Bin(200, 0,6). Tällöin E(X) = 200 0,6 = 120, Var(X) = 200 0,6 0,4 = 48.

20 Nyt X ~ N(120, 48), likimain. P(X 144) = 1 P(X 143) 1 - Φ(143 120)/ 48) = 1 - Φ(3,32) = 0,0005. Tämä harvinaista, joten ei toimi vanhan tehokkuudella. On siis parempi.

21 Esim. 17 Levykaupan omistaja arvioi, että 20 % asiakkaista suorittaa ostoksen. Laske todennäköisyys, että 180 asiakkaan joukosta ainakin 45 suorittaa ostoksen. X = ostosten suorittaneiden lukumäärä X ~ Bin( 180, 0,2), E(X) = 36, Var(X) = 28,8 X ~ N(36, 28,8), likimain P(X 45) = 1 P(X 44) 1 - Φ(44 36)/ 28,8) = 1 - Φ(1,49) = 0,0681.

22 4.3 Satunnaisotos, otossuure, otosjakauma, otossuureen keskivirhe s. 35 38 Olkoon X 1, X 2,..., X n satunnaismuuttujajono. Tätä jonoa sanotaan satunnaisotokseksi, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa.

23 Sanonta X 1, X 2,..., X n on satunnaisotos N(µ, σ 2 ):sta tarkoittaa sitä, että jokainen X i N(µ, σ 2 ) ja X i :t ovat riippumattomia. Satunnaisotoksen avulla määriteltyä funktiota kutsutaan otossuureeksi. Otossuureen todennäköisyysjakaumasta käytetään nimitystä otanta- tai otosjakauma.

24 Otossuureen keskihajontaa sanotaan otossuureen keskivirheeksi. Esillä olleiden otossuureiden jakaumia - Otoskeskiarvon jakauma: X ~N (μ, σ2 ), jos satunnaisotos n normaalijakaumasta. Esimerkit 14 & 15

25 - Otoskeskiarvojen erotuksen jakauma X Y ~N (μ 1 μ 2, σ 1 2 + σ 2 2 n m ), jos satunnaisotokset normaalijakaumista.

26 Esim. 19 Koneiden A ja B pitäisi valmistaa keskimäärin samanmittaisia tankoja. Molempien koneiden tuottamien tankojen pituuksissa X ja Y (cm) on jonkin verran vaihtelua, jota voidaan luonnehtia normaalijakaumalla, jonka varianssi on 0,20 cm 2. Laadunvalvonnassa seurataan koneiden toimintaa ja valitaan satunnaisesti koneen A tuotannosta 20 ja koneen B tuotannosta 10 tankoa. Koneen A tuotannosta valittujen tankojen keskipituus on 40,0 cm ja koneelta B valittujen 39,5 cm. Onko syytä epäillä, että A valmistaa keskimäärin pidempiä tankoja?

27 X Y ~ N (0, 0,2 20 + 0,2 ), jos tuottavat samanmittaisia 10 P(X Y > 40,0 39,5) = 1 P(X Y 40,0 39,5) = 1 Φ ( 0,5 0 ) = 1 Φ(2,89) = 1 0,9981 0,03 = 0,0019. On syytä epäillä. Jos tuottaisivat keskimäärin samanmittaisia, niin olisi harvinaista saada otokset, joiden keskiarvojen erotuksen olisi suurempi kuin 0,5 cm.

28 - Jos populaatiossa viallisia π %, niin viallisten lukumäärä otoksessa X ~ Bin(n, π). Tätä voidaan approksimoida normaalijakaumalla. Esimerkit 16 & 17

29 - Jos populaatiossa viallisia π %, niin viallisten prosenttiosuus otoksessa p ~N (π, π(100 π) ), likimain. n Perustelu: X = viallisten lukumäärä otoksessa X ~ Bin(n, π/100), E(X) =n π 100,

30 Var(X) = n π 100 (1- π 100 ) Viallisten prosenttiosuus p = 100X/n E(p) = E(100X/n) = 100 100 E(X) = n n n π 100 = π Var(p) = Var(100X/n) = ( 100 n )2 Var(X) = ( 100 n )2 n π 100 π (1 ) = π(100 π) 100 n

Koska X on likimain normaalisti jakautunut, niin myös 100X/n on likimain normaalijakautunut. 31