Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Samankaltaiset tiedostot
Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

riippumattomia ja noudattavat samaa jakaumaa.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

voidaan hylätä, pienempi vai suurempi kuin 1 %?

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

dx=5&uilang=fi&lang=fi&lvv=2014

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

MTTTP1, luento KERTAUSTA

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

MTTTP5, luento Luottamusväli, määritelmä

MTTTP1, luento KERTAUSTA

Luottamusvälit. Normaalijakauma johnkin kohtaan

Sovellettu todennäköisyyslaskenta B

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Väliestimointi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

10. laskuharjoituskierros, vko 14, ratkaisut

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

&idx=2&uilang=fi&lang=fi&lvv=2015

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

031021P Tilastomatematiikka (5 op) viikko 5

Harjoitus 7: NCSS - Tilastollinen analyysi

Estimointi. Otantajakauma

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Mat Tilastollisen analyysin perusteet, kevät 2007

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Mat Sovellettu todennäköisyyslasku A

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

&idx=2&uilang=fi&lang=fi&lvv=2015

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Luento JOHDANTO

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Sovellettu todennäköisyyslaskenta B

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisia peruskäsitteitä ja Monte Carlo

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Tilastollinen aineisto Luottamusväli

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

&idx=1&uilang=fi&lang=fi&lvv=2017

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

voidaan hylätä, pienempi vai suurempi kuin 1 %?

dx=2&uilang=fi&lang=fi&lvv=2015

Testit laatueroasteikollisille muuttujille

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Estimointi. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

pisteet Frekvenssi frekvenssi Yhteensä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

Tutkimustiedonhallinnan peruskurssi

1. Tilastollinen malli??

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

HAVAITUT JA ODOTETUT FREKVENSSIT

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

9. laskuharjoituskierros, vko 12-13, ratkaisut

g=fi&lvv=2018&uilang=fi#parents

Otoskoko 107 kpl. a) 27 b) 2654

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Matemaatikot ja tilastotieteilijät

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MTTTP1, luento KERTAUSTA

Korrelaatiokertoinen määrittely 165

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Testejä suhdeasteikollisille muuttujille

Transkriptio:

6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä, nk. luottamustasolla.

6.10.2016/2 Olkoon populaatiossa % viallisia. Nyt :n 100(1 - ) %:n luottamusväli on p z / 2 p(100 p) / n kaava (8)

6.10.2016/3 Esim. Rahapelin pitäisi antaa voitto 20 %:lle pelatuista peleistä. Pelaat peliä 200 kertaa ja voitat 32 kertaa. Voitko uskoa, että 20 % peleistä voittaa? Muodostetaan 95 %:n luottamusväli prosenttiosuudelle. Nyt = 0,05, z 0,05/2 = z 0,025 = 1,96, n = 200, p = 16, luottamusväli 16 1,96 16(100 16)/200 16 5,1 Koska 20 kuuluu luottamusvälille, päätellään pelin toimivan luvatulla tavalla.

6.10.2016/4 Esim. 7.6.5. Yritys valvoo tuotantoaan. Virheellisten komponenttien osuus ei saisi olla suurempi kuin 4 %. Laaduntarkkailussa tehtiin 500 komponentin otos, jossa 28 komponenttia osoittautui virheellisiksi. Onko tuotanto keskeytettävä? 95 %:n luottamusväli virheellisten komponenttien prosenttiosuudelle 5,6 1,96 5,6(100 5,6)/500 Virheellisten osuuden arvellaan olevan välillä 3,6 % - 7,6 %, joten vaihtelu on sallituissa rajoissa, koska 4 % kuuluu luottamusvälille.

6.10.2016/5 Populaation odotusarvon µ 100(1 - ) %:n luottamusväli on X t / 2; n 1s / n kaava (9)

Studentin t-jakauman taulukkoarvot t,df ja t /2,df 6.10.2016/6

6.10.2016/7

6.10.2016/8 Esim. 7.6.9. Tiedetään, että eräs kirjailija käyttää tuotannossaan virkkeitä, joiden keskipituus on 32 sanaa. Tutkija lukee erään tekstin, jossa on 30 virkettä. Näiden 30 virkkeen keskipituus on 35,0 sanaa ja keskihajonta 6,8 sanaa. Voisiko teksti olla peräisin kyseisen kirjailijan tuotannosta? Muodostetaan odotusarvon 95 %:n luottamusväli. Nyt t 0,05/2;30 1 = t 0,025;30 1 = 2,045 ja luottamusväli 35,0 2,045 6,8/ 30. Saadaan väliksi 32,5 37,5, jolle 32 ei kuulu. Päätellään, että teksti ei ole kyseisen kirjailijan tuotantoa.

Esim. 6.10.2016/9 Eräs tehdas valmistaa tiiliä, joiden keskipaino pitkän aikavälin seurannassa on ollut 2,000 kg. Erään päivän tuotannosta valittiin satunnaisesti 16 tiiltä. Näiden keskipainoksi saatiin 1,972 kg ja keskihajonnaksi 0,054 kg. Onko keskipainossa tapahtunut muutosta? Muodostetaan odotusarvon 95 %:n luottamusväli. Nyt t 0,05/2;16 1 = t 0,025;16 1 = 2,131 ja luottamusväli 1,972 2,131 0,054/ 16. Saadaan väliksi 1,972 ± 0,029. Koska 2,000 kuuluu välille, päätellään ettei muutosta.

Esim. 7.6.7. Esimerkissä 7.6.6, syntymäpituuden tarkastelu, otoksessa 65 poikaa 6.10.2016/10 Luottamusväli on laskettu 50,95±2 1,972/ 65, (t 0,05/2;65 1 2) 50,95±2 0,245

6.10.2016/11 Esim. Lepakoiden tunnistusmatkat, ks. http://www.sis.uta.fi/tilasto/mtttp1/syksy2016/esimerkit_ kaavoihin.pdf

6.10.2016/12 Esim. 7.6.8. Esimerkin 5.1.30 kovuusindeksien erotukset -5, 1, -2, -5, 2,-7, -1, -7, 1, 0, joista keskiarvo -2,3 ja keskihajonta 3,4. Odotusarvon 95 %:n luottamusväli -2,3±2,262 3,4/ 10-2,3±2,4 Lisäaineilla ei eroja, koska nolla kuuluu luottamusvälille.

6.10.2016/13 7.6.3 Kahden populaation odotusarvon erotuksen luottamusväli Jos halutaan arvioida kahden populaation odotusarvojen yhtäsuuruutta, niin voidaan arvioida odotusarvojen erotusta µ 1 - µ 2. Esim. 7.6.10. Arvio lähiö- ja keskusta-asuntojen keskineliöhintojen erotukselle on (-989,844, -798,862), muodostettu luottamusväli odotusarvojen erotukselle. Koska nolla ei kuulu luottamusvälille, niin päätellään: odotusarvojen olevan eri suuret (keskihinnat eivät samoja). http://www.sis.uta.fi/tilasto/mtttp1/syksy2016/luentorunk o.pdf#page=79

6.10.2016/14 7.7 Hypoteesien testausta Tutkimusongelmia: Puolueen kannatus? Väite: = 18 % Virheellisten komponenttien osuus tuotannossa? Väite: = 4 % Kynttilöiden keskimääräinen palamisaika? Väite: µ = 20 h

6.10.2016/15 Asuntojen keskimääräiset neliöhinnat keskustassa ja lähiössä? Väite: µ 1 = µ 2 Painon ja pituuden välinen lineaarinen riippuvuus? Väite: = 0 Opintosuunnan vaikutus kurssiarviointiin? Väite: ei riippuvuutta

6.10.2016/16 Tilastollinen hypoteesi on väite populaatiosta, usein populaation jakauman parametrista. Esim. H0: = 0 H0: µ = µ 0 Hypoteesin testaus on väitteen tutkimista otoksen perusteella. Käytetään sopivaa otossuuretta (testisuuretta), jonka jakauma tunnetaan, kun H0 tosi.

6.10.2016/17 Esim. H 0 : = 0 Z p 0 100 ) / n 0 ( 0 likimain ~ N(0,1), kun H 0 tosi H 0 : µ = µ 0 t X s / n 0 ~ tn 1, kun H 0 tosi

6.10.2016/18 Otossuureen (testisuureen) arvon perusteella H 0 hyväksytään tai hylätään. Jos testisuureen arvoa pidetään tavanomaisten arvojen joukkoon kuuluvaksi, niin H 0 hyväksytään. Jos arvoa pidetään harvinaisten arvojen joukkoon kuuluvaksi, niin H 0 hylätään. Mikä on harvinaista? Mihin H 0 :n hylkääminen johtaa?

6.10.2016/19 Esim. H 0 : = 0 H 1 : > 0 vaihtoehtoinen hypoteesi Z likimain p 0 ~ N(0,1) 100 ) / n 0 ( 0, kun H 0 tosi Nyt harvinaisiksi arvoiksi katsotaan suuret arvot, suuremmat kuin z. Tällöin merkitsevyys- eli riskitaso on. Usein = 0,05, 0,025, 0,01 tai 0,001.

Jos H 0 hylätään, niin H 1 hyväksytään. 6.10.2016/20

6.10.2016/21 Miten H 1 asetetaan? Esim. H 0 : = 0 H 1 : > 0 (yksisuuntainen testi) tai H 1 : < 0 (yksisuuntainen testi) tai H 1 : 0 (kaksisuuntainen testi) Kaksisuuntaisessa testissä harvinaisten arvojen joukko on jakauman hännillä.

6.10.2016/22 Esim. H 0 : = 0 H 1 : 0 (kaksisuuntainen testi) Päättely p-arvon perusteella, p-arvo on pienin riskitaso, jolla H0 voidaan hylätä.

6.10.2016/23 Esim. H 0 : = 0 H 1 : > 0 Jos p-arvo on pienempi kuin valittu riskitaso, niin H 0 hylätään.

6.10.2016/24 Testisuureita H 0 : = 0 Z p 0 100 ) / n 0 ( 0 likimain ~ N(0,1), kun H0 tosi

6.10.2016/25 Esim. 7.7.1. Tarkastellaan erään liikkeen asiakkaita. Halutaan tutkia, ovatko asiakkaista yli puolet naisia. Tehdään 200 asiakkaan satunnaisotos jossa naisia on 113. Nyt H 0 : = 50 % ja H 1 : > 50 %. Otoksessa naisia 56,5 %. Aineiston perusteella testisuureen arvoksi saadaan

6.10.2016/26 z 56,5 50 50(100 50)/ 200 1,838 z 0,05 1,6449. H 0 hylätään 5 %:n riskitasolla, mutta ei 2,5 %:n riskillä, joten 0,025 < p-arvo < 0,05. Ks. http://www.sis.uta.fi/tilasto/mtttp1/syksy201 6/luentorunko.pdf#page=83

6.10.2016/27 Esim. 7.7.2 http://www.sis.uta.fi/tilasto/mtttp1/syksy201 6/luentorunko.pdf#page=83