Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Samankaltaiset tiedostot
Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

riippumattomia ja noudattavat samaa jakaumaa.

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

voidaan hylätä, pienempi vai suurempi kuin 1 %?

dx=5&uilang=fi&lang=fi&lvv=2014

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

MTTTP1, luento KERTAUSTA

MTTTP5, luento Luottamusväli, määritelmä

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

MTTTP1, luento KERTAUSTA

Luottamusvälit. Normaalijakauma johnkin kohtaan

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

10. laskuharjoituskierros, vko 14, ratkaisut

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Väliestimointi (jatkoa) Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

031021P Tilastomatematiikka (5 op) viikko 5

&idx=2&uilang=fi&lang=fi&lvv=2015

Estimointi. Otantajakauma

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Mat Sovellettu todennäköisyyslasku A

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

&idx=2&uilang=fi&lang=fi&lvv=2015

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisia peruskäsitteitä ja Monte Carlo

Luento JOHDANTO

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Tilastollinen aineisto Luottamusväli

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

dx=2&uilang=fi&lang=fi&lvv=2015

Estimointi. Vilkkumaa / Kuusinen 1

A-OSA. Kyseessä on binomitodennäköisyys. 30 P(Tasan 10 sadepäivää ja muut 20 poutapäiviä) 0,35 (1 0,35) ,35 0, ,

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

Tutkimustiedonhallinnan peruskurssi

9. laskuharjoituskierros, vko 12-13, ratkaisut

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

g=fi&lvv=2018&uilang=fi#parents

&idx=1&uilang=fi&lang=fi&lvv=2017

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

pisteet Frekvenssi frekvenssi Yhteensä

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Otoskoko 107 kpl. a) 27 b) 2654

Testit laatueroasteikollisille muuttujille

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Matemaatikot ja tilastotieteilijät

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

x=2&uilang=fi&lang=fi&lvv=2017

dx=2&uilang=fi&lang=fi&lvv=2015

1. Tilastollinen malli??

HAVAITUT JA ODOTETUT FREKVENSSIT

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

MTTTP1, luento KERTAUSTA

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Testejä suhdeasteikollisille muuttujille

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Sovellettu todennäköisyyslaskenta B

Transkriptio:

5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä, nk. luottamustasolla.

5.10.2017/2 Olkoon populaatiossa % viallisia. Nyt :n 100(1 - ) %:n luottamusväli on p z / 2 p(100 p) / n kaava (8)

5.10.2017/3 Esim. Rahapelin pitäisi antaa voitto 20 %:lle pelatuista peleistä. Pelaat peliä 200 kertaa ja voitat 32 kertaa. Voitko uskoa, että 20 % peleistä voittaa? Muodostetaan 95 %:n luottamusväli prosenttiosuudelle. Nyt = 0,05, z 0,05/2 = z 0,025 = 1,96, n = 200, p = 16, luottamusväli 16 1,96 16 100 16 /200 16 5,1 Koska 20 kuuluu luottamusvälille, päätellään pelin toimivan luvatulla tavalla.

5.10.2017/4 Esim. 7.6.5. Yritys valvoo tuotantoaan. Virheellisten komponenttien osuus ei saisi olla suurempi kuin 4 %. Laaduntarkkailussa tehtiin 500 komponentin otos, jossa 28 komponenttia osoittautui virheellisiksi. Onko tuotanto keskeytettävä? 95 %:n luottamusväli virheellisten komponenttien prosenttiosuudelle 5,6 1,96 5,6(100 5,6)/500 Virheellisten osuuden arvellaan olevan välillä 3,6 % - 7,6 %, joten vaihtelu on sallituissa rajoissa, koska 4 % kuuluu luottamusvälille.

7.6.2 Populaation odotusarvon luottamusväli 5.10.2017/5 Esim. 7.6.6. Arvioidaan poikien keskimääräistä syntymäpituutta, siis poikapopulaation keskiarvoa. Otoksessa 65 pojan syntymäpituuden keskiarvo 50,95 cm ja keskihajonta 1,97 cm. Arvio populaation odotusarvon luottamusvälin avulla, määrittämisessä käytetään otoskeskiarvoa ja otoshajontaa. Poikien keskipituuden arvellaan olevan välillä 50,5 cm 51,4 cm. SPSS-tulos:

5.10.2017/6 Kaava (9), 100(1 - ) %:n luottamusväli odotusarvolle X t n s / / 2; 1 n

Studentin t-jakauman taulukkoarvot t,df ja t /2,df 5.10.2017/7

5.10.2017/8

5.10.2017/9 Esim. 7.6.9. Tiedetään, että eräs kirjailija käyttää tuotannossaan virkkeitä, joiden keskipituus on 32 sanaa. Tutkija lukee erään tekstin, jossa on 30 virkettä. Näiden 30 virkkeen keskipituus on 35,5 sanaa ja keskihajonta 6,8 sanaa. Voisiko teksti olla peräisin kyseisen kirjailijan tuotannosta? Muodostetaan odotusarvon 95 %:n luottamusväli. Nyt t 0,05/2;30 1 =2,045 ja luottamusväli 35,0 2,045 6,8/ 30. Saadaan väliksi 32,5 37,5, jolle 32 ei kuulu. Päätellään, että teksti ei ole kyseisen kirjailijan tuotantoa.

5.10.2017/10 Esim. Eräs tehdas valmistaa tiiliä, joiden keskipaino pitkän aikavälin seurannassa on ollut 2,000 kg. Erään päivän tuotannosta valittiin satunnaisesti 16 tiiltä. Näiden keskipainoksi saatiin 1,972 kg ja keskihajonnaksi 0,054 kg. Onko keskipainossa tapahtunut muutosta? Muodostetaan odotusarvon 95 %:n luottamusväli. Nyt t 0,05/2;16 1 = t 0,025;16 1 = 2,131 ja luottamusväli 1,972 2,131 0,054/ 16. Saadaan väliksi 1,972 ± 0,029. Koska 2,000 kuuluu välille, päätellään ettei muutosta.

Esim. 7.6.7. Esimerkissä 7.6.6, syntymäpituuden tarkastelu, otoksessa 65 poikaa 5.10.2017/11 Luottamusväli on laskettu 50,95±2 1,972/ 65, (t 0,05/2;65 1 2) 50,95±2 0,245

5.10.2017/12 Esim. Lepakoiden tunnistusmatkat, ks. http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/esimerkit_ kaavoihin.pdf

5.10.2017/13 Esim. 7.6.8. Esimerkin 5.1.30 kovuusindeksien erotukset -5, 1, -2, -5, 2,-7, -1, -7, 1, 0, joista keskiarvo -2,3 ja keskihajonta 3,4. Odotusarvon 95 %:n luottamusväli -2,3±2,262 3,4/ 10-2,3±2,4 Lisäaineilla ei eroja, koska nolla kuuluu luottamusvälille.

5.10.2017/14 7.6.3 Kahden populaation odotusarvon erotuksen luottamusväli Jos halutaan arvioida kahden populaation odotusarvojen yhtäsuuruutta, niin voidaan arvioida odotusarvojen erotusta µ 1 - µ 2.

5.10.2017/15 Esim. 7.6.10. Arvio lähiö- ja keskusta-asuntojen keskineliöhintojen erotukselle on (-989,844, -798,862), muodostettu luottamusväli odotusarvojen erotukselle. Koska nolla ei kuulu luottamusvälille, niin päätellään: odotusarvojen olevan eri suuret (keskihinnat eivät samoja). http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/luentorunk o.pdf#page=79 Aineisto Asunnot_2006

5.10.2017/16 7.7 Hypoteesien testausta Tutkimusongelmia: Puolueen kannatus? Väite: = 18 % Virheellisten komponenttien osuus tuotannossa? Väite: = 4 % Kynttilöiden keskimääräinen palamisaika? Väite: µ = 20 h

5.10.2017/17 Asuntojen keskimääräiset neliöhinnat keskustassa ja lähiössä? Väite: µ 1 = µ 2 Painon ja pituuden välinen lineaarinen riippuvuus? Väite: = 0 Opintosuunnan vaikutus kurssiarviointiin? Väite: ei riippuvuutta

Tilastollinen hypoteesi on väite populaatiosta, usein populaation jakauman parametrista. 5.10.2017/18 Esim. H0: = 0 H0: µ = µ 0 Hypoteesin testaus on väitteen tutkimista otoksen perusteella. Käytetään sopivaa otossuuretta (testisuuretta), jonka jakauma tunnetaan, kun H0 tosi.

5.10.2017/19 Esim. H 0 : = 0 Z p 0 100 ) / n 0 ( 0 likimain ~ N(0,1), kun H 0 tosi H 0 : µ = µ 0 t X s / n 0 ~ tn 1, kun H 0 tosi

Otossuureen (testisuureen) arvon perusteella H 0 hyväksytään tai hylätään. 5.10.2017/20 Jos testisuureen arvoa pidetään tavanomaisten arvojen joukkoon kuuluvaksi, niin H 0 hyväksytään. Jos arvoa pidetään harvinaisten arvojen joukkoon kuuluvaksi, niin H 0 hylätään. Mikä on harvinaista? Mihin H 0 :n hylkääminen johtaa?

5.10.2017/21 Esim. H 0 : = 0 H 1 : > 0 vaihtoehtoinen hypoteesi Z likimain p 0 ~ N(0,1) 100 ) / n 0 ( 0, kun H 0 tosi Nyt harvinaisiksi arvoiksi katsotaan suuret arvot, suuremmat kuin z. Tällöin merkitsevyys- eli riskitaso on. Usein = 0,05, 0,025, 0,01 tai 0,001.

Jos H 0 hylätään, niin H 1 hyväksytään. 5.10.2017/22

5.10.2017/23 Miten H 1 asetetaan? Esim. H 0 : = 0 H 1 : > 0 (yksisuuntainen testi) tai H 1 : < 0 (yksisuuntainen testi) tai H 1 : 0 (kaksisuuntainen testi) Kaksisuuntaisessa testissä harvinaisten arvojen joukko on jakauman hännillä.

5.10.2017/24 Esim. H 0 : = 0 H 1 : 0 (kaksisuuntainen testi) Päättely p-arvon perusteella, p-arvo on pienin riskitaso, jolla H0 voidaan hylätä.

5.10.2017/25 Esim. H 0 : = 0 H 1 : > 0 Jos p-arvo on pienempi kuin valittu riskitaso, niin H 0 hylätään.

5.10.2017/26 Testisuureita H 0 : = 0 Z p 0 100 ) / n 0 ( 0 likimain ~ N(0,1), kun H0 tosi

5.10.2017/27 Esim. 7.7.1. Tarkastellaan erään liikkeen asiakkaita. Halutaan tutkia, ovatko asiakkaista yli puolet naisia. Tehdään 200 asiakkaan satunnaisotos jossa naisia on 113. Nyt H 0 : = 50 % ja H 1 : > 50 %. Otoksessa naisia 56,5 %. Aineiston perusteella testisuureen arvoksi saadaan z 56,5 50 50(100 50)/ 200 1,838 z 0,05 1,6449.

5.10.2017/28 H 0 hylätään 5 %:n riskitasolla, mutta ei 2,5 %:n riskillä, joten 0,025 < p-arvo < 0,05. Ks. http://www.sis.uta.fi/tilasto/mtttp1/syksy201 7/luentorunko.pdf#page=83 Esim. 7.7.2 http://www.sis.uta.fi/tilasto/mtttp1/syksy201 7/luentorunko.pdf#page=83