806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Samankaltaiset tiedostot
Estimointi. Vilkkumaa / Kuusinen 1

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Tilastollinen aineisto Luottamusväli

pisteet Frekvenssi frekvenssi Yhteensä

riippumattomia ja noudattavat samaa jakaumaa.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

dx=5&uilang=fi&lang=fi&lvv=2014

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Väliestimointi (jatkoa) Heliövaara 1

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

9. laskuharjoituskierros, vko 12-13, ratkaisut

Sovellettu todennäköisyyslaskenta B

Teema 8: Parametrien estimointi ja luottamusvälit

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Todennäköisyyden ominaisuuksia

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Luottamusvälit. Normaalijakauma johnkin kohtaan

Sovellettu todennäköisyyslaskenta B

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

HAVAITUT JA ODOTETUT FREKVENSSIT

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

Mat Sovellettu todennäköisyyslasku A

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

Sovellettu todennäköisyyslaskenta B

6. laskuharjoitusten vastaukset (viikot 10 11)

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

1. Tilastollinen malli??

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Satunnaismuuttujien mittausasteikot 93

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Otoskoko 107 kpl. a) 27 b) 2654

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

805306A Johdatus monimuuttujamenetelmiin, 5 op

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 8B Ratkaisuehdotuksia.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

11. laskuharjoituskierros, vko 15, ratkaisut

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

5 Lisa materiaali. 5.1 Ristiintaulukointi

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastollisia peruskäsitteitä ja Monte Carlo

031021P Tilastomatematiikka (5 op) viikko 5

Parametrin estimointi ja bootstrap-otanta

031021P Tilastomatematiikka (5 op) viikko 4

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

MTTTP5, luento Luottamusväli, määritelmä

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Hypoteesin testaus Alkeet

Transkriptio:

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ on tuntematon ja σ 2 :n arvo tunnetaan. Otoksen havaituista arvoista laskettu aritmeettinen keskiarvo on x = 21.8. Määrää parametrin µ piste-estimaatti ja 99 %:n luottamusväli. µ:n piste-estimaatti: ˆµ = x = 21.8 µ:n 99 %:n luottamusväli: Nyt 100(1 α) = 99 1 α = 0.99 α = 1 0.99 = 0.01 N(0,1)-jakauman taulukosta nähdään, että kun Z N(0,1), niin P(Z ), joten z α/2 = kysytty 99 %:n luottamusväli on ( ) σ σ X z α/2 n, X +zα/2 n Luottamusvälin tulkinta:

2. Tarkastellaan vielä esimerkkiä 1 tilanteessa, jossa satunnaisotos(x 1,X 2,...,X 25 ) on N(µ,σ 2 )- jakaumasta eli sekä µ että σ 2 ovat tuntemattomia. Otoksen havaituista arvoista laskettu aritmeettinen keskiarvo x = 21.8 ja keskihajonta s x = 2.8. Määrätään µ:n 99 %:n luottamusväli. µ:n piste-estimaatti: ˆµ = x = 21.8 µ:n 99 %:n luottamusväli: Nyt 100(1 α) = 99 1 α = 0.99 α = 1 0.99 = 0.01 t(n-1)=t(25-1)=t(24)-jakauman taulukosta nähdään, että kun T t(24), niin P(T ) =, joten t α/2 = kysytty 99 %:n luottamusväli on ( ) S x S X t α/2 x, X +tα/2 n n Luottamusvälin tulkinta:

3. Määrätään seuraavaksi esimerkin 2 tilanteessa 98 %:n luottamusväli parametrille σ 2. σ 2 :n piste-estimaatti: ˆσ 2 = s 2 x = 2.8 2 = σ 2 :n 98 %:n luottamusväli: Nyt 100(1 α) = 98 1 α = 0.98 α = 1 0.98 = 0.02 χ 2 (n-1)=χ 2 (25-1)=χ 2 (24)-jakauman taulukosta nähdään, että kun χ 2 χ 2 (24), niin ja P(χ 2 ) = χ 2 α/2 = P(χ 2 ) = χ 2 1 α/2 = Täten kysytty 98 %:n luottamusväli σ 2 :lle on ( (n 1)Sx 2, χ 2 α/2 (n 1)S 2 x χ 2 1 α/2 ) Luottamusvälin tulkinta: Huom! Parametrin σ 98 %:n luottamusväli saadaan yllä olevasta σ 2 :n luottamusvälistä...

4. Yrityksellä AB tiedetään olleen 56 prosentin markkinaosuus tietyn tuotteen myynnistä. Kilpaileva yritys on kuitenkin järjestänyt laajan ja näyttävän mainoskampanjan ja nyt yrityksessä AB epäillään, että osa sen asiakkaista on siirtynyt käyttämään kilpailevan yrityksen tuotetta. Viidensadan kuluttajan satunnaisotoksessa 268 ilmoitti käyttävänsä AB:n tuotetta. Määrää 95 %:n luottamusväli nykyiselle markkinaosuudelle π perusjoukossa. Näyttääkö yrityksen epäily aiheelliselta luottamusvälin perusteella? Parametrin π piste-estimaatti: ˆπ = P = 268 500 = Parametrin π 95 %:n luottamusväli: Nyt n=500, P= ja 100(1 α) = 95 1 α = 0.95 α = 1 0.98 = 0.05 Kun Z N(0,1), niin P(Z ) =, joten z α/2 = ja kysytty 95 %:n luottamusväli on ) (P z α/2 P(1 P)/n, P +zα/2 P(1 P)/n Luottamusvälin tulkinta:

5. (Jatkoa edelliseen esimerkkiin.) Luottamusvälin pituuden ja luottamustason välisestä yhteydestä: Esimerkissä 4 luottamusvälin pituus on Jos edellä olisi laskettu π:n 99 %:n luottamusväli, olisi taulukkoluku z α/2 = ja luottamusväliksi saadaan, jolloin luottamusvälin pituus on Luottamustason kasvattaminen 95 %:sta 99 %:iin Otoskoosta: Jos haluttaisiin suhteellisen osuuden 95 % luottamusvälin pituuden olevan korkeintaan 5 %-yksikköä, montako kuluttajaa otokseen pitäisi ottaa? 2z α/2 P(1 P) n 0.05 2z α/2 P(1 P) 0.05 n n 2z α/2 P(1 P) 0.05 n ( 2zα/2 0.05 ) 2 P(1 P)

6. (Jatkoa esimerkkiin 1.) Satunnaisotos (X 1,X 2,...,X 25 ) N(µ,3 2 )-jakaumasta eli µ tuntematon ja σ 2 tunnetaan. Otoskeskiarvo x = 21.8. Testaa hypoteesia µ = 21.3. 1) Oletetaan, että X N(µ,3 2 ), jossa µ tuntematon. 2) Hypoteesit: H 0 : µ = H 1 : µ 3) Testisuure: 4) Testisuureen arvo: x =,σ =,n =,µ 0 = Z = X µ 0 σ/ n N(0,1), kun H 0 tosi 5) P-arvo: z = p-arvo= P(Z tai Z H 0 ) = 6) Johtopäätös:

7. Halutaan vertailla kahden toimialan (A ja B) maksuvalmiutta. Satunnaisesti valituista kahdeksasta A-toimialan yrityksestä ja kuudesta B-toimialan yrityksestä selvitettiin maksuvalmiutta kuvaava tunnusluku current ratio ja saatiin seuraavat tulokset: A : 1.38,1.55,1.90,1.22,1.11,1.48,1.61,1.90 B : 1.56,1.37,1.49,1.25,1.34,1.11 Oleta normaalijakaumamalli ja tutki sopivalla merkitsevyystestillä, onko maksuvalmius keskimäärin sama toimialoilla A ja B. Määrää myös aineistoon sopiva 95 prosentin luottamusväli ja tulkitse se. Current rationin varianssien oletetaan olevan yhtä suuret toimialoilla A ja B. 1) Populaatio 1: toimialan A yritykset X=toimialan A yrityksen maksuvalmius Oletetaan, että X N(µ x,σ 2 x). µ x ja σ 2 x ovat tuntemattomia Populaatio 2: toimialan B yritykset Y =toimialan B yrityksen maksuvalmius Oletetaan, että Y N(µ y,σ 2 y). µ y ja σ 2 y ovat tuntemattomia Oletetaan lisäksi, että σ 2 x = σ 2 y. 2) Hypoteesit: H 0 : µ x = µ y H 1 : µ x 3) Testisuure: µ y T = X Ȳ S 1/n+1/m t(n+m 2), kun H 0 on tosi, missä. S = (n 1)S 2 x +(m 1)S 2 y n+m 2

4) Testisuureen havaittu arvo: Nyt n =, x,s x, n =, x,s x, s = t = 5) P-arvo: Kun H 0 on tosi, T t(n+m 2)= p-arvo= P(T tai T H 0 tosi) = t-jakauman taulukosta 6) Johtopäätökset: 95 %:n luottamusväli (µ x µ y ):lle: 1 α = 0.95 α/2 = P(T t )=, kun T t(23) ( X Ȳ t α/2 S 1/n+1/m, X Ȳ +t α/2 S 1/n+1/m)

8. (Jatkoa esimerkkiin 4.) Yrityksellä AB tiedetään olleen 56 prosentin markkinaosuus tietyn tuotteen myynnistä. Kilpaileva yritys on kuitenkin järjestänyt laajan ja näyttävän mainoskampanjan ja nyt yrityksessä AB epäillään, että osa sen asiakkaista on siirtynyt käyttämään kilpailevan yrityksen tuotetta. Viidensadan kuluttajan satunnaisotoksessa 268 ilmoitti käyttävänsä AB:n tuotetta. Näyttääkö yrityksen epäily aiheelliselta? Suorita testaus. 1) Populaatio: kaikki kuluttajat X=yrityksen AB tuotteen käyttö X = 1, jos kuluttaja i käyttää yrityksen AB tuotetta 0, jos kuluttaja i ei käytä yrityksen AB tuotetta X Bern(π) ja P(X = 1) = π. 2) Hypoteesit: H 0 : π = H 1 : π 3) Testisuure: Z = P π 0 π 0 (1 π 0 ) n 4) Testisuureen havaittu arvo: Nyt N(0,1)likimain, kun H 0 on tosi, P =,n =,π 0, 5) P-arvo: z = p-arvo= P(Z H 0 tosi) = 6) Johtopäätökset:

9. Yritys ZZ valmistaa elektronisia laitteita sairaaloihin ja tarvitsee laitteissaan tiettyä komponenttia, jota puolestaan valmistavat yritykset A ja B. Ennen ostopäätöstä yrityksen ZZ johto päättää vertailla A:n ja B:n komponenttien toimivuutta ottamalla 250:n suuruisen satunnaisotoksen A:n komponenteista ja 200:n suuruisen satunnaisotoksen B:n komponenteista ja tutkimalla montako viallista komponenttia otoksista löytyy. A:n komponenteista viallisia oli 38, B:n komponenteista viallisia löytyi 12. Näyttääkö näiden tulosten perusteella A:n ja B:n komponentit yhtä luotettavilta? Analysoi aineistoa a) sopivalla merkitsevyystestillä, b) laskemalla sopiva 99 prosentin luottamusväli. 1) Populaatio 1: X= 1, X = 0, X Bern(π 1 ) ja P(X = 1) = π 1. Populaatio 2: Y = 1, Y = 0, Y Bern(π 2 ) ja P(Y = 1) = π 2. 2) Hypoteesit: H 0 : π 1 π 2 H 1 : π 1 π 2 3) Testisuure: Z = P 1 P 2 P(1 P)(1/n+1/m) N(0,1)likimain, kun H 0 on tosi.

4) Testisuureen havaittu arvo: Nyt n =,m =,P 1 =,P 2 = P = 5) P-arvo: z = p-arvo= P(Z H 0 tosi) = 6) Johtopäätökset: 99 %:n luottamusväli π 1 π 2 :lle: ( P 1 P 2 z α/2 P1 (1 P 1 ) n + P ) 2(1 P 2 ) P1 (1 P 1 ), P 1 P 2 + z α/2 + P 2(1 P 2 ) m n m

10. Vuonna 1990 Oulun kotitaloudet jakaantuivat seuraavasti: yhden hengen kotitalouksia oli 34%, kahden hengen 29 %, kolmen hengen 16%, neljän hengen 14% ja viiden tai useamman hengen kotitalouksia oli 7%. Vuonna 2008 otettiin 1980 oululaisen kotitalouden otos ja selvitettiin taloudessa asuvien henkilöiden lukumäärä. Tulos oli seuraava: Kotitalouden koko 1h 2h 3h 4h 5h Lukumäärä 787 615 225 213 140 Tutkija halusi selvittää, onko kotitalouden koko muuttunut vuodesta 1990 vuoteen 2008. Tutki asiaa sopivaa testiä käyttäen. 1) Populaatio: X= 2) Hypoteesit: 3) Testisuure: X:n mahdolliset arvot: H 0 : X:n todennäköisyysjakauma on H 1 : x i 1h 2h 3h 4h 5h Σ p 0 i X 2 = k (F i e i ) 2 e i=1 i χ 2 (k m 1) likimain, kun H 0 on tosi. 4) Testisuureen havaittu arvo: x i F i p 0 i e i = np 0 i 1h 2h 3h 4h 5h Σ x 2 =

5) P-arvo: X 2 χ 2 (k m 1) likimain, kun H 0 on tosi. Nyt k = ja m =, joten X 2 χ 2 (k m 1) = p-arvo= P(X 2 H 0 tosi) = χ 2 ( )-jakauman taulukosta nähdään, että 6) Johtopäätökset: 11. Satunnaisesti valituilta 294:ltä vuonna 1966 Oulun tai Lapin läänissä syntyneeltä kysyttiin tyytyväisyyttä elämäntilanteeseen vuonna 1996, jolloin he olivat 30-vuotiaita. Vastauksista saatiin seuraavanlainen taulukko: sukupuoli mies nainen yhteensä tyytyväisyys erittäin tyytyväinen 26 38 64 elämäntilanteeseen melko tyytyväinen 95 103 198 30-vuotiaana melko/erittäin tyytymätön 22 10 32 yhteensä 143 151 294 Näyttääkö sukupuolen ja elämäntilanteeseen tyytyväisyyden välillä olevan riippuvuutta? Käytä χ 2 -riippumattomuustestiä. 1) Populaatio: X= Y = (X 1,Y 1 ),(X 2,Y 2 ),...,(X 294,Y 294 ) 2) Hypoteesit: H 0 : x ja y H 1 : x ja y 3) Testisuure: X 2 = m r (F ij E ij ) 2 χ 2 [(r 1)(m 1)] likimain, kun H 0 on tosi. i=1 j=1 E ij

4) Testisuureen havaittu arvo: E ij = f i.f.j n E 11 = E 22 = χ 2 -testiin liittyvät kaksi ehtoa x 2 = i=1 j=2 (F ij E ij ) 2 E ij = 5) P-arvo: X 2 χ 2 [(r 1)(m 1)] likimain, kun H 0 on tosi. Nyt r = jam =, joten X 2 χ 2 [ p-arvo= P(X 2 H 0 on tosi) = χ 2 ( )-jakauman taulukosta nähdään, että 6) Johtopäätökset: Huom! Riippuvuuden suuntaa merkitsevyystestin tulos ei kerro, mutta se voidaan selvittää vertailemalla havaittuja ja odotettuja frekvenssejä. Vertailun perusteella voidaan sanoa, että