Sovellettu todennäköisyyslaskenta B

Samankaltaiset tiedostot
Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Osa 2: Otokset, otosjakaumat ja estimointi

Estimointi. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Sovellettu todennäköisyyslaskenta B

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Sovellettu todennäköisyyslaskenta B

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kuvaaminen

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Testejä suhdeasteikollisille muuttujille

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 2: Matlab - Statistical Toolbox

7. laskuharjoituskierros, vko 10, ratkaisut

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

riippumattomia ja noudattavat samaa jakaumaa.

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

9. laskuharjoituskierros, vko 12-13, ratkaisut

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Harjoitus 7: NCSS - Tilastollinen analyysi

Sovellettu todennäköisyyslaskenta B

Tutkimustiedonhallinnan peruskurssi

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Testit laatueroasteikollisille muuttujille

dx=5&uilang=fi&lang=fi&lvv=2014

Normaalijakaumasta johdettuja jakaumia

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Mat Sovellettu todennäköisyyslasku A

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

031021P Tilastomatematiikka (5 op) viikko 3

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Mat Tilastollisen analyysin perusteet, kevät 2007

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Sovellettu todennäköisyyslaskenta B

Teema 8: Parametrien estimointi ja luottamusvälit

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 5: Jakaumaoletuksien. testaaminen

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Tilastollisia peruskäsitteitä ja Monte Carlo

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Testit järjestysasteikollisille muuttujille

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Todennäköisyyden ominaisuuksia

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut

Luottamusvälit. Normaalijakauma johnkin kohtaan

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

031021P Tilastomatematiikka (5 op) viikko 4

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

805306A Johdatus monimuuttujamenetelmiin, 5 op

Maximum likelihood-estimointi Alkeet

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

10. laskuharjoituskierros, vko 14, ratkaisut

Transkriptio:

Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19

1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut ja otosjakaumat Aritmeettisen keskiarvon odotusarvo ja varianssi Otosvarianssin odotusarvo ja varianssi Otosvarianssin otosjakauma, kun otos on normaalijakautunut Jakauman vinous ja huipukkuus Geometrinen- ja harmoninen keskiarvo Antti Rasila () TodB 18. lokakuuta 2007 2 / 19

Tilastollinen aineisto Tilastollinen aineisto koostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista. Tilastollisissa tutkimusasetelmissa havaintoarvoihin liittyy aina epävarmuutta ja satunnaisuutta. Tilastollisesta aineistosta (otoksesta) voidaan laskea erilaisia tunnuslukuja todennäköisyyslaskennan keinoin. Antti Rasila () TodB 18. lokakuuta 2007 3 / 19

Esimerkki 1/2 Tutkittaessa eräiden komponettien kestoikää valittiin umpimähkään 36 komponettia, joiden kestoikä määritettiin ajannopeutuskokeen avulla. Kestoiät täysinä tunteina: 86 5998 450 6672 988 1014 73 1448 4607 119 506 1113 1901 219 910 34 221 387 793 3036 546 2875 1350 104 3476 2082 2708 2171 4988 2750 3198 427 250 2467 924 40 Saadaan otoskeskiarvo x = 1693h, mediaani Md = (998 + 1014)/2 = 1001h, otoskeskihajonta s = 1754 h, otoskeskipoikkeama t = 1 n n k=1 x k x = 292 h, ensimmäinen kvartiili Q 1 = 250 h, kolmas kvartiili Q 3 = 2708 h ja kvartiilipoikkeama Q 3 Q 1 = 2458 h. Antti Rasila () TodB 18. lokakuuta 2007 4 / 19

Esimerkki 2/2 Luokitellaan aineisto. Valitaan jaoksi 0-999,1000-1999,...,6000-6999. Merkitään luokkia Lk, k = 1,..., 7 Luokkien frekvensseiksi saadaan: Luokka L1 L2 L3 L4 L5 L6 L7 Frekvenssi 18 5 6 3 2 1 1 Kumulat. frekv. 18 23 29 32 34 35 36 Luokitellusta aineistosta voidaan laskea likiarvo keskiarvolle x l = 1 n l f k z k = 1749.5, k=1 missä l on luokkien lukumäärä, f k :t ovat luokkafrekvenssit ja z k luokkien keskikohdat (esim. tapauksessa 499.5, 1499.5, jne.). Vrt. luokittelemattomasta aineistosta laskettuun keskiarvoon 1693. Antti Rasila () TodB 18. lokakuuta 2007 5 / 19

Tilastollinen malli Tilastollisella mallilla tarkoitetaan tutkimuksen kohteita kuvaavien satunnaismuuttujien todennäköisyysjakaumaa, jonka ajatellaan generoineen ko. satunnaismuuttujien havaitut arvot. Nämä todennäköisyysjakaumat riippuvat tavallisesti parametreista, joiden arvoja ei yleensä tunneta. Tilastollista mallia sovellettaessa kohdataan tavallisesti seuraavat parametreja koskevat ongelmat: Parametrien arvoja ei tunneta ja ne on estimoitava eli arvioitava havaintoaineistosta. Parametrien arvoista on olemassa oletuksia, joita halutaan testata havaintoaineiston antaman informaation avulla. Antti Rasila () TodB 18. lokakuuta 2007 6 / 19

Yksinkertainen satunnaisotos Olkoot X 1, X 2,..., X n riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys- tai tiheysfunktio f (x). Tällöin satunnaismuuttujat X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen jakaumasta f (x). Antti Rasila () TodB 18. lokakuuta 2007 7 / 19

Otostunnusluvut ja otosjakaumat Olkoon T = g(x 1, X 2,..., X n ) jokin satunnaismuuttujien X 1, X 2,..., X n (mitallinen) funktio. Satunnaismuuttujaa T kutsutaan otostunnusluvuksi. Tunnusluvun T jakaumaa kutsutaan T :n otosjakaumaksi. Antti Rasila () TodB 18. lokakuuta 2007 8 / 19

Aritmeettisen keskiarvon odotusarvo ja varianssi Oletetaan, että havainnot X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen satunnaismuuttujan X jakaumasta, jonka odotusarvo ja varianssi ovat E(X ) = µ ja Var(X ) = σ 2. Havaintojen aritmeettisen keskiarvon X odotusarvo ja varianssi ovat E( X ) = µ Var( X ) = σ2 n Aritmeettisen keskiarvon standardipoikkeamaa D( X ) = σ/ n kutsutaan keskiarvon keskivirheeksi. Antti Rasila () TodB 18. lokakuuta 2007 9 / 19

Esimerkki (Laininen) 1/2 Laudan paksuuden X keskihajonta on 0.05 tuumaa ja odotusarvo tuntematon µ tuumaa. Kuinka monen umpimähkään valitun laudan paksuus tulee mitata, jotta mitattu keskiarvo poikkeaisi tarkasta odotusarvosta korkeintaan 0.01 tuumaa todennäköisyydellä 0.95? Merkitään X :llä n:n havainnon aritmeettista keskiarvoa. Sen odotusarvo on µ ja varianssi 0.05 2 /n. Keskeisen raja-arvolauseen mukaan X N(µ, 0.05 2 /n). Antti Rasila () TodB 18. lokakuuta 2007 10 / 19

Esimerkki (Laininen) 2/2 Etsitään n siten, että Pr( X µ 0.01) = 0.95, eli ( Pr Z 0.01 ) 0.05/ = 0.95. n Taulukosta saadaan Pr( Z 1.96) = 0.95, joten ehto on täytetty, jos 0.01 0.05/ n = 1.960. Saadaan n = 96.04, eli pyöristettynä ylöspäin n = 97. Antti Rasila () TodB 18. lokakuuta 2007 11 / 19

Aritmeettisen keskiarvon otosjakauma, kun otos on normaalijakautunut Oletetaan, että havainnot X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen normaalijakaumasta N(µ, σ 2 ). Tällöin havaintojen aritmeettinen keskiarvo X noudattaa eksaktisti normaalijakaumaa: ) X N (µ, σ2 n Standardoitu satunnaismuuttuja Z = X µ σ/ n noudattaa eksaktisti standardoitua normaalijakaumaa: Z N(0, 1) Antti Rasila () TodB 18. lokakuuta 2007 12 / 19

Otosvarianssin odotusarvo ja varianssi Oletetaan, että havainnot X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen satunnaismuuttujan X jakaumasta, jonka odotusarvo ja varianssi ovat E(X ) = µ ja Var(X ) = σ 2. Havaintojen otosvarianssin s 2 odotusarvo ja varianssi ovat E(s 2 ) = σ 2 Var(s 2 ) = 2σ4 n 1 Antti Rasila () TodB 18. lokakuuta 2007 13 / 19

Otosvarianssin otosjakauma, kun otos on normaalijakautunut Oletetaan, että havainnot X 1, X 2,..., X n muodostavat yksinkertaisen satunnaisotoksen normaalijakaumasta N(µ, σ 2 ). Tällöin satunnaismuuttuja V = (n 1)s2 σ 2 = n ( Xi X i=1 σ ) 2 noudattaa eksaktisti χ 2 -jakaumaa vapausastein (n 1): V χ 2 (n 1) Antti Rasila () TodB 18. lokakuuta 2007 14 / 19

Vinous Olkoot m 2 = 1 n n (x i x) 2 m 3 = 1 n i=1 havaintoarvojen 2. ja 3. keskusmomentti. n (x i x) 3 Tunnuslukua c 1 = m 3 m 3/2 2 käytetään kuvaamaan havaintoarvojen jakauman vinoutta. Jos c 1 0, on havaintoarvojen jakauma symmetrinen painopisteensä suhteen. Jos c 1 > 0, on havaintoarvojen jakauma positiivisesti vino. Jos c 1 < 0, on havaintoarvojen jakauma negatiivisesti vino. i=1 Antti Rasila () TodB 18. lokakuuta 2007 15 / 19

Huipukkuus Olkoot m 2 = 1 n n (x i x) 2 m 4 = 1 n i=1 havaintoarvojen 2. ja 4. keskusmomentti. n (x i x) 4 Tunnuslukua c 2 = m 4 m2 2 3 käytetään kuvaamaan havaintoarvojen jakauman huipukkuutta. Normaalijakautuneella havaintoaineistolla c 2 0. Jos c 2 > 0, on havaintoarvojen jakauma huipukas (Normaalijakautuneeseen havaintoaineistoon verrattuna). Jos c 2 < 0, on havaintoarvojen jakauma laakea (Normaalijakautuneeseen havaintoaineistoon verrattuna). i=1 Antti Rasila () TodB 18. lokakuuta 2007 16 / 19

Geometrinen- ja harmoninen keskiarvo Aritmeettinen keskiarvo ei ole kaikissa tilanteissa sopiva keskiluku. Vaihtoehtoisia keskilukuja ovat geometrinen keskiarvo ja harmoninen keskiarvo. Havaintoarvojen x 1, x 2,..., x n geometrinen keskiarvo on G = n x 1, x 2,..., x n. Havaintoarvojen x 1, x 2,..., x n harmoninen keskiarvo on H = 1 1. n 1 i=1 n x i Antti Rasila () TodB 18. lokakuuta 2007 17 / 19

Esimerkki Rahasto-osuuden arvo kasvaa ensimmäisenä vuotena 5.5%, toisena 9.3%, kolmantena 1.2% ja neljäntenä 7.1%. Mikä on rahaston keskimääräinen vuotuinen tuotto? Tässä on luonnollista käyttää geometrista keskiarvoa. Saadaan 4 1.055 1.093 1.012 1.071 1.05733. Tämä luku on luonnollinen siinä mielessä, että 1.055 1.093 1.012 1.071 1.2498 1.05733 4. Antti Rasila () TodB 18. lokakuuta 2007 18 / 19

Esimerkki Matka TKK:n matematiikan laitokselta (Otakaari 1, Espoo) Tilastokeskukseen (Työpajankatu 13, Helsinki) julkisilla kulkuvälineillä vaatii: 5 km bussilla 102 (keskinopeus 55km/h) 5.45 min 4 km metrolla (keskinopeus 70km/h) 3.43 min 0.7 km kävely (keskinopeus 5km/h) 8.40 min Keskinopeus on siis 60(5 + 4 + 0.7)/17.27 33.7 km/h. Laskemalla harmoninen keskiarvo saadaan 1/((5/55 + 4/70 + 0.7/5)/9.7) 33.7 km/h. Antti Rasila () TodB 18. lokakuuta 2007 19 / 19