Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Samankaltaiset tiedostot
9. laskuharjoituskierros, vko 12-13, ratkaisut

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

10. laskuharjoituskierros, vko 14, ratkaisut

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Osa 2: Otokset, otosjakaumat ja estimointi

tilastotieteen kertaus

Tilastollinen aineisto Luottamusväli

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

,ܾ jaü on annettu niin voidaan hakea funktion

Väliestimointi (jatkoa) Heliövaara 1

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Sovellettu todennäköisyyslaskenta B

Testejä suhdeasteikollisille muuttujille

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

805306A Johdatus monimuuttujamenetelmiin, 5 op

dx=5&uilang=fi&lang=fi&lvv=2014

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Harjoitus 7: NCSS - Tilastollinen analyysi

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

riippumattomia ja noudattavat samaa jakaumaa.

Tilastollisia peruskäsitteitä ja Monte Carlo

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Mat Sovellettu todennäköisyyslasku A

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Teema 8: Parametrien estimointi ja luottamusvälit

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Testit laatueroasteikollisille muuttujille

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

1. Tilastollinen malli??

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

3.6 Su-estimaattorien asymptotiikka

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Sovellettu todennäköisyyslaskenta B

Parametrin estimointi ja bootstrap-otanta

30A02000 Tilastotieteen perusteet

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

4. laskuharjoituskierros, vko 7, ratkaisut

Maximum likelihood-estimointi Alkeet

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

D ( ) E( ) E( ) 2.917

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Otoskoko 107 kpl. a) 27 b) 2654

pitkittäisaineistoissa

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

2. Uskottavuus ja informaatio

Transkriptio:

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 017 Laskuharjoitus 4, Kotitehtävien palautus Mycourses:iin PDF-tiedostona viimeistään Lauantaina 6.8. klo 16. tai paperille kirjoitettuna Tommi Raidan (Ryhmä 3:n laskuharjoitusten pitäjä) määräämään paikkaan viimeistään perjantaina 5.8. klo 15.30. Palautetuista kotitehtävistä eli ns. K-tehtävistä annetaan bonuspisteitä kesän 017 loppukokeisiin. Loppukokeiden ajat ovat näkyvisssä Web Oodissa. Muista että harjoitustehtävien ratkaisuissa tärkeintä ei ole virheetön ratkaisu. Oman subjektiivisen näkemyksen nojalla matematiikassa tulee kullekin meistä vastaan uusia asioita, joiden ymmärtämien vaatii pidempiaikaista asiaan panetumista. Tätä tarkoittaa sitä, että asian käy monta kertaa pdemmän ajanjakoson sisällä läpi. Erityisesti tällaisen asian kohdalla on parasta ensin tutustua asian teoriaan huolella ja sitten ryhtyä ratkomaan siihen liittyviä tehtäviä. Näin ollen tärkeää on myös, että käyttää aikaa kurssin opiskeluun riittävästi. Harjoituksissa saa vihjeitä ja opastusta kotitehtäviin. Palauta K-tehtävien vastauksesi Mycoursesiin ryhmäsi kansioon, nimellä ja opintonumerolla varustettuna. Kuten huomaa alla oleva jaoittelu työmäärän suhteen on epäsuhteessa harjoitusten tuntimäärien kanssa. Alkuviikon tunneilla pyritään toki käymnään läpi mahdollisimman moni tehtävä. Kuitenkin on jopa todennäköistä, että jokin tehtävä jää käytäväksi loppuviikolla. (A-tehtävät on tarkoitus laskea ennen harjoitusta. Ne käydään läpi tunnilla ja tehdyistä tehtävistä saa lisäpisteitä.) T-tehtävät ovat ns. tuntitehtäviä, joita lasketaan laskuharjoitustilaisuudessa. T=yhdessä tunnilla laskettava tehtävä; (A= ennen harjoitusta laskettava tehtävä;) K= palautettava kotitehtävä 1

Ma 15.8. ja Ti 16.8. K1. Tarkastelemme tehtävässä seuraavaa tilastollista koetta. Yksi havainto x on poimittu diskreetistä jakaumasta, jonka pistetodennäköisyysfunktio on parametrin θ eri arvoilla f(x; θ) ja θ {1,, 3}. Alla taululukossa on tulokset kokeessa saadun tuloksen x eri vaihtoehdoilla. Ts. kullakin vaakarivillä on kokeen tulos saadulla arvolla x. Satunnaismuuttuja X noudattaa jakaumaa, jonka pistetodennäköisyysfunktio on pystyrivillä (riveillä) kolmella eri parametrin θ arvolla. Siis kyseessä on yksi parametirinen jakauma, jonka parametrin arvoa ei tunneta.parametrillä on olemassa kolme arvovaihtoehtoa θ {1,, 3}. Tehtävänä on määrätä parametrin θ suurimman uskottavuuden estimaatti kussakin viidessä tilanteessa, jonka testin tulos x on saanut. x f(x; 1) f(x; ) f(x; 3) 0 1/3 1/4 0 1 1/3 1/4 0 0 1/4 1/4 3 1/6 1/4 1/ 4 1/6 0 1/4 Siis mikä on parametrin θ suurimman uskottavuuden estimaatti? K. Olkoon f(y; θ) = θy θ 1, kun 0 y 1; ja = 0 muulloin. a) Varmista, että f on erään jatkuvan jakauman tiheysfunktio, kun θ > 0. b) Oletetaan, että satunnaismuuttujat Y 1, Y,..., Y n ovat riippumattomia ja noudattavat a)-kohdan jakaumaa. Muodosta syntyvän tilastollisen mallin yhteistiheysfunktio, ilmoita sen log-uskottavuusfunktio ja etsi parametrin suurimman uskottavuuden estimaatti, kun aineisto on y = (y 1,..., y n ). K3. Tarkastellaan toistokoemallia T Bin(n, θ). Tässä mallissa 0 θ 1 ja havaitsemme T :n arvon ja havaittu arvo on T = t. Tiedämme, että suurimman uskottavuuden estimaatti on ˆθ = t/n (ei tarvitse laskea). Tutkimme tätä vastaavaa satunnaismuuttujaa eli estimaattoria ˆθ = T/n. a) Totea, että ˆθ on harhaton eli E(ˆθ) = θ. Mitä tämä merkitsee tilastollisesti kun tilastollisen aineiston keruu toistetaan; eli meillä on suuri määrä samalla tavalla saatuja aineistoja.

b) Laske varianssi V ar(ˆθ) ja totea, että V ar(ˆθ) 0, kun toistojen lukumäärä n. Mitä tämä tulos merkitsee? T1. Halutaan selvittää tietyn kunnallisen hankkeen kannatusta satunnaisotantaan perustuvalla kyselytutkimuksella. Kuinka suuri otos kuntalaisten joukosta on poimittava, jotta saataisiin 98 prosentin varmuus siitä, että otoksesta laskettu kannattajien suhteellinen osuus ei poikkea enempää kuin 1,5 prosenttiyksikköä todellisesta kannattajien osuudesta? Oletamme, että hanketta kannattaa ainakin 70 prosenttia kuntalaisista. Siis vaaditaan, että symmetrisen luottamusvälin pituus on 3 prosenttiyksikköä. Käytä normaaliapproksimaatiota. K4. Kuntaan suunnitellaan ydin voimalan rakentamista. Kunnan asukkaiden mielipiteet halutaan selvittää yksinkertaiseen satunnaisotantaan perustuvalla kyselytutkimuksella. Kuinka suuri otos kuntalaisten joukosta on poimittava, jotta saataisiin 95 prosentin varmuus siitä, että otoksesta laskettu kannattajien suhteellinen osuus ei poikkea enempää kuin ± prosenttiyksikköä todellisesta kannattajien osuudesta? K5. Havainnot X i, i = 1,..., 0 muodostavat satunnaisotoksen jakaumasta N(µ, σ ). Havaintoarvoista on laskettu 0 i=1 x i = 90, 5784 ja 0 i=1 x i = 93, 5969 ja 0 i=1 x i = 574, 4955 sekä 0 i=1 x 3 i = 4035, 8. Määritä varianssin 98 prosentin luottamusväli. K6. Tölkitetyn tuoremehun C-vitamiinipitoisuus (mg/dl) vaihtelee jonkin verran valmistuserästä toiseen noudattaen normaalijakaumaa. Laboratorio haluaa selvittää erään tuotemerkin keskimääräisen C-vitamiinipitoisuuden mittaamalla pitoisuudet myynnissä olevien tuoremehutölkkien joukosta poimitusta yksinkertaisesta satunnaisotoksesta. Laboratorio haluaa niin tarkan arvion C-vitamiinipitoisuudesta, että voidaan 95 prosentin varmuudella tehdä johtopäätös, että otoksesta laskettu keskimääräinen C-vitamiinipitoisuus ei poikkea todellisesta keskimääräisestä C-vitamiinipitoisuudesta enempää kuin 0,5 mg. Määrää tarvittava otoskoko, kun aikaisempien tutkimusten perusteella tiedetään, että C-vitamiinipitoisuuden otoshajonta on tavallisesti n. mg. 3

K7. Olkoon X i, i = 1,,..., n riippumattomia satunnaismuuttujia, jotka noudattavat samaa geometrista jakaumaa. Tämän jakauman odotusarvo on E(X i ) = 1/p, ts. satunnaismuuttujat X i, i = 1,,..., n muodostavat yksinkertaisen satunnaisotoksen geometrisesta jakaumasta, jonka parametrina on p. Määrää parametrin p suurimman uskottavuuden estimaatti. Ke 17.8. ja To 18.8. K8. Tulet uuteen kaupunkiin. Lentokentällä näet kolme taksia, joiden numerot ovat 57, 113 ja 758. Oletamme, että kaupungissa on θ taksia, joiden numerot ovat 1,,..., θ ja kaikilla takseilla on sama todennäköisyys näkyä lentokentällä. Näin ollen olemme saaneet otoksen takseista. Esitä arvio tämän otoksen perusteella siitä montako taksia kaupungissa on suurimman uskottavuuden parametriestimointimenetelmän avulla? K9. Tehdas tekee nauloja, joiden tavoitepituus on 10 cm. Valmistettujen naulojen pituus vaihtelee kuitenkin satunnaisesti noudattaen normaalijakaumaa N(10; 0, 1). Naulat joiden pituus on välin (9, 5; 10, 5) sisällä pidetään käyttökelpoisena. Valmistettujen naulojen laatua valvotaan niin, että tasatunnein edellisen tunnin aikana valmistettujen naulojen joukosta poimitaan satunnaisesti 30 naulaa, joiden pituudet mitataan. Naulaerää pidetään hyväksyttävänä, jos mitattujen naulojen aritmeettinen keskiarvo ei eroa tilastollisesti merkitsevästi tavoitearvosta 10 cm ja pituuksien otosvarianssi ei ylitä tilastollisesti merkitsevästi tavoitearvoaan 0, 1cm. Molemmissa testeissä käytetään 5 prosentin merkitsevyystasoa. Erään kerran naulojen pituuden aritmeettiseksi keskiarvoksi saatiin 10,05 cm ja otosvarianssiksi saatiin 0, 16cm. Voidaanko naulaerää pitää hyväksyttävänä? 4

K10. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset (sademäärät mm:nä) on annettu alla olevassa taulukossa. Testaa hypoteesia, että mittarit näyttävät keskimäärin samalla tavalla. Käytä testissä 5 prosentin merkitsevyystasoa. Laite 1 3 4 5 6 7 8 9 10 A 1, 38 9, 69 0, 39 1, 4 0, 54 5, 94 0, 59, 63, 44 0, 56 B 1, 4 10, 37 0, 39 1, 46 0, 55 6, 15 0, 61, 69, 68 0, 53 T. Epäillään, että kolikko on harhainen sillä tavalla, että kruunan todennäköisyys p on suurempi kuin 1. Montako kertaa kolikkoa on vähintään heitettävä, jotta todennäköisyys nollahypoteesin p 1 hylkäämiselle merkitsevyystasolla 0,05 on vähintään 95 prosenttia? Oletetaan, että todellisuudessa p. Käytä normaaliapproksimaatiota. 3 T3. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset otoskokojen ja otostunnulukujen osalta on seuraavassa taulukossa: A K n 10 16 x 64, 94 57, 06 s 9, 0 7, 9 Oletetaan mittautulosten noudattavan kummassakin kohteessa normaalijakaumaa. a) Testaa hypoteesit H 0 : σ A = σ K, H 1 : σ A > σ K merkitsevyystasolla 0,01. b) Testaa hypoteesit H 0 : µ A = µ K, H 1 : µ A µ K merkitsevyystasolla 0,05. 5