Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Samankaltaiset tiedostot
Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Kuusinen/Heliövaara 1

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Johdatus regressioanalyysiin. Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Tilastollisen analyysin perusteet, kevät 2007

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Harjoitus 9: Excel - Tilastollinen analyysi

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Sovellettu todennäköisyyslaskenta B

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

Korrelaatiokertoinen määrittely 165

2. Teoriaharjoitukset

Sovellettu todennäköisyyslaskenta B

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Dynaamiset regressiomallit

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Johdatus regressioanalyysiin

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Opiskelija viipymisaika pistemäärä

Yleinen lineaarinen malli

2. Tietokoneharjoitukset

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

805324A (805679S) Aikasarja-analyysi Harjoitus 6 (2016)

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari

Väliestimointi (jatkoa) Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

1. Tutkitaan tavallista kahden selittäjän regressiomallia

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyden ominaisuuksia

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Kertaus. MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä

Yhden selittäjän lineaarinen regressiomalli

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Aalto-yliopiston perustieteiden korkeakoulu Matematiikan ja systeemianalyysin laitos

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

HAVAITUT JA ODOTETUT FREKVENSSIT

1. Tilastollinen malli??

Aalto-yliopiston perustieteiden korkeakoulu Matematiikan ja systeemianalyysin laitos

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

031021P Tilastomatematiikka (5 op) viikko 6

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Regressiomallin valinta. TKK (c) Ilkka Mellin (2004) 1

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Mat Tilastollisen analyysin perusteet, kevät 2007

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) viikko 6

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Regressiomallin valinta. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Osa 2: Otokset, otosjakaumat ja estimointi

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Harha mallin arvioinnissa

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Harjoitukset 4 : Paneelidata (Palautus )

4. Tietokoneharjoitukset

tilastotieteen kertaus

Tilastollinen päättely II (MAT22003), kevät 2018

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

4. Tietokoneharjoitukset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

Mat Sovellettu todennäköisyyslasku A

Testejä suhdeasteikollisille muuttujille

Transkriptio:

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten palautuskaappiin viimeistään perjantaina 2.9. klo 16.00. Palautetuista k-tehtävistä annetaan bonuspisteitä kesän 2016 välikokeisiin. Muista että harjoituksissa tärkeintä ei ole virheetön ratkaisu, vaan se että yrität ja pohdit (sekä pohdit ja yrität). Harjoituksissa saa vihjeitä ja opastusta tehtäviin. Palauta K-tehtävien vastauksesi, nimellä ja opintonumerolla varustettuna. Huomioi, että Otanimemen päärakennus suljetaan klo 16 perjantaina!! D-tehtävät on ns. demo-tehtäviä, joita harjoituksen pitäjä käy läpi harjoituksen alussa tai parhaaksi katsomanaan ajankohtana harjoituksissa. Mikäli et pääse laskuharjoitukseen ja sinulla on riittävä/välttämätön este, voit saada läsnäolopisteet seuraavalla tavalla. Esteen laatu kannattaa mainita suhteellisen täsmällisesti vastauspaperissa; mm. työeste tai toisen kurssin koe tai jokin pakollinen meno tms. on todennäköisesti riittävä syy. Palauta tällöin D-tehtävien ratkaisut nimellä ja opiskelijanumerolla varustettuna ennen ko. laskuharjotuksen alkamista laskuharjotusten palautuskaappiin. Tällöin vastaukset arvioidaan ( D-tehtävät toki kevyemmin kuin kotitehtävät) ja niistä saa maksimissaan 4 pistettä harjoitusta kohti, eli maksimissaan läsnäolopisteet. Lisäksi esteen sattuessa suosittelen kyllä (joka tapauksessa) palauttamaan kirjallisena vastaukset. Kuten huomaa tässäkin harjoituksessa alla oleva jaoittelu työmäärän suhteen on epätasainen. Tehtäviä käydään tässäharjoituksessa läpi vapaasti sopivassa tahdissa. ((T=yhdessä laskuharjoituksissa laskettava tehtävä; A= ennen harjoitusta tai harjoituksen aikana laskettava tehtävä;)) K= palautettava kotitehtävä. D= demo-tehtävät 1

Ma 22.8. ja Ti 23.8. K1. Muuttujien X ja Y havaitut arvot ovat seuraavassa taulukossa. x 1 3 4 6 8 9 11 14 y 1 2 4 4 5 7 8 9 a) Määritä regressiomallin Y i = β 0 + β 1 x i + ε i regressiokertoimien PNSestimaatit. b) Määritä estimoidun regressiomallin jäännösvarianssin estimaatti ja selitysaste sekä otoskorrelaatiokerroin. c) Testaa regressiomallin kerrointa β koskevaa nollahypoteesia H 0 : β 1 = 0. Käytä 5 prosentin merkitsevyystasoa. d) Testaa korrelaatiokerrointa ρ xy koskevaa nollahypoteesia H 0 : ρ xy = 0. Käytä 5 prosentin merkitsevyystasoa. K2. Muuttujien X ja Y havaitut arvot ovat seuraavassa taulukossa. x 1 3 4 6 8 9 11 14 y 1 2 4 4 5 7 8 9 a) Määritä regressiomallin X i = α 0 + α 1 x i + ε i regressiokertoimien PNSestimaatit ja piirrä pistediagrammiin estimoitu suora. b) Määritä estimoidun regressiomallin jäännösvarianssin estimaatti ja selitysaste sekä otoskorrelaatiokerroin. c) Testaa regressiomallin kerrointa α koskevaa nollahypoteesia H 0 : α 1 = 0. Käytä 5 prosentin merkitsevyystasoa. d) Testaa korrelaatiokerrointa ρ xy koskevaa nollahypoteesia H 0 : ρ xy = 0. Käytä 5 prosentin merkitsevyystasoa. K3. Kokeessa tutkittiin erään elektronisen komponentin elinaikaa. Koe oli ns. kiihdytetty elinaikakoe, jossa komponentit saadaan vanhenemaan normaalitilannetta nopeammin nostamalla lämpötilaa, jossa komponentin annetaan toimia. Kokeessa valittiin satunnaisesti viisi komponenttia, joita käytettiin viidessä erilaisessa lämpötilassa (muuttuja x) kunnes ne lopettivat toimintansa. Komponenttien elinajat (muuttuja y) otettiin ylös. Lämpötilat mitattiin Fahrenheit-asteina (F) ja elinajat tunteina (h). 2

Alla olevassa taulukossa on annnettu muuttujien x ja y havaitut arvot. i 1 2 3 4 5 x i 500 600 700 800 900 y i 804 791 658 599 562 a) Piirrä havaitoarvojen pareista (x i, y i ), i = 1, 2, 3, 4, 5 pistediagrammi. b) Arvioi pistediagrammin perusteella muuttujien x ja y havaittujen arvojen korrelaatiokertoimen merkki ja suuruusluokka. c) Laske muuttujien x ja y havaittujen arvojen aritmeettiset keskiarvot, otoskeskihajonnat sekä otoskorrelaatio. K4. Kokeessa tutkittiin kuparilankojen vetolujuuden ( muuttuja y) riippuvuutta Brinell-kovuudesta (muuttuja x). Kokeessa käytettiin kymmentä kuparilangan pätkää. Langanpätkiä koskevat tiedot on annettu alla olevassa taulukossa. i 1 2 3 4 5 6 7 8 9 10 x i 35, 0 37, 2 39, 8 35, 8 41, 3 40, 7 38, 7 40, 2 38, 1 41, 6 y i 106, 2 106, 3 105, 3 106, 1 105, 4 106, 3 104, 7 105, 4 105, 5 105, 1 Testaa tilastollisesti nollahypoteesia, jonka mukaan Brinell-kovuuden ja vetolujuuden välinen korrelaatio =0, kun vaihtoehtoisena hypoteesina on, että korrelaatio ei ole nolla. D1. (Demo!) Kokeessa tutkittiin seitsemän kuorma-auton polttoainetaloudellisuuden (muttuja y, Mileage, yksikkönä mi/gal, mailia per gallona) riippuvuutta ajoneuvon painosta ( muuttuja x, Weight, yksikkönä ton). Kokeesta saadut tiedot on annettu alla olevassa taulukossa. i 1 2 3 4 5 6 7 x i 8, 00 24, 50 27, 00 14, 50 28, 50 12, 75 21, 25 y i 7, 69 4, 97 4, 56 6, 49 4, 34 6, 24 4, 45 a) Määrää yhden selittäjän lineaarisen regressiomallin missä y i = β 0 + β 1 x i + ε i ; ε i N(0, σ 2 ), i = 1, 2,..., n 3

y=ajoneuvon polttoainetaloudellisuus x= ajoneuvon paino regressiokertoimien pienimmän neliösumman (PNS-) estimaatit. b) Määrää estimoidun mallin sovite ja residuaali, kun i = 6. c) Määrää estimoidun mallin selitysaste. d) Määrää harhaton estimaatti jäännösvarianssille σ 2. e) Piirrä tehtävässä estimoitu regressiosuora havaintoja (x i, y i ), i = 1, 2,..., n esittävään pistediagrammiin. Piirrä kuvioon myös residuaaleja kuvaavat janat. K5. Laajakaistaliittymän yleisyydestä on olemassa seuraavat tiedot: Aika (kuukauden lopussa) 12/04 12/05 12/06 2/08 Prosenttiosuus kotitalouksista 16 23 27 66 Jos 100 p i on prosenttiosuus hetkellä x i, missä esimerkiksi x:n yksikkönä on kuukausi ja 0 on joulukuun lopussa 2005, ja y i = ln( p i 1 p i ), niin määritä tavanomaisen lineaarisen regressiomallin Y i = β 0 + β 1 x i + ε i ; ε i N(0, σ 2 ), i = 1, 2,..., n kertomien β 0 ja β 1 estimaatit pienimmän neliösumman menetelmällä. Määritä lisäksi 95 prosentin luottamusväli odotusarvolle β 0 + β 1 36 ja tämän avulla 95 prosentin luottamusväli liittymien yleisyydelle (liittymien yleisyyden odotusarvolle) joulukuun lopussa 2008. Ke 24.8. ja To 25.8. K6. Firefox-verkkoselaimen markkinaosuudesta Euroopassa on olemassa seuraavat tiedot: 4

Aika (kuukauden lopussa) 3/07 4/08 8/08 9/08 Prosenttiosuus käyttäjistä 25 29 33 31 Määritä tavanomaisen lineaarisen regressiomallin Y i = β 0 + β 1 x i + ε i ; ε i N(0, σ 2 ), i = 1, 2,..., n kertomien β 0 ja β 1 estimaatit pienimmän neliösumman menetelmällä. Tässä mallissa Y i on prosenttiosuus hetkellä x i. Aika lasketaan kuukausissa siten että 0 on joulukuun lopussa 2007. Määritä lisäksi 95 prosentin luottamusväli markkinaosuudelle (markkinaosuuden odotusarvolle) marraskuun lopussa 2009. D2. (Demo!) Tämä tehtävä on jatkoa tehtävälle D1. a) Testaa tehtävässä määritetyn regressiosuoran kerrointa β 1 koskevaa nollahypoteesia H 01 : β 1 = 0 Käytä testissä kaksisuuntaista vaihtoehtoista hypoteesia ja 5 prosentin merkitsevyystasoa. b) Muodosta kertoimelle β 1 95 prosentin luottamusväli. D3. (Demo!) Tämä tehtävä on jatkoa tehtävälle D2. a) Ennusta muuttujan y keskimääräinen arvo, kun x = 19, 5 ja x = 40. Määrää myös 95 prosentin luottamusvälit kummallekin ennusteelle. b) Ennusta muuttujan y arvo, kun x = 19, 5 ja x = 40. Määrää myös 95 prosentin luottamusvälit kummallekin ennusteelle. 5