Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten palautuskaappiin viimeistään perjantaina 2.9. klo 16.00. Palautetuista k-tehtävistä annetaan bonuspisteitä kesän 2016 välikokeisiin. Muista että harjoituksissa tärkeintä ei ole virheetön ratkaisu, vaan se että yrität ja pohdit (sekä pohdit ja yrität). Harjoituksissa saa vihjeitä ja opastusta tehtäviin. Palauta K-tehtävien vastauksesi, nimellä ja opintonumerolla varustettuna. Huomioi, että Otanimemen päärakennus suljetaan klo 16 perjantaina!! D-tehtävät on ns. demo-tehtäviä, joita harjoituksen pitäjä käy läpi harjoituksen alussa tai parhaaksi katsomanaan ajankohtana harjoituksissa. Mikäli et pääse laskuharjoitukseen ja sinulla on riittävä/välttämätön este, voit saada läsnäolopisteet seuraavalla tavalla. Esteen laatu kannattaa mainita suhteellisen täsmällisesti vastauspaperissa; mm. työeste tai toisen kurssin koe tai jokin pakollinen meno tms. on todennäköisesti riittävä syy. Palauta tällöin D-tehtävien ratkaisut nimellä ja opiskelijanumerolla varustettuna ennen ko. laskuharjotuksen alkamista laskuharjotusten palautuskaappiin. Tällöin vastaukset arvioidaan ( D-tehtävät toki kevyemmin kuin kotitehtävät) ja niistä saa maksimissaan 4 pistettä harjoitusta kohti, eli maksimissaan läsnäolopisteet. Lisäksi esteen sattuessa suosittelen kyllä (joka tapauksessa) palauttamaan kirjallisena vastaukset. Kuten huomaa tässäkin harjoituksessa alla oleva jaoittelu työmäärän suhteen on epätasainen. Tehtäviä käydään tässäharjoituksessa läpi vapaasti sopivassa tahdissa. ((T=yhdessä laskuharjoituksissa laskettava tehtävä; A= ennen harjoitusta tai harjoituksen aikana laskettava tehtävä;)) K= palautettava kotitehtävä. D= demo-tehtävät 1
Ma 22.8. ja Ti 23.8. K1. Muuttujien X ja Y havaitut arvot ovat seuraavassa taulukossa. x 1 3 4 6 8 9 11 14 y 1 2 4 4 5 7 8 9 a) Määritä regressiomallin Y i = β 0 + β 1 x i + ε i regressiokertoimien PNSestimaatit. b) Määritä estimoidun regressiomallin jäännösvarianssin estimaatti ja selitysaste sekä otoskorrelaatiokerroin. c) Testaa regressiomallin kerrointa β koskevaa nollahypoteesia H 0 : β 1 = 0. Käytä 5 prosentin merkitsevyystasoa. d) Testaa korrelaatiokerrointa ρ xy koskevaa nollahypoteesia H 0 : ρ xy = 0. Käytä 5 prosentin merkitsevyystasoa. K2. Muuttujien X ja Y havaitut arvot ovat seuraavassa taulukossa. x 1 3 4 6 8 9 11 14 y 1 2 4 4 5 7 8 9 a) Määritä regressiomallin X i = α 0 + α 1 x i + ε i regressiokertoimien PNSestimaatit ja piirrä pistediagrammiin estimoitu suora. b) Määritä estimoidun regressiomallin jäännösvarianssin estimaatti ja selitysaste sekä otoskorrelaatiokerroin. c) Testaa regressiomallin kerrointa α koskevaa nollahypoteesia H 0 : α 1 = 0. Käytä 5 prosentin merkitsevyystasoa. d) Testaa korrelaatiokerrointa ρ xy koskevaa nollahypoteesia H 0 : ρ xy = 0. Käytä 5 prosentin merkitsevyystasoa. K3. Kokeessa tutkittiin erään elektronisen komponentin elinaikaa. Koe oli ns. kiihdytetty elinaikakoe, jossa komponentit saadaan vanhenemaan normaalitilannetta nopeammin nostamalla lämpötilaa, jossa komponentin annetaan toimia. Kokeessa valittiin satunnaisesti viisi komponenttia, joita käytettiin viidessä erilaisessa lämpötilassa (muuttuja x) kunnes ne lopettivat toimintansa. Komponenttien elinajat (muuttuja y) otettiin ylös. Lämpötilat mitattiin Fahrenheit-asteina (F) ja elinajat tunteina (h). 2
Alla olevassa taulukossa on annnettu muuttujien x ja y havaitut arvot. i 1 2 3 4 5 x i 500 600 700 800 900 y i 804 791 658 599 562 a) Piirrä havaitoarvojen pareista (x i, y i ), i = 1, 2, 3, 4, 5 pistediagrammi. b) Arvioi pistediagrammin perusteella muuttujien x ja y havaittujen arvojen korrelaatiokertoimen merkki ja suuruusluokka. c) Laske muuttujien x ja y havaittujen arvojen aritmeettiset keskiarvot, otoskeskihajonnat sekä otoskorrelaatio. K4. Kokeessa tutkittiin kuparilankojen vetolujuuden ( muuttuja y) riippuvuutta Brinell-kovuudesta (muuttuja x). Kokeessa käytettiin kymmentä kuparilangan pätkää. Langanpätkiä koskevat tiedot on annettu alla olevassa taulukossa. i 1 2 3 4 5 6 7 8 9 10 x i 35, 0 37, 2 39, 8 35, 8 41, 3 40, 7 38, 7 40, 2 38, 1 41, 6 y i 106, 2 106, 3 105, 3 106, 1 105, 4 106, 3 104, 7 105, 4 105, 5 105, 1 Testaa tilastollisesti nollahypoteesia, jonka mukaan Brinell-kovuuden ja vetolujuuden välinen korrelaatio =0, kun vaihtoehtoisena hypoteesina on, että korrelaatio ei ole nolla. D1. (Demo!) Kokeessa tutkittiin seitsemän kuorma-auton polttoainetaloudellisuuden (muttuja y, Mileage, yksikkönä mi/gal, mailia per gallona) riippuvuutta ajoneuvon painosta ( muuttuja x, Weight, yksikkönä ton). Kokeesta saadut tiedot on annettu alla olevassa taulukossa. i 1 2 3 4 5 6 7 x i 8, 00 24, 50 27, 00 14, 50 28, 50 12, 75 21, 25 y i 7, 69 4, 97 4, 56 6, 49 4, 34 6, 24 4, 45 a) Määrää yhden selittäjän lineaarisen regressiomallin missä y i = β 0 + β 1 x i + ε i ; ε i N(0, σ 2 ), i = 1, 2,..., n 3
y=ajoneuvon polttoainetaloudellisuus x= ajoneuvon paino regressiokertoimien pienimmän neliösumman (PNS-) estimaatit. b) Määrää estimoidun mallin sovite ja residuaali, kun i = 6. c) Määrää estimoidun mallin selitysaste. d) Määrää harhaton estimaatti jäännösvarianssille σ 2. e) Piirrä tehtävässä estimoitu regressiosuora havaintoja (x i, y i ), i = 1, 2,..., n esittävään pistediagrammiin. Piirrä kuvioon myös residuaaleja kuvaavat janat. K5. Laajakaistaliittymän yleisyydestä on olemassa seuraavat tiedot: Aika (kuukauden lopussa) 12/04 12/05 12/06 2/08 Prosenttiosuus kotitalouksista 16 23 27 66 Jos 100 p i on prosenttiosuus hetkellä x i, missä esimerkiksi x:n yksikkönä on kuukausi ja 0 on joulukuun lopussa 2005, ja y i = ln( p i 1 p i ), niin määritä tavanomaisen lineaarisen regressiomallin Y i = β 0 + β 1 x i + ε i ; ε i N(0, σ 2 ), i = 1, 2,..., n kertomien β 0 ja β 1 estimaatit pienimmän neliösumman menetelmällä. Määritä lisäksi 95 prosentin luottamusväli odotusarvolle β 0 + β 1 36 ja tämän avulla 95 prosentin luottamusväli liittymien yleisyydelle (liittymien yleisyyden odotusarvolle) joulukuun lopussa 2008. Ke 24.8. ja To 25.8. K6. Firefox-verkkoselaimen markkinaosuudesta Euroopassa on olemassa seuraavat tiedot: 4
Aika (kuukauden lopussa) 3/07 4/08 8/08 9/08 Prosenttiosuus käyttäjistä 25 29 33 31 Määritä tavanomaisen lineaarisen regressiomallin Y i = β 0 + β 1 x i + ε i ; ε i N(0, σ 2 ), i = 1, 2,..., n kertomien β 0 ja β 1 estimaatit pienimmän neliösumman menetelmällä. Tässä mallissa Y i on prosenttiosuus hetkellä x i. Aika lasketaan kuukausissa siten että 0 on joulukuun lopussa 2007. Määritä lisäksi 95 prosentin luottamusväli markkinaosuudelle (markkinaosuuden odotusarvolle) marraskuun lopussa 2009. D2. (Demo!) Tämä tehtävä on jatkoa tehtävälle D1. a) Testaa tehtävässä määritetyn regressiosuoran kerrointa β 1 koskevaa nollahypoteesia H 01 : β 1 = 0 Käytä testissä kaksisuuntaista vaihtoehtoista hypoteesia ja 5 prosentin merkitsevyystasoa. b) Muodosta kertoimelle β 1 95 prosentin luottamusväli. D3. (Demo!) Tämä tehtävä on jatkoa tehtävälle D2. a) Ennusta muuttujan y keskimääräinen arvo, kun x = 19, 5 ja x = 40. Määrää myös 95 prosentin luottamusvälit kummallekin ennusteelle. b) Ennusta muuttujan y arvo, kun x = 19, 5 ja x = 40. Määrää myös 95 prosentin luottamusvälit kummallekin ennusteelle. 5