Mat Tilastollisen analyysin perusteet

Samankaltaiset tiedostot
A B DIFFERENCE

analyysin perusteet Mat Ti lastol I isen Tentti /Mellin

MS-C2{04 Tilastollisen analyysin perusteet

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

voidaan hylätä, pienempi vai suurempi kuin 1 %?

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Perusnäkymä yksisuuntaiseen ANOVAaan

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:


Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

A250A0050 Ekonometrian perusteet Tentti

Menestyminen valintakokeissa ja todennäköisyyslaskussa

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Mat Tilastollisen analyysin perusteet, kevät 2007

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

2. Tietokoneharjoitukset

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Regressioanalyysi. Vilkkumaa / Kuusinen 1

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

MTTTP5, luento Luottamusväli, määritelmä

Regressioanalyysi. Kuusinen/Heliövaara 1

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

SELVITTÄJÄN KOMPETENSSISTA

Harjoitus 7: NCSS - Tilastollinen analyysi

Frequencies. Frequency Table

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Partiotoiminnan laatuun vaikuttavat tekijät vuosiselostedatan perusteella Uudenmaan Partiopiirissä

TKMS7a-f/LRS20a-f/MAS2/KVS2/TMS82a-f/JOM/TJM/YRM Monimuuttujamenetelmien soveltaminen taloustieteissä. Tentti

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Testejä suhdeasteikollisille muuttujille

Altistusaika 1 kk 2 kk 3 kk

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Toimittaja Erä

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Harjoitus 9: Excel - Tilastollinen analyysi

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i p X ip + u i

E80. Data Uncertainty, Data Fitting, Error Propagation. Jan. 23, 2014 Jon Roberts. Experimental Engineering

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

Tilastotieteen jatkokurssi syksy 2003 Välikoe

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Väliestimointi (jatkoa) Heliövaara 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

SPSS-perusteet. Sisältö

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Teema 9: Tilastollinen merkitsevyystestaus

Johdatus regressioanalyysiin. Heliövaara 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Otoskoon arviointi. Tero Vahlberg

1. PARAMETRIEN ESTIMOINTI

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Mat Tilastollisen analyysin perusteet, kevät 2007

11. laskuharjoituskierros, vko 15, ratkaisut

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

χ 2 -yhteensopivuustestissä käytetään χ 2 -testisuuretta χ = Mat Sovellettu todennäköisyyslasku A

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Mat Sovellettu todennäköisyyslasku A

MS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4

Kvantitatiiviset menetelmät

Kaksisuuntainen varianssianalyysi. Heliövaara 1

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Mat Tilastollisen analyysin perusteet, kevät 2007

10. laskuharjoituskierros, vko 14, ratkaisut

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Geenikartoitusmenetelmät. Kytkentäanalyysin teoriaa. Suurimman uskottavuuden menetelmä ML (maximum likelihood) Uskottavuusfunktio: koko aineisto

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

2. Keskiarvojen vartailua

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Transkriptio:

/ Mat-2.21 04 Tilastollisen analyysin perusteet Tentti 24.5.2013/Virtanen Kirjoita selvasti jokaiseen koepaperiin alia mainitussa jarjestyksessa: Mat-2.2104 Tap 24.5.2013 opiskelijanumero kirjain TEKSTATEN sukunimi ja kaikki etunimet koulutusohjelma ja vuosikurssi mahdolliset entiset nimet ja koulutusohjelmat nimikirjoitus OHJEJTA (i) TehtavHi on 5 kpl. (ii) Yhden tehtavista saa korvata kevaan 2013 harjoitustyolla. Korvattava tehtava on ilmaistava vastauspaperissa selvasti kokonaislukuna. (iii) Vastaa lyhyesti ja ytimekkaasti, mutta esita niin paljon perusteluita, etta vastauksestasi saa selville mita ja miksi olet tehnyt. (iv) Tentissa saa kayttaa laskinta ja Lainisen tai Mellinin kaava- ja taulukkokokoelmaa. 1112

1. Kokeessa verrattiin kahden tulostimen, A ja B, tulostusnopeuksia tulostamalla molenunalla samat 14 tehtavaa. Tulokset kokeesta (kunkin tehtavan tulostusaika tunteina) on annettu alia. Tulostin I Tulostin Tehtava A B Tehtava A B 1 73 68 \ 8 84 \ 88 2 56' 73 9 73 \ 85 3 95 89 \ 10 92 \ 96 4 64 '\ 73 11 99 91'\ 5 68 66 ' 12 68 86 6 94 87 \ 13 44'\. 59 7 55 ' 75 14 53 '\. 67 Ongelmanasi on testata 5 %:n merkitsevyystasoa kayttaen nollahypoteesia Ho, jonka mukaan tulostimien Aja B tulostusnopeudet ovat yhta suuria, kun vaihtoehtoisena hypoteesina on, etta tulostusnopeudet eivat ole yhta suuria. Alia on annettu ylla esitettyyn ongehnaan liittyen kaksi Statistix-ohjelman tulostusta. Tulostus 1.1: TWO-SAMPLE T TESTS FOR A VS B SAMPLE VARIABLE MEAN SIZE S.D. S.E. --------- --------- - ----- --------- - -------- A 72.714 14 B 78.786 14 DIFFERENCE -6.0714 NULL HYPOTHESIS: DIFFERENCE 0 ALTERNATIVE HYP: DIFFERENCE <> 0 ASSUMPTION T OF p 17.687 4. 7271 11.383 3.0422 95% CI FOR DIFFERENCE ----------------- ----- ---- - --------------------- EQUAL VARIANCES -1.08 26 0.290 (-17. 626, 5.4835) UNEQUAL VARIANCES -1.08 22. 2 0. 2 92 (-17.724, 5.5808) F NUM OF DEN OF p TESTS FOR EQUALITY - --- - --- --- - ----- - ----- OF VARIANCES 2.41 13 13 0. 0 62 4 CASES INCLUDED 28 MISSING CASES 0 2/12

Tulostus 1.2: PAIRED T TEST FOR A - B NULL HYPOTHESIS: DIFFERENCE 0 ALTERNATIVE HYP: DIFFERENCE <> 0 MEAN STD ERROR LO 95% CI UP 95% CI T OF p -6.0714 2. 72 65-11.962-0.1812-2.23 13 0.0543 CASES INCLUDED 14 Tehtavat: (a) (b) (c) MISSING CASES 0 Tulostuksessa 1.1 on sovellettu t-testiii Uosta on kaksi versiota) ja F-testiii. Esittele testit: Kerro mitii on testattu ja mitkii o livat testien tulokset. Tulostuksessa 1.2 on sovellettu t-testiii. Esittele testi: Kerro mita on testattu ja mika oli testi tulos. Vain toinen tulostuksissa 1 ja 2 sovelletuista t-testeista sopii tehtavan tilanteeseen. Kumpi? Perustele valintasi. (d) Tarkastellaan tulostuksessa 1.2 sovellettua t-testiaja oletaan, etta vaihtoehtoinen hypoteesi on "tulostimen A tulostusnopeus on suurempi kuin tulostimen B tulostusnopeus". Mika on testin tulos nyt? Kaytettavii riskitaso on edelleen 5%. (e) Tarkastellaan tulostuksessa 1.2 sovellettua t-testia ja o letaan, etta vaihtoehtoinen hypoteesi on "tulostimen B tulostusnopeus on suurempi kuin tulostimen A tulostusnopeus". Mika on testin tulos nyt? Kaytettava riskitaso on edelleen 5%. (f) Jos tehtavana olisi ollut tulostusnopeuksien mediaanien vertaaminen, niin mita testia olisit kayttanyt? 3/12

2. Helsingin kaupungin puhtaanapitolaitoksen puhdistaja halusi poistaa lokit kauppatorilta. Puhdistajalla oli kaytossaan neljaa erilaista myrkkya lokkien likvidointiin. Myrkkyjen toimivuuden testaamiseksi puhdistaja nappasi torilta kiinni 20 lokkia. Taman jalkeen puhdistaja jakoi lokit vii den hengen ryhmiin ja juotti kullekin.ryhmalle yhta myrkkylaatua. Yhteenveto koetuloksista (lokin elinika millisekunneisssa myrkyn nauttirnisenjalkeen) on annettu alia olevassa taulukossa. MYRl MYR2 MYR3 MYR4 70.6 70.3 67.7 62.4 68.4 67.6 68.9 63 71.8 68.4 63.8 64.3 71.4 69.4 64.9 65.1 67 70.0 66.3 65.0 Koetulosten perusteella haluttiin siis selvittaa onko myrkkylaadulla vaikutusta lokkien elinikaan. Statistix-tulostukset tehdysta tilastollisesta analyysista on annettu seuraavalla sivulla. Huomautus: Eras viisaampi lokki halusi estaa vastaamisesi ja korvasi osan tulostuksen 2.1 luvuista kysymysmerkeilla. Lokki ei kuitenkaan tiennyt, etta osaat kylla maarata puuttuvat luvut. Puuttuvat luvut ovat ryhmien sisaista vaihtelua kuvaava neliosumma, kaikkien neliosummien vapausasteet, keskineliovirheet (MS) seka F-testisuureen arvo. 4112

Tulostus 2.1: ONE-WAY AOV FOR: MYR1 MYR2 MYR3 MYR4 SOURCE OF ss MS F p ------- --------- ------- ----- ------ BETWEEN?? 94.7299???????????? 0.0017 WITHIN???????????????? TOTAL?? 134.589 CHI-SQ OF p BARTLETT'S TEST OF ------ ------ ------ EQUAL VARIANCES 2.18 3 0.5349 COCHRAN'S Q LARGEST VAR / SMALLEST VAR 0.4993 5.1429 COMPONENT OF VARIANCE FOR BETWEEN GROUPS 7.13811 EFFECTIVE CELL SIZE 4.0 SAMPLE GROUP VARIABLE MEAN SIZE STD DEV --------- ---------- ------ ---------- MYR1 69.840 5 2. 0611 MYR2 68.925 5 1. 1758 MYR3 66.800 5 2.6665 MYR4 63.700 5 1.2247 TOTAL 67.506 20 1.8225 CASES INCLUDED 20 MISSING CASES 0 Tulostus 2.2: BON FERRON I COMPARISON OF MEANS HOMOGENEOUS VARIABLE MEAN GROUPS --------- ---------- ----------- MYR1 69.840 I MYR2 68.925 I MYR3 66.800 I I MYR4 63.700 I THERE ARE 2 GROUPS IN WHICH THE MEANS ARE NOT SIGNIFICANTLY DIFFERENT FROM ONE ANOTHER. CRITICAL T VALUE 3.153 REJECTION LEVEL 0.050 STANDARD ERRORS AND CRITICAL VALUES OF DIFFERENCES VARY BETWEEN COMPARISONS BECAUSE OF UNEQUAL SAMPLE SIZES. 5/12

Tehtavat: (a) (b) (c) (d) Mita tilastollista menetelmaa on kaytetty? Mista menete~nan nimi johtuu ja miksi nimi on hassu? Mika on menetelmalla testattu no llahypoteesi? Mika on vaihtoehtoinen hypoteesi? Mika on tulostuksessa 2.1 mainitun Bartlettin testin rooli menetemiin soveltamisessa. Laske tulostuksen 2.1 puuttuvat luvut. (e) Tee johtopaat6kset tulostuksesta 2.1. (f) Tee johtopaat6kset tulostuksesta 2.2. 3. Erasta tappavaa tautia vastaan on kehitetty rokote. Rokotuksen tehon selvittamiseksi jarjestettiin seuraava rokotuskoe. Kokeen kohteiksi valitut henkilot jaettiin satunnaisesti kahteen ryhmaan: Ryhma 1 (CASE = 1 ): Rokotetut Ryhma 2 (CASE= 2): Ei-rokotetut Kokeessa rekisteroitiin rokotusta seuranneen vuoden aikana sairastuneiden ja eisairastuneiden lukumaarat. Kokeen tulokset on annettu alia olevassa 2x2-frekvenssitaulukossa. VARIABLE CASE SAIRASTUI TERVE ---------------------- 1 I 8 I 42 I ---------------------- 2 I 20 I 30 I ---------------------- Kokeen tekijat halusivat tutkia tilastollisesti ovatko rokotus ja sairastuminen riippumattomia tekijoita. Tulokset tehdysta tilastollisesta analyysista on annettu tehtavan alia. Huomautus: 6/12

Painovirhepaholainen halusi esti:hi vastaamisesi ja korvasi osan tulostuksen luvuista kysymysmerkeiwi.. Paholainen ei kuitenkaan tiennyt, etta puuttuvat luvut voidaan Jaskeajaljelle jaaneista Juvuista. Puuttuvat luvut ovat havaintojen kokonaislukumaara, solun (CASE = 1, TERVE) odotettufrekvenssi, solun (CASE = 2, TERVE) ;r!-arvo, koko frekvenssitaulua vastaava x! -testisuureen arvo ja vapausasteiden lukumaara. TehHivat: (a) (b) (c) (d) Mita testia sovellettiin? Kuvaa testia ja sen kayttoa lyhyesti. Laske puuttuvat luvut. Tee johtopaatokset tilastollisen analyysin tuloksista. Olisitko halukas suosittelisitko rokotusta analyysituloksen perusteella? Pohdi asiaa siina valossa, etta ko. tauti on vakava. Eras toinen testi tehdaan teknisesti samaan tapaan kuin tehtavassa sovellettu testi. Mika taman toisen testin nimi on ja mita tassa toisessa testissa testataan? Statistix 8.1 12 :40: 54 PM 5/4/2013, Chi-Square Test for Heterogeneity or Independence Variable Case sairastui terve ---------------------- 1 Observed I 8 I 42 I 50 Expected I 14. 00 I????? I Cell Ch i - Sq I 2. 57 I 1.00 I ---------------------- 2 Obser ved I 20 I 30 I 50 Expect e d I 14.00 I 36.00 I Cell Chi-Sq I 2. 57 I???? I -------------------- - - 28 72??? Overall Chi-Square???? P- Value 0. 0075 De grees o f Freedom? Cases Included 4 Mi ssing Cases 0 7/12

4. STATISTIX-tiedostossa CITYDAT on seuraavat muuttujat: HSEVAL SIZEHSE Omakotitalojen hintojen keskiarvo Talojen mediaanikoko TAXRATE Kiinteist6verosuhde TOTEXP Kunnallispalveluihin kiiytetty rahamiiiirii COMPER Vuokratalojen osuus Aineisto koostuu 90 USA:n kuntaa koskevista tiedoista. Havainnoista on estimoitu lineaarinen regressiomalli ( 4.1) HSEV AL = f3o {3 1 SIZEHSE /32 TAXRA TE /3J TOTEXP /34 COMPER & Mallin tavoitteena on selvittiiii erilaisten taustatekijoiden vaikutus omakotitalojen keskimiiiiriiiseen hintaan. Estimointitulokset mallista ( 4.1) on annettu alia: STATISTIX FOR WINDOWS CITYDAT UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF HSEVAL PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT'S T p VIF --------- ----------- --------- ----------- ------ CONSTANT -23.4328 8.98561-2.61 0.0108 SIZEHSE 9.21014 1.56419 5.89 0.0000 1.1 TAXRATE -177.534 39.8668-4.45 0.0000 1.0 TOTEXP 1.423E-06 2.963E-07 4.80 0.0000 1.1 COM PER -20.3704 6.19937-3.29 0.0015 1.2 R-SQUARED 0.5505 RES I D. MEAN SQUARE (MSE) 11.5623 ADJUSTED R-SQUARED 0.5294 STANDARD DEVIATION 3.40033 SOURCE OF ss MS F p ---------- ---------- ---------- ------ REGRESSION 4 1203.84 300. 960 26.03 0.0000 RESIDUAL 85 982.792 11.5623 TOTAL 89 2186.63 CASES INCLUDED 90 MISSING CASES 0 8/12

Kuva alia esittaa estimoidun mallin (4.1) standardoituja residuaaleja: Regression Residual Plot 4.!!1 2 <ll ::l "0 u; & "0 _gj 0 "0 Cii "0 c: <ll U5-2 -h. ~ -~ *.at \~ 1f..:r-.:t= * ft- * ft- 13 16 19 22 25 Fitted values 28 31 Residuaaleil1in on sovitettu apuregressio (4.2) e~ =a 0 a 1 y 1 8 1 jossa e. = estimoidun mallin residuaali.i y 1 = estimoidun mallin sovite Estimointitulokset apuregressiosta ( 4.2) on annettu seuraavalla sivulla. 9/12

STATISTIX FOR WI NDOWS CITYDAT UNWEIGHTED LEAST SQUARES LINEAR REGRESSION OF RESSQR PREDICTOR VARIABLES COEFFICIENT STD ERROR STUDENT ' S T p CONSTANT FIT -15.0943 1. 23697 11.9630 0. 56043-1.26 2. 21 0. 21 0 4 0. 0299 R-SQUARED 0. 0525 ADJUS TED R-SQUARED 0. 0417 RESID. MEAN SQUARE STANDARD DEVIATION (MSE) 378. 099 19. 44 48 SOURCE DF ss MS ---------- ---------- ---------- REGRESSION 1 1841.99 1841. 99 RESIDUAL 88 33272. 7 378. 099 TOTAL 89 35114. 7 CASES INCLUDE D 90 MISSING CASES 0 F 4.87 p ------ 0. 0299 Apuregression ( 4.2) selitysasteesta R 2 laskettiin testisuure (4.3) nr 2 = 90x0.0525 = 4.725 jossa on n on havaintojen lukumaarii. Erddn nollahypoteesin pdtiessd nr2~x 2 (l). Testisuureen (4.3) arvoa 4.725 vastaava p-arvo on 0.02973. Tehtavat: (a) Ovatko kaikki mall in ( 4.1) regressiokertoimet merkitseviii 1 %:n merkitsevyystaso lla? (b) Mikii on estimoidun mallin (4.1) selitysaste? MitiijohtopiiiitOksiii voit tehdii tulostuksen F-testistii?. (c) Mikii on suureiden R-SQUARED ja ADJUSTED R- SQUARED ero? (d) Onko multikollineaarisuus ollut estimoinnissa ongelma? (e) Miksi alkuperiiisen regressiomallin ( 4.1) residuaaleihin on sovitettu apuregressio ( 4.2)? (f) Mitii nollahypoteesia testisuureella ( 4.3) on testattu? Mikii on testin tulos? 10112

5. Tutkimuksessa ha1uttiin se1vittaa tietokoneen prosessorin nopeuden ja RAM- muistin koon vaikutus 1askenta-aikaan monimutkaisissa matemaattisissa 1askutoimituksissa. Kokeeseen va1ittiin kaksi prosessoria ( 144 MHz ja 400 MHz) ja kaksi muistikokoa (128MB ja 256 MB). Sarna matemaattinen ohjelma ajettiin jokaisella nopeusmuistikoko-kombinaatiolla kolme kertaa niin, ettajokaisesta kombinaatiosta saatiin 3 havaintoa. Tu1okset kokeesta (suoritusajat; 111000 s) on annettu alia olevassa tu1ostuksessa. S uoritusaika Prosessorin nopeus (Ill 000 s) 144 MHz 400 MHz 30 16 128MB 26 9 RAM 16 11 22 6 256MB 12 10 14 8 Koetu1osten perusteella ha1uttiin selvittaa millaisia vaikutuksia prosessorin nopeudellaja RAM-muistin koolla on ko. tehtavan suoritusaikaan. Statistix-tu1ostus tehdysta tilastollisesta ana1yysista on annettu alia. Huomautus: Painovirhepaholainen halusi estaa vastaamisesi ja korvasi osan tu1ostuksen luvuista kysymysmerkeilla. Paho1ainen ei kuitenkaan tiennyt, etta osaat kylla maarata puuttuvat 1uvut. Puuttuvat luvut ovat jaannosneliosumma, kaikkien neliosummien vapausasteet, keskineliovirheet (MS) seka F-testisuureiden arvot. Tulostus 5.1: ANALYSIS OF VARIANCE TABLE FOR AIKA SOURCE DF ss MS F p ------------- ------- -------- ------ ------ RAM (A)?? 108.000???????????? 0.0678 PROSNOP (B)?? 300.000???????????? 0.0079 A*B?? 12.000???????????? 0.5017 RESIDUAL???????????????? ------------- ------- TOTAL?? 614.000 11112

Tehtavat: (a) (b) (c) Mita tilastollista menetehnaa on kaytetty? Kuvaa kaytetyn menetelman tavoitetta lyhyesti. Mitka ovat menetelmalla testatut nollahypoteesit? Laske tulostuksen 5.1 puuttuvat luvut. (d) Tee johtopaatokset tulostuksesta 5.1. 12/12