1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Samankaltaiset tiedostot
1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Kuusinen/Heliövaara 1

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Johdatus regressioanalyysiin. Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Olkoot X ja Y riippumattomia satunnaismuuttujia, joiden odotusarvot, varianssit ja kovarianssi ovat

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Heliövaara 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Mat Tilastollisen analyysin perusteet, kevät 2007

2 Taylor-polynomit ja -sarjat

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 9: Excel - Tilastollinen analyysi

Tilastolliset menetelmät: Varianssianalyysi

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

Mat Tilastollisen analyysin perusteet, kevät 2007

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä ym., osa I

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Kertausluento. Vilkkumaa / Kuusinen 1

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Yleistetyistä lineaarisista malleista

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Vastepintamenetelmä. Vilkkumaa / Kuusinen 1

Tilastolliset menetelmät: Varianssianalyysi

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.

[ ] [ 2 [ ] [ ] ( ) [ ] Tehtävä 1. ( ) ( ) ( ) ( ) ( ) ( ) 2( ) = 1. E v k 1( ) R E[ v k v k ] E e k e k e k e k. e k e k e k e k.

Vakuutusmatematiikan sovellukset klo 9-15

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Vastepintamenetelmä. Heliövaara 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi. Useampisuuntainen varianssianalyysi

10. laskuharjoituskierros, vko 14, ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

V. POTENSSISARJAT. V.1. Abelin lause ja potenssisarjan suppenemisväli. a k (x x 0 ) k M

Yleinen lineaarinen malli

Tehtävä 2 Todista luennoilla annettu kaava: jos lukujen n ja m alkulukuesitykset. ja m = k=1

MS-A0402 Diskreetin matematiikan perusteet

Koesuunnittelu Vastepintamenetelmä. TKK (c) Ilkka Mellin (2005) 1

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

III. SARJATEORIAN ALKEITA. III.1. Sarjan suppeneminen. x k = x 1 + x 2 + x ,

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

Estimointi Laajennettu Kalman-suodin. AS , Automaation signaalinkäsittelymenetelmät Laskuharjoitus 4

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Testejä suhdeasteikollisille muuttujille

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Testit laatueroasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

DEE Lineaariset järjestelmät Harjoitus 5, harjoitustenpitäjille tarkoitetut ratkaisuehdotukset

J1 (II.6.9) J2 (X.5.5) MATRIISILASKENTA(TFM) MALLIT AV 6

Mat Sovellettu todennäköisyyslasku A

2. Teoriaharjoitukset

Todennäköisyyden ominaisuuksia

Transkriptio:

imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo, Koonaisneliösumma, Koonaisvaihtelu, Luottamusväli, Neliösumma, Odotusarvo, Odotusarvojen vertailu, Ryhmien sisäinen vaihtelu, Ryhmien välinen vaihtelu, Ryhmä, Ryhmäesiarvo, Ryhmäneliösumma, Taso, Testi, Vapauaste, Varianssi, Varianssianalyysihajotelma, Ysisuuntainen varianssianalyysi, Yleinen lineaarinen malli 1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Alihanijat A, B ja C toimittavat tehtaalle osia 500 appaleen erissä. Kaiien olmen alihanijan toimittamien erien jouosta poimittiin satunnaisesti 6 erää tarastettavasi. Alla olevassa tauluossa on annettu tarastetuista eristä löytyneiden viallisten osien luumäärät. Poieavato viallisten osien esimääräiset luumäärät eri ali-hanijoiden toimittamissa erissä tilastollisesti meritsevästi toisistaan? Alihanija A Alihanija B Alihanija C 28 22 33 37 27 29 34 29 39 29 20 33 31 18 37 33 30 38 Tehtävä rataistaan äyttämällä ysisuuntaista varianssianalyysia. Talleta aineisto STATISTIX-tiedostosi DEFECT1 tauluomuodossa, jolloin eri alihanijoita osevat tiedot talletetaan erillisinä muuttujina. Talleta aineisto STATISTIX-tiedostosi DEFECT2 ategorisessa muodossa, jolloin eri alihanijoita osevat tiedot talletetaan yhdesi muuttujasi, mutta tiedostoon lisättään indiaattorimuuttuja, joa ertoo mihin alihanijaan miin havainto liittyy. Anna indiaattorimuuttujalle arvoisi luvut 1, 2, 3. Tee ysisuuntaiset varianssianalyysit seä - että -ohdan tiedostoille ja tarista, että saat samat tuloset. TKK/SAL Ila Mellin (2005) 1/5

2. YKSISUUNTAISEN VARIANSSIANALYYSIN TULOSTEN TULKINTA Tutustu taremmin STATISTIX-ohjelman antamiin tulosiin tehtävän 1 aineistolle. (d) (e) (f) (g) Mitä ovat ryhmäohtaiset esiarvot ja oonaisesiarvo? Mitä ovat ryhmien välinen neliösumma, ryhmien sisäinen neliösumma ja oonaisneliösumma? Ysisuuntaisessa varianssianalyysissa testataan oletusta, jona muaan ryhmäohtaiset odotusarvot ovat yhtä suuria. Miä on oletusta testaavan testisuureen arvo ja vastaava p- arvo? Ono oletus perusteltu? Lase varianssianalyysin testisuureen arvo varianssianalyysihajotelman neliösummien avulla ja tarista, että tulos on sama uin -ohdassa. Kun ysisuuntaisessa varianssianalyysissa testataan oletusta, jona muaan ryhmäohtaiset odotusarvot ovat yhtä suuria, oletetaan, että ryhmien sisäiset varianssit ovat yhtä suuria. Ono oletus perusteltu? Lase ryhmien sisäistä vaihtelua uvaava neliösumma ryhmäohtaisten varianssien avulla. Vertaile odotusarvoja äyttämällä Bonferronin menetelmää. Montao ryhmää aineistosta löytyy? 3. YKSISUUNTAINEN VARIANSSIANALYYSI JA YLEINEN LINEAARINEN MALLI Tehtävässä äytetään tehtävän 1 -ohdan tiedostoa DEFECT2. Lisää tiedostoon DEFECT2 olme indiaattorimuuttujaa IA, IB, IC. Indiaattorimuuttujat määritellään seuraavalla tavalla: I i 1, jos havainto uuluu ryhmään i = 0, jos havainto ei uulu ryhmään i Estimoi lineaarinen malli, jossa selittäjinä äytetään muuttujia IA, IB, IC. Vertaa regressioertoimia tehtävän 1 tulostusista löytyviin ryhmäohtaisiin aritmeettisiin esiarvoihin. Huomautus: Mallissa ei saa olla vaiotermiä! Misi? Testaa regressioertoimien yhtäsuuruutta ja vertaa testin tulosta tehtävässä 1 saatuun ysisuuntaisen varianssianalyysin testituloseen. Testin suoritus on esitetty tehtäväpaperin lopussa. 4. YKSISUUNTAINEN VARIANSSIANALYYSI: SOVELLUS 1 USA:ssa toimiva yritys on etsimässä sopivaa automeriä hoitamaan uljetusiaan. Ehdolla on otimainen, japanilainen ja eurooppalainen automeri. Joaista meriä tilataan 5 appaletta, tilatuilla autoilla ajetaan 10,000 mailia normaaliajoa ja autojen ajoustannuset (c/maili) mitataan. Tiedot mittausista on annettu STATISTIX-tiedostossa CARS1. Ono eri automerien esimääräisissä ajoustannusissa tilastollisesti meritsevää eroa? TKK/SAL Ila Mellin (2005) 2/5

5. YKSISUUNTAINEN VARIANSSIANALYYSI: SOVELLUS 2 Eräs oreajänniteaapeli punotaan 12 teräslangasta, joilta vaaditaan suurta vetolujuutta. Lanojen vetolujuuden tutimisesi valitaan satunnaisesti 9 aapelia ja joaisen aapelin aiien teräslanojen vetolujuudet mitataan. Mitattujen veto-lujuusien poieamat arvosta 340 g on annettu iloina STATISTIX-tiedostossa CABLES. Indiaattorimuuttuja I1 ilmaisee mistä aapelista uin teräslana on otettu. (d) Testaa nollahypoteesia, että eri aapeleista otetuilla teräslangoilla on samat esimääräiset vetolujuudet. Tee myös ryhmäohtaisten odotusarvojen vertailut Bonferronin menetelmällä. Kohdassa nollahypoteesi hylätään. Asiaa taremmin tutittaessa havaitaan, että aapeleiden 1-4 langat on valmistettu teräserästä A, aapeleiden 5-8 langat on valmistettu teräserästä B ja aapelin 9 langat on valmistettu teräserästä C. Indiaattorimuuttuja I2 ilmaisee mistä teräserästä aapelin langat on valmistettu. Testaa nollahypoteesia, että teräserästä A valmistettujen aapeleiden teräslangoilla on samat esimääräiset vetolujuudet. Testaa nollahypoteesia, että teräserästä B valmistettujen aapeleiden teräslangoilla on samat esimääräiset vetolujuudet. Miä on johtopäätös? Testaa nollahypoteesia, että eri teräseristä valmistettujen aapeleiden teräslangoilla on samat esimääräiset vetolujuudet. Tee myös ryhmä-ohtaisten odotusarvojen vertailut Bonferronin menetelmällä. Tee tulosista yhteenveto. TKK/SAL Ila Mellin (2005) 3/5

Mat-2.104 Tilastollisen analyysin perusteet KAAVOJA Tehtävässä 3 pyydetään testaamaan ysisuuntaisen varianssianalyysin mallia vastaavassa regressiomallissa regressioertoimien yhtäsuuruutta. Tämä testi ja ysisuuntaisen varianssianalyysin testi ryhmäohtaisten odotusarvojen yhtäsuuruudelle ovat evivalentteja. Ysisuuntaisen varianssianalyysin malli Oloon (1) y = µ + ε, ε ~ N(0, σ ), j = 1,2,, n, i = 1,2, 2 ji i ji ji i, ysisuuntaisen varianssianalyysin malli, jossa jäännöstermit ε ji oletetaan lisäsi orreloimattomisi. Ysisuuntaisen varianssianalyysin malli ja yleinen lineaarinen malli Varianssinalyysimallia (1) vastaava yleinen lineaarinen malli on muotoa (2) y = µ 1I1 + µ 2I2 + + µ I + ε, j = 1, 2,, n, i = 1, 2,, ji ji i jossa jäännöstermistä ε ji tehdään samat oletuset uin mallissa (1). Oloon nollahypoteesina Testin suoritus (i) (ii) Estimoidaan lineaarinen regressiomalli (2) PNS-menetelmällä. Oloon SSE tulosena saatava jäännösneliösumma. Estimoidaan lineaarinen regressiomalli, jossa selittäjänä on pelä vaio. Oloon SSE R tulosena saatava jäännnösneliösumma. Huomautus: jossa SSE = ( n 1) s R 2 y 2 s y on aiien y-havaintojen varianssin harhaton estimaattori. TKK/SAL Ila Mellin (2005) 4/5

Mat-2.104 Tilastollisen analyysin perusteet (iii) Muodostetaan testisuure jossa (iv) Jos nollahypoteesi pätee, n SSER SSE F = 1 SSE n = n + n + + n 1 2 F ~ F( 1, n ) Testin idea Nollahypoteesi meritsee ( 1) lineaarisen rajoitusen spesifioimista malli (2) regressioertoimille. Huomaa, että rajoitusien luumäärä on ( 1). Misi? Jos rajoituset otetaan huomioon, malli (2) voidaan irjoittaa muotoon (3) y = µ + ε, j = 1, 2,, n, i = 1, 2,, ji ji i Esitetyssä testissä mallin (2) jäännösneliösummaa SSE verrataan rajoitetun mallin (3) jäännösneliösummaan SSE R. Voidaan osoittaa, että mallin (3) jäännösneliösumma SSE R on aina vähintään yhtä suuri uin mallin (2) jäännösneliösumma SSE. Nollahypoteesi H 0 hylätään, jos jäännösneliösumma asvaa yllin voimaaaasti, un nollahypoteesin määrämät rajoituset otetaan estimoinnissa huomioon. Huomautusia (i) (ii) Mallin (2) regressioertoimien µ, µ,, µ 1 2 PNS-estimaattoreisi saadaan y-havaintojen ryhmäohtaiset aritmeettiset esiarvot. Mallin (3) regressioertoimen µ PNS-estimaattorisi saadaan y-havaintojen oonaisesiarvo eli aiien y-havaintojen yhteinen aritmeettinen esiarvo. TKK/SAL Ila Mellin (2005) 5/5