3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Koko: px
Aloita esitys sivulta:

Download "3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä)."

Transkriptio

1 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta, joka riippuu käytettävän puuvillan määrästä (%-osuus painosta) kankaassa. Puuvillapitoisuuden tulee olla prosenttia. Koe toteutetaan määrillä 15, 20, 25, 30 ja 35 prosenttia. Havaintoaineisto: Tensile strength experiment data (lb/square inch) ================================================================ Cotton Observations weight percentage Total Average Std ================================================================ Total ================================================================ Source: Montgomery (2002), p. 62 Tässä siis a = 5. Kullakin tasolla toteutetaan n =5 toistoa. Kaikkiaan on siis 25 käsittelyä (runs). Käsittelyt toteutetaan satunnaisessa järjestyksessä (completely randomized design). 1 2

2 Yksisuuntaisen varianssianalyysin malli: (One-way or single factor analysis of variance model) Huom. 3.1: Vaihtoehdossa (1) (5) μ i = μ + τ i. μ: yleiskeskiarvo (grand mean, overall mean) τ i : käsittelyn i vaikutus (treatment effect). (1) Y ij = μ i + ε ij, i =1, 2,...,a, j =1,...,n. Vaihtoehtoisesti (2) Y ij = μ + τ i + ε ij, jossa (3) ε ij NID(0,σ 2 ), josta seuraa, että Y ij ovat riipumattomia ja Huom. 3.2: Molemmat yllä olevista malleista kuuluvat lineaaristen mallien perheeseen. Huom. 3.3: Määrittämällä yleiskeskiarvo (6) μ = 1 μ i, a silloin (7) τ i =0. Täten τ i kuvaa poikkeamaa yleiskeskiarvosta μ. (4) Y ij N(μ + τ i,σ 2 ). 3 4

3 Kiinteän tekijän ja satunnaistekijän malli (Fixed effect and random effect) Jos käsittelytasot i =1,...,avalitaan ennalta (kiinitetään), koskevat johtopäätökset tarkasti ottaen vain näiden käsittelytasojen keskiarvoja. Estimoitavat parametrit ovat (μ, τ i,σ 2 ). Tätä sanotaan kiinteän tekijän malliksi. Jos käsittelytasot i =1,...,a on satunnaisotos laajemmasta käsittelytasojen populaatiosta, voidaan johtopäätöksetkin ulottaa koko käsittelytasojen populaatioon. Tällaista mallia sanotaan satunnaistekijän malliksi. Kiinteän tekijän mallin analysointi Lähtökohtamallina (2) [vaihtoehtoisesti (1)]. Käsittelyiden vaikutusten analyysi perustuu siihen, kuinka suuri osa Y ij :n vaihtelusta on kästittelyistä τ i peräisin ja kuinka suuri osa on luettavissa sattuman tiliin (virhekomponentin ε ij aiheuttamaa). Tällöin τ i on myös satunnaismuuttuja, odotusarvona E[τ i ] = 0. Kiinnostuksen kohteena on millaisen varianssikontribuution τ i tuottaa vastemuuttujan (Y ) kokonaisvarianssiin. 5 6

4 Tukitaan ensimmäisessä vaiheessa onko käsittelyillä ylipäätään vaikutusta. Testisuure: Testisuure perustuu varianssin dekomponointiin (varianssihajotelmaan). Tilastollin nollahypoteesi (ei vaikutusta): (8) H 0 : τ 1 = = τ a =0. Vastahypoteesi (on vaikutusta): Määritellään (12) y i. = n j=1 y ij, (9) H 1 : τ i = 0 jollakin i. Jos (8) on voimassa, eli käsittelyillä ei vaikutusta, typistyy malli (2) muotoon. Y ij = μ + ε ij, eli havainnot ovat puhdasta satunnaiskohinaa. Huom. 3.4: Yhtäpitävästi mallin (2) sijaan voidaan testata mallia (1), jolloin (13) y.. = (14) y i. = 1 n (15) y.. = 1 N jossa N = an. y i. = n j=1 n j=1 y ij = y i. n, n j=1 y ij, y ij = y.. N, (10) H 0 : μ 1 = = μ a (11) H 1 : μ i = μ j jollakin (i, j) 7 8

5 Kokonaisneliösumma (Total Sum of Squares): n (16) SS tot = (y ij y.. ) 2 j=1 mittaa kokonaisvaihtelua. Varianssianalyysin peruslauseke: (19) j=1 n (y ij y.. ) 2 = n ( y i. y.. ) 2 + j=1 n (y ij y i. ) 2 Käsittelyjen välinen neliösumma (Between Treatment Sum of Squares): (17) SS treat = n ( y i. y.. ) 2 kuvaa käsittelystä (treatment) aiheutuvaa vaihtelua. Käsittelyjen sisäinen neliösumma (virhevaihtelu) (Error Sum of Squares): n (18) SS err = (y ij y i. ) 2 j=1 kuvaa käsittelyjen sisäistä vaihtelua, joka on virhevaihtelua (within or error variation). eli lyhyesti (20) SS tot = SS treat + SS err. SS tot :n vapausasteet: df tot = N 1 SS treat :n vapausasteet: df treat = a 1 SS err :n vapausasteet: df err = N a Havaitaan (21) df tot = df treat + df err 9 10

6 Keskineliöt (Mean Squares): Saadaan jakamalla neliösummat vapausasteillaan (22) MS treat = SS treat a 1 (23) MS err = SS err N a Nollahypoteesin (8) testaaminen perustuu suhdelukuun (24) F = SS treat/(a 1) SS err /(N a) = MS treat, MS err joka noudattaa F -jakaumaa vapausastein df treat = a 1jadf err = N a, josh 0 -hypoteesi on tosi. Huom. 3.5: F -testisuure muodostuu kahden riippumattoman χ 2 -jakautuneen satunnaismuuttujan osamäärästä, jolloin sen jakaumana on F -jakauma (k.s. Kappale 2). Varianssianalyysissa periaate on, että kokoneliösumma pyritään jakamaan osaneliösummiin, jotka (nollahyposteesin) vallitessa ovat riippumattomia. Jakaumatulokset seuraavat oheisesta tärkeästä Cochranen lauseesta. Lause 3.1: (Cochran) Olkoon satunnaismuuttujat z i N(0, 1), i =1,...ν. Määritellään n (25) Q = Zi 2 = Q 1 + Q Q m, jossa Q k :n vapausasteet on ν k (k =1,...,m), m ν. Silloin Q k ovat riippumattomia χ 2 -jakautuneita satunnaismuuttujia vapausasteilla ν k, jos ja vain jos (26) ν = ν ν m

7 ANOVA-taulu (Analysis of Variance Table): Source of variation SS df MS F MS Treatment SS treat a 1 MS treat treat MS err Error SS err N a MS err Total SS tot N 1 Esimerkki 3.2 (Esimerkin 3.1 jatkoa). Tässä a =5,n =5jaN = an = SAS PROC ANOVA ajojono. options ls = 78; data tensile; input treatment datalines; ; proc anova data = tensile; class treatment; model strength = treatment; run; Tulokset: The ANOVA Procedure Class Level Information Class Levels Values treatment Number of observations Dependent Variable: strength =============================================================== Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total =============================================================== 14

8 p-arvo on pienempi kuin , joten H 0 -hypoteesi hylätään. Täten tulokset osoittavat vahvasti sen puolesta, että puuvillan osuus kuidussa vaikuttaa lujuuteen. Mallin parametrien estimointi: F -testi osoittaa vain, että keskiarvoissa on eroa. Mallin y ij = μ + τ i + ε ij ylesikeskiarvo μ ja poikkeamat τ i (käsittelyvaikutukset) voidaan estimoida kaavoilla: (27) ˆμ = y.. (28) ˆτ i = y i. y.., ja (29) ˆμ i = y i.. Huom. 3.6: μ i = μ + τ i ja ˆμ i =ˆμ +ˆτ i = y i

9 Esimerkki 3.3: (Jatkoa) Esimerkin 3.1 havaintaineiston yhteydessä on laskettu ˆμ i = y i. estimaatit ja yleiskeskiarvo. Näistä saadaan ˆτ 1 = y 1. y.. = 5.24 ˆτ 2 = y 2. y.. = ˆτ 3 = y 3. y.. = 2.56 ˆτ 4 = y 4. y.. = ˆτ 5 = y 5. y.. = 4.24 Kuten jo esimerkin 3.1 tuloksista havaitaan kasvaa keskimääräinen lujuus aina 30 prosentin kohdalle saakka, jonka jälkeen se selvästi laskee. Yksittäisten tasojen tilastollisiin vertailuihin palataan tarkemmin tuonnempana. Epätasapainoinen aineisto (Unbalanced data) Kun faktoreiden eri tasoilla havaintojen määrät poikkeavat toisistaan sanotaan, että koeasetelma on epätasapainoinen (unbalanced). Yllä oleva varianssianalyysi soveltuu myös tällaiseen aineistoon. Havaintojen kokonaismäärä N = a n i, jossa n i on havaintojen määrä käsittelyn tasolla i. Tarvittavat neliösummat: n i (30) SS T = (y ij y.. ) 2 j=1 (31) SS B = ja (32) SS E = j=1 n i ( y i. y.. ) 2 n i (y ij y i. ) 2 17 Huom. 3.7: Neliösummista tarvitaan vain kaksi. Kolmas voidaan ratkaista identiteetistä SS T = SS B + SS E. 18

10 3.2 Mallin riittävyystarkastelut Varianssianalyysin testitulos on luotettava ainoastaan, jos mallin taustalla olevat oletukset täyttyvät. Oletuksena on, että havainnot ovat mallin (33) y ij = μ + τ i + ε ij mukaisia, jossa (34) ε ij N(0,σ 2 ). Erityisesti siis jakauman pitäisi olla normaalinen ja varianssin pitäisi olla sama kaikilla käsittelyn tasoilla i. Oletusten paikkansapitävyyttä voidaan tutkia residuaalien (35) e ij = y ij ˆy ij avulla, jossa ˆy ij =ˆμ +ˆτ i on havainnon y ij mallin ennustama arvo. Havaitaan, että kullakin käsittelyn tasolla ennustearvo on (36) ˆy ij = ˆμ +ˆτ i = y.. +( y i. y.. ) = y i

11 Normaalisuus Varianssin yhtäsuuruus: Kuten aiemmin, yksi käytetty tapa on Normal Probability Plot Varianssien yhtäsuuruutta voidaan testata. (37) H 0 : σ 2 1 = σ2 2 = = σ2 a Normal probability plot for residuals vastahypoteesina (38) H 1 : ainakin yksi on eri suuruinen Standardized normal distribution value Residual Bartlettin testi (39) χ 2 = (N a)lns2 p a (n i 1) ln Si 2 ( a ) (a 1) n i 1 1 N a joka noudattaa χ 2 -jakaumaa vapausasteella a 1, jos H 0 on tosi. Kuvio on jälleen ok. (40) S 2 p = 1 N a (n i 1)Si

12 Varianssin vakioisuutta voidaan tutkia myös graafisesti muodostamalla sirontakuvio, jossa pystyakselilla on residuaalin arvo ja vaakaakselilla ennustettu arvo. Varianssin stabilointimenetelmiä Jos jäännösvarianssi ei ole vakio, voidaan tietyillä muunnoksilla yrittää stabiloida sitä: 6 Resiidual vs fitted values Usein epästabiilissa tilanteessa keskihajonta on relaatiossa odotusarvoon siten, että Residual Predicted Kuvion perusteella ei ole havaittavissa mitään hälyyttävää. (41) σ y μ α, jossa tarkoittaa suoraan verrannollinen. Tällöin muuntamalla alkuperäiset havainnot muotoon (42) y = y 1 α saadaan parannettua tilannetta, jossa muunnettujen havaintojen varianssi on likimain vakio

13 Taulukko 3.1: Varianssin stabilointimuunnoksia. α 1 α Muunnos σ y vakio 0 1 Ei muunnosta σ y μ 1/2 1/2 1/2 Neliöjuuri σ y μ 1 0 log-muunnos σ y μ 3/2 3/2 1/2 käänteisarvo neliöjuuresta σ y μ käänteisarvo 3.3 Keskiarvojen vertailu Jos testitulokset osoittavat, että keskiarvot poikkeavat toisistaan, niin seuraava kysymys on, että mitkä kesiarvot ovat poikkeavia. Käsittelytasojen keskiarvoja tarkastelmalla saadaan käsitys asiasta

14 Parittainen vertailu: The Fisher Least Significant Difference (LSD): Testattavat hypoteesit: (43) H 0 : μ i = μ j H 0 : μ i = μ j. Suoraviivainen parittainen t-testaus johtaa kokonaismerkitsevyystason kasvuun (esim. jos kätetään 5%:n merkitsevyystasoa, on jokaisessa vertailussa 5%:n virhe, joten kasvaa lähes testien lkm x 5%:n suuruiseksi). Fisherin menetelmä perustuu parittaisten keskiarvojen vertailuun t-testillä. Heikkoutena tällä menetelmällä on edellä mainittu kokonaismerkitsevyystaso kasvu. Hypotseestia (43) voidaan testat t-testillä (44) t ij = y i. y j. MS E ( 1 n j + 1 n i ). Menetelmiä on useampia. Tunnetuimpia ovat Tukeyn, Duncanin ja Fisherin menetelmät. Tarkastellaan tässä Fisherin mentelmää

15 Keskiarvot y i. ja y j. poikkeavat toisistaan merkitsevästi tasolla α, jos ( ) MSE + 1ni 1nj (45) y i. y j. >t α/2,n a Lukua (46) LSD = t α/2,n a 1 MS E + 1 ) n i n j sanotaan least significant difference ( pienimmän merkitsevän eron ) luvuksi.. Esimerklki 3.4: Portland sementtiesimerkissä, n 1 = = n 5 n =5. Olkoon α =0.05, jolloin 2MS E (47) LSD = t.025,20 =2.086 =3.75. n 5 Täten keskiarvoparit, jotka poikkeavat vähintään 3.75 ovat tilastollisesti merkitseviä (antavat tilastollista evidenssiä, että vastaavat populaatiokeskiarvot poikkeavat toisistaan) Aineistosta: y 1. y 2. = = 5.6 y 1. y 3. = = 7.8 y 1. y 4. = = 11.8 y 1. y 5. = = 1.0 y 2. y 3. = = 2.2 y 2. y 4. = = 6.2 y 2. y 5. = = 4.6 y 3. y 4. = = 4.0 y 3. y 5. = = 6.8 y 4. y 5. = = 10.8 Tähdellä merkityt erot ovat tilstollisesti merkitseviä. Täten muut paitsi y 1. y 5. = 1.0 ja y 2. y 3. = 2.2 ovat (tilastollisesti) merkitseviä

16 SAS-ohjelmistolla nämä saadaan proc anova ohjelmas käskyllä means. Ohessa on esimerkki Tukey, Scheffe, Duncan ja LSD menetelmien veratiluista options ls = 78; data tensile; input treatment datalines; ; proc anova data = tensile; class treatment; model strength = treatment; run; means treatment / tukey scheffe duncan lsd; run; Tulokset: The ANOVA Procedure Dependent Variable: strength Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total t Tests (LSD) for strength NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 20 Error Mean Square 8.06 Critical Value of t Least Significant Difference Means with the same letter are not significantly different. t Grouping Mean N treatment A B B B C C C

17 Duncan s Multiple Range Test for strength NOTE: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 20 Error Mean Square 8.06 Number of Means Critical Range Means with the same letter are not significantly different. Duncan Grouping Mean N treatment A B B B C C C Tukey s Studentized Range (HSD) Test for strength NOTE: This test controls the Type I experimentwise error rate, nut it generally has a higher Type II error rate than REGWQ. Alpha 0.05 Error Degrees of Freedom 20 Error Mean Square 8.06 Critical Value of Studentized Range Minimum Significant Difference Means with the same letter are not significantly different. Tukey Grouping Mean N treatment A A B A B B C C D C D D

18 Ryan-Einot-Gabriel-Welsch Multiple Range Test for strength NOTE: This test controls the Type I experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 20 Error Mean Square 8.06 Number of Means Critical Range Means with the same letter are not significantly different. REGWQ Grouping Mean N treatment A A B A B B C C C Vertailu kontrolliryhmään: [Dunnet (1964)] Usein yksi ryhmistä muodostaa kontrolliryhmän, johon testituloksia verrataan. Oletetaan, että ensimmäinen ryhmä on kontrolliryhmä. Testattavat hypoteesit ovat (48) H 0 : μ i = μ 1 H 1 : μ i = μ 1 i =2,...,a. H 0 hylätään merkitsevyystasolla α, jos y i. y 1. >d α (a 1,df) 1 MS E + 1 ), n i n 1 (49) jossa d α (a 1,df) on taulukkoarvo (Dunnet in t-arvo, vastaavasta kuin t-testissä), merkitsevyystasolla α ja vapauasteluvulla df = N a

19 Esimerkki 3.5: Olkoon edellisessä esimerkissä ensimmäinen käsittely kontrolliryhmänä. SAS:lla saadaan käskyllä means treatment / dunnett( 15 ); The ANOVA Procedure Dunnett s t Tests for strength NOTE: This test controls the Type I experimentwise error for comparisons of all treatments against a control. Alpha 0.05 Error Degrees of Freedom 20 Error Mean Square 8.06 Critical Value of Dunnett s t Minimum Significant Difference Comparisons significant at the 0.05 level are indicated by ***. 3.4 Kontrastit Keskiarvoja voidaan verrata yleisemminkin. Tekstiiliesimerkissä voitaisiin testata ovatko kahden alimman tason ja ylimmän tason keskimääräiset vetolujuudet samat. (50) tai (51) H 0 : μ 1 + μ 2 = μ 4 + μ 5 H 1 : μ 1 + μ 2 = μ 4 + μ 5 H 0 : μ 1 + μ 2 μ 4 μ 5 =0 H 1 : μ 1 + μ 2 μ 4 μ 5 =0 Difference treatment Between Simultaneous 95% Comparison Means Confidence Limits *** *** ***

20 Yleisesti kontrasti on parametrien lineaarikombinaatio (52) μ c = c i μ i, jossa kertoimille c 1,...,c a (kontrastikertoimet) pätee (53) n i c i =0 Yllä (51):n tapauksessa μ c =0, c 1 = c 2 =1, c 3 =0jac 4 = c 5 = 1 (n 1 = = n 5 = n). Huom. 3.8: Kontrastit ovat erikoistapaus yleisistä lineaarisista hypoteeseista, muotoa (54) H 0 : d i μ i = μ, jossa kertoimet d i eivät välttämättä summaudu nollaksi. 39 Kontrastien testaus (i) t-testi: Merkitään (55) y c = jolloin (56) E[y c ]= c i y i., c i E[y i. ]= ja riippumattomuuden nojalla (57) Var[y c ]=σ 2 a n i c 2 i. Hypoteesia (58) H 0 : c i μ i =0 c i μ i = μ c voidaan testata t-testillä a c i y i. (59) t = MS a E n i c 2, i joka on t-jakautunut vapausasteella N a, kun H 0 on tosi. 40

21 Ortogonaaliset kontrastit Kontrasteja {c i } ja {d i } sanotaan ortogonaalisiksi, jos (60) n i c i d i =0. 41

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). 3. Yhden faktorin kokeet 3.1 Varianssianalyysi Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä). Esimerkki 3.1: Tutkitaan kankaassa käytettävän synteettisen kuidun vetolujuutta,

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

2. Keskiarvojen vartailua

2. Keskiarvojen vartailua 2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena

Lisätiedot

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä:

Tavoite on eliminoida sen vaikutus koetuloksista. 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Eliminointimenetelmiä: 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa

Lisätiedot

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Kiusatekijä on taustatekijä, joka voi vaikuttaa 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor): Kiusatekijä on taustatekijä, joka voi vaikuttaa

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs)

Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9. Muita koeasetelmia. 9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

9.1 Hierarkiset asetelmat (Nested Designs)

9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yksisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Kokonaiskeskiarvo,

Lisätiedot

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla.

Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. 5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa: Mat-.03 Koesuunnittelu ja tilastolliset mallit Mat-.03 Koesuunnittelu ja tilastolliset mallit / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalsi Aritmeettinen keskiarvo, Estimointi, F-testi,

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs)

9. Muita koeasetelmia. Kaksitasoiset hierarkiset asetelmat (Two-Stage Nested Designs) 9.1 Hierarkiset asetelmat (Nested Designs) 9. Muita koeasetelmia 9.1 Hierarkiset asetelmat (Nested Designs) Tietyissä koetilanteissa yhden faktorin tasot ovat samanlaisia joskaan ei täysin identtisiä toisen faktorin eri tasoilla. Tällaista asetelmaa

Lisätiedot

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486. Mat-.103 Koesuunnittelu ja tilastolliset mallit Harjoitus 8, kevät 004 Esimerkkiratkaisut. 1. Myrkyllistä ainetta oli kaadettu jokeen, joka johtaa suurelle kalastusalueelle. Tie- ja vesirakennusinsinöörit

Lisätiedot

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä:

4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat. Tavoite on eliminoida sen vaikutus koetuloksista. Eliminointimenetelmiä: 4. Satunnaistetut lohkokokeet, latinalaiset neliöt ja vastaavat asetelmat Tavoite on eliminoida sen vaikutus koetuloksista. 4.1 Satunnaistettu lohkokoe (Randomized Block Design) Kiusatekijä (nuisance factor):

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa 5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla

Lisätiedot

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa

5. Johdatus faktorikokeisiin. Tekijän omaa vaikutusta vastemuuttujaan sanotaan. 5.1 Taustaa 5. Johdatus faktorikokeisiin 5.1 Taustaa Faktorikokeilla tarkoitetaan koesuunnitelmaa, jossa koe toistetaan kaikilla faktoreiden tasojen kombninaatioilla. Täten, jos faktorilla A on a tasoa ja faktorilla

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1 Lohkoasetelmat Vilkkumaa / Kuusinen 1 Motivointi 1/3 Kaksisuuntaisella varianssianalyysilla voidaan tutkia kahden tekijän A ja B vaikutusta sekä niiden yhdysvaikutusta tutkimuksen kohteeseen Kaksisuuntaisessa

Lisätiedot

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Kuusinen/Heliövaara 1 Lohkoasetelmat Kuusinen/Heliövaara 1 Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Heliövaara 1 Lohkoasetelmat Heliövaara 1 Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon,

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 5 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

proc glm data = ex61; Title2 Aliasing Structure of the 2_IV^(5-1) design; model y = A B C D E /Aliasing; run; quit; Title "Exercises 6"; Data ex61; input A B C D E y @@; Label A = "Furnance Temperature" B = "Heating Time" C = "Transfer Time" D = "Hold Down Time" E = "Quench of Oil Temperature" y = "Free Height of Leaf

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas NORMAALIJAKATUNEISUUDEN TESTAUS H 0 : Muuttuja on perusjoukossa normaalisti jakautunut. H 1 : Muuttuja ei ole perusjoukossa normaalisti

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

5.7 Uskottavuusfunktioon perustuvia testejä II

5.7 Uskottavuusfunktioon perustuvia testejä II 5.7 Uskottavuusfunktioon perustuvia testejä II Tässä pykälässä pohditaan edellä tarkasteltujen kolmen testisuureen yleistystä malleihin, joiden parametri on useampiulotteinen, ja testausasetelmiin, joissa

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Otoskoon arviointi. Tero Vahlberg

Otoskoon arviointi. Tero Vahlberg Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä

Lisätiedot

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6) Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. 9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT imat-2.104 Tilastollisen analyysin perusteet / Tehtävät Aiheet: Avainsanat: Ysisuuntainen varianssianalyysi Bartlettin testi, Bonferronin menetelmä, F-testi, Jäännösneliösumma, χ 2 -testi, Koonaisesiarvo,

Lisätiedot

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH

8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH 8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot