Korrelaatiokertoinen määrittely 165

Koko: px
Aloita esitys sivulta:

Download "Korrelaatiokertoinen määrittely 165"

Transkriptio

1 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Muuttujien X ja Y lineaarista riippuvuutta mittaa korrelaatiokerroin xy ( x)( y)/n r = ( x 2 ( ) ( x) 2 /n y 2 ( y) /n) 2 Tätä kutsutaan myös Pearsonin tulomomenttikorrelaatiokertoimeksi erotukseksi muista korrelaatiokertoimista.

2 kertoinen määrittely 166 Jos merkitään on SS xy = SS xx = SS yy = n (x i x)(y i ȳ) = i=1 n (x i x) 2 = i=1 n (y i ȳ) 2 = i=1 r = i=1 n n n x i y i ( x i )( y i )/n i=1 i=1 n n xi 2 ( x i ) 2 /n n i=1 y 2 i ( i=1 n y i ) 2 /n i=1 SS xy SSxx SS yy i=1

3 kertoimen ominaisuuksia 167 1) 1 r 1 2) kerroin r mittaa muuttujien välistä lineaarista riippuvuutta. Jos r < 0, muuttujien välillä on negatiivista riippuvuutta: suuriin x-arvoihin liittyy yleensä pieni y-arvo ja pieniin x-arvoihin suuri y-arvo. Jos r > 0, muuttujienvälillä on positiivista riippuvuutta: suuriin x-arvoihin liittyy yleensä suuri y-arvo ja pieniin x-arvoihin pieni y-arvo. Jos r 0, muuttujien välillä ei ole lineaarista riippuvuutta. Jos r = 1, havaintopisteet ovat samalla suoralla, jonka kulmakerroin on positiivinen. Jos r = 1, havaintopisteet ovat samalla suoralla, jonka kulmakerroin on negatiivinen.

4 kertoimen ominaisuuksia 168 3) kertoimen arvo on riippumaton käytetystä mitta-asteikosta, ts. se ei muutu, vaikka muuttuja-arvoille tehdään lineaarinen muunnos. Esimerkkejä: a) positiivinen korrelaatio b) negatiivinen korrelaatio c) ei korrelaatiota

5 Tarkastellaan, kuinka tietyn elintarvikkeen rikkiyhdistepitoisuus Y riippuu säilytysajasta X. Havainnot (n = 6): x y x = 10.3, x 2 = 20.95, y = 13.5, y 2 = 33.91, xy = SS xy = /6 = SS xx = /6 = SS yy = /6 = r = =

6 n merkitsevyys 170 Koska r on otossuure, sen arvosta ei voida suoraan päätellä, onko muuttujien välillä todellista riippuvuutta vai ei. Jos otos on pieni, korrelaatiokerroin voi sattuman vaikutuksesta näyttää suurelta, vaikka muuttujilla ei olisi mitään tekemistä toistensa kanssa. Satunnaismuuttujien X ja Y yhteisjakaumaan perustuva lineaarisen korrelaation kerroin on ρ = σ xy σ x σ y missä σ xy = E((X µ x )(Y µ y )) = E(XY ) µ x µ y on muuttujien X ja Y kovarianssi.

7 n merkitsevyys 171 Teoreettinen korrelaatiokerroin ρ on koko populaatiota koskeva, yleensä tuntematon parametri, jonka estimaattori on otoskorrelaatiokerroin r. n testaus koskee parametria ja testisuure perustuu otossuureeseen r. Hypoteesi: H 0 : ρ = 0 (ei lineaarista riippuvuutta) Testisuure: H 1 : ρ 0 (on lineaarinen riippuvuus) T = r n 2 t(n 2) 1 r 2 Hylkäysehto: Hypoteesi H 0 hylätään riskitasolla, jos t > t 1 α/2 (n 2). Sama P-arvon avulla: P = P(T > t ) + P(T < t ) Hypoteesi H 0 hylätään riskitasolla α, jos P < α.

8 n merkitsevyys 172 n testaus tehdään yleensä kaksisuuntaisena. Jos riippuvuus voi periaatteessa olla vain yhdensuuntaista (joko positiivista tai negatiivista), tehdään yksisuuntainen testaus, jolloin hypoteesit ovat H 0 : ρ = 0 (ei lin. riippuvuutta) Hylkäysehto: H1 : ρ > 0 (positiivinen lin. riippuvuus) t > t 1 α (n 2) tai H 0 : ρ = 0 (ei lin. riippuvuutta) Hylkäysehto: H 1 : ρ < 0 (negatiivinen lin. riippuvuus) t < t 1 α (n 2)

9 Kasvaako elintarvikkeen rikkiyhdistepitoisuus säilytysajan myötä eli onko muuttujien välillä positiivinen korrelaatio? H 0 : ρ = 0 H 1 : ρ > 0 kertoimen arvo r = 0.59, otoskoko n=6. Testisuureen arvo: t = r n 2 = = r Olkoon valittu riskitaso α = 0.05, krittinen arvo t 1 α (n 2) = t 0.95 (4) = 2.13 Koska t < t 0.95 (4), niin H 0 jää voimaan eli säilytysajan ja rikkiyhdistepitoisuuden välillä ei voida todeta merkitsevää positiivista korrelaatiota.

10 Otoskoon merkitys 174 Minkä suuruinen korrelaatio on merkitsevä kaksisuuntaisessa testissä esim. tasolla α = 0.05 eri n:n arvoilla? n r vähintään VAROITUS: Havaittu tilastollinen riippuvuus ei välttämättä merkitse suoraa syy-seuraus-suhdetta muuttujien välillä! Kyseessä voi olla molempiin muuttujiin yhdessä vaikuttava kolmas tekijä tai useampia tekijöitä. Em. varoitus koskee myös χ 2 -riippumattomuustestiä ja regressioanalyysia.

11 Regressioanalyysi 175 Regressioanalyysin tavoitteena on kuvata ja analysoida selitettävän eli riippuvan muuttujan Y riippuvuutta selittävistä eli riippumattomista muuttujista X 1, X 2,..., X k. Lineaarinen regressiomalli: Y = β 0 + β 1 X β k X }{{ k + } }{{} ɛ deterministinen osa satunnaisosa parametrit β 0, β 1,..., β k ovat tuntemattomia vakioita jäännöstermi eli residuaali on satunnaismuuttuja selittävät muuttujat X j voivat olla satunnaismuuttujia tai niiden arvot voidaan määrätä kontrolloidusti, jolloin niitä merkitään x 1, x 2,..., x k.

12 Regressioanalyysin vaiheet Mallin muodostaminen: selittävien muuttujien valinta ja riippuvuutta kuvaavan funktion valinta. 2. Mallin parametrien estimointi. 3. Satunnaisvaihtelun estimointi (satunnaistermin jakauma ja parametrit). 4. Mallin parametrien ja/tai yhteensopivuuden testaus. 5. Mallilla ennustaminen

13 Yhden selittävän muuttujan lineaarinen regressioanalyysi 177 Tutkitaan muuttujan Y lineaarista riippuvuutta yhdestä selittävästä muuttujasta x. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x n, y n ). Malli: Y = β 0 + β 1 x + ɛ missä β 0 on vakiotermi ja β 1 regressiokerroin Eri havaintoihin i = 1,..., n liittyvät jäännöstermit ɛ i ovat riippumattomia, samoin jakautuneita ja E(ɛ i ) = 0, D 2 (ɛ i ) = σ 2 kaikilla i Jos mallia käytetään tilastolliseen päättelyyn, esim. testaukseen, oletetaan, että ɛ i N(0, σ 2 ).

14 Regressiomallin parametrien estimointi pienimmän neliösumman menetelmällä 178 Merkitään estimaattoreita ˆβ 0 = b 0 ja ˆβ 1 = b 1. Estimaattorit pyritään määräämään siten, että havaitut arvot sopivat mahdollisimman hyvin mallin antamiin arvoihin ŷ i = b 0 + b 1 x i. Tämä saadaan aikaan minimoilla jäännösneliösummaa SSE = n (y i ŷ i ) 2 = i=1 n (y i b 0 b 1 x i ) 2 i=1 parametrien b 0 ja b 1 funktiona. Minimissä osittaisderivaattojen arvot ovat nollia.

15 Regressiomallin parametrien estimointi pienimmän neliösumman menetelmällä 179 SSE b 0 = 2 SSE b 1 = 2 josta saadaan normaaliyhtälöt: n (y i b 0 b 1 x i ) = 0 i=1 n (y i b 0 b 1 x i )x i = 0 i=1 nb 0 + ( x i )b 1 = y i ( x i )b 0 + ( x 2 i )b 1 = x i y i Normaaliyhtälöiden ratkaisuna saadaan kertoimien pienimmän neliösumman estimaatit eli pns-estimaatit

16 Pienimmän neliösumman estimaatit eli pns-estimaatit 180 n n n x i y i ( x i )( y i )/n i=1 i=1 i=1 β 1 = b 1 = = n n SS xy SS xi 2 ( x i ) 2 xx /n ( i=1 i=1 n ) β 0 = b 0 = 1 n y i b 1 x i = ȳ b 1 x n i=1 Sovitettu regressiosuora: ŷ = b 0 + b 1 x antaa ennusteet Y :lle x:n funktiona. Havaintopisteittäin lasketut sovitteet ovat ŷ i = b 0 + b 1 x i ja havaitut poikkeamat eli jäännökset e i = y i ŷ i. i=1

17 Vaihtelun tutkiminen 181 Regressioanalyysin tavoitteena on Y :n vaihtelun syiden tutkiminen. Poikkeamien y i ȳ neliösumma (y i ȳ) 2, joka kuvaa Y :n kokonaisvaihtelua, voidaan hajoittaa komponentteihin: (yi ȳ) 2 = (ŷ i ȳ) 2 + (y i ŷ i ) 2 eli SST = SSD + SSE SST = (y i ȳ) 2 = y 2 ( y i ) 2 /n = SS yy on selitettävän kokonaisneliösumma SSD = (ŷ i ȳ) 2 = b 1 (xi x)(y i ȳ) = b 1 SS xy = b 1 (xi x) 2 = b 1 SS xx = SS 2 xy/ss xx on selitetty neliösumma SSE = (y i ŷ i ) 2 = (y i b 0 b 1 x i ) 2 = SST SSD on jäännösneliösumma, virheneliösumma

18 Vaihtelun tutkiminen 182 Regressiomallin sopivuutta havaintoaineistoon kuvaa mallin selitysaste R 2 = SSD SST joka on mallin selittämä osuus y-arvojen vaihtelusta. Selitysasteen neliöjuuri, yhteiskorrelaatiokerroin R = SSD/SST on y i -arvojen ja ŷ i -arvojen välinen korrelaatiokerroin. Yhden selittävän muuttujan tapauksessa R = r xy.

19 Vaihtelun tutkiminen 183 Selitysaste on välillä 0 R 2 1. Jos lineaarinen malli sopii hyvin aineistoon eli havaintopisteet lähellä regressiosuoraa, SSE 0 ja R 2 = SSD SST = SST SSE SST = 1 SSE SST on lähellä ykköstä Satunnaisvirheen ɛ varianssin eli jäännösvarianssin σ 2 harhaton estimaatti on otoksesta laskettu jäännösvarianssi s = jäännöshajonta, s 2 = SSE n 2

20 Mallin parametrien luottamusvälit ja testaus 184 Kertoimien β 0 ja β 1 estimaattorit ˆβ 0 = b 0 ja ˆβ 1 = b 1 ovat satunnaismuuttujia, joiden voidaan osoittaa noudattavan jakaumia b 1 N(β 1, σ 2 /SS xx ) b 0 N(β 0, σ 2 x 2 i /(nss xx)) Korvaamalla σ 2 estimaatillaan s 2 = SSE/(n 2) saadaan hajontaestimaatit s(b 1 ) = s SSxx s(b 0 ) = s x 2 i nss xx 1 = s n + x2 SS xx Voidaan osoittaa, että T = b j β j s(b j ) t(n 2), j = 0, 1

21 Mallin parametrien luottamusvälit ja testaus 185 Luottamusvälit: Parametrien β 0 ja β 1 (1 α)100% luottamusvälit ovat β j = b j ± t 1 α/2 (n 2)s(b j ), j = 0, 1 : H 0 : β j = b H 1 : β j b Missä j = 0 tai 1 ja b testattava lukuarvo, yleensä 0. Testisuure: T = b j b s(b j ) t(n 2) Olkoon testisuureen laskettu arvo t. H 0 hylätään riskitasolla α, jos t > t 1 α/2 (n 2). Yksisuuntaiset hypoteesit vastaavasti, käyttäen toispuoleisista hylkäysrajaa.

22 Tutkitaan vannesahan tehonkulutuksen Y riippuvuutta sahattavan kappaleen paksuudesta x. Havainnot (n = 6): x y x = 48.0 x 2 = y = 22.2 y 2 = xy = SS xy = /6 = 20.7 SS xx = /6 = 60.0 SS yy = /6 = 8.60 Kertoimien pns-estimaatit: b 1 = SS xy /SS xx = 20.7/60 = b 0 = ȳ b 1 x = ( )/6 = SST = SS yy = 8.6 SSD = SS xy /SS xx = SSE = SST SSD =

23 Selitysaste: R 2 = 0.83 Jäännösvarianssi: s 2 = SSE/(n 2) = /4 = s 2 Hajontaestimaatit: s(b 1 ) = = SS xx s 2 x 2 s(b 0 ) = = nss xx 95%:n luottamusvälit, t (4) = β 0 = ± = ± β 1 = ± = ±

24 Testataan riskitasolla α = 0.05 hypoteesiparit H 1) 0 : β 0 = 1 H 1 : β 0 < 1 Testisuureen arvo t = b 0 1 s(b 0 ) = = ) Kriittinen arvo: t 0.95 (4) = Koska t > t 0.95 (4), niin H 0 jää voimaan H 0 : β 1 = 0 H 1 : β 1 0 Testisuureen arvo t = b 1 0 s(b 1 ) = = Kriittinen arvo: t (4) = Koska t > t (4), niin H 0 hylätään

25 Ennusteet ja niiden luottamusvälit 189 Mallin Y = β 0 + β 1 x + ɛ antama ennuste, kun x:llä on kiinteä arvo a, on ŷ = b 0 + b 1 a. 1) Y:n odotusarvon eli regressiosuoran luottamusrajat Y :n odotusarvo,kun x = a, on µ = EY = β 0 + β 1 a ja µ:n piste-estimaatti on ŷ = b 0 + b 1 a = ȳ + b 1 (a x) 1 Ennusteen hajontaestimaatti: s(ŷ) = s n + (a x)2 SS xx Satunnaismuuttuja y µ s(y) t(n 2), josta saadaan (1 α)100% luottamusväli Y : n odotusarvolle µ = β 0 + β 1 a eli regressiosuoran luottamusrajat pisteessä x = a. 1 (a x)2 1 (a x)2 µ = ŷ±t 1 α/2 (n 2)s + = b 0 +b 1 a±t n SS 1 α/2 (n 2)s + xx n SS xx

26 Ennusteet ja niiden luottamusvälit 190 2) Y:n arvon eli yksittäisen ennusteen luottamusrajat Y :n arvon luottamusväli mallin Y = β 0 + β 1 x + ɛ puitteissa perustuu satunnaismuuttujaan Y ŷ = µ ŷ + ɛ Hajontaestimaatti: s(y ŷ) = s n + (a x)2 SS xx Satunnaismuuttuja Y y s(y y) t(n 2), josta saadaan (1 α)100% luottamusväli Y :lle eli yksittäisin ennusteen luottamusrajat pisteessä x = a. µ = ŷ ± t 1 α/2 (n 2)s n + (a x)2 SS xx

27 Regressiomalli 191 Lineaarinen regressiomalli on muotoa Y = β 0 + β 1 x 1 + β 2 x β k x k + ɛ Selittävät muuttujat x j voivat olla havaintoarvoja sellaisinaan, niiden logaritmeja, potensseja tms. funktioita. Satunnaisvirheen ɛ oletetaan noudattavan normaalijakaumaa, jonka odotusarvo on 0 ja varianssi on vakio σ 2

28 Regressiomallin kertoimien estimointi 192 Jos regressiomallin kertoimille annetaan arvot (b 0,..., b k ), voidaan Y :n havaitut arvot lausua y 1 = b 0 + b 1 x b k x 1k + e 1 y 2 = b 0 + b 1 x b k x 2k + e 2. y n = b 0 + b 1 x n b k x nk + e n Sovitettu malli on ŷ = b 0 + b 1 x b k x k ja e i = y i ŷ i ovat havaitut jäännökset eli residuaalit

29 Regressiomallin kertoimien estimointi 193 Otetaan käyttöön seuraavat matriisimerkinnät: 1 x 11 x x 1k 1 x 21 x x 2k X = , Y = 1 x n1 x n2... x nk Yhtälöt voidaan kirjoittaa muotoon Y = X b + ē y 1 y 2. y n, b = b 1 b 2. b n

30 Regressiomallin kertoimien estimointi 194 Kertoimien β j estimaatit määrätään etsimällä yhtälöistä kertoimille b j sellaiset arvot, jotka minivoivat poikkeamien neliösumman eli jäännösneliösumman SSE = ei 2 = (y i ŷ i ) 2 n = (y i b 0 b 1 x i1... b k x ik ) 2 t=1 Minimi löydetään merkitsemällä osittaisderivaatat nolliksi: SSE b j = 0, j = 0,..., k

31 Regressiomallin kertoimien estimointi 195 Ehto tuottaa kertoimien b j määräämiseksi muotoa A x = ū olevan yhtälöryhmän, joka tapauksessa k=2 saa seuraavan muodon n xi1 xi2 b 0 xi1 x 2 yi i1 xi1 x i2 b 1 = xi1 y i xi2 xi1 x i2 x 2 i2 b 2 xi2 y i Matriisimerkinnöin nämä normaaliyhtälöt voidaan ilmaista X X b = X Y Ratkaisuksi saadaan kerroinestimaatit b = ˆβ = (X X ) 1 X Y

32 Satunnaisvaihtelun varianssin estimointi 196 Regressiomallin satunnaisvirheen ɛ varianssille σ 2 voidaan johtaa estimaatti ˆσ 2 = s 2 = SSE n k 1 Jäännösneliösumman SSE lauseke voidaan laskemista varten saattaa muotoon SSE = y 2 i = Y Y b X Y b 0 yi b 1 xi1 y i... b k xik y i

33 Mallin sopivuuden tutkiminen 197 Regressiomallin kykyä selittää havaittuja Y :n arvoja voidaan tutkia vertaamalla jäännösneliösummaa SSE havaittuun Y :n kokonaisvaihtelun neliösummaan SST = (y i ȳ) 2 = y 2 i + 1 n ( y i ) 2 ja selitettyyn neliösummaan SSD = SST SSE Regressiomallin sopivuutta havaintoaineistoon kuvastaa selitysaste R 2 = SSD SST = SST SSE SST

34 Mallin sopivuuden tutkiminen 198 Mallin tilastollista merkitsevyyttä voidaan arvioida testaamalla hypoteeseja H 0 : β 1 = β 2 =... = β k = 0 H 1 : β j 0, joillakin j = 1,..., k SSD/k Testisuure: F = F (k, n k 1) SSE/(n k 1) Jos F > F 1 α (k, n k 1), niin H 0 hylätään riskitasolla α.

35 Regressiokertoimien testaus 199 Saadut regressiokertoimien estimaatit b j = ˆβ j ovat satunnaismuuttujien arvoja. Laskemalla voidaan todeta, että estimaattori b j = ˆβ j noudattaa normaalijakaumaa N(β, σ 2 v jj, missä v jj on matriisin V = (X X ) 1 j:s lävistäjäalkio. Muotoa H 0 : β j = b olevaa hypoteesia voidaan siten testata suureen T = b j b s v jj t(n k 1) avulla. Mikäli hypoteesit on asetettu muotoon H 0 : β j = 0, H 1 : β j 0, hylätään H 0 riskitasolla α, mikäli b j /(s v jj ) > t 1 α/2 (n k 1)

36 Tekstiilitehtaassa tutkittiin kankaan värjäävyyttä Y kun vaihdeltiin värjäysliuoksen lämpötilaa X 1 ja kiuotusaikaa X 2. Värjäävyyttä mitattiin kankaaseen absorboituneen väriaineen määrän mukaan. Mittaustulokset olivat seuraavat: X 1 ( o C) X 2 (min) Y (mg) Sovitetaan aineistoon kahden selittävän muuttujan lineaarista regressiomallia Y = β 0 + β 1 X 1 + β 2 X 2 + ɛ A) Estimoi mallin parametrit (myös jäännösvarianssi). B) Laske mallin selitysaste ja yhteiskorrelaatiokerroin. C) Testaa regression merkitsevyys F-testillä. D) Mikä ennuste imeytyneen väriaineen määrälle, jos liuoksen lämpötila on 95 ja liuotusiaika 25 min?

37 A) Estimoi mallin parametrit (myös jäännösvarianssi). Y = β 0 + β 1 X 1 + β 2 X 2 + ɛ Normaaliyhtälöt X Xb = X Y n = 6 k = 2 X = X X = = Y = xi xi2 n xi1 xi2 x 2 i1 xi1 x i2 xi1 x i2 x 2 i

38 X Y = yi xi1 y i xi2 y i Normaaliyhtälöt Ratkaisu = b 0 b 1 b 2 b = ˆβ = (X X ) 1 (X Y ) = SST = SS yy = y 2 ( y) 2 n = = =

39 SSE = Y Y bx Y = y 2 (b 0 b 1 b 2 ) = = y SSD = b X 2 Y = SST SSE = n Jäännösvarianssi s 2 = SSE n k 1 = = s = 5.44 B)Laske mallin selitysaste ja yhteiskorrelaatiokerroin. Selitysaste R 2 = SSD = SST Yhteiskorrelaatiokerroin R =

40 C) Testaa regression merkitsevyys F-testillä. H 0 : β 1 = β 2 = 0 (Malli ei selitä) H 1 : ainakin toinen β 0 (Malli selittää) Testisuure: SSD/k F = SSE/(n k 1) = / /(6 2 1) = Kriit. arvo tasolla α = 0.05F 0.95 (k, n k 1) = F 0.95 (2, 3) = 9.55 Kriit. arvo tasolla α = 0.01F 0.99 (2, 3) = F > F 0,99 H 0 hylätään : malli selittää merkitsevästi värjäävyyttä Y D) Mikä ennuste imeytyneen väriaineen määrälle, jos liuoksen lämpötila on 95 ja liuotusiaika 25 min? Kun, x 1 = 95 C, x 2 = 25min ennuste ŷ = b 0 + b b 2 25 = mg

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. marraskuuta 2007 Antti Rasila () TodB 30. marraskuuta 2007 1 / 19 1 Lineaarinen regressiomalli ja suurimman uskottavuuden menetelmä Minimin löytäminen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾. 24.11.2006 1. Oletetaan, että kaksiulotteinen satunnaismuuttuja µ noudattaa kaksiulotteista normaalijakaumaa. Oletetaan lisäksi, että satunnaismuuttujan regressiofunktio satunnaismuuttujan suhteen on ݵ

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 6

031021P Tilastomatematiikka (5 op) viikko 6 031021P Tilastomatematiikka (5 op) viikko 6 Jukka Kemppainen Mathematics Division Satunnaismuuttujien välinen riippuvuus Kokeellisen tutkimuksen keskeinen tehtävä on selvittää mitattavien muuttujien välisiä

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 6

031021P Tilastomatematiikka (5 op) viikko 6 031021P Tilastomatematiikka (5 op) viikko 6 Jukka Kemppainen Mathematics Division Odotusarvojen erotuksen testi, hajonnat σ 1 σ 2 tuntemattomia Oletetaan jälleen, että X ja Y ovat normaalijakautuneita.

Lisätiedot

Yleinen lineaarinen malli

Yleinen lineaarinen malli MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 1: 1 Määritelmä ja standardioletukset 2

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Johdatus regressioanalyysiin

Johdatus regressioanalyysiin Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Lauri Viitasaari Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016 Tilastolliset aikasarjat voidaan jakaa kahteen

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 5

031021P Tilastomatematiikka (5 op) viikko 5 031021P Tilastomatematiikka (5 op) viikko 5 Jukka Kemppainen Mathematics Division Hypoteesin testauksesta Tilastollisessa testauksessa on kyse havainnoista tapahtuvasta päätöksenteosta. Kokeellisen tutkimuksen

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

4.0.2 Kuinka hyvä ennuste on?

4.0.2 Kuinka hyvä ennuste on? Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

9. laskuharjoituskierros, vko 12-13, ratkaisut

9. laskuharjoituskierros, vko 12-13, ratkaisut 9. laskuharjoituskierros, vko 12-13, ratkaisut D1. Olkoot X i, i = 1, 2,..., n riippumattomia, samaa eksponenttijakaumaa noudattavia satunnaismuuttujia, joiden odotusarvo E(X i = β, toisin sanoen X i :t

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 5 Tilastollisten hypoteesien testaaminen Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio TKK (c) Ilkka Mellin (2005) 1 Tilastollinen riippuvuus ja korrelaatio Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2005) 1 Johdatus regressioanalyysiin Regressioanalyysin lähtökohdat ja tavoitteet Deterministiset mallit ja regressioanalyysi

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa

Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Erityiskysymyksiä yleisen lineaarisen mallin soveltamisessa TKK (c) Ilkka Mellin (2007) 1 Erityiskysymyksiä yleisen lineaarisen

Lisätiedot

2. Keskiarvojen vartailua

2. Keskiarvojen vartailua 2. Keskiarvojen vartailua Esimerkki 2.1: Oheiset mittaukset liittyvät Portland Sementin sidoslujuuteen (kgf/cm 2 ). Mittaukset y 1 ovat nykyisestä seoksesta ja mittaukset y 2 uudesta seoksesta, jossa lisäaineena

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos

Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos Datan käsittely Helsingin yliopisto, Fysiikan laitos kevät 2013 3. Datan käsittely Luennon sisältö: Havaintovirheet tähtitieteessä Korrelaatio Funktion sovitus Aikasarja-analyysi 3.1 Havaintovirheet Satunnaiset

Lisätiedot

Lohkoasetelmat. Kuusinen/Heliövaara 1

Lohkoasetelmat. Kuusinen/Heliövaara 1 Lohkoasetelmat Kuusinen/Heliövaara 1 Kiusatekijä Kaikissa kokeissa kokeen tuloksiin voi vaikuttaa vaihtelu, joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla on mahdollisesti vaikutusta vastemuuttujan

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Aiheet: Satunnaisvektorit ja moniulotteiset jakaumat Tilastollinen riippuvuus ja lineaarinen korrelaatio Satunnaisvektorit ja moniulotteiset

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

Lohkoasetelmat. Heliövaara 1

Lohkoasetelmat. Heliövaara 1 Lohkoasetelmat Heliövaara 1 Kiusatekijä Kaikissa kokeissa, kokeen tuloksiin voi vaikuttaa vaihtelu joka johtuu kiusatekijästä. Kiusatekijä on tekijä, jolla mahdollisesti on vaikutusta vastemuuttujan arvoon,

Lisätiedot

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen Yhden faktorin malli: n kpl sijoituskohteita, joiden tuotot ovat r i, i =, 2,..., n. Olkoon f satunnaismuuttuja ja oletetaan, että tuotot voidaan selittää yhtälön r i = a i + b i f + e i avulla, missä

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012 Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Vastepintamenetelmä. Kuusinen/Heliövaara 1

Vastepintamenetelmä. Kuusinen/Heliövaara 1 Vastepintamenetelmä Kuusinen/Heliövaara 1 Vastepintamenetelmä Vastepintamenetelmässä pyritään vasteen riippuvuutta siihen vaikuttavista tekijöistä approksimoimaan tekijöiden polynomimuotoisella funktiolla,

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Simuloinnin strategisia kysymyksiä

Simuloinnin strategisia kysymyksiä Simuloinnin strategisia kysymyksiä Timo Tiihonen Tietotekniikan laitos 2010 Simuloinnin strategisia kysymyksiä Miten toimitaan, kun halutaan tietää enemmän kuin yhden simulointimallin tulos. Miten tulos

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004 Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004 Esimerkkien ratkaisut http://mtl.uta.fi/tilasto/tiltp3/kevat2004/kaikki_esimerkit.pdf Raija Leppälä 19. joulukuuta 2003 Sisältö 1

Lisätiedot

031021P Tilastomatematiikka (5 op) viikko 4

031021P Tilastomatematiikka (5 op) viikko 4 031021P Tilastomatematiikka (5 op) viikko 4 Jukka Kemppainen Mathematics Division Tilastollinen aineisto Tilastolliset menetelmät ovat eräs keino tutkia numeerista havaintoaineistoa todennäköisyyslaskentaa

Lisätiedot