Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

Koko: px
Aloita esitys sivulta:

Download "Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1"

Transkriptio

1 Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio TKK (c) Ilkka Mellin (2005) 1

2 Tilastollinen riippuvuus ja korrelaatio Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin korrelaatiokertoimen estimointi ja testaus Järjestyskorrelaatiokertoimet TKK (c) Ilkka Mellin (2005) 2

3 Tilastollinen riippuvuus ja korrelaatio: Mitä opimme? Tarkastelemme tässä luvussa tilastollisia tutkimusasetelmia, joissa on mukana kaksi tai useampia muuttujia. Pyrimme vastaamaan seuraaviin kysymyksiin: Miten kahden (tai useamman) muuttujan samanaikainen tarkastelu vaikuttaa tilastolliseen analyysiin? Miten kahden (tai useamman) muuttujan tilastollista aineistoa kuvataan? Mitä tarkoitetaan kahden muuttujan tilastollisella riippuvuudella ja miten se eroaa eksaktista riippuvuudesta? Mitä tarkoitetaan korrelaatiolla? Mikä on korrelaation ja riippuvuuden suhde? Miten korrelaatio estimoidaan? Miten korrelaatiota koskevia hypoteeseja testataan? TKK (c) Ilkka Mellin (2005) 3

4 Tilastollinen riippuvuus ja korrelaatio: Esitiedot Esitiedot: ks. seuraavia lukuja: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Estimointi Estimointimenetelmät Väliestimointi Tilastolliset testit Testit suhdeasteikollisille muuttujille Tarvitset esitietoja myös seuraavista kalvokokoelman Johdatus todennäköisyyslaskentaan luvuista: Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (2005) 4

5 Tilastollinen riippuvuus ja korrelaatio: Lisätiedot Johdatus regressioanalyysiin esitetään luvussa Johdatus regressioanalyysiin Regressioanalyysia yhden selittäjän lineaarisen regressiomallin tapauksessa käsitellään luvussa Yhden selittäjän lineaarinen regressiomalli Pitemmälle meneviä regressioanalyysin kysymyksiä käsitellään luvuissa Yleinen lineaarinen malli Regressiodiagnostiikka Regressiomallin valinta Regressioanalyysin erityiskysymyksiä TKK (c) Ilkka Mellin (2005) 5

6 Tilastollinen riippuvuus ja korrelaatio >> Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin korrelaatiokertoimen estimointi ja testaus Järjestyskorrelaatiokertoimet TKK (c) Ilkka Mellin (2005) 6

7 Tilastollinen riippuvuus, korrelaatio ja regressio Avainsanat Eksakti riippuvuus Korrelaatio Korrelaatiokerroin Regressioanalyysi Regressiomalli Testit korrelaatiokertoimille Tilastollinen riippuvuus Usean muuttujan havaintoaineiston kuvaaminen TKK (c) Ilkka Mellin (2005) 7

8 Tilastollinen riippuvuus, korrelaatio ja regressio Muuttujien väliset riippuvuudet tilastollisen tutkimuksen kohteena Tieteellisen tutkimuksen tärkeimmät ja mielenkiintoisimmat kysymykset liittyvät tavallisesti tutkimuksen kohteena olevaa ilmiötä kuvaavien muuttujien välisiin riippuvuuksiin. Jos tilastollisen tutkimuksen kohteena olevaan ilmiöön liittyy useampia kuin yksi muuttuja, yhden muuttujan tilastolliset menetelmät antavat tavallisesti vain rajoittuneen kuvan ilmiöstä. Sovellusten kannalta ehkä merkittävin osa tilastotiedettä käsittelee kahden tai useamman muuttujan välisten riippuvuuksien kuvaamista ja mallintamista. TKK (c) Ilkka Mellin (2005) 8

9 Tilastollinen riippuvuus, korrelaatio ja regressio Esimerkkejä riippuvuustarkasteluista Miten työttömyysaste Suomessa (% työvoimasta) riippuu BKT:n (bruttokansantuotteen) kasvuvauhdista Suomessa, Suomen viennin volyymista sekä BKT:n kasvuvauhdista muissa EUmaissa ja USA:ssa? Miten alkoholin kulutus (l per capita vuodessa) riippuu alkoholijuomien hintatasosta, ihmisten käytettävissä olevista tuloista ja alkoholin saatavuudesta? Miten todennäköisyys sairastua keuhkosyöpään (p) riippuu tupakoinnin määrästä ja kestosta? Miten vehnän hehtaarisato (t/ha) riippuu kesän keskilämpötilasta ja sademäärästä sekä maan muokkauksesta, lannoituksesta ja tuholaisten torjunnasta? Miten betonin lujuus (kg/cm 2 ) riippuu sen kuivumisajasta? Miten kemiallisen aineen saanto (%) riippuu valmistusprosessissa käytettävästä lämpötilasta? TKK (c) Ilkka Mellin (2005) 9

10 Tilastollinen riippuvuus, korrelaatio ja regressio Eksakti vs tilastollinen riippuvuus Tarkastelemme tässä esityksessä yksinkertaisuuden vuoksi pääasiassa kahden muuttujan välistä riippuvuutta: (i) Muuttujien välinen riippuvuus on eksaktia, jos toisen arvot voidaan ennustaa tarkasti toisen saamien arvojen perusteella. (ii) Muuttujien välinen riippuvuus on tilastollista, jos niiden välillä ei ole eksaktia riippuvuutta, mutta toisen muuttujan arvoja voidaan käyttää apuna toisen muuttujan arvojen ennustamisessa. TKK (c) Ilkka Mellin (2005) 10

11 Tilastollinen riippuvuus, korrelaatio ja regressio Tilastollinen riippuvuus ja korrelaatio Kahden muuttujan välistä (lineaarista) tilastollista riippuvuutta kutsutaan tilastotieteessä tavallisesti korrelaatioksi. Korrelaation eli (lineaarisen) tilastollisen riippuvuuden voimakkuutta mittaavia tilastollisia tunnuslukuja kutsutaan korrelaatiokertoimiksi. Korrelaatiot muodostavat perustan muuttujien välisten riippuvuuksien ymmärtämiselle. TKK (c) Ilkka Mellin (2005) 11

12 Tilastollinen riippuvuus, korrelaatio ja regressio Tilastollinen riippuvuus ja regressio Vaikka korrelaatiot muodostavat perustan muuttujien välisten riippuvuuksien ymmärtämiselle, riippuvuuksia halutaan tavallisesti analysoida myös tarkemmin. Regressioanalyysi on tilastollinen menetelmä, jossa jonkin, ns. selitettävän muuttujan tilastollista riippuvuutta joistakin toisista, ns. selittävistä muuttujista pyritään mallintamaan regressiomalliksi kutsutulla tilastollisella mallilla; ks. lukua Johdatus regressioanalyysiin. Huomautus: Tässä luvussa rajoitutaan tarkastelemaan korrelaatioiden estimointia ja testaamista. TKK (c) Ilkka Mellin (2005) 12

13 Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen Kuten yhden muuttujan havaintoaineistojen tapauksessa, lähtökohdan kahden tai useamman muuttujan havaintoaineistojen kuvaamiselle muodostaa tutustuminen havaintoarvojen jakaumaan. Havaintoarvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvoihin sisältyvä informaatio sopivaan muotoon: Havaintoarvojen jakaumaa kokonaisuutena voidaan kuvata sopivasti valituilla graafisilla esityksillä. Havaintoarvojen jakauman karakteristisia ominaisuuksia voidaan kuvata sopivasti valituilla otostunnusluvuilla. TKK (c) Ilkka Mellin (2005) 13

14 Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen: Graafiset menetelmät Koska useampi- kuin kaksiulotteisten kuvioiden tekeminen ei ole käytännössä mahdollista, kolmen tai useamman muuttujan havaintoaineistoja havainnollistetaan tavallisesti niin, että muuttujia tarkastellaan pareittain. Kahden järjestys-, välimatka- tai suhdeasteikoillisen muuttujan havaittujen arvojen pareja havainnollistetaan tavallisesti graafisella esityksellä, jota kutsutaan pistediagrammiksi. Huomautus: Monimuuttujamenetelmissä on kehitetty myös sellaisia tilastografiikan menetelmiä, joilla voidaan havainnollistaa useampi- kuin kaksiulotteisia aineistoja. TKK (c) Ilkka Mellin (2005) 14

15 Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen: Tunnusluvut Usean muuttujan havaintoaineistojen karakteristisia ominaisuuksia voidaan kuvata muuttujakohtaisilla otostunnusluvuilla. Muuttujakohtaiset otostunnusluvut eivät kuitenkaan voi antaa informaatiota muuttujien välisistä riippuvuuksista. Muuttujien pareittaisia tilastollisia riippuvuuksia voidaan kuvata sopivasti valitulla korrelaation mitalla. TKK (c) Ilkka Mellin (2005) 15

16 Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen: Korrelaatio Tutkittavien muuttujien mitta-asteikolliset ominaisuudet ohjaavat korrelaation mitan valintaa: Välimatka- ja suhdeasteikollisille muuttujille käytetään tavallisesti Pearsonin korrelaatiokerrointa. Järjestysasteikollisille muuttujille käytetään tavallisesti Spearmanin tai Kendallin järjestyskorrelaatiokerrointa. TKK (c) Ilkka Mellin (2005) 16

17 Tilastollinen riippuvuus, korrelaatio ja regressio Testit korrelaatiolle Satunnaismuuttujien väliseen korrelaatioon voidaan kohdistaa erilaisia tilastollisia testejä. Tässä esityksessä tarkastellaan seuraavia Pearsonin korrelaatiokertoimelle sopivia testejä: Yhden otoksen testi korrelaatiokertoimelle Korrelaatiokertoimien vertailutesti Testi korreloimattomuudelle Tässä esityksessä tarkastellaan seuraavia Spearmanin ja Kendallin järjestyskorrelaatiokertoimille sopivia testejä: Testit korreloimattomuudelle TKK (c) Ilkka Mellin (2005) 17

18 Tilastollinen riippuvuus ja korrelaatio Tilastollinen riippuvuus, korrelaatio ja regressio >> Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin korrelaatiokertoimen estimointi ja testaus Järjestyskorrelaatiokertoimet TKK (c) Ilkka Mellin (2005) 18

19 Kahden muuttujan havaintoaineiston kuvaaminen Avainsanat Aikasarjadiagrammi Aritmeettinen keskiarvo Keskihajonta Korrelaatio Otoskovarianssi Pearsonin otoskorrelaatiokerroin Pistediagrammi Varianssi TKK (c) Ilkka Mellin (2005) 19

20 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi Tarkastellaan tilannetta, jossa tutkimuksen kohteina olevista havaintoyksiköistä on mitattu kahden järjestys-, välimatka-tai suhdeasteikollisen muuttujan x ja y arvot. Muuttujien x ja y arvojen samaan havaintoyksikköön liittyvien parien muodostamaa havaintoaineistoa voidaan kuvata graafisesti pistediagrammilla. Pistediagrammi sopii erityisesti kahden muuttujan välisen riippuvuuden havainnollistamiseen. Pistediagrammi on keskeinen työväline korrelaatio-ja regressioanalyysissa. TKK (c) Ilkka Mellin (2005) 20

21 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: Määritelmä Olkoot x ja yjärjestys-, välimatka-tai suhdeasteikollisia muuttujia, joiden havaitut arvot ovat x 1, x 2,, x n y 1, y 2,, y n Oletetaan lisäksi, että havaintoarvot x i ja y i liittyvät samaan havaintoyksikköön kaikille i = 1, 2,, n. Havaintoarvojen x 1, x 2,, x n ja y 1, y 2,, y n parien pistediagrammi saadaan esittämällä lukuparit (x i, y i ), i = 1, 2,, n pisteinä avaruudessa 2. TKK (c) Ilkka Mellin (2005) 21

22 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: Havainnollistus Kuvio oikealla esittää lukuparien (x i, y i ) ja (x j, y j ) määrittelemien pisteiden esittämistä tasokoordinaatistossa. (x i, y i ) y j y i y (x j, y j ) x x i x j TKK (c) Ilkka Mellin (2005) 22

23 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: 1. esimerkki 1/2 Hooken lain mukaan kierrejousen pituus riippuu lineaarisesti jouseen ripustetusta painosta. Oikealla on tulokset kokeesta, jossa Hooken lain pätevyyttä tutkittiin ripustamalla jouseen 6 erikokoista painoa. Merkitään: (x i, y i ), i = 1, 2, 3, 4, 5, 6 jossa x i = paino i y i = jousen pituus, kun painona on x i Paino (kg) Pituus (cm) TKK (c) Ilkka Mellin (2005) 23

24 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: 1. esimerkki 2/2 Pistediagrammi oikealla havainnollistaa koetuloksia graafisesti. Ovatko havainnot sopusoinnussa Hooken lain kanssa? Vastausta tarkastellaan luvuissa Johdatus regressioanalyysiin ja Yhden selittäjän lineaarinen regressiomalli. Jousen pituus (cm) Kierrejousen pituuden riippuvuus jouseen ripustetusta painosta Paino (kg) TKK (c) Ilkka Mellin (2005) 24

25 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: 2. esimerkki 1/2 Perinnöllisyystieteen mukaan lapset perivät geneettiset ominaisuutensa vanhemmiltaan. Periytyykö isän pituus heidän pojilleen? Havaintoaineisto koostuu 300:n isän ja heidän poikiensa pituuksien muodostamasta lukuparista (x i, y i ), i = 1, 2,, 300 jossa x i = isän i pituus y i = isän i pojan pituus Ks. pistediagrammia oikealla. Pojan pituus (cm) Isien ja poikien pituudet Isän pituus (cm) TKK (c) Ilkka Mellin (2005) 25

26 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: 2. esimerkki 2/2 Yhtä pitkillä isillä näyttää olevan monen mittaisia poikia. Mutta: Lyhyillä isillä näyttää olevan keskimäärin lyhyempiä poikia kuin pitkillä isillä ja pitkillä isillä näyttää olevan keskimäärin pitempiä poikia kuin lyhyillä isillä. Tällaisten tilastollisten riippuvuuksien analysoimista lineaaristen regressiomallien avulla tarkastellaan luvuissa Johdatus regressioanalyysiin ja Yhden selittäjän lineaarinen regressiomalli. Pojan pituus (cm) Isien ja poikien pituudet Isän pituus (cm) TKK (c) Ilkka Mellin (2005) 26

27 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: 3. esimerkki 1/2 Onko keuhkosyöpä yleisempää sellaisissa maissa, joissa tupakoidaan paljon? Oikealla on tiedot savukkeiden kulutuksesta ja keuhkosyövän yleisyydestä 10:ssä maassa. Havaintoaineisto koostuu 10:stä lukuparista (x i, y i ), i = 1, 2,, 10 jossa x i = savukkeiden kulutus maassa i 1930 y i = sairastuvuus keuhkosyöpään maassa i 1950 Maa Savukkeiden kulutus (kpl) per capita 1930 Keuhkosyöpätapausten lkm per 1 milj. henkilöä 1950 Islanti Norja Ruotsi Kanada Tanska Itävalta Hollanti Sveitsi Suomi Englanti TKK (c) Ilkka Mellin (2005) 27

28 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: 3. esimerkki 2/2 Pistediagrammi oikealla havainnollistaa savukkeiden kulutuksen ja keuhkosyövän yleisyyden välistä yhteyttä. Sairastuvuus keuhkosyöpään näyttää olevan keskimäärin korkeampaa sellaisissa maissa, joissa savukkeiden kulutus on ollut keskimääräistä suurempaa. Tällaisten tilastollisten riippuvuuksien analysoimista lineaaristen regressiomallien avulla tarkastellaan luvussa Yhden selittäjän lineaarinen regressiomalli. Keuhkosyöpätapausten lkm per 1 milj. henkilöä Savukkeiden kulutus ja sairastuvuus keuhkosyöpään Sveitsi Hollanti Tanska Itävalta kanada Ruotsi Norja Islanti Englanti Suomi Savukkeiden kulutus (kpl) per capita 1930 TKK (c) Ilkka Mellin (2005) 28

29 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: 4. esimerkki 1/2 Kokeessa tutkittiin betonin vetolujuuden riippuvuutta betonin kuivumisajasta. Havaintoaineisto koostuu 21:stä lukuparista (x i, y i ), i = 1, 2,, 21 jossa x i = betoniharkon i kuivumisaika y i = betoniharkon i vetolujuus Ks. pistediagrammia oikealla. Vetolujuus (kg/cm2) Betonin vetolujuuden riippuvuus kuivumisajasta Kuivumisaika (vrk) TKK (c) Ilkka Mellin (2005) 29

30 Kahden muuttujan havaintoaineiston kuvaaminen Pistediagrammi: 4. esimerkki 2/2 Vetolujuus näyttää riippuvan kuivumisajasta epälineaarisesti Betonin vetolujuuden riippuvuus kuivumisajasta Tässä tapauksessa muuttujien välinen epälineaarinen riippuvuus voidaan kuitenkin linearisoida; ks. lukua Johdatus regressioanalyysiin. Linearisoinnin jälkeen riippuvuutta voidaan analysoida lineaaristen regressiomallien avulla. Vetolujuus (kg/cm2) Kuivumisaika (vrk) TKK (c) Ilkka Mellin (2005) 30

31 Kahden muuttujan havaintoaineiston kuvaaminen Aikasarjadiagrammi: Määritelmä 1/2 Oletetaan, että järjestys-, välimatka-tai suhdeasteikollisen muuttujan x havaitut arvot x 1, x 2,, x n muodostavat aikasarjan. Tällä tarkoitetaan sitä, että havaintoarvot on indeksoitu niin, että indeksit viittaavat peräkkäisiin ajanhetkiin, jolloin havainnot ovat aikajärjestyksessä. TKK (c) Ilkka Mellin (2005) 31

32 Kahden muuttujan havaintoaineiston kuvaaminen Aikasarjadiagrammi: Määritelmä 2/2 Aikasarjadiagrammi on pistediagrammi, jossa lukuparit (t, x t ), t = 1, 2,, n 2 esitetään pisteinä avaruudessa. Tavallisesti peräkkäisiin ajanhetkiin liittyvät pisteet (t 1, x t 1 ), (t, x t ), t = 2, 3,, n yhdistetään aikasarjadiagrammissa toisiinsa janoilla. TKK (c) Ilkka Mellin (2005) 32

33 Kahden muuttujan havaintoaineiston kuvaaminen Aikasarjadigarammi: Havainnollistus Kuvio oikealla esittää aikasarjan x t, t = 1, 2,, n peräkkäisten havaintoarvojen x t+1 x x t (t, x t ) (t+1, x t+1 ) x t 1, x t, x t+1 määrittelemien pisteiden esittämistä tasokoordinaatistossa. x t 1 (t 1, x t 1 ) t 1 t t+1 t TKK (c) Ilkka Mellin (2005) 33

34 Kahden muuttujan havaintoaineiston kuvaaminen Aikasarjadiagrammi: Esimerkki Aikasarjadiagrammi oikealla esittää erään tukkukaupan kkmyynnin arvon vaihtelua. Havaintoaineisto koostuu 144:stä lukuparista (t, x t ) jossa t = aika (1970/1-1981/12) x t = kk-myynnin arvoa kuvaava indeksi (1960/1 = 100) Huomaa, että kk-myynnissä on ollut nouseva trendi ja selvää kausivaihtelua. Myynti (indeksi) Myynti 1970/1-1981/ TKK (c) Ilkka Mellin (2005) 34

35 Kahden muuttujan havaintoaineiston kuvaaminen Tunnusluvut Kahden välimatka- tai suhdeasteikollisen muuttujan havaintoarvojen parien muodostamaa jakaumaa voidaan karakterisoida seuraavilla tunnusluvuilla: Havaintoarvojen keskimääräistä sijaintia kuvataan aritmeettisilla keskiarvoilla. Havaintoarvojen hajaantuneisuutta tai keskittyneisyyttä kuvataan keskihajonnoilla tai (otos-) variansseilla. Havaintoarvojen (lineaarista) riippuvuutta kuvataan otoskovarianssilla ja otoskorrelaatiokertoimella. TKK (c) Ilkka Mellin (2005) 35

36 Kahden muuttujan havaintoaineiston kuvaaminen Havainnot Olkoot ja x 1, x 2,, x n y 1, y 2,, y n välimatka-tai suhdeasteikollisten muuttujien x ja y havaittuja arvoja. Oletetaan lisäksi, että havaintoarvot x i ja y i liittyvät samaan havaintoyksikköön i kaikille i = 1, 2,, n. TKK (c) Ilkka Mellin (2005) 36

37 Kahden muuttujan havaintoaineiston kuvaaminen Aritmeettiset keskiarvot: Määritelmät Havaintoarvojen x 1, x 2,, x n aritmeettinen keskiarvo on x 1 n x1+ x2 + + xn xi n i= 1 n = = Havaintoarvojen y 1, y 2,, y n aritmeettinen keskiarvo on y 1 n y1+ y2 + + yn yi n i= 1 n = = TKK (c) Ilkka Mellin (2005) 37

38 Kahden muuttujan havaintoaineiston kuvaaminen Aritmeettiset keskiarvot: Tulkinnat Havaintoarvojen pareista (x i, y i ), i = 1, 2,, n laskettujen aritmeettisten keskiarvojen x ja y muodostama lukupari ( x, y) on havaintoarvojen parien muodostamien pisteiden painopiste. Havaintoarvojen aritmeettinen keskiarvo kuvaa havaintoarvojen keskimääräistä sijaintia. TKK (c) Ilkka Mellin (2005) 38

39 Kahden muuttujan havaintoaineiston kuvaaminen Varianssit: Määritelmät Havaintoarvojen x 1, x 2,, x n (otos-) varianssi on n 2 1 s ( ) 2 x = xi x n 1 i= 1 jossa x on x-havaintoarvojen aritmeettinen keskiarvo. Havaintoarvojen y 1, y 2,, y n (otos-) varianssi on n 2 1 s ( ) 2 y = yi y n 1 i= 1 jossa y on y-havaintoarvojen aritmeettinen keskiarvo. Havaintoarvojen varianssi mittaa havaintoarvojen hajaantuneisuutta tai keskittyneisyyttä havaintoarvojen aritmeettisen keskiarvon suhteen. TKK (c) Ilkka Mellin (2005) 39

40 Kahden muuttujan havaintoaineiston kuvaaminen Keskihajonnat: Määritelmät Havaintoarvojen x 1, x 2,, x n keskihajonta on n 1 s ( ) 2 x = xi x n 1 i= 1 jossa x on x-havaintoarvojen aritmeettinen keskiarvo. Havaintoarvojen y 1, y 2,, y n keskihajonta on n 1 s ( ) 2 y = yi y n 1 i= 1 jossa y on y-havaintoarvojen aritmeettinen keskiarvo. Havaintoarvojen keskihajonta mittaa havaintoarvojen hajaantuneisuutta tai keskittyneisyyttä havaintoarvojen aritmeettisen keskiarvon suhteen. TKK (c) Ilkka Mellin (2005) 40

41 Kahden muuttujan havaintoaineiston kuvaaminen Otoskovarianssi: Määritelmä Havaintoarvojen pareista (x i, y i ), i = 1, 2,, n laskettu otoskovarianssi on n 1 sxy = ( xi x)( yi y) n 1 i= 1 jossa x = x-havaintoarvojen aritmeettinen keskiarvo y = y-havaintoarvojen aritmeettinen keskiarvo Huomaa, että x-ja y-havaintoarvojen otoskovarianssit niiden itsensä kanssa ovat niiden variansseja: 2 s = s s xx yy = s x 2 y TKK (c) Ilkka Mellin (2005) 41

42 Kahden muuttujan havaintoaineiston kuvaaminen Otoskovarianssi: Merkin määräytyminen 1/4 Otoskovarianssin s xy merkin määrää summalauseke (1) ( xi x)( yi y) Summalausekkeen (1) i. termin ( xi x)( yi y) itseisarvo xi x yi y on sellaisen suorakaiteen pinta-ala, jonka sivujen pituudet ovat ja xi yi x y TKK (c) Ilkka Mellin (2005) 42

43 Kahden muuttujan havaintoaineiston kuvaaminen Otoskovarianssi: Merkin määräytyminen 2/4 Summalausekkeen (1) i. termin ( xi x)( yi y) merkki määräytyy seuraavalla tavalla: jos xi x ja yi y ( xi x)( yi y) 0 jos xi x ja yi y jos xi x ja yi y ( xi x)( yi y) 0 jos xi x ja yi y Merkin määräytymistä voidaan havainnollistaa geometrisesti seuraavalla tavalla (ks. kuviota seuraavalla kalvolla): (i) Jaetaan xy-taso neljään osaan eli neljännekseen pisteen ( x, y) kautta piirretyillä koordinaattiakseleiden suuntaisilla suorilla. (ii) Termin ( xi x)( yi y) merkin määrää se, mihin neljännekseen havaintopiste (x i, y i ) sijoittuu. TKK (c) Ilkka Mellin (2005) 43

44 Kahden muuttujan havaintoaineiston kuvaaminen Otoskovarianssi: Merkin määräytyminen 3/4 ( x x)( y y) 0 ( x x)( y y) 0 i i i i ( xi, y ) i ( xi, yi) ( x, y) ( x, y ) ( x, y ) i i i i ( x x)( y y) 0 ( x x)( y y) 0 i i i i TKK (c) Ilkka Mellin (2005) 44

45 Kahden muuttujan havaintoaineiston kuvaaminen Otoskovarianssi: Merkin määräytyminen 4/4 Jos positiiviset termit summalausekkeeseen (1) ( xi x)( yi y) tuottavien suorakaiteiden yhteenlaskettu pinta-ala on suurempi (pienempi) kuin negatiiviset termit tuottavien suorakaiteiden yhteenlaskettu pinta-ala, otoskovarianssin s xy merkki on positiivinen (negatiivinen). Siten otoskovarianssilla on taipumus saada positiivisia (negatiivisia) arvoja, jos havaintopisteiden muodostama pistepilvi tai -parvi näyttää nousevalta (laskevalta) oikealle mentäessä; ks. pistediagrammin ilmeen ja Pearsonin otoskorrelaatiokertoimen yhteyttä kuvaavia havainnollistuksia tässä kappaleessa. TKK (c) Ilkka Mellin (2005) 45

46 Kahden muuttujan havaintoaineiston kuvaaminen Otoskovarianssi: Tulkinta Havaintoarvojen pareista (x i, y i ), i = 1, 2,, n laskettu otoskovarianssi s xy mittaa x-ja y-havaintoarvojen yhteisvaihtelua niiden aritmeettisten keskiarvojen ympärillä. Mitä suurempi on otoskovarianssin s xy itseisarvo s xy sitä voimakkaampaa on x-ja y-havaintoarvojen yhteisvaihtelu. TKK (c) Ilkka Mellin (2005) 46

47 Kahden muuttujan havaintoaineiston kuvaaminen Otoskovarianssi ja Pearsonin otoskorrelaatiokerroin Otoskovarianssin s xy avulla voidaan määritellä x-ja y- havaintoarvojen lineaarisen tilastollisen riippuvuuden voimakkuuden mittari, jota kutsutaan Pearsonin otoskorrelaatiokertoimeksi. Pearsonin otoskorrelaatiokerroin r xy saadaan otoskovarianssista s xy normeerausoperaatiolla, jossa x-ja y- havaintoarvojen otoskovarianssi s xy jaetaan x-ja y- havaintoarvojen keskihajonnoilla s x ja s y. TKK (c) Ilkka Mellin (2005) 47

48 Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin otoskorrelaatiokerroin: Määritelmä 1/2 Havaintoarvojen pareista (x i, y i ), i = 1, 2,, n laskettu Pearsonin otoskorrelaatiokerroin on sxy rxy = ss jossa s xy = x-ja y-havaintoarvojen otoskovarianssi s x s y x y = x-havaintoarvojen keskihajonta = y-havaintoarvojen keskihajonta TKK (c) Ilkka Mellin (2005) 48

49 Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin otoskorrelaatiokerroin: Määritelmä 2/2 Havaintoarvojen pareista (x i, y i ), i = 1, 2,, n laskettu Pearsonin otoskorrelaatiokerroin voidaan kirjoittaa myös muotoon r xy = n ( x x)( y y) i i i= 1 n n 2 2 ( xi x) ( yi y) i= 1 i= 1 jossa x = x-havaintoarvojen aritmeettinen keskiarvo y = y-havaintoarvojen aritmeettinen keskiarvo TKK (c) Ilkka Mellin (2005) 49

50 Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin otoskorrelaatiokerroin: Ominaisuuksia Havaintoarvojen pareista (x i, y i ), i = 1, 2,, n lasketulla Pearsonin otoskorrelaatiokertoimella r xy on seuraavat ominaisuudet: (i) 1 r + 1 (ii) r xy xy =± 1, jos ja vain jos y i = α + βx i jossa α ja β ovat reaalisia vakiota ja β 0. (iii) Korrelaatiokertoimella rxy ja kovarianssilla s on aina sama merkki. xy TKK (c) Ilkka Mellin (2005) 50

51 Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin otoskorrelaatiokerroin: Tulkinta Havaintoarvojen pareista (x i, y i ), i = 1, 2,, n laskettu Pearsonin otoskorrelaatiokerroin r xy mittaa x- ja y-havaintoarvojen lineaarisen tilastollisen riippuvuuden voimakkuutta. Jos r xy = ±1, niin x-ja y-havaintoarvojen välillä on eksakti eli funktionaalinen lineaarinen riippuvuus, mikä merkitsee sitä, että kaikki havaintopisteet (x i, y i ) asettuvat samalle suoralle. Jos r xy = 0, niin x-ja y-havaintoarvojen välillä ei voi olla eksaktia lineaarista riippuvuutta. Vaikka r xy = 0, x-ja y-havaintoarvojen välillä saattaa silti olla jopa eksakti epälineaarinen riippuvuus. TKK (c) Ilkka Mellin (2005) 51

52 Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin otoskorrelaatiokerroin: Havainnollistus Kuviot alla havainnollistavat kahden muuttujan havaittujen arvojen (n = 30) pistediagrammin ilmeen ja korrelaation välistä yhteyttä. r xy = 0.81 r xy = 0.62 r xy = 0.48 r xy = 0.43 r xy = 0.83 r xy = 1 TKK (c) Ilkka Mellin (2005) 52

53 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen 1/4 Oletetaan, että haluamme laskea havaintoarvojen pareista (x i, y i ), i = 1, 2,, n seuraavat otostunnusluvut käsin tai käyttämällä laskinta: (i) Aritmeettiset keskiarvot: x, y 2 2 (ii) Varianssit: sx, sy (iii) Keskihajonnat: sx, sy (iv) Kovarianssi: s xy (v) Korrelaaatio: r xy Tällöin tarvittavat laskutoimitukset on mukavinta järjestää seuraavalla kalvolla esitettävän kaavion muotoon. TKK (c) Ilkka Mellin (2005) 53

54 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen 2/4 Määrätään ensin havaintoarvojen summat, neliösummat ja tulosumma: i x y x y x y 1 2 x x y y x x y y x y x y n x y x y x y Summa 2 2 i i i i i i n n 2 2 n n n n n n n 2 2 i i xi yi i= 1 i= 1 i= 1 i= 1 i= 1 x y x y n i n i TKK (c) Ilkka Mellin (2005) 54

55 TKK (c) Ilkka Mellin (2005) 55 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen 3/4 Havaintoarvojen aritmeettiset keskiarvot, varianssit ja kovarianssi saadaan havaintoarvojen summista, neliösummista ja tulosummasta alla esitetyillä kaavoilla: n i i n i i x y xy n n i i i i n n i i i i n n n i i i i i i i x x s n n n y s n n n xy x y x y n y s n x y = = = = = = = = = = = = = =

56 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen 4/4 Havaintoarvojen keskihajonnat ja Pearsonin otoskorrelaatiokerroin saadaan havaintoarvojen variansseista ja kovarianssista alla esitetyillä kaavoilla: s s r x y xy = = = s s s x 2 x 2 y xy ss y TKK (c) Ilkka Mellin (2005) 56

57 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen: Havainnollistava esimerkki 1/5 Taulukossa oikealla on keinotekoisen kahden muuttujan aineiston havaintoarvot (n = 6). Aineistoa kuvaava pistediagrammi on oikealla alhaalla. i x y Pistediagrammi 8 6 y x TKK (c) Ilkka Mellin (2005) 57

58 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen: Havainnollistava esimerkki 2/5 Alla olevassa taulukossa on laskettu muuttujien x ja y havaittujen arvojen summat, neliösummat ja tulosumma. i x y x 2 y 2 xy Summa Muuttujien x ja y havaittujen arvojen aritmeettiset keskiarvot, otosvarianssit, keskihajonnat, otoskovarianssi ja otoskorrelaatio voidaan laskea näistä viidestä summasta; ks. seuraavaa kalvoa. TKK (c) Ilkka Mellin (2005) 58

59 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen: Havainnollistava esimerkki 3/5 Keskiarvot, otosvarianssit ja otoskovarianssi: n 1 1 x = xi = 29 = n i= n n sx = xi xi = = n 1 i 1 n = i= n 1 1 y = yi = 32 = n i= 1 6 n n sy = yi yi = = n 1 i= 1 n i= n n n sxy = xi yi n 1 xi yi i= 1 n = i= 1 i= = TKK (c) Ilkka Mellin (2005) 59

60 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen: Havainnollistava esimerkki 4/5 Otoskeskihajonnat ja otoskorrelaatio: s s r x y xy = s = = x = s = = y sxy = = = ss x y TKK (c) Ilkka Mellin (2005) 60

61 Kahden muuttujan havaintoaineiston kuvaaminen Tunnuslukujen laskeminen: Havainnollistava esimerkki 5/5 Kuvioon oikealla on lisätty havaintopisteiden painopiste ( x, y ) = (4.833,5.333) 10 8 II Pistediagrammi I Lisäksi kuvioon on piirretty painopisteen kautta kulkevat koordinaattiakseleiden suuntaiset suorat sekä kovarianssin ja korrelaation merkin määräytymistä havainnollistavat suorakaiteet. Kovarianssi (ja siten myös korrelaatio) on positiivinen, koska I ja III neljänneksen suorakaiteiden yhteenlaskettu pinta-ala on suurempi kuin II ja IV neljänneksen suorakaiteiden yhteenlaskettu pinta-ala; ks. tässä kappaleessa esitettyä selitystä kovarianssin merkin määräytymisestä. y III ( x, y) IV x TKK (c) Ilkka Mellin (2005) 61

62 Tilastollinen riippuvuus ja korrelaatio Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen >> Pearsonin korrelaatiokertoimen estimointi ja testaus Järjestyskorrelaatiokertoimet TKK (c) Ilkka Mellin (2005) 62

63 Pearsonin korrelaatiokertoimen estimointi ja testaus Avainsanat Fisherin z-muunnos Korrelaatio Korrelaatiokertoimen testaaminen Korrelaatiokertoimien vertailutesti Korreloimattomuuden testaaminen Pearsonin korrelaatiokerroin Pearsonin korrelaatiokertoimen estimointi Pearsonin korrelaatiokertoimen luottamusväli Pearsonin otoskorrelaatiokerroin TKK (c) Ilkka Mellin (2005) 63

64 Pearsonin korrelaatiokertoimen estimointi ja testaus Korrelaation estimointi ja testaus Tarkastellaan välimatka-tai suhdeasteikollisten satunnaismuuttujien X ja Y Pearsonin (tulomomentti-) korrelaatiokertoimen ρ XY estimointia sekä seuraavia testejä korrelaatiokertoimelle ρ XY : Yhden otoksen testi korrelaatiokertoimelle Korrelaatiokertoimien vertailutesti Korreloimattomuuden testaaminen Lisätietoja moniulotteisista satunnaismuuttujista ja jakaumista: Ks. kalvokokoelman Johdatus todennäköisyyslaskentaan lukuja Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat ja Moniulotteisia jakaumia. TKK (c) Ilkka Mellin (2005) 64

65 Pearsonin korrelaatiokertoimen estimointi ja testaus Satunnaismuuttujien kovarianssi ja korrelaatio 1/2 Olkoon (X, Y) satunnaismuuttujien X ja Y muodostama järjestetty pari. Olkoot µ X = E( X ) µ Y = E( Y ) satunnaismuuttujien X ja Y odotusarvot ja σ = Var( X) = D ( X) = E[( X µ ) ] X X σ Y = Var( Y) = D ( Y) = E[( Y µ Y) ] satunnaismuuttujien X ja Y varianssit. TKK (c) Ilkka Mellin (2005) 65

66 Pearsonin korrelaatiokertoimen estimointi ja testaus Satunnaismuuttujien kovarianssi ja korrelaatio 2/2 Määritellään satunnaismuuttujien X ja Y kovarianssi σ XY kaavalla σ XY = Cov( X, Y) = E[( X µ X )( Y µ Y )] Määritellään satunnaismuuttujien X ja Y korrelaatio ρ XY kaavalla σ XY ρ XY = Cor( XY, ) = σ XσY jossa 2 σ = D( X ) = σ σ X Y = D( Y ) = σ 2 Y X TKK (c) Ilkka Mellin (2005) 66

67 Pearsonin korrelaatiokertoimen estimointi ja testaus Satunnaismuuttujien korrelaatio Satunnaismuuttujien X ja Y korrelaatiota ρ XY = Cor(X, Y) kutsutaan tavallisesti Pearsonin (tulomomentti-) korrelaatiokertoimeksi. Pearsonin korrelaatiokerroin ρ XY mittaa satunnaismuuttujien X ja Y lineaarisen riippuvuuden voimakkuutta. TKK (c) Ilkka Mellin (2005) 67

68 Pearsonin korrelaatiokertoimen estimointi ja testaus Pearsonin korrelaatiokertoimen estimointi 1/3 Oletetaan, että satunnaismuuttujien X ja Y muodostama järjestetty pari (X, Y) noudattaa 2-ulotteista normaalijakaumaa N 2 (µ X, µ Y, σ X2, σ Y2, ρ XY ), jossa µ X = E( X ) µ Y = E( Y ) 2 2 σ X = Var( X ) σ Y = Var( Y ) ρ XY = Cor( XY, ) Olkoon ( X i, Yi), i = 1,2,, n riippumaton satunnaisotos satunnaismuuttujien X ja Y muodostaman parin (X, Y) jakaumasta. TKK (c) Ilkka Mellin (2005) 68

69 Pearsonin korrelaatiokertoimen estimointi ja testaus Pearsonin korrelaatiokertoimen estimointi 2/3 Olkoot n n 1 1 X = X Y = Y i i n i= 1 n i= 1 n n X = ( i ) Y = ( i ) n 1 i= 1 n 1 i= 1 n s X X s Y Y 1 s = ( X X)( Y Y) XY i i n 1 i= 1 sxy rxy = sxsy tavanomaiset havaintoarvojen pareista lasketut otostunnusluvut. TKK (c) Ilkka Mellin (2005) 69 ( X, Y), i = 1,2,, n i i

70 Pearsonin korrelaatiokertoimen estimointi ja testaus Pearsonin korrelaatiokertoimen estimointi 3/3 Satunnaismuuttujien X ja Y Pearsonin (tulomomentti-) korrelaatiokerroin σ XY ρ XY = Cor( XY, ) = σ σ voidaan estimoida vastaavalla Pearsonin otoskorrelaatiokertoimella sxy rxy = s s Huomautus: X Y X Y Estimaattori r XY voidaan johtaa sekä momenttimenetelmällä että suurimman uskottavuuden menetelmällä. TKK (c) Ilkka Mellin (2005) 70

71 Pearsonin korrelaatiokertoimen estimointi ja testaus Fisherin z-muunnos Määritellään Fisherin z-muunnos kaavalla 1 1+ u z = f( u) = log 2 1 u Fisherinz-muunnosta soveltamalla luottamusvälit ja testit Pearsonin tulomomenttikorrelaatiokertoimelle ρ XY voidaan konstruoida samanlaisella tekniikalla kuin luottamusvälit ja testit konstruoidaan normaalijakauman odotusarvolle; ks. lukuja Väliestimointi ja Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 71

72 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Oletukset Oletetaan, että satunnaismuuttujien X ja Y muodostama järjestetty pari (X, Y) noudattaa 2-ulotteista normaalijakaumaa N 2 (µ X, µ Y, σ X2, σ Y2, ρ XY ), jossa µ = E( X ) µ = E( Y ) σ X = Var( X ) σ = Var( Y ) 2 2 X Y ρ XY = Cor( XY, ) Olkoon ( X i, Yi), i = 1,2,, n riippumaton satunnaisotos satunnaismuuttujien X ja Y muodostaman parin (X, Y) jakaumasta. Y TKK (c) Ilkka Mellin (2005) 72

73 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Parametrien estimointi Estimoidaan 2-ulotteisen normaalijakauman parametrit tavanomaisilla estimaattoreillaan: n n 1 1 X = X Y = Y i i n i= 1 n i= 1 n n X = ( i ) Y = ( i ) n 1 i= 1 n 1 i= 1 n s X X s Y Y 1 s = ( X X)( Y Y) r XY i i n 1 i= 1 XY = sxy s s X Y TKK (c) Ilkka Mellin (2005) 73

74 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Fisherin z-muunnos 1/2 Sovelletaan Fisherin z-muunnosta z = f (u) otoskorrelaatiokertoimeen r XY : 1 1+ rxy z = f( rxy ) = log 2 1 r XY Voidaan osoittaa, että satunnaismuuttuja z noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa: 2 z a N( µ z, σ z) jossa 1 1+ ρ XY 2 1 µ z = log ja σz = 2 1 ρ XY n 3 Approksimaatio on käytännössä riittävän hyvä, kun n > 25. TKK (c) Ilkka Mellin (2005) 74

75 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Fisherin z-muunnos 2/2 Pearsonin korrelaatiokertoimelle ρ XY voidaan konstruoida approksimatiivinen luottamusväli Fisherin z-muunnoksen avulla. Olkoon 1 1+ ρ XY 2 1 µ z = log ja σz = 2 1 ρ XY n 3 Tällöin standardoitu satunnaismuuttuja z µ z v = σ z noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0,1): v a N(0,1) TKK (c) Ilkka Mellin (2005) 75

76 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Luottamustaso Määrätään approksimatiivinen luottamusväli Pearsonin korrelaatiokertoimelle ρ XY. Valitaan luottamustasoksi 1 α Luottamustason valinta kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää korrelaatiokertoimen ρ XY oikean arvon. TKK (c) Ilkka Mellin (2005) 76

77 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Luottamuskertoimet 1/2 Olkoon luottamustasona (1 α). Valitaan luottamuskerroin eli piste +z α/2 siten, että se erottaa standardoidun normaalijakauman N(0, 1) oikealle hännälle todennäköisyysmassan α/2. Koska normaalijakauma on symmetrinen, luottamuskerroin eli piste z α/2 erottaa standardoidun normaalijakauman vasemmalle hännälle todennäköisyysmassan α/2. TKK (c) Ilkka Mellin (2005) 77

78 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Luottamuskertoimet 2/2 Siten luottamuskertoimet +z α/2 ja z α/2 valitaan siten, että α Pr( z + zα /2) = 2 α Pr( z zα /2) = 2 jossa satunnaismuuttuja z noudattaa standardoitua normaalijakaumaa: z N(0,1) Huomaa, että Pr( z z + z ) = 1 α/2 α/2 α TKK (c) Ilkka Mellin (2005) 78

79 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Parametrin µ z luottamusväli 1/2 Parametrin 1 1+ ρ log XY µ z = 2 1 ρ XY approksimatiivinen luottamusväli luottamustasolla (1 α) on edellä esitetyn nojalla muotoa 1 1 z zα/2, z+ zα/2 n 3 n 3 TKK (c) Ilkka Mellin (2005) 79

80 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Parametrin µ z luottamusväli 2/2 Parametrin µ z approksimatiivisen luottamusvälin 1 1 z zα/2, z+ zα/2 n 3 n 3 kaavassa 1 1+ rxy z = f( rxy ) = log 2 1 r XY n = havaintojen lukumäärä z α/2, +z α/2 = luottamustasoon (1 α) liittyvät luottamuskertoimet standardoidusta normaalijakaumasta N(0, 1) TKK (c) Ilkka Mellin (2005) 80

81 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Parametrin µ z luottamusvälin tulkinta Parametrin µ z approksimatiivisen luottamusvälin 1 1 z zα/2, z+ zα/2 n 3 n 3 konstruktiosta seuraa, että 1 1 Prz zα/2 µ z z+ zα/2 = a1 α n 3 n 3 Siten konstruoitu luottamusväli peittää parametrin µ z oikean arvon approksimatiivisesti todennäköisyydellä (1 α)ja se ei peitä parametrin µ z oikeata arvoa approksimatiivisesti todennäköisyydellä α. TKK (c) Ilkka Mellin (2005) 81

82 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Korrelaatiokertoimen ρ XY luottamusväli 1/2 Pearsonin korrelaatiokertoimen ρ XY approksimatiivinen luottamusväli saadaan parametrin µ z luottamusvälistä ratkaisemalla ρ XY epäyhtälöketjusta rxy 1 z zα/2 = log zα/2 n rxy n ρ log XY µ z = 2 1 ρ XY rxy 1 z + zα/2 = log + zα/2 n r n 3 XY TKK (c) Ilkka Mellin (2005) 82

83 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Korrelaatiokertoimen ρ XY luottamusväli 2/2 Pearsonin korrelaatiokertoimen ρ XY approksimatiiviseksi luottamusväliksi saadaan (lb, ub) jossa (1 + rxy ) (1 rxy ) exp + 2zα /2 n 3 lb = (1 + rxy ) + (1 rxy ) exp + 2zα /2 n 3 on luottamusvälin alaraja ja (1 + rxy ) (1 rxy ) exp 2zα /2 n 3 ub = (1 + rxy ) + (1 rxy ) exp 2zα /2 n 3 on luottamusvälin yläraja. ( ) ( ) ( ) ( ) TKK (c) Ilkka Mellin (2005) 83

84 Pearsonin korrelaatiokertoimen estimointi ja testaus Luottamusväli Pearsonin korrelaatiokertoimelle: Korrelaatiokertoimen ρ XY luottamusvälin tulkinta Pearsonin korrelaatiokertoimen ρ XY approksimatiivisen luottamusvälin (lb, ub) konstruktiosta seuraa, että Pr( lb ρ XY ub) = a 1 α Siten konstruoitu luottamusväli peittää korrelaatiokertoimen ρ XY oikean arvon approksimatiivisesti todennäköisyydellä (1 α)ja se ei peitä korrelaatiokertoimen ρ XY oikeata arvoa approksimatiivisesti todennäköisyydellä α. TKK (c) Ilkka Mellin (2005) 84

85 Pearsonin korrelaatiokertoimen estimointi ja testaus Yhden otoksen testi korrelaatiokertoimelle: Testausasetelma Tarkastellaan yhden otoksen testiä Pearsonin korrelaatiokertoimelle. Fisherinz-muunnoksen avulla testi voidaan pukea tavanomaisen t-testin muotoon. TKK (c) Ilkka Mellin (2005) 85

86 Pearsonin korrelaatiokertoimen estimointi ja testaus Yhden otoksen testi korrelaatiokertoimelle: Yleinen hypoteesi Yleinen hypoteesi H : (i) Oletetaan, että satunnaismuuttujien X ja Y muodostama järjestetty pari (X, Y) noudattaa 2- ulotteista normaalijakaumaa, jonka parametrit ovat µ = E( X ) µ = E( Y ) σ X = Var( X ) σ = Var( Y ) 2 2 X Y ρ XY = Cor( XY, ) (ii) Olkoon ( X i, Yi), i = 1,2,, n riippumaton satunnaisotos satunnaismuuttujien X ja Y muodostaman parin (X, Y) jakaumasta. Y TKK (c) Ilkka Mellin (2005) 86

87 Pearsonin korrelaatiokertoimen estimointi ja testaus Yhden otoksen testi korrelaatiokertoimelle: Nollahypoteesi ja vaihtoehtoinen hypoteesi Nollahypoteesi H 0 : H 0 : ρxy = ρ0 Vaihtoehtoinen hypoteesi H 1 : H: 1 ρxy > ρ0 1-suuntaiset vaihtoehtoiset hypoteesit H: 1 ρxy < ρ0 H : ρ ρ 2-suuntainen vaihtoehtoinen hypoteesi 1 XY 0 TKK (c) Ilkka Mellin (2005) 87

88 Pearsonin korrelaatiokertoimen estimointi ja testaus Yhden otoksen testi korrelaatiokertoimelle: Parametrien estimointi Estimoidaan 2-ulotteisen normaalijakauman parametrit tavanomaisilla estimaattoreillaan: n n 1 1 X = X Y = Y n n i i i= 1 i= 1 n n X = ( i ) Y = ( i ) n 1 i= 1 n 1 i= 1 n s X X s Y Y 1 sxy = ( Xi X)( Yi Y) n 1 i= 1 sxy rxy = s s X Y TKK (c) Ilkka Mellin (2005) 88

89 Pearsonin korrelaatiokertoimen estimointi ja testaus Yhden otoksen testi korrelaatiokertoimelle: Fisherin z-muunnos 1/2 Sovelletaan Fisherin z-muunnosta z = f (u) otoskorrelaatiokertoimeen r XY : 1 1+ rxy z = f( rxy ) = log 2 1 r XY Satunnaismuuttuja z noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa: 2 z a N( µ z, σ z) jossa 1 1+ ρ XY 2 1 µ z = log ja σz = 2 1 ρ XY n 3 Approksimaatio on riittävän hyvä, kun n > 25. TKK (c) Ilkka Mellin (2005) 89

90 Pearsonin korrelaatiokertoimen estimointi ja testaus Yhden otoksen testi korrelaatiokertoimelle: Fisherin z-muunnos 2/2 Testi nollahypoteesille H 0 : ρxy = ρ0 voidaan perustaa Fisherin z-muunnoksen käyttöön. Jos nollahypoteesi H 0 pätee, 1 1+ ρ 0 0 E( z) = log = µ z 2 1 ρ0 Siten satunnaismuuttuja 0 z µ z v = σ z noudattaa nollahypoteesin H 0 pätiessä suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa. TKK (c) Ilkka Mellin (2005) 90

91 Pearsonin korrelaatiokertoimen estimointi ja testaus Yhden otoksen testi korrelaatiokertoimelle: Testisuure ja sen jakauma Määritellään testisuure 1 1+ rxy 1 1+ ρ0 log log 2 1 r 2 XY 1 ρ 0 v = 1 n 3 Jos nollahypoteesi H 0: ρxy = ρ0 pätee, testisuure v noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa: v a N(0,1) TKK (c) Ilkka Mellin (2005) 91

92 Pearsonin korrelaatiokertoimen estimointi ja testaus Yhden otoksen testi korrelaatiokertoimelle: Testi Testisuureen v normaaliarvo = 0, koska nollahypoteesin H 0: ρxy = ρ0 pätiessä E(v) = 0 Siten itseisarvoltaan suuret testisuureen v arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (2005) 92

93 Pearsonin korrelaatiokertoimen estimointi ja testaus Korrelaatiokertoimien vertailutesti: Testausasetelma Tarkastellaan vertailutestiä Pearsonin korrelaatiokertoimille. Fisherinz-muunnoksen avulla testi voidaan pukea tavanomaisen riippumattomien otosten t-testin muotoon. TKK (c) Ilkka Mellin (2005) 93

94 Pearsonin korrelaatiokertoimen estimointi ja testaus Korrelaatiokertoimien vertailutesti: Hypoteesit Yleinen hypoteesi H : Oletetaan, että käytössä on kaksi toisistaan riippumatonta yksinkertaista satunnaisotosta perusjoukoista, jotka noudattavat 2-ulotteisia normaalijakaumia, joiden korrelaatiokertoimet ovat ρ 1 ja ρ 2. Nollahypoteesi H 0 : H 0 : ρ 1 = ρ 2 = ρ 0 Vaihtoehtoinen hypoteesi H 1 : H: 1 ρ1 > ρ2 1-suuntaiset vaihtoehtoiset hypoteesit H: 1 ρ1 < ρ2 H : ρ ρ 2-suuntainen vaihtoehtoinen hypoteesi TKK (c) Ilkka Mellin (2005) 94

95 Pearsonin korrelaatiokertoimen estimointi ja testaus Korrelaatiokertoimien vertailutesti: Parametrien estimointi Olkoot n 1 ja n 2 otoskoot otoksista 1 ja 2. Olkoot r 1 ja r 2 otoksista 1 ja 2 lasketut Pearsonin otoskorrelaatiokertoimet. TKK (c) Ilkka Mellin (2005) 95

96 Pearsonin korrelaatiokertoimen estimointi ja testaus Korrelaatiokertoimien vertailutesti: Fisherin z-muunnokset Olkoon 1 1+ rk zk = f( rk) = log 2 1 r k Fisherin z-muunnos otoksesta k lasketulle otoskorrelaatiokertoimelle r k, k = 1, 2. Jos nollahypoteesi H 0 : ρ 1 = ρ 2 = ρ 0 pätee, satunnaismuuttuja z k, k = 1, 2 noudattaa suurissa otoksissa 0 2 approksimatiivisesti normaalijakaumaa N( µ z, σ k), jossa ρ µ z = log ja σk = 2 1 ρ0 n k 3 Approksimaatio on riittävän hyvä, kun n 1 > 25 ja n 2 > 25. TKK (c) Ilkka Mellin (2005) 96

97 Pearsonin korrelaatiokertoimen estimointi ja testaus Korrelaatiokertoimien vertailutesti: Testisuure ja sen jakauma 1/2 Koska satunnaismuuttujat z 1 ja z 2 ovat riippumattomia, satunnaismuuttuja z1 z2 v = n 3 n noudattaa nollahypoteesin H 0 : ρ 1 = ρ 2 = ρ 0 pätiessä suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa: v ~ N(0,1) a TKK (c) Ilkka Mellin (2005) 97

98 Pearsonin korrelaatiokertoimen estimointi ja testaus Korrelaatiokertoimien vertailutesti: Testisuure ja sen jakauma 2/2 Määritellään testisuure 1 1+ r r2 log log 2 1 r r 2 v = n1 3 n2 3 Jos nollahypoteesi H 0 : ρ 1 = ρ 2 = ρ 0 pätee, testisuure v noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa: v a N(0,1) TKK (c) Ilkka Mellin (2005) 98

99 Pearsonin korrelaatiokertoimen estimointi ja testaus Korrelaatiokertoimien vertailutesti: Testi Testisuureen v normaaliarvo = 0, koska nollahypoteesin H 0 : ρ 1 = ρ 2 = ρ 0 pätiessä E(v) = 0 Siten itseisarvoltaan suuret testisuureen v arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (2005) 99

100 Pearsonin korrelaatiokertoimen estimointi ja testaus Korreloimattomuuden testaaminen: Testausasetelma Monissa tutkimustilanteissa ollaan kiinnostuneita siitä ovatko satunnaismuuttujat X ja Y korreloimattomia vai ei. Huomautuksia: Satunnaismuuttujien X ja Y korreloimattomuudesta ei välttämättä seuraa niiden riippumattomuus, vaikka satunnaismuuttujien X ja Y riippumattomuudesta seuraa aina niiden korreloimattomuus. Jos satunnaismuuttujat X ja Y noudattavat 2-ulotteista normaalijakaumaa, satunnaismuuttujien X ja Y korreloimattomuudesta seuraa niiden riippumattomuus. Monissa tutkimusasetelmissa toivotaan, että korreloimattomuusoletus tulee testissä hylätyksi. TKK (c) Ilkka Mellin (2005) 100

101 Pearsonin korrelaatiokertoimen estimointi ja testaus Korreloimattomuuden testaaminen: Yleinen hypoteesi Yleinen hypoteesi H : (i) Oletetaan, että satunnaismuuttujien X ja Y järjestetty pari (X, Y) noudattaa 2-ulotteista normaalijakaumaa, jonka parametrit ovat µ = E( X ) µ = E( Y ) σ X = Var( X ) σ = Var( Y ) 2 2 X Y ρ XY = Cor( XY, ) (ii) Olkoon ( X i, Yi), i = 1,2,, n riippumaton satunnaisotos satunnaismuuttujien X ja Y muodostaman parin (X, Y) jakaumasta. Y TKK (c) Ilkka Mellin (2005) 101

102 Pearsonin korrelaatiokertoimen estimointi ja testaus Korreloimattomuuden testaaminen: Nollahypoteesi ja vaihtoehtoinen hypoteesi Nollahypoteesi H 0 : H 0 : ρ XY = 0 Vaihtoehtoinen hypoteesi H 1 : H: 1 ρ XY > 0 1-suuntaiset vaihtoehtoiset hypoteesit H: 1 ρ XY < 0 H : ρ 0 2-suuntainen vaihtoehtoinen hypoteesi 1 XY TKK (c) Ilkka Mellin (2005) 102

103 Pearsonin korrelaatiokertoimen estimointi ja testaus Korreloimattomuuden testaaminen: Parametrien estimointi Estimoidaan 2-ulotteisen normaalijakauman parametrit tavanomaisilla estimaattoreillaan: n n 1 1 X = X Y = Y i i n i= 1 n i= 1 n n X = ( i ) Y = ( i ) n 1 i= 1 n 1 i= 1 n s X X s Y Y 1 s = ( X X)( Y Y) r XY i i n 1 i= 1 XY = sxy s s X Y TKK (c) Ilkka Mellin (2005) 103

104 Pearsonin korrelaatiokertoimen estimointi ja testaus Korreloimattomuuden testaaminen: Testisuure ja sen jakauma Määritellään t-testisuure rxy t = n rxy Jos nollahypoteesi H 0 : ρ XY = 0 pätee, testisuure t noudattaa Studentin t-jakaumaa, jonka vapausasteluku on n 2: t t( n 2) TKK (c) Ilkka Mellin (2005) 104

105 Pearsonin korrelaatiokertoimen estimointi ja testaus Korreloimattomuuden testaaminen: Testi Testisuureen t normaaliarvo = 0, koska nollahypoteesin H 0 : ρ XY = 0pätiessä E(t) = 0 Siten itseisarvoltaan suuret testisuureen t arvot viittaavat siihen, että nollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätään, jos testin p-arvo on kyllin pieni. TKK (c) Ilkka Mellin (2005) 105

106 Tilastollinen riippuvuus ja korrelaatio Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin korrelaatiokertoimen estimointi ja testaus >> Järjestyskorrelaatiokertoimet TKK (c) Ilkka Mellin (2005) 106

107 Järjestyskorrelaatiokertoimet Avainsanat Järjestyskorrelaatiokertoimet Kendallin järjestyskorrelaatiokerroin Korrelaatio Korreloimattomuuden testaaminen Spearmanin järjestyskorrelaatiokerroin TKK (c) Ilkka Mellin (2005) 107

108 Järjestyskorrelaatiokertoimet Korreloimattomuuden testaaminen järjestysasteikollisilla muuttujilla Tarkastellaan korrelaatiokertoimen määrittelemistä ja korreloimattomuuden testaamista järjestysasteikollisille muuttujille. Tarkastelun kohteena ovat seuraavat järjestyskorrelaatiokertoimet: Spearmanin järjestyskorrelaatiokerroin Kendallin järjestyskorrelaatiokerroin Tarkasteltavat järjestyskorrelaatiokertoimet ja testit sopivat myös välimatka-ja suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 108

109 Järjestyskorrelaatiokertoimet Spearmanin järjestyskorrelaatiokerroin: Kertoimen idea Spearmanin järjestyskorrelaatiokerroin ρ S mittaa kahden muuttujan havaintoarvojen suuruusjärjestyksien yhteensopivuutta. Spearmanin järjestyskorrelaatiokerroin sopii järjestys-, välimatka-ja suhdeasteikollisille muuttujille. Spearmanin järjestyskorrelaatiokertoimella on samantapaiset ominaisuudet kuin Pearsonin otoskorrelaatiokertoimella. TKK (c) Ilkka Mellin (2005) 109

110 Järjestyskorrelaatiokertoimet Spearmanin järjestyskorrelaatiokerroin: Määritelmä 1/3 Olkoot X 1, X 2,, X n ja Y 1, Y 2,, Y n järjestys-, välimatka-tai suhdeasteikollisten satunnaismuuttujien X ja Y havaittuja arvoja. Oletetaan lisäksi, että havainnot X i ja Y i liittyvät samaan havaintoyksikköön kaikille i = 1, 2,, n. Järjestetään sekä X-että Y-muuttujan havaitut arvot suuruusjärjestykseen pienimmästä suurimpaan. TKK (c) Ilkka Mellin (2005) 110

111 Järjestyskorrelaatiokertoimet Spearmanin järjestyskorrelaatiokerroin: Määritelmä 2/3 Liitetään sekä X- että Y-muuttujan havaittuihin arvoihin niiden suuruusjärjestyksien mukaiset järjestysnumerot: R(X i ) = havainnon X i järjestysnumero parissa i R(Y i ) = havainnon Y i järjestysnumero parissa i sekä määritellään erotukset D i = R(X i ) R(Y i ) Muuttujien X ja Y havaituille arvoille voidaan määritellä järjestyskorrelaatiokerroin erotuksien D i avulla. TKK (c) Ilkka Mellin (2005) 111

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Johdatus regressioanalyysiin

Johdatus regressioanalyysiin Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2007) 1 Johdatus regressioanalyysiin >> Regressioanalyysin lähtökohdat ja tavoitteet

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Johdatus regressioanalyysiin TKK (c) Ilkka Mellin (2005) 1 Johdatus regressioanalyysiin Regressioanalyysin lähtökohdat ja tavoitteet Deterministiset mallit ja regressioanalyysi

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Moniulotteiset satunnaismuuttujat ja jakaumat

Moniulotteiset satunnaismuuttujat ja jakaumat Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat KE (2014) 1 Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat >> Kaksiulotteiset

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastolliset testit TKK (c) Ilkka Mellin (2005) 1 Tilastolliset testit Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5 TKK (c) Ilkka Mellin (4) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (4) : Mitä opimme? 1/5 Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitä

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat TKK (c) Ilkka Mellin (2005) 1 Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat Kaksiulotteiset todennäköisyysjakaumat

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1 Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus KE (2014) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat .9. Kaksiulotteiset satunnaismuuttujat MS-A Todennäköisslaskennan ja tilastotieteen peruskurssi Viikko Moniulotteiset satunnaismuuttujat sekä niiden jakaumat ja tunnusluvut; Moniulotteisia jakaumia Usein

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1 Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia Heliövaara 1 Regressiokertoimien PNS-estimaattorit Määritellään havaintojen x j ja y j, j = 1, 2,...,n

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Johdatus regressioanalyysiin Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen vaihtelun avulla.

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Aiheet: Satunnaisvektorit ja moniulotteiset jakaumat Tilastollinen riippuvuus ja lineaarinen korrelaatio Satunnaisvektorit ja moniulotteiset

Lisätiedot

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat: Mat-.9 Sovellettu todennäköisyyslasku A Mat-.9 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Moniulotteiset jakaumat Diskreetti jakauma, Ehdollinen jakauma, Ehdollinen odotusarvo, Jatkuva

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat TKK (c) Ilkka Mellin (2006) 1 Moniulotteiset satunnaismuuttujat ja

Lisätiedot

Johdatus regressioanalyysiin. Heliövaara 1

Johdatus regressioanalyysiin. Heliövaara 1 Johdatus regressioanalyysiin Heliövaara 1 Regressioanalyysin idea Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun selittävien muuttujien havaittujen arvojen

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat

Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat TKK (c) Ilkka Mellin (4) todennäköisyysjakaumat Johdatus todennäköisyyslaskentaan todennäköisyysjakaumat TKK (c) Ilkka Mellin (4) todennäköisyysjakaumat: Mitä opimme? /5 hden satunnaismuuttujan todennäköisyysjakaumat

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

Korrelaatiokertoinen määrittely 165

Korrelaatiokertoinen määrittely 165 kertoinen määrittely 165 Olkoot X ja Y välimatka- tai suhdeasteikollisia satunnaismuuttujia. Havaintoaineistona on n:n suuruisesta otoksesta mitatut muuttuja-arvoparit (x 1, y 1 ), (x 2, y 2 ),..., (x

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 25.9.2018/1 MTTTP1, luento 25.9.2018 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2018/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen TKK (c) Ilkka Mellin (2004) 1 Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen Jakaumaoletuksien

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2005) 1 Tilastollisten aineistojen kuvaaminen Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten muuttujien tunnusluvut

Lisätiedot

Normaalijakaumasta johdettuja jakaumia

Normaalijakaumasta johdettuja jakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2007) 1 Normaalijakaumasta johdettuja jakaumia >> Johdanto χ 2 -jakauma F-jakauma

Lisätiedot

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteesee Tilastollie riippuvuus ja korrelaatio TKK (c) Ilkka Melli (2004) 1 Tilastollie riippuvuus ja korrelaatio Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1 Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Tilastollisten aineistojen kuvaaminen

Tilastollisten aineistojen kuvaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2007) 1 Tilastollisten aineistojen kuvaaminen >> Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.04 Tilastollisen analyysin perusteet, kevät 007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen Jakaumaoletuksien testaamiseen soveltuvat testit χ -yhteensopivuustesti yksi otos otoksen vertaaminen

Lisätiedot

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2004) 1 Yleinen lineaarinen malli Usean selittäjän lineaarinen regressiomalli Yleisen lineaarisen mallin matriisisesitys Yleisen

Lisätiedot

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012 Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 4: Lineaarinen regressioanalyysi. Yleinen lineaarinen malli. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 4: Lineaarinen regressioanalyysi Yleinen lineaarinen malli TKK (c) Ilkka Mellin (2007) 1 Yleinen lineaarinen malli >> Usean selittäjän lineaarinen regressiomalli

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1 Tilastolliset menetelmät Osa 1: Johdanto Johdanto tilastotieteeseen KE (2014) 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä ja malleja, joiden avulla reaalimaailman ilmiöistä voidaan

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit järjestysasteikollisille muuttujille Järjestysasteikollisten muuttujien testit Merkkitesti Wilcoxonin

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan:

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan: Mat-.6 Sovellettu todennäköisslaskenta B Mat-.6 Sovellettu todennäköisslaskenta B / Ratkaisut Aiheet: Moniulotteiset satunnaismuuttujat ja todennäköissjakaumat Moniulotteisia jakaumia Avainsanat: Diskreetti

Lisätiedot