Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1

Samankaltaiset tiedostot
Tilastollinen riippuvuus ja korrelaatio

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2005) 1

Yhden selittäjän lineaarinen regressiomalli

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastolliset menetelmät: Tilastolliset testit

Yhden selittäjän lineaarinen regressiomalli: Lisätiedot. Yhden selittäjän lineaarinen regressiomalli

2-suuntainen vaihtoehtoinen hypoteesi

χ 2 -yhteensopivuustesti

Tilastolliset menetelmät: Tilastolliset testit

Johdatus regressioanalyysiin. Johdatus regressioanalyysiin. Johdatus regressioanalyysiin: Mitä opimme? 2/3

8. laskuharjoituskierros, vko 11, ratkaisut

2-suuntainen vaihtoehtoinen hypoteesi

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Osa 2: Otokset, otosjakaumat ja estimointi

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

χ 2 -yhteensopivuustesti

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Otantajakauman käyttö päättelyssä

Testit laatueroasteikollisille muuttujille

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Väliestimointi (jatkoa) Heliövaara 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Testejä suhdeasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Testit järjestysasteikollisille muuttujille

Satunnaismuuttujien muunnokset ja niiden jakaumat. Satunnaismuuttujien muunnokset ja niiden jakaumat

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

Johdatus regressioanalyysiin

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Yleinen lineaarinen malli. Yleinen lineaarinen malli. Yleinen lineaarinen malli: Mitä opimme? 2/4. Yleinen lineaarinen malli: Mitä opimme?

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

S Laskennallinen systeemibiologia

EX1 EX 2 EX =

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Johda jakauman momenttiemäfunktio ja sen avulla jakauman odotusarvo ja varianssi.

Moniulotteisia todennäköisyysjakaumia

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Moniulotteiset satunnaismuuttujat ja jakaumat

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

2.1. Parametrien estimointi 2.2. Regressiokertoimien estimointi kovariansseista ja korrelaatioista

Mat Sovellettu todennäköisyyslaskenta B 5. harjoitukset / Ratkaisut Aiheet: Jatkuvia jakaumia Avainsanat: Jatkuvia jakaumia

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Mat Tilastollisen analyysin perusteet, kevät 2007

Regressiodiagnostiikka. Regressiodiagnostiikka. Regressiodiagnostiikka: Mitä opimme? 2/2. Regressiodiagnostiikka: Mitä opimme? 1/2

Tilastollinen päättely II, kevät 2017 Harjoitus 3B

8.3. Yleinen lineaarinen malli ja yleistetty pienimmän neliösumman menetelmä

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Harjoitus 7: NCSS - Tilastollinen analyysi

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Kvantitatiiviset menetelmät

TILASTOT: johdantoa ja käsitteitä

Regressioanalyysi. Kuusinen/Heliövaara 1

Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

n = 100 x = %:n luottamusväli µ:lle Vastaus:

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 6A Ratkaisuehdotuksia.

Tehtävä 1. Riku Eskelinen DEMOVASTAUKSET Demokerta 3/ vk 15 Tilastomenetelmien peruskurssi TILP150 Tulostuspv Sivu 1/6

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot

Estimointi. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tunnuslukuja 27 III TUNNUSLUKUJA

Transkriptio:

Johdatus tilastotieteesee Tilastollie riippuvuus ja korrelaatio TKK (c) Ilkka Melli (2004) 1

Tilastollie riippuvuus ja korrelaatio Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto kuvaamie Pearsoi korrelaatiokertoime estimoiti ja testaus Järjestyskorrelaatiokertoimet TKK (c) Ilkka Melli (2004) 2

Tilastollie riippuvuus ja korrelaatio: Mitä opimme? Pyrimme vastaamaa seuraavii kysymyksii: Mitä lisää tilastollisee aalyysii tuo mukaaa kahde (tai useamma) muuttuja samaaikaie tarkastelu? Mite kahde (tai useamma) muuttuja tilastollista aieistoa kuvataa? Millä tavalla muuttujie välie tilastollie riippuvuus eroaa eksaktista riippuvuudesta? Mitä tarkoitetaa kahde muuttuja korrelaatiolla? Mikä o korrelaatio ja riippuvuude suhde? Mite korrelaatio estimoidaa? Mite korrelaatiota koskevia hypoteeseja testataa? TKK (c) Ilkka Melli (2004) 3

Tilastollie riippuvuus ja korrelaatio: Esitiedot Esitiedot: ks. seuraavia lukuja: Tilastolliste aieistoje keräämie ja mittaamie Tilastolliste aieistoje kuvaamie Estimoiti Estimoitimeetelmät Väliestimoiti Tilastolliset testit Testit suhdeasteikollisille muuttujille Satuaismuuttujat ja todeäköisyysjakaumat Jakaumie tuusluvut Moiulotteiset satuaismuuttujat ja todeäköisyysjakaumat Moiulotteisia todeäköisyysjakaumia TKK (c) Ilkka Melli (2004) 4

Tilastollie riippuvuus ja korrelaatio: Lisätiedot Johdatus regressioaalyysii esitetää luvussa Johdatus regressioaalyysii Regressioaalyysia yhde selittäjä lieaarise regressiomalli tapauksessa käsitellää luvussa Yhde selittäjä lieaarie regressiomalli Pitemmälle meeviä regressioaalyysi kysymyksiä käsitellää luetosarja Tilastollise aalyysi perusteet luvuissa Yleie lieaarie malli Regressiodiagostiikka Regressiomalli valita Regressioaalyysi erityiskysymyksiä TKK (c) Ilkka Melli (2004) 5

Tilastollie riippuvuus ja korrelaatio >> Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto kuvaamie Pearsoi korrelaatiokertoime estimoiti ja testaus Järjestyskorrelaatiokertoimet TKK (c) Ilkka Melli (2004) 6

Tilastollie riippuvuus, korrelaatio ja regressio Avaisaat Eksakti riippuvuus Korrelaatio Korrelaatiokerroi Regressioaalyysi Regressiomalli Testit korrelaatiokertoimille Tilastollie riippuvuus Usea muuttuja havaitoaieisto kuvaamie TKK (c) Ilkka Melli (2004) 7

Tilastollie riippuvuus, korrelaatio ja regressio Muuttujie väliset riippuvuudet tilastollise tutkimukse kohteea Tieteellise tutkimukse tärkeimmät ja mielekiitoisimmat kysymykset liittyvät tavallisesti tutkimukse kohteea olevaa ilmiötä kuvaavie muuttujie välisii riippuvuuksii. Jos tilastollise tutkimukse kohteea olevaa ilmiöö liittyy useampia kui yksi muuttuja, yhde muuttuja tilastolliset meetelmät atavat tavallisesti vai rajoittuee kuva ilmiöstä. Sovelluste kaalta ehkä merkittävi osa tilastotiedettä käsittelee kahde tai useamma muuttuja väliste riippuvuuksie kuvaamista ja mallitamista. TKK (c) Ilkka Melli (2004) 8

Tilastollie riippuvuus, korrelaatio ja regressio Esimerkkejä riippuvuustarkasteluista Mite työttömyysaste Suomessa (% työvoimasta) riippuu BKT: (bruttokasatuottee) kasvuvauhdista Suomessa, Suome viei volyymista sekä BKT: kasvuvauhdista muissa EUmaissa ja USA:ssa? Mite alkoholi kulutus (l per capita vuodessa) riippuu alkoholijuomie hitatasosta, ihmiste käytettävissä olevista tuloista ja alkoholi saatavuudesta? Mite todeäköisyys sairastua keuhkosyöpää (p) riippuu tupakoii määrästä ja kestosta? Mite vehä hehtaarisato (t/ha) riippuu kesä keskilämpötilasta ja sademäärästä sekä maa muokkauksesta, laoituksesta ja tuholaiste torjuasta? TKK (c) Ilkka Melli (2004) 9

Tilastollie riippuvuus, korrelaatio ja regressio Eksakti vs tilastollie riippuvuus Tarkastelemme tässä yksikertaisuude vuoksi kahde muuttuja välistä riippuvuutta: (i) Muuttujie välie riippuvuus o eksaktia, jos toise arvot voidaa eustaa tarkasti toise saamie arvoje perusteella. (ii) Muuttujie välie riippuvuus o tilastollista, jos iide välillä ei ole eksaktia riippuvuutta, mutta toise muuttuja arvoja voidaa käyttää apua toise muuttuja arvoje eustamisessa. TKK (c) Ilkka Melli (2004) 10

Tilastollie riippuvuus, korrelaatio ja regressio Tilastollie riippuvuus ja korrelaatio Kahde muuttuja välistä (lieaarista) tilastollista riippuvuutta kutsutaa tilastotieteessä tavallisesti korrelaatioksi. Korrelaatio eli (lieaarise) tilastollise riippuvuude voimakkuutta mittaavia tilastollisia tuuslukuja kutsutaa korrelaatiokertoimiksi. Korrelaatiot muodostavat perusta muuttujie väliste riippuvuuksie ymmärtämiselle. TKK (c) Ilkka Melli (2004) 11

Tilastollie riippuvuus, korrelaatio ja regressio Tilastollie riippuvuus ja regressio Vaikka korrelaatiot muodostavat perusta muuttujie väliste riippuvuuksie ymmärtämiselle, riippuvuuksia halutaa tavallisesti aalysoida tarkemmi. Regressioaalyysi o tilastollie meetelmä, jossa joki, s. selitettävä muuttuja tilastollista riippuvuutta joistaki toisista, s. selittävistä muuttujista pyritää mallitamaa regressiomalliksi kutsutulla tilastollisella mallilla; ks. lukua Johdatus regressioaalyysii. Huomautus: Tässä luvussa rajoitutaa tarkastelemaa korrelaatioide estimoitia ja testaamista. TKK (c) Ilkka Melli (2004) 12

Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto kuvaamie Kute yhde muuttuja havaitoaieistoje tapauksessa, lähtökohda kahde tai useamma muuttuja havaitoaieistoje kuvaamiselle muodostaa tutustumie havaitoarvoje jakaumaa. Havaitoarvoje jakaumaa voidaa kuvailla ja esitellä tiivistämällä havaitoarvoihi sisältyvä iformaatio sopivaa muotoo: Havaitoarvoje jakaumaa kokoaisuutea voidaa kuvata sopivasti valituilla graafisilla esityksillä. Havaitoarvoje jakauma karakteristisia omiaisuuksia voidaa kuvata sopivasti valituilla otostuusluvuilla. TKK (c) Ilkka Melli (2004) 13

Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto kuvaamie: Graafiset meetelmät Koska useampi- kui kaksiulotteiste kuvioide tekemie ei ole käytäössä mahdollista, kolme tai useamma muuttuja havaitoaieistoja havaiollistetaa tavallisesti ii, että muuttujia tarkastellaa pareittai. Kahde järjestys-, välimatka-tai suhdeasteikoillise muuttuja havaittuje arvoje pareja havaiollistetaa tavallisesti graafisella esityksellä, jota kutsutaa pistediagrammiksi. Huomautus: Moimuuttujameetelmissä o kehitetty myös sellaisia tilastografiika meetelmiä, joilla voidaa havaiollistaa useampi- kui kaksiulotteisia aieistoja. TKK (c) Ilkka Melli (2004) 14

Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto kuvaamie: Tuusluvut Usea muuttuja havaitoaieistoje karakteristisia omiaisuuksia voidaa kuvata muuttujakohtaisilla otostuusluvuilla. Muuttujakohtaiset otostuusluvut eivät kuitekaa voi ataa iformaatiota muuttujie välisistä riippuvuuksista. Muuttujie pareittaisia tilastollisia riippuvuuksia voidaa kuvata sopivasti valitulla korrelaatio mitalla. TKK (c) Ilkka Melli (2004) 15

Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto kuvaamie: Korrelaatio Tutkittavie muuttujie mitta-asteikolliset omiaisuudet ohjaavat korrelaatio mita valitaa: Välimatka- ja suhdeasteikollisille muuttujille käytetää tavallisesti Pearsoi korrelaatiokerroita. Järjestysasteikollisille muuttujille käytetää tavallisesti Spearmai tai Kedalli järjestyskorrelaatiokerroita. TKK (c) Ilkka Melli (2004) 16

Tilastollie riippuvuus, korrelaatio ja regressio Testit korrelaatiolle Satuaismuuttujie välisee korrelaatioo voidaa kohdistaa erilaisia tilastollisia testejä. Tässä esityksessä tarkastellaa seuraavia Pearsoi korrelaatiokertoimelle sopivia testejä: Yhde otokse testi korrelaatiokertoimelle Korrelaatiokertoimie vertailutesti Testi korreloimattomuudelle Tässä esityksessä tarkastellaa seuraavia Spearmai ja Kedalli järjestyskorrelaatiokertoimille sopivia testejä: Testit korreloimattomuudelle TKK (c) Ilkka Melli (2004) 17

Tilastollie riippuvuus ja korrelaatio Tilastollie riippuvuus, korrelaatio ja regressio >> Kahde muuttuja havaitoaieisto kuvaamie Pearsoi korrelaatiokertoime estimoiti ja testaus Järjestyskorrelaatiokertoimet TKK (c) Ilkka Melli (2004) 18

Kahde muuttuja havaitoaieisto kuvaamie Avaisaat Aikasarjadiagrammi Aritmeettie keskiarvo Keskihajota Korrelaatio Otoskovariassi Pearsoi otoskorrelaatiokerroi Pistediagrammi Variassi TKK (c) Ilkka Melli (2004) 19

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi Tarkastellaa tilaetta, jossa tutkimukse kohteia olevista havaitoyksiköistä o mitattu kahde järjestys-, välimatka-tai suhdeasteikollise muuttuja x ja y arvot. Muuttujie x ja y arvoje samaa havaitoyksikköö liittyvie parie muodostamaa havaitoaieistoa voidaa kuvata graafisesti pistediagrammilla. Pistediagrammi sopii erityisesti kahde muuttuja välise riippuvuude havaiollistamisee. Pistediagrammi o keskeie työvälie korrelaatio-ja regressioaalyysissa. TKK (c) Ilkka Melli (2004) 20

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: Määritelmä Olkoot x ja y järjestys-, välimatka-tai suhdeasteikollisia muuttujia, joide havaitut arvot ovat x 1, x 2,, x y 1, y 2,, y Oletetaa lisäksi, että havaitoarvot x i ja y i liittyvät samaa havaitoyksikköö kaikille i = 1, 2,,. Havaitoarvoje x 1, x 2,, x ja y 1, y 2,, y parie pistediagrammi saadaa esittämällä lukuparit (x i, y i ), i = 1, 2,, pisteiä avaruudessa! 2. TKK (c) Ilkka Melli (2004) 21

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: Havaiollistus Kuvio oikealla esittää lukuparie y (x i, y i ) ja (x j, y j ) y j (x j, y j ) määrittelemie pisteide esittämistä tasokoordiaatistossa. (x i, y i ) y i x x i x j TKK (c) Ilkka Melli (2004) 22

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: 1. esimerkki 1/2 Hooke lai mukaa kierrejouse pituus riippuu lieaarisesti jousee ripustetusta paiosta. Oikealla o tulokset kokeesta, jossa Hooke lai pätevyyttä tutkittii ripustamalla kierrejousee 6 erikokoista paioa. Merkitää: jossa (x i, y i ), i = 1, 2, 3, 4, 5, 6 x i = paio i y i = jouse pituus, ku paioa o x i Paio (kg) Pituus (cm) 0 43.00 2 43.60 4 44.05 6 44.55 8 45.00 10 45.50 TKK (c) Ilkka Melli (2004) 23

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: 1. esimerkki 2/2 Pistediagrammi oikealla havaiollistaa koetuloksia graafisesti. Ovatko havaiot sopusoiussa Hooke lai kassa? Vastausta tarkastellaa luvuissa Johdatus regressioaalyysii ja Yhde selittäjä lieaarie regressiomalli. Jouse pituus (cm) 46.00 45.50 45.00 44.50 44.00 43.50 43.00 42.50 Kierrejouse pituude riippuvuus jousee ripustetusta paiosta -2 0 2 4 6 8 10 12 Paio (kg) TKK (c) Ilkka Melli (2004) 24

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: 2. esimerkki 1/2 Periöllisyystietee mukaa lapset perivät geeettiset omiaisuutesa vahemmiltaa. Periytyykö isä pituus heidä pojillee? Havaitoaieisto koostuu 300: isä ja heidä poikiesa pituuksie muodostamasta lukuparista jossa (x i, y i ), i = 1, 2,, 300 x i = isä i pituus y i = isä i poja pituus Ks. pistediagrammia oikealla. Poja pituus (cm) Isie ja poikie pituudet 195 190 185 180 175 170 165 160 155 160 165 170 175 180 185 190 Isä pituus (cm) TKK (c) Ilkka Melli (2004) 25

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: 2. esimerkki 2/2 Yhtä pitkillä isillä äyttää oleva moe mittaisia poikia. Mutta: Lyhyillä isillä äyttää oleva keskimääri lyhyempiä poikia kui pitkillä isillä ja pitkillä isillä äyttää oleva keskimääri pitempiä poikia kui lyhyillä isillä. Tällaiste tilastolliste riippuvuuksie aalysoimista lieaariste regressiomallie avulla tarkastellaa luvuissa Johdatus regressioaalyysii ja Yhde selittäjä lieaarie regressiomalli. Poja pituus (cm) Isie ja poikie pituudet 195 190 185 180 175 170 165 160 155 160 165 170 175 180 185 190 Isä pituus (cm) TKK (c) Ilkka Melli (2004) 26

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: 3. esimerkki 1/2 Oko keuhkosyöpä yleisempää sellaisissa maissa, joissa tupakoidaa paljo? Oikealla o tiedot savukkeide kulutuksesta ja keuhkosyövä yleisyydestä 10:ssä maassa. Havaitoaieisto koostuu 10:stä lukuparista jossa (x i, y i ), i = 1, 2,, 10 x i = savukkeide kulutus maassa i 1930 y i = sairastuvuus keuhkosyöpää maassa i 1950 Maa Savukkeide kulutus (kpl) per capita 1930 Keuhkosyöpätapauste lkm per 1 milj. hekilöä 1950 Islati 220 58 Norja 250 90 Ruotsi 310 115 Kaada 510 150 Taska 380 165 Itävalta 455 170 Hollati 460 245 Sveitsi 530 250 Suomi 1115 350 Eglati 1145 465 TKK (c) Ilkka Melli (2004) 27

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: 3. esimerkki 2/2 Pistediagrammi oikealla havaiollistaa savukkeide kulutukse ja keuhkosyövä yleisyyde välistä yhteyttä. Sairastuvuus keuhkosyöpää äyttää oleva keskimääri korkeampaa sellaisissa maissa, joissa savukkeide kulutus o ollut keskimääräistä suurempaa. Tällaiste tilastolliste riippuvuuksie aalysoimista lieaariste regressiomallie avulla tarkastellaa luvussa Yhde selittäjä lieaarie regressiomalli. Keuhkosyöpätapauste lkm per 1 milj. hekilöä 1950 500 400 300 200 100 0 Savukkeide kulutus ja sairastuvuus keuhkosyöpää Sveitsi Hollati Taska Itävalta kaada Ruotsi Norja Islati Eglati Suomi 0 200 400 600 800 1000 1200 1400 Savukkeide kulutus (kpl) per capita 1930 TKK (c) Ilkka Melli (2004) 28

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: 4. esimerkki 1/2 Kokeessa tutkittii betoi vetolujuude riippuvuutta betoi kuivumisajasta. Havaitoaieisto koostuu 21:stä lukuparista jossa (x i, y i ), i = 1, 2,, 21 x i = betoiharko i kuivumisaika y i = betoiharko i vetolujuus Ks. pistediagrammia oikealla. Vetolujuus (kg/cm2) 50.0 40.0 30.0 20.0 10.0 0.0 Betoi vetolujuude riippuvuus kuivumisajasta 0 5 10 15 20 25 30 Kuivumisaika (vrk) TKK (c) Ilkka Melli (2004) 29

Kahde muuttuja havaitoaieisto kuvaamie Pistediagrammi: 4. esimerkki 2/2 Vetolujuus äyttää riippuva kuivumisajasta epälieaarisesti. 50.0 Betoi vetolujuude riippuvuus kuivumisajasta Tässä tapauksessa muuttujie välie epälieaarie riippuvuus voidaa kuiteki liearisoida; ks. lukua Johdatus regressioaalyysii. Liearisoii jälkee riippuvuutta voidaa aalysoida lieaariste regressiomallie avulla. Vetolujuus (kg/cm2) 40.0 30.0 20.0 10.0 0.0 0 5 10 15 20 25 30 Kuivumisaika (vrk) TKK (c) Ilkka Melli (2004) 30

Kahde muuttuja havaitoaieisto kuvaamie Aikasarjadiagrammi: Määritelmä Oletetaa, että järjestys-, välimatka-tai suhdeasteikollise muuttuja x havaitut arvot x 1, x 2,, x muodostavat aikasarja. Tällä tarkoitetaa sitä, että havaitoarvot x 1, x 2,, x o ideksoitu ii, että e ovat aikajärjestyksessä. Aikasarjadiagrammi o pistediagrammi, jossa lukuparit (t, x t ), t = 1, 2,, 2 esitetää pisteiä avaruudessa!. Tavallisesti peräkkäisii ajahetkii liittyvät pisteet (t 1, x t 1 ), (t, x t ), t = 2, 3,, yhdistetää aikasarjadiagrammissa toisiisa jaoilla. TKK (c) Ilkka Melli (2004) 31

Kahde muuttuja havaitoaieisto kuvaamie Aikasarjadigarammi: Havaiollistus Kuvio oikealla esittää aikasarja x t, t = 1, 2,, peräkkäiste havaitoarvoje x t+1 x x t (t, x t ) (t+1, x t+1 ) x t 1, x t, x t+1 määrittelemie pisteide esittämistä tasokoordiaatistossa. x t 1 (t 1, x t 1 ) t 1 t t+1 t TKK (c) Ilkka Melli (2004) 32

Kahde muuttuja havaitoaieisto kuvaamie Aikasarjadiagrammi: Esimerkki Aikasarjadiagrammi oikealla esittää erää tukkukaupa kkmyyi arvo vaihtelua. Havaitoaieisto koostuu 144:stä lukuparista jossa (t, x t ) t = aika (1970/1-1981/12) x t = kk-myyi arvoa kuvaava ideksi (1960/1 = 100) Huomaa, että kk-myyissä o ollut ouseva tredi ja selvää kausivaihtelua. Myyti (ideksi) Myyti 1970/1-1981/12 300 250 200 150 100 1970 1972 1974 1976 1978 1980 1982 TKK (c) Ilkka Melli (2004) 33

Kahde muuttuja havaitoaieisto kuvaamie Tuusluvut Kahde välimatka- tai suhdeasteikollise muuttuja havaitoarvoje parie muodostamaa jakaumaa voidaa karakterisoida seuraavilla tuusluvuilla: Havaitoarvoje keskimääräistä sijaitia kuvataa aritmeettisilla keskiarvoilla. Havaitoarvoje hajaatueisuutta tai keskittyeisyyttä kuvataa keskihajooilla tai (otos-) variasseilla. Havaitoarvoje (lieaarista) riippuvuutta kuvataa otoskovariassilla ja otoskorrelaatiokertoimella. TKK (c) Ilkka Melli (2004) 34

Kahde muuttuja havaitoaieisto kuvaamie Havaiot Olkoot ja x 1, x 2,, x y 1, y 2,, y välimatka-tai suhdeasteikolliste muuttujie x ja y havaittuja arvoja. Oletetaa lisäksi, että havaitoarvot x i ja y i liittyvät samaa havaitoyksikköö i kaikille i = 1, 2,,. TKK (c) Ilkka Melli (2004) 35

Kahde muuttuja havaitoaieisto kuvaamie Aritmeettiset keskiarvot: Määritelmät Havaitoarvoje x 1, x 2,, x aritmeettie keskiarvo o x x + x + " + x 1 1 2 xi i= 1 = = Havaitoarvoje y 1, y 2,, y aritmeettie keskiarvo o y y + y + " + y 1 1 2 yi i= 1 = = TKK (c) Ilkka Melli (2004) 36

Kahde muuttuja havaitoaieisto kuvaamie Aritmeettiset keskiarvot: Tulkiat Havaitoarvoje pareista (x i, y i ), i = 1, 2,, laskettuje aritmeettiste keskiarvoje x ja ymuodostama lukupari ( x, y) o havaitoarvoje parie muodostamie pisteide paiopiste. Havaitoarvoje aritmeettie keskiarvo kuvaa havaitoarvoje keskimääräistä sijaitia. TKK (c) Ilkka Melli (2004) 37

Kahde muuttuja havaitoaieisto kuvaamie Variassit: Määritelmät Havaitoarvoje x 1, x 2,, x (otos-) variassi o 2 1 sx = xi x 1 i= 1 ( ) 2 jossa x o x-havaitoarvoje aritmeettie keskiarvo. Havaitoarvoje y 1, y 2,, y (otos-) variassi o 2 1 s ( ) 2 y = yi y 1 i= 1 jossa y o y-havaitoarvoje aritmeettie keskiarvo. Havaitoarvoje variassi mittaa havaitoarvoje hajaatueisuutta tai keskittyeisyyttä havaitoarvoje aritmeettise keskiarvo suhtee. TKK (c) Ilkka Melli (2004) 38

Kahde muuttuja havaitoaieisto kuvaamie Keskihajoat: Määritelmät Havaitoarvoje x 1, x 2,, x keskihajota o 1 s ( ) 2 x = xi x 1 i= 1 jossa x o x-havaitoarvoje aritmeettie keskiarvo. Havaitoarvoje y 1, y 2,, y keskihajota o 1 s ( ) 2 y = yi y 1 i= 1 jossa y o y-havaitoarvoje aritmeettie keskiarvo. Havaitoarvoje keskihajota mittaa havaitoarvoje hajaatueisuutta tai keskittyeisyyttä havaitoarvoje aritmeettise keskiarvo suhtee. TKK (c) Ilkka Melli (2004) 39

Kahde muuttuja havaitoaieisto kuvaamie Otoskovariassi: Määritelmä Havaitoarvoje pareista (x i, y i ), i = 1, 2,, laskettu otoskovariassi o jossa 1 s = x x y y x y ( )( ) xy i i 1 i= 1 = x-havaitoarvoje aritmeettie keskiarvo = y-havaitoarvoje aritmeettie keskiarvo Huomaa, että x-ja y-havaitoarvoje otoskovariassit iide itsesä kassa ovat iide variasseja: 2 s = s s xx yy = s x 2 y TKK (c) Ilkka Melli (2004) 40

Kahde muuttuja havaitoaieisto kuvaamie Otoskovariassi: Merki määräytymie 1/4 Otoskovariassi s xy merki määrää summalauseke (1) ( xi x)( yi y) Summalausekkee (1) i. termi ( xi x)( yi y) itseisarvo x x y y o sellaise suorakaitee pita-ala, joka sivuje pituudet ovat ja i xi yi x y i TKK (c) Ilkka Melli (2004) 41

Kahde muuttuja havaitoaieisto kuvaamie Otoskovariassi: Merki määräytymie 2/4 Summalausekkee (1) i. termi merkki määräytyy seuraavalla tavalla: jos xi x ja yi y ( xi x)( yi y) 0 jos xi x ja yi y jos xi x ja yi y ( xi x)( yi y) 0 jos xi x ja yi y Merki määräytymistä voidaa havaiollistaa geometrisesti seuraavalla tavalla (ks. kuviota seuraavalla kalvolla): (i) Jaetaa xy-taso eljää osaa eli eljäeksee pistee ( x, y) kautta piirretyillä koordiaattiakseleide suutaisilla suorilla. (ii) ( x x)( y y) i i Termi ( xi x)( yi y) merki määrää se, mihi eljäeksee havaitopiste (x i, y i ) sijoittuu. TKK (c) Ilkka Melli (2004) 42

Kahde muuttuja havaitoaieisto kuvaamie Otoskovariassi: Merki määräytymie 3/4 ( x x)( y y) 0 ( x x)( y y) 0 i i i i ( xi, y )!! i ( xi, yi) ( x, y) ( x, y )!!( x, y ) i i i i ( x x)( y y) 0 ( x x)( y y) 0 i i i i TKK (c) Ilkka Melli (2004) 43

Kahde muuttuja havaitoaieisto kuvaamie Otoskovariassi: Merki määräytymie 4/4 Jos positiiviset termit summalausekkeesee (1) ( xi x)( yi y) tuottavie suorakaiteide yhteelaskettu pita-ala o suurempi (pieempi) kui egatiiviset termit tuottavie suorakaiteide yhteelaskettu pita-ala, otoskovariassi s xy merkki o positiivie (egatiivie). Site otoskovariassilla o taipumus saada positiivisia (egatiivisia) arvoja, jos havaitopisteide muodostama pistepilvi tai -parvi äyttää ousevalta (laskevalta) oikealle metäessä; ks. pistediagrammi ilmee ja Pearsoi otoskorrelaatiokertoime yhteyttä kuvaavia havaiollistuksia tässä kappaleessa. TKK (c) Ilkka Melli (2004) 44

Kahde muuttuja havaitoaieisto kuvaamie Otoskovariassi: Tulkita Havaitoarvoje pareista (x i, y i ), i = 1, 2,, laskettu otoskovariassi s xy mittaa x-ja y-havaitoarvoje yhteisvaihtelua iide aritmeettiste keskiarvoje ympärillä. Mitä suurempi o otoskovariassi s xy itseisarvo s xy sitä voimakkaampaa o x-ja y-havaitoarvoje yhteisvaihtelu. TKK (c) Ilkka Melli (2004) 45

Kahde muuttuja havaitoaieisto kuvaamie Otoskovariassi ja Pearsoi otoskorrelaatiokerroi Otoskovariassi s xy avulla voidaa määritellä x-ja y- havaitoarvoje lieaarise tilastollise riippuvuude voimakkuude mittari, jota kutsutaa Pearsoi otoskorrelaatiokertoimeksi. Pearsoi otoskorrelaatiokerroi r xy saadaa otoskovariassista s xy ormeerausoperaatiolla, jossa x-ja y- havaitoarvoje otoskovariassi s xy jaetaa x-ja y- havaitoarvoje keskihajooilla s x ja s y. TKK (c) Ilkka Melli (2004) 46

Kahde muuttuja havaitoaieisto kuvaamie Pearsoi otoskorrelaatiokerroi: Määritelmä 1/2 Havaitoarvoje pareista (x i, y i ), i = 1, 2,, laskettu Pearsoi otoskorrelaatiokerroi o sxy rxy = ss jossa s xy = x-ja y-havaitoarvoje otoskovariassi s x s y x y = x-havaitoarvoje keskihajota = y-havaitoarvoje keskihajota TKK (c) Ilkka Melli (2004) 47

Kahde muuttuja havaitoaieisto kuvaamie Pearsoi otoskorrelaatiokerroi: Määritelmä 2/2 Havaitoarvoje pareista (x i, y i ), i = 1, 2,, laskettu Pearsoi otoskorrelaatiokerroi voidaa kirjoittaa myös muotoo jossa r x y xy = i= 1 ( x x)( y y) i 2 2 ( xi x) ( yi y) i= 1 i= 1 i = x-havaitoarvoje aritmeettie keskiarvo = y-havaitoarvoje aritmeettie keskiarvo TKK (c) Ilkka Melli (2004) 48

Kahde muuttuja havaitoaieisto kuvaamie Pearsoi otoskorrelaatiokerroi: Omiaisuuksia Havaitoarvoje pareista (x i, y i ), i = 1, 2,, lasketulla Pearsoi otoskorrelaatiokertoimella r xy o seuraavat omiaisuudet: (i) 1 r + 1 (ii) r xy xy =± 1, jos ja vai jos y i = α + βx i jossa α ja β ovat reaalisia vakiota ja β 0. (iii) Korrelaatiokertoimella rxy ja kovariassilla s o aia sama merkki. xy TKK (c) Ilkka Melli (2004) 49

Kahde muuttuja havaitoaieisto kuvaamie Pearsoi otoskorrelaatiokerroi: Tulkita Havaitoarvoje pareista (x i, y i ), i = 1, 2,, laskettu Pearsoi otoskorrelaatiokerroi r xy mittaa x-ja y-havaitoarvoje lieaarise tilastollise riippuvuude voimakkuutta. Jos r xy = ±1, ii x-ja y-havaitoarvoje välillä o eksakti eli fuktioaalie lieaarie riippuvuus, mikä merkitsee sitä, että kaikki havaitopisteet (x i, y i ) asettuvat samalle suoralle. Jos r xy = 0, ii x-ja y-havaitoarvoje välillä ei voi olla eksaktia lieaarista riippuvuutta. Vaikka r xy = 0, x-ja y-havaitoarvoje välillä saattaa silti olla jopa eksakti epälieaarie riippuvuus. TKK (c) Ilkka Melli (2004) 50

Kahde muuttuja havaitoaieisto kuvaamie Pearsoi otoskorrelaatiokerroi: Havaiollistus Kuviot alla havaiollistavat kahde muuttuja havaittuje arvoje ( = 30) pistediagrammi ilmee ja korrelaatio välistä yhteyttä. r xy = 0.81 r xy = 0.62 r xy = 0.48 r xy = 0.43 r xy = 0.83 r xy = 1 TKK (c) Ilkka Melli (2004) 51

Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie 1/4 Oletetaa, että haluamme laskea havaitoarvoje pareista (x i, y i ), i = 1, 2,, seuraavat otostuusluvut käsi tai käyttämällä laskita: (i) Aritmeettiset keskiarvot: (ii) Variassit: sx, s (iii) Keskihajoat: s (iv) Kovariassi: (v) Korrelaaatio: 2 2 y s xy r xy x, s y Tällöi tarvittavat laskutoimitukset o mukavita järjestää seuraavalla kalvolla esitettävä kaavio muotoo. x, y TKK (c) Ilkka Melli (2004) 52

Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie 2/4 Määrätää esi havaitoarvoje summat, eliösummat ja tulosumma: i x y x y x y 1 2 Summa 2 2 i i i i i i 2 2 1 1 1 1 1 1 2 2 2 2 2 2 2 2 x y x y x y x y x y x y # # # # # # x y x y x y 2 2 2 2 i i xi yi i= 1 i= 1 i= 1 i= 1 i= 1 x y x y i i TKK (c) Ilkka Melli (2004) 53

TKK (c) Ilkka Melli (2004) 54 Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie 3/4 Havaitoarvoje aritmeettiset keskiarvot, variassit ja kovariassi saadaa havaitoarvoje summista, eliösummista ja tulosummasta alla esitetyillä kaavoilla: 1 2 1 2 1 1 1 1 1 2 2 2 1 2 1 1 1 1 1 1 1 1 1 1 1 1 i i i i x y xy i i i i i i i i i i i i i i i x x s y s xy x y x y y s x y = = = = = = = = = = = = = =

Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie 4/4 Havaitoarvoje keskihajoat ja Pearsoi otoskorrelaatiokerroi saadaa havaitoarvoje variasseista ja kovariassista alla esitetyillä kaavoilla: s s r x y xy = = = s s s x 2 x 2 y xy ss y TKK (c) Ilkka Melli (2004) 55

Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie: Havaiollistava esimerkki 1/5 Taulukossa oikealla o keiotekoise kahde muuttuja aieisto havaitoarvot ( = 6). Aieistoa kuvaava pistediagrammi o oikealla alhaalla. i x y 1 1 2.5 2 3 3 3 4 6 4 6 5 5 7 7.5 6 8 8 10 Pistediagrammi 8 6 y 4 2 0 0 2 4 6 8 10 x TKK (c) Ilkka Melli (2004) 56

Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie: Havaiollistava esimerkki 2/5 Alla olevassa taulukossa o laskettu muuttujie x ja y havaittuje arvoje summat, eliösummat ja tulosumma. i x y x 2 y 2 xy 1 1 2.5 1 6.25 2.5 2 3 3 9 9 9 3 4 6 16 36 24 4 6 5 36 25 30 5 7 7.5 49 56.25 52.5 6 8 8 64 64 64 Summa 29 32 175 196.5 182 Muuttujie x ja y havaittuje arvoje aritmeettiset keskiarvot, otosvariassit, keskihajoat, otoskovariassi ja otoskorrelaatio voidaa laskea äistä viidestä summasta; ks. seuraavaa kalvoa. TKK (c) Ilkka Melli (2004) 57

Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie: Havaiollistava esimerkki 3/5 Keskiarvot, otosvariassit ja otoskovariassi: 1 1 x = xi = 29 = 4.833 6 i= 1 2 2 1 2 1 1 1 2 sx = xi xi = 175 29 = 6.967 1 i= 1 i= 1 6 1 6 1 1 y = yi = 32 = 5.333 6 i= 1 2 2 1 2 1 1 1 2 sy = yi yi = 196.5 32 = 5.167 1 i= 1 i= 1 6 1 6 s 1 1 1 1 = x y i i 182 29 32 x y = i= 1 i= 1 6 1 6 = 5.467 xy i i 1 i= 1 TKK (c) Ilkka Melli (2004) 58

Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie: Havaiollistava esimerkki 4/5 Otoskeskihajoat ja otoskorrelaatio: s s r x y xy = s = 6.967 = 2.639 2 x = s = 5.167 = 2.273 2 y sxy 5.467 = = = ss 2.639 2.273 x y 0.9112 TKK (c) Ilkka Melli (2004) 59

Kahde muuttuja havaitoaieisto kuvaamie Tuuslukuje laskemie: Havaiollistava esimerkki 5/5 Kuvioo oikealla o lisätty havaitopisteide paiopiste ( x, y ) = (4.833,5.333) 10 8 II Pistediagrammi I Lisäksi kuvioo o piirretty paiopistee kautta kulkevat koordiaattiakseleide suutaiset suorat sekä kovariassi ja korrelaatio merki määräytymistä havaiollistavat suorakaiteet. Kovariassi (ja site myös korrelaatio) o positiivie, koska I ja III eljäekse suorakaiteide yhteelaskettu pita-ala o suurempi kui II ja IV eljäekse suorakaiteide yhteelaskettu pita-ala; ks. tässä kappaleessa esitettyä selitystä kovariassi merki määräytymisestä. y 6 4 2 0 III ( x, y) IV 0 2 4 6 8 10 x TKK (c) Ilkka Melli (2004) 60

Tilastollie riippuvuus ja korrelaatio Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto kuvaamie >> Pearsoi korrelaatiokertoime estimoiti ja testaus Järjestyskorrelaatiokertoimet TKK (c) Ilkka Melli (2004) 61

Pearsoi korrelaatiokertoime estimoiti ja testaus Avaisaat Fisheri z-muuos Korrelaatio Korrelaatiokertoime testaamie Korrelaatiokertoimie vertailutesti Korreloimattomuude testaamie Pearsoi korrelaatiokerroi Pearsoi korrelaatiokertoime estimoiti Pearsoi korrelaatiokertoime luottamusväli Pearsoi otoskorrelaatiokerroi TKK (c) Ilkka Melli (2004) 62

Pearsoi korrelaatiokertoime estimoiti ja testaus Korrelaatio estimoiti ja testaus Tarkastellaa välimatka-tai suhdeasteikolliste satuaismuuttujie X ja Y Pearsoi (tulomometti-) korrelaatiokertoime ρ XY estimoitia sekä seuraavia testejä korrelaatiokertoimelle ρ XY : Yhde otokse testi korrelaatiokertoimelle Korrelaatiokertoimie vertailutesti Korreloimattomuude testaamie Lisätietoja moiulotteisista satuaismuuttujista: ks. lukua Moiulotteiset satuaismuuttujat ja todeäköisyysjakaumat. TKK (c) Ilkka Melli (2004) 63

Pearsoi korrelaatiokertoime estimoiti ja testaus Satuaismuuttujie kovariassi ja korrelaatio 1/2 Olkoo (X, Y) satuaismuuttujie X ja Y muodostama järjestetty pari. Olkoot µ X = E( X ) µ Y = E( Y ) satuaismuuttujie X ja Y odotusarvot ja σ = Var( X) = D ( X) = E[( X µ ) ] 2 2 2 X X 2 2 2 σ Y = Var( Y) = D ( Y) = E[( Y µ Y) ] satuaismuuttujie X ja Y variassit. TKK (c) Ilkka Melli (2004) 64

Pearsoi korrelaatiokertoime estimoiti ja testaus Satuaismuuttujie kovariassi ja korrelaatio 2/2 Määritellää satuaismuuttujie X ja Y kovariassi σ XY kaavalla σ = Cov( XY, ) = E[( X µ )( Y µ )] XY X Y Määritellää satuaismuuttujie X ja Y korrelaatio ρ XY kaavalla σ XY ρ XY = Cor( XY, ) = σ Xσ Y jossa σ σ X Y = D( X ) = = D( Y ) = σ σ 2 Y 2 X TKK (c) Ilkka Melli (2004) 65

Pearsoi korrelaatiokertoime estimoiti ja testaus Satuaismuuttujie korrelaatio Satuaismuuttujie X ja Y korrelaatiota ρ XY = Cor(X, Y) kutsutaa tavallisesti Pearsoi (tulomometti-) korrelaatiokertoimeksi. Pearsoi korrelaatiokerroi ρ XY mittaa satuaismuuttujie X ja Y lieaarise riippuvuude voimakkuutta. TKK (c) Ilkka Melli (2004) 66

Pearsoi korrelaatiokertoime estimoiti ja testaus Pearsoi korrelaatiokertoime estimoiti 1/3 Oletetaa, että satuaismuuttujie X ja Y muodostama järjestetty pari (X, Y) oudattaa 2-ulotteista ormaalijakaumaa N 2 (µ X, µ Y, σ X2, σ Y2, ρ XY ), jossa µ = E( X) µ = E( Y) σ X ρ XY = Cor( XY, ) ks. lukua Moiulotteisia todeäköisyysjakaumia. Olkoo 2 2 X Y ( X, Y), i = 1,2,, i = Var( X) σ = Var( Y) i riippumato satuaisotos satuaismuuttujie X ja Y muodostama pari (X, Y) jakaumasta. Y TKK (c) Ilkka Melli (2004) 67

Pearsoi korrelaatiokertoime estimoiti ja testaus Pearsoi korrelaatiokertoime estimoiti 2/3 Olkoot 1 1 X = X Y = Y i i= 1 i= 1 1 1 s X X s Y Y 2 2 2 2 X = ( i ) Y = ( i ) 1 i= 1 1 i= 1 1 s = ( X X)( Y Y) XY i i 1 i= 1 sxy rxy = sxsy tavaomaiset havaitoarvoje pareista lasketut otostuusluvut. TKK (c) Ilkka Melli (2004) 68 i ( X, Y), i = 1,2,, i i

Pearsoi korrelaatiokertoime estimoiti ja testaus Pearsoi korrelaatiokertoime estimoiti 3/3 Satuaismuuttujie X ja Y Pearsoi (tulomometti-) korrelaatiokerroi σ XY ρ XY = Cor( XY, ) = σ σ voidaa estimoida vastaavalla Pearsoi otoskorrelaatiokertoimella sxy rxy = s s Huomautus: X Y X Y Estimaattori r XY voidaa johtaa sekä momettimeetelmällä että suurimma uskottavuude meetelmällä. TKK (c) Ilkka Melli (2004) 69

Pearsoi korrelaatiokertoime estimoiti ja testaus Fisheri z-muuos Määritellää Fisheri z-muuos kaavalla 1 1+ u z = f( u) = log 2 1 u Fisheri z-muuosta soveltamalla luottamusvälit ja testit Pearsoi tulomomettikorrelaatiokertoimelle ρ XY voidaa kostruoida samalaisella tekiikalla kui luottamusvälit ja testit kostruoidaa ormaalijakauma odotusarvolle; ks. lukua Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Melli (2004) 70

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Oletukset Oletetaa, että satuaismuuttujie X ja Y muodostama järjestetty pari (X, Y) oudattaa 2-ulotteista ormaalijakaumaa N 2 (µ X, µ Y, σ X2, σ Y2, ρ XY ), jossa µ = E( X) µ = E( Y) σ X ρ Olkoo = Var( X) σ = Var( Y) 2 2 X Y XY = Cor( XY, ) ( Xi, Yi), i = 1,2,, riippumato satuaisotos satuaismuuttujie X ja Y muodostama pari (X, Y) jakaumasta. Y TKK (c) Ilkka Melli (2004) 71

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Parametrie estimoiti Estimoidaa 2-ulotteise ormaalijakauma parametrit tavaomaisilla estimaattoreillaa: 1 1 X = X Y = Y i i= 1 i= 1 1 1 s X X s Y Y 2 2 2 2 X = ( i ) Y = ( i ) 1 i= 1 1 i= 1 1 s = ( X X)( Y Y) r XY i i 1 i= 1 XY = sxy s s X Y i TKK (c) Ilkka Melli (2004) 72

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Fisheri z-muuos 1/2 Sovelletaa Fisheri z-muuosta z = f (u) otoskorrelaatiokertoimee r XY : 1 1+ rxy z = f( rxy ) = log 2 1 r XY Voidaa osoittaa, että satuaismuuttuja z oudattaa suurissa otoksissa approksimatiivisesti ormaalijakaumaa: z 2 a N( µ z, σ z) jossa 1 1+ ρ XY 2 1 µ z = log ja σz = 2 1 ρ XY 3 Approksimaatio o käytäössä riittävä hyvä, ku > 25. TKK (c) Ilkka Melli (2004) 73

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Fisheri z-muuos 2/2 Pearsoi korrelaatiokertoimelle ρ XY voidaa kostruoida approksimatiivie luottamusväli Fisheri z-muuokse avulla. Olkoo 1 1+ ρ XY 2 1 µ z = log ja σz = 2 1 ρ XY 3 Tällöi stadardoitu satuaismuuttuja z µ z v = σ z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0,1): v a N(0,1) TKK (c) Ilkka Melli (2004) 74

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Luottamustaso Määrätää approksimatiivie luottamusväli Pearsoi korrelaatiokertoimelle ρ XY. Valitaa luottamustasoksi 1 α Luottamustaso valita kiiittää todeäköisyyde, jolla kostruoitava luottamusväli peittää korrelaatiokertoime ρ XY oikea arvo. TKK (c) Ilkka Melli (2004) 75

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Luottamuskertoimet 1/2 Olkoo luottamustasoa (1 α). Valitaa luottamuskerroi eli piste +z α/2 site, että se erottaa stadardoidu ormaalijakauma N(0, 1) oikealle häälle todeäköisyysmassa α/2. Koska ormaalijakauma o symmetrie, luottamuskerroi eli piste z α/2 erottaa stadardoidu ormaalijakauma vasemmalle häälle todeäköisyysmassa α/2. TKK (c) Ilkka Melli (2004) 76

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Luottamuskertoimet 2/2 Site luottamuskertoimet +z α/2 ja z α/2 valitaa site, että α Pr( z + zα /2) = 2 α Pr( z zα /2) = 2 jossa satuaismuuttuja z oudattaa stadardoitua ormaalijakaumaa: z N(0,1) Huomaa, että Pr( z z + z ) = 1 α /2 α /2 α TKK (c) Ilkka Melli (2004) 77

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Parametri µ z luottamusväli 1/2 Parametri 1 1+ ρ log XY µ z = 2 1 ρ XY approksimatiivie luottamusväli luottamustasolla (1 α) o edellä esitety ojalla muotoa 1 1 z zα/2, z+ zα/2 3 3 TKK (c) Ilkka Melli (2004) 78

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Parametri µ z luottamusväli 2/2 Parametri µ z approksimatiivise luottamusväli 1 1 z zα/2, z+ zα/2 3 3 kaavassa 1 1+ rxy z = f( rxy ) = log 2 1 r XY = havaitoje lukumäärä z α/2, +z α/2 = luottamustasoo (1 α) liittyvät luottamuskertoimet stadardoidusta ormaalijakaumasta N(0, 1) TKK (c) Ilkka Melli (2004) 79

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Parametri µ z luottamusväli tulkita Parametri µ z approksimatiivise luottamusväli 1 1 z zα/2, z+ zα/2 3 3 kostruktiosta seuraa, että 1 1 Pr z zα/2 µ z z+ zα/2 = a1 α 3 3 Site kostruoitu luottamusväli peittää parametri µ z oikea arvo approksimatiivisesti todeäköisyydellä (1 α)ja se ei peitä parametri µ z oikeata arvoa approksimatiivisesti todeäköisyydellä α. TKK (c) Ilkka Melli (2004) 80

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Korrelaatiokertoime ρ XY luottamusväli 1/2 Pearsoi korrelaatiokertoime ρ XY approksimatiivie luottamusväli saadaa parametri µ z luottamusvälistä ratkaisemalla ρ XY epäyhtälöketjusta 1 1 1+ r 1 z z = log z 3 3 µ = z XY α/2 α/2 2 1 rxy 1 1+ ρ log 2 1 ρ XY XY 1 1 1+ r 1 z + z = log + z 3 3 XY α/2 α/2 2 1 rxy TKK (c) Ilkka Melli (2004) 81

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Korrelaatiokertoime ρ XY luottamusväli 2/2 Pearsoi korrelaatiokertoime ρ XY approksimatiiviseksi luottamusväliksi saadaa (lb, ub) jossa (1 + rxy ) (1 rxy ) exp + 2zα /2 3 lb = (1 + rxy ) + (1 rxy ) exp + 2zα /2 3 o luottamusväli alaraja ja (1 + rxy ) (1 rxy ) exp 2zα /2 3 ub = (1 + rxy ) + (1 rxy ) exp 2zα /2 3 o luottamusväli yläraja. ( ) ( ) ( ) ( ) TKK (c) Ilkka Melli (2004) 82

Pearsoi korrelaatiokertoime estimoiti ja testaus Luottamusväli Pearsoi korrelaatiokertoimelle: Korrelaatiokertoime ρ XY luottamusväli tulkita Pearsoi korrelaatiokertoime ρ XY approksimatiivise luottamusväli (lb, ub) kostruktiosta seuraa, että ( ) Pr lb ρ XY ub = a 1 α Site kostruoitu luottamusväli peittää korrelaatiokertoime ρ XY oikea arvo approksimatiivisesti todeäköisyydellä (1 α)ja se ei peitä korrelaatiokertoime ρ XY oikeata arvoa approksimatiivisesti todeäköisyydellä α. TKK (c) Ilkka Melli (2004) 83

Pearsoi korrelaatiokertoime estimoiti ja testaus Yhde otokse testi korrelaatiokertoimelle: Testausasetelma Tarkastellaa yhde otokse testiä Pearsoi korrelaatiokertoimelle. Fisheriz-muuokse avulla testi voidaa pukea tavaomaise t-testi muotoo. TKK (c) Ilkka Melli (2004) 84

Pearsoi korrelaatiokertoime estimoiti ja testaus Yhde otokse testi korrelaatiokertoimelle: Yleie hypoteesi Yleie hypoteesi H : (i) Oletetaa, että satuaismuuttujie X ja Y muodostama järjestetty pari (X, Y) oudattaa 2- ulotteista ormaalijakaumaa, joka parametrit ovat µ = E( X) µ = E( Y) σ X = Var( X) σ = Var( Y) 2 2 X Y ρ XY = Cor( XY, ) (ii) Olkoo ( X, Y), i = 1,2,, i i riippumato satuaisotos satuaismuuttujie X ja Y muodostama pari (X, Y) jakaumasta. Y TKK (c) Ilkka Melli (2004) 85

Pearsoi korrelaatiokertoime estimoiti ja testaus Yhde otokse testi korrelaatiokertoimelle: Nollahypoteesi ja vaihtoehtoie hypoteesi Nollahypoteesi H 0 : H : ρ ρ 0 XY 0 Vaihtoehtoie hypoteesi H 1 : H: ρ = 1 XY 0 H: ρ 1 XY 0 H : ρ > ρ < ρ ρ 1 XY 0 1-suutaiset vaihtoehtoiset hypoteesit 2-suutaie vaihtoehtoie hypoteesi TKK (c) Ilkka Melli (2004) 86

Pearsoi korrelaatiokertoime estimoiti ja testaus Yhde otokse testi korrelaatiokertoimelle: Parametrie estimoiti Estimoidaa 2-ulotteise ormaalijakauma parametrit tavaomaisilla estimaattoreillaa: 1 1 X = X Y = Y i i= 1 i= 1 1 1 s X X s Y Y 2 2 2 2 X = ( i ) Y = ( i ) 1 i= 1 1 i= 1 1 s = ( X X)( Y Y) r XY i i 1 i= 1 XY = sxy s s X Y i TKK (c) Ilkka Melli (2004) 87

Pearsoi korrelaatiokertoime estimoiti ja testaus Yhde otokse testi korrelaatiokertoimelle: Fisheri z-muuos 1/2 Sovelletaa Fisheri z-muuosta z = f (u) otoskorrelaatiokertoimee r XY : 1 1+ rxy z = f( rxy ) = log 2 1 r XY Satuaismuuttuja z oudattaa suurissa otoksissa approksimatiivisesti ormaalijakaumaa: z 2 a N( µ z, σ z) jossa 1 1+ ρ XY 2 1 µ z = log ja σz = 2 1 ρ XY 3 Approksimaatio o riittävä hyvä, ku > 25. TKK (c) Ilkka Melli (2004) 88

Pearsoi korrelaatiokertoime estimoiti ja testaus Yhde otokse testi korrelaatiokertoimelle: Fisheri z-muuos 2/2 Testi ollahypoteesille H : ρ ρ 0 XY 0 voidaa perustaa Fisheri z-muuokse käyttöö. Jos ollahypoteesi H 0 pätee, = 1 1+ ρ 0 0 E( z) = log = µ z 2 1 ρ0 Site satuaismuuttuja 0 z µ z v = σ z oudattaa ollahypoteesi H 0 pätiessä suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa. TKK (c) Ilkka Melli (2004) 89

Pearsoi korrelaatiokertoime estimoiti ja testaus Yhde otokse testi korrelaatiokertoimelle: Testisuure ja se jakauma Määritellää testisuure v = Jos ollahypoteesi H : ρ 1 1+ r 1 1+ ρ log log 2 1 2 1 0 XY 0 XY 0 r XY ρ 0 1 3 pätee, testisuure v oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: v a = ρ N(0,1) TKK (c) Ilkka Melli (2004) 90

Pearsoi korrelaatiokertoime estimoiti ja testaus Yhde otokse testi korrelaatiokertoimelle: Testi Testisuuree v ormaaliarvo = 0, koska ollahypoteesi H : ρ = ρ pätiessä 0 XY 0 E(v) = 0 Site itseisarvoltaa suuret testisuuree v arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. TKK (c) Ilkka Melli (2004) 91

Pearsoi korrelaatiokertoime estimoiti ja testaus Korrelaatiokertoimie vertailutesti: Testausasetelma Tarkastellaa vertailutestiä Pearsoi korrelaatiokertoimille. Fisheriz-muuokse avulla testi voidaa pukea tavaomaise riippumattomie otoste t-testi muotoo. TKK (c) Ilkka Melli (2004) 92

Pearsoi korrelaatiokertoime estimoiti ja testaus Korrelaatiokertoimie vertailutesti: Hypoteesit Yleie hypoteesi H : Oletetaa, että käytössä o kaksi toisistaa riippumatota yksikertaista satuaisotosta perusjoukoista, jotka oudattavat 2-ulotteisia ormaalijakaumia, joide korrelaatiokertoimet ovat ρ 1 ja ρ 2. Nollahypoteesi H 0 : H 0 : ρ 1 = ρ 2 = ρ 0 Vaihtoehtoie hypoteesi H 1 : H: 1 ρ1 > ρ2 H: 1 ρ1 < ρ2 H : ρ ρ 1 1 2 1-suutaiset vaihtoehtoiset hypoteesit 2-suutaie vaihtoehtoie hypoteesi TKK (c) Ilkka Melli (2004) 93

Pearsoi korrelaatiokertoime estimoiti ja testaus Korrelaatiokertoimie vertailutesti: Parametrie estimoiti Olkoot 1 ja 2 otoskoot otoksista 1 ja 2. Olkoot r 1 ja r 2 otoksista 1 ja 2 lasketut Pearsoi otoskorrelaatiokertoimet. TKK (c) Ilkka Melli (2004) 94

Pearsoi korrelaatiokertoime estimoiti ja testaus Korrelaatiokertoimie vertailutesti: Fisheri z-muuokset Olkoo 1 1+ rk zk = f( rk) = log 2 1 r k Fisheri z-muuos otoksesta k lasketulle otoskorrelaatiokertoimelle r k, k = 1, 2. Jos ollahypoteesi H 0 : ρ 1 = ρ 2 = ρ 0 pätee, satuaismuuttuja z k, k = 1, 2 oudattaa suurissa otoksissa 0 2 approksimatiivisesti ormaalijakaumaa N( µ, σ ), jossa 0 1 1+ ρ 0 2 1 µ z = log ja σk = 2 1 ρ0 k 3 Approksimaatio o riittävä hyvä, ku 1 > 25 ja 2 > 25. z k TKK (c) Ilkka Melli (2004) 95

Pearsoi korrelaatiokertoime estimoiti ja testaus Korrelaatiokertoimie vertailutesti: Testisuure ja se jakauma 1/2 Koska satuaismuuttujat z 1 ja z 2 ovat riippumattomia, satuaismuuttuja z1 z2 v = 1 1 + 3 3 1 2 oudattaa ollahypoteesi H 0 : ρ 1 = ρ 2 = ρ 0 pätiessä suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: v ~ N(0,1) a TKK (c) Ilkka Melli (2004) 96

Pearsoi korrelaatiokertoime estimoiti ja testaus Korrelaatiokertoimie vertailutesti: Testisuure ja se jakauma 2/2 Määritellää testisuure 1 1+ r1 1 1+ r2 log log 2 1 r 1 2 1 r 2 v = 1 1 + 1 3 2 3 Jos ollahypoteesi H 0 : ρ 1 = ρ 2 = ρ 0 pätee, testisuure v oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: v a N(0,1) TKK (c) Ilkka Melli (2004) 97

Pearsoi korrelaatiokertoime estimoiti ja testaus Korrelaatiokertoimie vertailutesti: Testi Testisuuree v ormaaliarvo = 0, koska ollahypoteesi H 0 : ρ 1 = ρ 2 = ρ 0 pätiessä E(v) = 0 Site itseisarvoltaa suuret testisuuree v arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. TKK (c) Ilkka Melli (2004) 98

Pearsoi korrelaatiokertoime estimoiti ja testaus Korreloimattomuude testaamie: Testausasetelma Moissa tutkimustilateissa ollaa kiiostueita siitä ovatko satuaismuuttujat X ja Y korreloimattomia vai ei. Huomautuksia: Satuaismuuttujie X ja Y korreloimattomuudesta ei välttämättä seuraa iide riippumattomuus, vaikka satuaismuuttujie X ja Y riippumattomuudesta seuraa aia iide korreloimattomuus. Jos satuaismuuttujat X ja Y oudattavat 2-ulotteista ormaalijakaumaa, satuaismuuttujie X ja Y korreloimattomuudesta seuraa iide riippumattomuus. Moissa tutkimusasetelmissa toivotaa, että korreloimattomuusoletus tulee testissä hylätyksi. TKK (c) Ilkka Melli (2004) 99

Pearsoi korrelaatiokertoime estimoiti ja testaus Korreloimattomuude testaamie: Yleie hypoteesi Yleie hypoteesi H : (i) Oletetaa, että satuaismuuttujie X ja Y järjestetty pari (X, Y) oudattaa 2-ulotteista ormaalijakaumaa, joka parametrit ovat µ = E( X) µ = E( Y) σ X = Var( X) σ = Var( Y) 2 2 X Y ρ XY = Cor( XY, ) (ii) Olkoo ( X, Y), i = 1,2,, i i riippumato satuaisotos satuaismuuttujie X ja Y muodostama pari (X, Y) jakaumasta. Y TKK (c) Ilkka Melli (2004) 100

Pearsoi korrelaatiokertoime estimoiti ja testaus Korreloimattomuude testaamie: Nollahypoteesi ja vaihtoehtoie hypoteesi Nollahypoteesi H 0 : H : ρ = 0 0 XY Vaihtoehtoie hypoteesi H 1 : H: 1 ρ XY > 0 1-suutaiset vaihtoehtoiset hypoteesit H: 1 ρ XY < 0 H : ρ 0 2-suutaie vaihtoehtoie hypoteesi 1 XY TKK (c) Ilkka Melli (2004) 101

Pearsoi korrelaatiokertoime estimoiti ja testaus Korreloimattomuude testaamie: Parametrie estimoiti Estimoidaa 2-ulotteise ormaalijakauma parametrit tavaomaisilla estimaattoreillaa: 1 1 X = X Y = Y i i= 1 i= 1 1 1 s X X s Y Y 2 2 2 2 X = ( i ) Y = ( i ) 1 i= 1 1 i= 1 1 s = ( X X)( Y Y) r XY i i 1 i= 1 XY = sxy s s X Y i TKK (c) Ilkka Melli (2004) 102

Pearsoi korrelaatiokertoime estimoiti ja testaus Korreloimattomuude testaamie: Testisuure ja se jakauma Määritellää t-testisuure rxy t = 2 1 r Jos ollahypoteesi H : ρ = 0 0 XY 2 XY pätee, testisuure t oudattaa Studeti t-jakaumaa, joka vapausasteluku o 2: t t( 2) TKK (c) Ilkka Melli (2004) 103

Pearsoi korrelaatiokertoime estimoiti ja testaus Korreloimattomuude testaamie: Testi Testisuuree t ormaaliarvo = 0, koska ollahypoteesi H : ρ = 0pätiessä 0 XY E(t) = 0 Site itseisarvoltaa suuret testisuuree t arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. TKK (c) Ilkka Melli (2004) 104

Tilastollie riippuvuus ja korrelaatio Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto kuvaamie Pearsoi korrelaatiokertoime estimoiti ja testaus >> Järjestyskorrelaatiokertoimet TKK (c) Ilkka Melli (2004) 105

Järjestyskorrelaatiokertoimet Avaisaat Järjestyskorrelaatiokertoimet Kedalli järjestyskorrelaatiokerroi Korrelaatio Korreloimattomuude testaamie Spearmai järjestyskorrelaatiokerroi TKK (c) Ilkka Melli (2004) 106

Järjestyskorrelaatiokertoimet Korreloimattomuude testaamie järjestysasteikollisilla muuttujilla Tarkastellaa korrelaatiokertoime määrittelemistä ja korreloimattomuude testaamista järjestysasteikollisille muuttujille. Tarkastelu kohteea ovat seuraavat järjestyskorrelaatiokertoimet: Spearmai järjestyskorrelaatiokerroi Kedalli järjestyskorrelaatiokerroi Tarkasteltavat järjestyskorrelaatiokertoimet ja testit sopivat myös välimatka-ja suhdeasteikollisille muuttujille. TKK (c) Ilkka Melli (2004) 107

Järjestyskorrelaatiokertoimet Spearmai järjestyskorrelaatiokerroi: Kertoime idea Spearmai järjestyskorrelaatiokerroi ρ S mittaa kahde muuttuja havaitoarvoje suuruusjärjestyksie yhteesopivuutta. Spearmai järjestyskorrelaatiokerroi sopii järjestys-, välimatka-ja suhdeasteikollisille muuttujille. Spearmai järjestyskorrelaatiokertoimella o samatapaiset omiaisuudet kui Pearsoi otoskorrelaatiokertoimella. TKK (c) Ilkka Melli (2004) 108

Järjestyskorrelaatiokertoimet Spearmai järjestyskorrelaatiokerroi: Määritelmä 1/3 Olkoot X 1, X 2,, X ja Y 1, Y 2,, Y järjestys-, välimatka-tai suhdeasteikolliste satuaismuuttujie X ja Y havaittuja arvoja. Oletetaa lisäksi, että havaiot X i ja Y i liittyvät samaa havaitoyksikköö kaikille i = 1, 2,,. Järjestetää sekä X- että Y-muuttuja havaitut arvot suuruusjärjestyksee pieimmästä suurimpaa. TKK (c) Ilkka Melli (2004) 109

Järjestyskorrelaatiokertoimet Spearmai järjestyskorrelaatiokerroi: Määritelmä 2/3 Liitetää sekä X- että Y-muuttuja havaittuihi arvoihi iide suuruusjärjestyksie mukaiset järjestysumerot: R(X i ) = havaio X i järjestysumero parissa i R(Y i ) = havaio Y i järjestysumero parissa i sekä määritellää erotukset D i = R(X i ) R(Y i ) Muuttujie X ja Y havaituille arvoille voidaa määritellä järjestyskorrelaatiokerroi erotuksie D i avulla. TKK (c) Ilkka Melli (2004) 110

Järjestyskorrelaatiokertoimet Spearmai järjestyskorrelaatiokerroi: Määritelmä 3/3 Määritellää Spearmai järjestyskorrelaatiokerroi ρ S eli Spearmai rho kaavalla 1 6 i= 1 ρ S = 3 Spearmai järjestyskorrelaatiokerroi ρ S voidaa laskea myös soveltamalla Pearsoi otoskorrelaatiokertoime kaavaa muuttujie X ja Y havaittuje arvoje pareja (X i, Y i ) vastaavii järjestyslukuje eli rakie pareihi (R(X i ), R(Y i )) D 2 i TKK (c) Ilkka Melli (2004) 111

Järjestyskorrelaatiokertoimet Spearmai järjestyskorrelaatiokerroi: Omiaisuudet 1/2 Spearmai järjestyskorrelaatiokertoimella ρ S o kaikki hyvältä korrelaatio mitalta vaadittavat omiaisuudet: (i) 1 ρ S +1 (ii) Jos muuttujie X ja Y havaittuje arvoje järjestysumerot ovat jokaisessa havaitoparissa samat, ρ S = +1 (iii) Jos muuttujie X ja Y havaittuje arvoje järjestysumerot liittyvät toisiisa täysi satuaisesti, ρ S 0 Jos ρ S = 0, saotaa, että muuttujat X ja Y ovat korreloimattomia. TKK (c) Ilkka Melli (2004) 112

Järjestyskorrelaatiokertoimet Spearmai järjestyskorrelaatiokerroi: Omiaisuudet 2/2 (iv) Jos sekä suuret muuttujie X ja Y järjestysumerot että pieet muuttujie X ja Y järjestysumerot liittyvät havaitopareissa (X i, Y i ) toisiisa, kertoimella ρ S o taipumus saada positiivisia arvoja. (v) Jos suuret ja pieet muuttujie X ja Y järjestysumerot liittyvät havaitopareissa (X i, Y i ) toisiisa, kertoimella ρ S o taipumus saada egatiivisia arvoja. TKK (c) Ilkka Melli (2004) 113

Järjestyskorrelaatiokertoimet Spearmai järjestyskorrelaatiokerroi: Korreloimattomuude testaamie 1/2 Määritellää t-testisuure ρs z = 2 1 2 ρs Jos ollahypoteesi H 0 :Cor( XY, ) = 0 pätee, testisuure z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa: z a N(0,1) TKK (c) Ilkka Melli (2004) 114

Järjestyskorrelaatiokertoimet Spearmai järjestyskorrelaatiokerroi: Korreloimattomuude testaamie 2/2 Testisuure z oudattaa suurissa otoksissa approksimatiivisesti stadardoitua ormaalijakaumaa N(0, 1), jos ollahypoteesi H 0 pätee. Approksimaatio o melko hyvä jo, ku > 10 ja riittävä lähes kaikkii tarkoituksii, ku > 30. Testisuuree z ormaaliarvo = 0, koska ollahypoteesi H 0 pätiessä E(z) = 0 Site itseisarvoltaa suuret testisuuree z arvot viittaavat siihe, että ollahypoteesi H 0 ei päde. Nollahypoteesi H 0 hylätää, jos testi p-arvo o kylli piei. TKK (c) Ilkka Melli (2004) 115

Järjestyskorrelaatiokertoimet Kedalli järjestyskorrelaatiokerroi: Kertoime idea Kedalli järjestyskorrelaatiokerroi τ mittaa kahde muuttuja havaitoarvoje suuruusjärjestyksie yhteesopivuutta. Kedalli järjestyskorrelaatiokerroi sopii järjestys-, välimatka-ja suhdeasteikollisille muuttujille. Kedalli järjestyskorrelaatiokertoimella o samatapaiset omiaisuudet kui Pearsoi otoskorrelaatiokertoimella. TKK (c) Ilkka Melli (2004) 116

Järjestyskorrelaatiokertoimet Kedalli järjestyskorrelaatiokerroi: Määritelmä 1/3 Olkoot X 1, X 2,, X ja Y 1, Y 2,, Y järjestys-, välimatka-tai suhdeasteikolliste satuaismuuttujie X ja Y havaittuja arvoja. Oletetaa lisäksi, että havaiot X i ja Y i liittyvät samaa havaitoyksikköö kaikille i = 1, 2,,. Järjestetää parit (X i, Y i ) muuttuja X havaittuje arvoje mukaa suuruusjärjestyksee pieimmästä suurimpaa. Kedalli järjestyskorrelaatiokerroi perustuu tuuslukuu, joka mittaa muuttuja Y arvoje epäjärjestystä muuttuja X arvoihi ähde. TKK (c) Ilkka Melli (2004) 117

Järjestyskorrelaatiokertoimet Kedalli järjestyskorrelaatiokerroi: Määritelmä 2/3 Järjestetää parit (X i, Y i ), i = 1, 2,, muuttuja X havaittuje arvoje mukaa site, että esimmäiseksi tulee pari, jossa muuttuja X arvo o piei ja viimeiseksi pari, jossa muuttuja X arvo o suuri. Olkoo (X k, Y k ) järjestetyksee asetetuista pareista umero k. Määritellää havaitoarvoo Y k liittyvät epäjärjestyspisteet S kl, l = k +1, k +2,,, k = 1, 2,, 1 seuraavalla tavalla: S kl = +1, jos Y l > Y k S kl = 1, jos Y l < Y k TKK (c) Ilkka Melli (2004) 118