Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos
Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170 175 150 155 160 165 170 175 180 äidin pituus (cm) Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 2 / 11
Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170 175 150 155 160 165 170 175 180 äidin pituus (cm) Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 2 / 11
Miten mitataan kahden muuttujan välistä riippuvuutta, kun muuttujat ovat vähintään välimatka-asteikkoa ja muuttujien välinen riippuvuus on luonteeltaan lineaarista? Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 3 / 11
Olkoon muuttujien ja y saamat arvot n havaintoyksiköllä ( 1, y 1 ), ( 2, y 2 ),...,( n, y n ). Tällöin yhteisvaihtelun mitta kovarianssi on. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 4 / 11
Olkoon muuttujien ja y saamat arvot n havaintoyksiköllä ( 1, y 1 ), ( 2, y 2 ),...,( n, y n ). Tällöin yhteisvaihtelun mitta kovarianssi on s = s y = 1 n 1 n ( i )(y i ȳ) i=1. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 4 / 11
Olkoon muuttujien ja y saamat arvot n havaintoyksiköllä ( 1, y 1 ), ( 2, y 2 ),...,( n, y n ). Tällöin yhteisvaihtelun mitta kovarianssi on s = s y = 1 n 1 n ( i )(y i ȳ) i=1 = 1 n 1 [( 1 )(y 1 ȳ) + ( 2 )(y 2 ȳ) +... +( n )(y n ȳ)]. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 4 / 11
Olkoon muuttujien ja y saamat arvot n havaintoyksiköllä ( 1, y 1 ), ( 2, y 2 ),...,( n, y n ). Tällöin yhteisvaihtelun mitta kovarianssi on s = s y = 1 n 1 n ( i )(y i ȳ) i=1 = 1 n 1 [( 1 )(y 1 ȳ) + ( 2 )(y 2 ȳ) +... +( n )(y n ȳ)]. Millaisia arvoja kovarianssi s y saa? Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 4 / 11
Esimerkki 1 jatkuu: s y = 1 n 1 [( 1 )(y 1 ȳ) + ( 2 )(y 2 ȳ) +... + ( n )(y n ȳ)] tyttären pituus (cm) 155 160 165 170 175 150 155 160 165 170 175 180 äidin pituus (cm) Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 5 / 11
Esimerkki 1 jatkuu: s y = 1 n 1 [( 1 )(y 1 ȳ) + ( 2 )(y 2 ȳ) +... + ( n )(y n ȳ)] tyttären pituus (cm) 155 160 165 170 175 167.5 cm 165.1 cm 150 155 160 165 170 175 180 äidin pituus (cm) Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 5 / 11
Esimerkki 1 jatkuu: s y = 1 n 1 [( 1 )(y 1 ȳ) + ( 2 )(y 2 ȳ) +... + ( n )(y n ȳ)] tyttären pituus (cm) 155 160 165 170 175 167.5 cm 165.1 cm 150 155 160 165 170 175 180 äidin pituus (cm) Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 5 / 11
Esimerkki 1 jatkuu: s y = 1 n 1 [( 1 )(y 1 ȳ) + ( 2 )(y 2 ȳ) +... + ( n )(y n ȳ)] tyttären pituus (cm) 155 160 165 170 175 167.5 cm 165.1 cm 150 155 160 165 170 175 180 äidin pituus (cm) Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 5 / 11
Jos muuttujien ja y välinen riippuvuus on positiivista ja lineaarista, s y saa positiivisia arvoja, negatiivista ja lineaarista, s y saa negatiivisia arvoja. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 6 / 11
Jos muuttujien ja y välinen riippuvuus on positiivista ja lineaarista, s y saa positiivisia arvoja, negatiivista ja lineaarista, s y saa negatiivisia arvoja. Kuinka voimakasta riippuvuus on? Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 6 / 11
Jos muuttujien ja y välinen riippuvuus on positiivista ja lineaarista, s y saa positiivisia arvoja, negatiivista ja lineaarista, s y saa negatiivisia arvoja. Kuinka voimakasta riippuvuus on? Esimerkissä: s y = 17.0 cm 2. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 6 / 11
Jos muuttujien ja y välinen riippuvuus on positiivista ja lineaarista, s y saa positiivisia arvoja, negatiivista ja lineaarista, s y saa negatiivisia arvoja. Kuinka voimakasta riippuvuus on? Esimerkissä: s y = 17.0 cm 2. Kovarianssin arvoja ei voida vertailla eri muuttujaparien välillä, sillä s y on mittayksiköistä riippuvainen. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 6 / 11
Pearsonin tulomomenttikorrelaatiokerroin määritellään muuttujien ja y välillä r = r y = s y, s s y 1 jossa s = n n 1 i=1 ( i ) 2 ja s y = ovat muuttujien ja y keskihajonnat. 1 n 1 n i=1 (y i ȳ) 2 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 7 / 11
Pearsonin tulomomenttikorrelaatiokerroin määritellään muuttujien ja y välillä r = r y = s y, s s y 1 jossa s = n n 1 i=1 ( i ) 2 ja s y = ovat muuttujien ja y keskihajonnat. 1 n 1 Kun kovarianssi skaalataan keskihajonnoilla, saadaan n i=1 (y i ȳ) 2 korrelaatiokerroin välille [ 1, +1]. Korrelaatiokerroin r y ei siis ole mittayksiköistä riippuvainen. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 7 / 11
Pearsonin tulomomenttikorrelaatiokerroin määritellään muuttujien ja y välillä r = r y = s y, s s y 1 jossa s = n n 1 i=1 ( i ) 2 ja s y = ovat muuttujien ja y keskihajonnat. 1 n 1 Kun kovarianssi skaalataan keskihajonnoilla, saadaan n i=1 (y i ȳ) 2 korrelaatiokerroin välille [ 1, +1]. Korrelaatiokerroin r y ei siis ole mittayksiköistä riippuvainen. Miten tulkitaan riippuvuuden voimakkuus? Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 7 / 11
y y Korrelaatiokertoimen r tulkinta täydellinen negatiivinen ei lainkaan täydellinen positiivinen lineaarinen riippuvuus lineaarista riippuvuutta lineaarinen riippuvuus -1 0 1 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 8 / 11
y y Korrelaatiokertoimen r tulkinta täydellinen negatiivinen ei lainkaan täydellinen positiivinen lineaarinen riippuvuus lineaarista riippuvuutta lineaarinen riippuvuus -1 0 1 r = 0.52 tyttären pituus (cm) 155 160 165 170 175 150 160 170 180 äidin pituus (cm) Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 8 / 11
Esimerkki 2. Mikä on korrelaatiokertoimen r y arvo seuraavissa tilanteissa? y 20 25 30 35 y 0 5 10 20 y 0 100 300 y 0 100 300 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 9 / 11
Esimerkki 2. Mikä on korrelaatiokertoimen r y arvo seuraavissa tilanteissa? y 20 25 30 35 y 0 5 10 20 y 0 100 300 y 0 100 300 r = 0.57 r = 0 r = 0.80 r = 0.80 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 9 / 11
Esimerkki 2. Mikä on korrelaatiokertoimen r y arvo seuraavissa tilanteissa? y 20 25 30 35 y 0 5 10 20 y 0 100 300 y 0 100 300 r = 0.57 r = 0 r = 0.80 r = 0.80 s = 12 s = 0 s = 23.6 s = 236 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 9 / 11
Muistettavaa: Korrelaatiokerroin r mittaa kahden muuttujan välistä riippuvuutta, kun kumpikin muuttuja on vähintään välimatka-asteikkoa, riippuvuus on luonteeltaan lineaarista ja muuttujien jakaumat ovat vähintäänkin symmetriset. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 10 / 11
Muistettavaa: Korrelaatiokerroin r mittaa kahden muuttujan välistä riippuvuutta, kun kumpikin muuttuja on vähintään välimatka-asteikkoa, riippuvuus on luonteeltaan lineaarista ja muuttujien jakaumat ovat vähintäänkin symmetriset. Riippuvuudesta ei välttämättä seuraa muuttujien välinen syy-seuraussuhde. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 10 / 11
Muistettavaa: Korrelaatiokerroin r mittaa kahden muuttujan välistä riippuvuutta, kun kumpikin muuttuja on vähintään välimatka-asteikkoa, riippuvuus on luonteeltaan lineaarista ja muuttujien jakaumat ovat vähintäänkin symmetriset. Riippuvuudesta ei välttämättä seuraa muuttujien välinen syy-seuraussuhde. Korrelaatiokertoimen tulkinnassa pitää huomioida havaintojen lukumäärä n. Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 10 / 11
r = 0.01 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.30 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.24 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.40 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.51 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.35 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.59 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.36 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.75 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.05 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.10 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.33 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.37 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.25 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.24 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.66 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.78 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.47 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.26 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.43 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.20 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.19 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.29 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.09 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = +0.11 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.01 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11
r = 0.09 Hanna Heikkinen Oulun yliopisto 23. toukokuuta 2012 11 / 11