Metodifestivaali 9.5.009 Monitasomallit koulututkimuksessa Mitä ihmettä? Antero Malin Koulutuksen tutkimuslaitos Jyväskylän yliopisto 009 1
Tilastollisten analyysien lähtökohta: Perusjoukolla on luonnollinen monitasoinen tai hierarkkinen rakenne, joka otetaan mukaan tilastolliseen analyysiin Monitasoinen rakenne: Perusjoukossa on havaintoyksiköitä kahdella (tai useammalla) tasolla. Alemman tason havaintoyksiköt muodostavat luonnollisia ryhmiä, jotka ovat ylemmän tason havaintoyksiköitä Tutkimusaineistossa on yleensä muuttujia eri tasoilla Havaintoyksiköiden riippumattomuusoletus ei ole voimassa
Esimerkkejä luonnollisista kaksitasoisista rakenteista ja eri tasojen havaintoyksiköistä: Taso 1 Taso Oppilas Työntekijä Perheenjäsen Urheilija Poikanen Koulu Työpaikka/yritys Perhe Urheiluseura Pesä Myös seuranta- ja toistomittausaineisto voidaan käsitellä aineistona joka sisältää rakenteen: Tason 1 havaintoyksiköitä ovat mittaukset eri ajankohtina ja tason havaintoyksiköitä ovat henkilöt 3
Olennaista Perusjoukko jakaantuu luonnollisiin osaryhmiin tai klustereihin. Monitasoinen rakenne on perusjoukon ominaisuus, ei seurausta otannasta (vaikkakin sitä usein hyödynnetään otannassa käyttämällä ryväsotantaa). Otantatutkimuksessa otoksen täytyy edustaa kaikkia perusjoukon tasoja eli sisältää havaintoyksiköitä riittävästi ja edustavasti kaikilta perusjoukon tasoilta. 4
Havaintoyksiköiden homogeenisuus Kun aineistolla on rakenne, samaan ryhmään kuuluvat havaintoyksiköt ovat usein jossain määrin toistensa kaltaisia tai keskenään homogeenisia tutkittavan ominaisuuden suhteen Rakenteeseen liittyvät tekijät homogenisoivat havaintoyksiköitä. Havaintoyksiköt eivät ole toisistaan riippumattomia. Havaintoyksiköiden homogeenisuuden mittana käytetään sisäkorrelaatiota. 5
Sisäkorrelaatio ICC: Intra-class correlation, Intra-cluster correlation Muuttujan sisäkorrelaatio lasketaan jakamalla muuttujan kokonaisvarianssi kahteen osaan, ryhmien väliseen varianssiin ja ryhmien sisäiseen varianssiin tot u e u e tot Sisäkorrelaatiolla tarkoitetaan ryhmien välisen varianssin osuutta kokonaisvarianssista 6
Sisäkorrelaation kaava: u u e u Jos u 0 niin 0 Jos e 0 niin 1 7
Sisäkorrelaatio On kahden samaan ylemmän tason ryhmään kuuluvan alemman tason havaintoyksikön välinen korrelaatio, ei siis kahden muuttujan välinen korrelaatio Vaihtelee välillä 0 1 Kertoo havaintoyksiköiden keskinäisestä riippuvuudesta joka ilmenee positiivisena sisäkorrelaationa Kertoo alemman tason havaintoyksiköiden homogeenisuudesta ylemmän tason havaintoyksiköiden sisällä Kertoo kuinka monta prosenttia ryhmien välinen varianssi on kokonaisvarianssista Kun sisäkorrelaatio kasvaa, tehokas otoskoko pienenee 8
Yhteenvetoa Jos aineiston rakennetta ja siihen liittyvää havaintoyksiköiden keskinäistä riippuvuutta ei oteta huomioon tilastollisissa analyyseissa vaan analysoidaan aineisto olettaen havaintoyksiköt toisistaan riippumattomiksi, käy niin että: Tilastollisen mallin kertoimet ovat virheellisiä Kerroinestimaattien keskivirheet ovat virheellisiä, erityisesti ylemmän tason muuttujilla Tilastolliset testitulokset ovat virheellisiä Johtopäätökset ovat virheellisiä Ei saada tietoa aineiston rakenteen yhteyksistä tutkittavaan ilmiöön 9
Esimerkki 1: Koulujen väliset erot oppilaiden lukutaidossa, Suomen PISA 000 -aineisto 10
Esimerkki 1 (jatkuu): Koulujen väliset erot oppilaiden lukutaidossa, Suomen PISA 000 -aineisto ˆ0 548.8 ˆ u 490.8 ˆ e 7087.5 ˆ ˆ u ˆ ˆ u 490.8 0.065 7578.3 e 490.8 490.8 7087.5 Lukutaitopistemäärän read1 sisäkorrelaatio on 0.065. Lukutaitopistemäärien keskiarvojen vaihtelu koulujen välillä poikkeaa tilastollisesti merkitsevästi nollasta ja koulujen väliset keskiarvoerot lukutaidossa selittävät 6.5 % oppilaiden lukutaitopistemäärän kokonaisvarianssista 11
Esimerkki 1 (jatkuu): Koulujen väliset erot oppilaiden lukutaidossa, Suomen PISA 000 -aineisto Suomen otoskoulujen keskiarvot ja niiden 95 %:n luottamusvälit: 1
Esimerkki : Koulujen välillä keskiarvoeroja mutta kerroin on sama: Sosioekonomisen taustan vaikutus y ij 0 1 Hisei ij u j e ij 13
Esimerkki (jatkuu): Suomen otoskoulujen regressiosuorat Punainen viiva on yhteisen kertoimen regressiosuora 14
Esimerkki 3: Koulujen välillä keskiarvoeroja ja lisäksi kertoimen arvo vaihtelee kouluittain y ij ( 0 u0 j ) ( 1 u1 j ) Hisei 1ij e ij 0 Hisei 1 1ij u 0 j u 1 j Hisei 1ij e ij 15
Esimerkki 3 (jatkuu): Suomen otoskoulujen regressiosuorat: Punainen viiva on yhteisen kertoimen regressiosuora 16