JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Esko Leskinen 28.5.2009 Mitä IHMEttä on MIXTURE -mallintaminen? A-L Lyyra 2009
2 1. Taustaa mixture sekoitus (mikstuura) sekoitetut jakaumat sekoitetut perusjoukot
3 Esimerkki Kahden perusjoukon sekoitus, yksi vastemuuttuja y c = 1 c = 2 μ 1 μ μ 2
4 Lähtökohta Havaintoaineisto Y, jossa on N havaintoa havaituista (vaste)muuttujista y 1, y 2,,y p y 1 y 2... y p y 11 y 12... y 1p 1. havainto y 21 y 22... y 2p 2. havainto Y =............ y N1 y N2... y Np N:s havainto
5 Ongelmia ei tiedetä latenttien ryhmien lukumäärää ei tiedetä mihin latenttiin ryhmään kukin havainto i (i = 1, 2,, N) kuuluu Lähestymistapoja Klassinen ryhmittelyanalyysi Trajektorianalyysi taustalla ei ole varsinaista tilastollista mallia Mixture analyysi taustalla rakenneyhtälömallit (SEM, Structural Equation Models), LISREL mallit
6 Jatkuvat havaitut vastemuuttujat regressio ja polkumallit konfirmatoriset faktorimallit (Torppa et al 2007) 2. kertaluvun faktorimallit (Hakanen et al 2007) latentit kasvukäyrämallit (Aunola et al 2004, Leskinen 2005, Parrila et al 2005) simplex mallit (Leskinen 2005)
7 Kategoriset havaitut vastemuuttujat latenttien luokkien analyysi latenttien luokkien siirtymäanalyysi latentit Markov mallit mover stayer mallit
8 Hybridimallit (Bengt Muthén) edellisten analyysien ja mallien yhdistelmiä: malleissa voi olla mukana samanaikaisesti havaittuja jatkuvia ja kategorisia muuttujia sekä latentteja jatkuvia ja kategorisia muuttujia
9 Mallinnusvaiheita 2. Mallintaminen estimoidaan ja testataan malli (SEM) ensin koko aineistolle valitaan latenttien ryhmien lukumäärä K = 2,3, estimoidaan ja testataan mallia samanaikaisesti kaikissa valituissa latenteissa ryhmissä mielenkiinnon kohteena useimmiten faktoreiden/latenttien muuttujien tasoerot latenttien ryhmien välillä latenttien ryhmien nimeäminen havaintojen luokittelu latentteihin ryhmiin mallien rakentaminen Mplus -ohjelmalla (Muthén & Muthén, 1998 2008)
10 3. Esimerkkejä 3.1 Toisen kertaluvun pitkittäisfaktorimalli ja mixture mallinnus Hakanen, Feldt & Leskinen (2005) 3.2 Latentti kasvukäyrämalli ja mixture mallinnus Aunola, Leskinen, Lerkkanen & Nurmi (2004) 3.3 Latentti kasvukäyrämalli, kovariaatit ja mixture mallinnus Aunola, Leskinen, Lerkkanen & Nurmi (2004) 3.4 Konfirmatorinen faktorimalli ja mixture mallinnus kaksitasoaineistolle Torppa et al (2007)
3.1 Toisen kertaluvun pitkittäisfaktorimalli ja mixture mallinnus Hakanen, Feldt & Leskinen (2005) 11 4 8 16 28.46.47.67.79 Meaningfullness 1985.76.77 Meaningfullness 1998.45.51.61.77 4 8 16 28 12 19 21 26.65.72.73.38 Comprehensibility 1985.99.92 Sense of Coherence 1985.59 Sense of Coherence 1998.94.99 Comprehensibility 1998.76.76.81.39 12 19 21 26 9 25 29.55.56.67 Manageability 1985 Manageability 1998.54.61.71 9 25 29 Figure 1. Final stability model for SOC over 13 years with statistically significant standardized estimates for whole data.
3.1 Toisen kertaluvun pitkittäisfaktorimalli ja mixture mallinnus Hakanen, Feldt & Leskinen (2005) 12 Sense of Coherence 7 6 5 4 Low SOC group High SOC group N 1 = 344 N 2 = 188 3 Mean at Time 1 Mean at Time 2 Figure 2. Estimated mean values of SOC for high-soc and low-soc groups over 13 years.
13 3.2 Latentti kasvukäyrämalli ja mixture mallinnus Aunola, Leskinen, Lerkkanen & Nurmi (2004) 0* math performance 1 math performance 2 math performance 3 math performance 4 math performance 5 math performance 6 1* 1* 1* Level 1* 1* 1*.24 0*.38.65.82 Slope 1*.17 Figure 2. Latent growth curve model for math performance, whole data.
14 3.2 Latentti kasvukäyrämalli ja mixture mallinnus Aunola, Leskinen, Lerkkanen & Nurmi (2004) Mathematical Performance 60 40 20 0 C2 C1 1 2 3 4 5 6 Latent group C1 (High performers, N 1 = 57 ) : μ t = 16 + 48.81 t, t = 0,.24,.38,.65,.82, 1 ^ Latent group C2 (Low performers, N 2 = 136 ) : μ t = 10 + 41.14 t, t = 0,.24,.38,.65,.82, 1 ^
3.3 Latentti kasvukäyrämalli, kovariaatit ja mixture mallinnus Aunola, Leskinen, Lerkkanen & Nurmi (2004) 15 Metacognitive Knowledge.17**.16** Level R 2 =.58 Slope R 2 =.23 Listening Comprehension.62*** Counting Ability Visual Attention.44***.15*.14* Gender Figure 3. Predictors of latent Level and Slope of math performance, whole data.
3.3 Latentti kasvukäyrämalli, kovariaatit ja mixture mallinnus 16 Latent group C1 High performers, N 1 = 57 Metacognitive Knowledge.69***.29** Level R 2 =.60 Slope R 2 =.50 Visual Attention Counting Ability.58**.46* Level R 2 =.78 Slope R 2 =.29 Geder.86*** Listening Comprehension Counting Ability Visual Attention.38**.20* Latent group C2 Low performers, N 2 = 136
3.4 Konfirmatorinen faktorimalli ja mixture mallinnus kaksitasoaineistolle Torppa et al (2007) 17 C fwr1 fwr2 fwr3 fwr4 rc1 rc2 rc3 Wfwr Wrc Within fwr1 fwr2 fwr3 fwr4 rc1 rc2 rc3 Between Bfwr Brc Note. C = Latent categorical variable fwr = Fluent word recognition rc = Reading comprehension C
Lähteitä Aunola, K., Leskinen, E., Lerkkanen, M-K & Nurmi, J-E (2004). Developmental dynamics of mathematical performance from preschool to grade 2. Journal of Educational Psychology, 96, 699-713. Hakanen, J., Feldt, T. & Leskinen, E.(2007). Change and stability of sense of coherence in adulthood: Longitudinal evidence from the healthy child study. Journal of Research in Personality, 41, 602-617. Leskinen, E. ( 2005). Pitkittäisaineistojen analyysista latenttien muuttujien malleilla. Psykologia, 40, 476-488. Muthén, L., & Muthén, B.O. (1998 2007). Mplus User s Guide. Fifth Edition. Los Angeles, CA: Muthén & Muthén. Parrila, R., Aunola, K., Leskinen, E., Nurmi, J-E. & Kirby, J.R. (2005). Development of individual differences in reading: Results from two longitudinal studies. Journal of Educational Psychology, 97, 299-319. Torppa, M., Tolvanen, A., Poikkeus, M-L., Eklund, K., Lerkkanen, M-K., Leskinen, E. & Lyytinen, H. (2007). Reading Development Subtypes and Their Early Characteristics. Annals of Dyslexia, 57, 3 32. Web: www.statmodel.com