Puheentutkimuksen tilastoanalyysin perusteet 8. luento Pertti Palo 20.1.2012
Käytännön asioita Viimeisen seminaarin siirto: 2.3. 10-12 -> 2.3. 14-16. Miten seminaarin luentokuulustelun voi korvata?
Harjoitustöiden arvosanat Oletusarvosana on 3. Sitä muutetaan seuraavin perustein: Oppiminen ja osaamisen taso näkyy: -1 - +1 Perustelut: -1 - +1 Mielenkiintoisuus eli hyvin motivoitu: 0 - +1 Selkeys, järjestelmällisyys: 0 - +1
Lisäkriteerit Hyväksyttävältä työltä vaaditaan lisäksi, että: Analyysi on teknisesti ok. Työnjako ja ajankäyttö on raportoitu. Käytetyn ajan raportoinnin ei tarvitse olla orjallisen tarkka. Arvio kunkin ryhmän jäsenen tekemistä tunneista riittää. Lisäksi voi kertoa, jos joku teki jollain lailla merkittävemmän osan työstä ja sen pitäisikö tämän vaikuttaa arvosanoihin.
Seminaari Kullakin ryhmällä yksi esitelmä ja yksi posteri. Seminaarissa esitelmät 4*15 min ja posterit yht. 20 min. Kummallakin kerralla 10 min luentokuulustelu.
2. harjoitustyön datan esittely Katsotaan R:llä dataa...
5min happipaussi
Mikä on ANOVA ja mitä sillä tehdään? ANOVA on lyhenne sanoista ANalysis Of VAriance. Siis suomeksi varianssi- tai vaihteluanalyysi. Yksinkertaisimmillaan se on tilastollinen testi, joka yleistää odotusarvojen vertaamisen useammalle kuin kahdelle ryhmälle. Tämä on myös sen yleisin käyttötarkoitus.
No, jos se on testi, miten se tehdään? Yksisuuntainen varianssianalyysi: Taustaoletukset: (Seuraava koskee useita/tyypillisiä ANOVA-malleja, mutta ei kaikkia.) Kerätään otos joka luokittuu kolmeen tai useampaan luokkaan. Verrattavat ryhmät/luokat ovat riippumattomia Normaalisuus - residuaalit ovat normaalijakautuneita Varianssien homogeenisuus eli homoskedastisuus - sama varianssi eri ryhmissä.
No, jos se on testi, miten se tehdään? Yksisuuntainen varianssianalyysi: Taustaoletukset: (Seuraava koskee useita/tyypillisiä ANOVA-malleja, mutta ei kaikkia.) Kerätään otos joka luokittuu kolmeen tai useampaan luokkaan. Verrattavat ryhmät/luokat ovat riippumattomia Normaalisuus - residuaalit ovat normaalijakautuneita Varianssien homogeenisuus eli homoskedastisuus - sama varianssi eri ryhmissä. Hypoteesit: H 0 : Luokkien odotusarvot ovat yhtä suuret eli µ 1 = µ 2 =... = µ n. H 1 : Jonkin luokan odotusarvo on erisuuri kuin muiden.
Entäs jos data ei ole normaalijakautunutta? Kruskal-Wallis -testi: Taustaoletukset: Kerätään otos joka luokittuu kolmeen tai useampaan luokkaan. Verrattavat ryhmät/luokat ovat riippumattomia Varianssien homogeenisuus eli homoskedastisuus - sama varianssi eri ryhmissä.
Entäs jos data ei ole normaalijakautunutta? Kruskal-Wallis -testi: Taustaoletukset: Kerätään otos joka luokittuu kolmeen tai useampaan luokkaan. Verrattavat ryhmät/luokat ovat riippumattomia Varianssien homogeenisuus eli homoskedastisuus - sama varianssi eri ryhmissä. Hypoteesit: H 0 : Luokkien mediaanit ovat yhtä suuret. H 1 : Jonkin luokan mediaani on eri suuri kuin muiden.
ANOVA-esimerkki, osa I Esimerkki R:llä...
ANOVA-esimerkki, osa I Esimerkki R:llä... > aov ( du1~tcond, d u r a t i o n _ d a t a _ v a i n i o) >tavutyypin_ja_du1n_anova > summary ( tavutyypin_ja_ du1n_ anova ) Df Sum Sq Mean Sq F v a l u e Pr(>F ) tcond 5 10. 1930 2. 03860 1583. 8 < 2. 2 e 16 R e s i d u a l s 3294 4. 2398 0.00129 S i g n i f. c o d e s : 0 0. 0 0 1 0. 0 1 0. 0 5. 0. 1 1
ANOVA-esimerkki, osa II > summary ( t a v u t y y p i n _ j a _ d u 1 n _ l i n e a a r i m a l l i ) C a l l : lm ( f o r m u l a = du1 ~ tcond, data = d u r a t i o n _ d a t a _ v a i n i o ) R e s i d u a l s : Min 1Q Median 3Q Max 0.14886 0.02167 0.00290 0. 01783 0. 17667 C o e f f i c i e n t s : E s t i m a t e Std. E r r o r t v a l u e Pr ( > t ) ( I n t e r c e p t ) 0.096746 0.001465 6 6. 054 < 2e 16 t condcv2 0.003716 0. 002145 1.733 0. 0 833. t c o n d c v c 0.114851 0.002143 5 3. 595 < 2e 16 t c o n d c v v 0.118675 0.002071 5 7.294 < 2e 16 tcondvbx 0.013070 0. 002165 6.036 1. 7 6 e 09 tcondvby 0. 065902 0. 002124 3 1. 0 2 8 < 2e 16 S i g n i f. c o d e s : 0 0. 0 0 1 0. 0 1 0. 0 5. 0. 1 1 R e s i d u a l s t a n d a r d e r r o r : 0.03588 on 3294 d e g r e e s o f freedom M u l t i p l e R s q u a r e d : 0. 7 0 6 2, A d j u s t e d R s q u a r e d : 0. 7058 F s t a t i s t i c : 1584 on 5 and 3294 DF, p v a l u e : < 2. 2 e 16
Mikä kaikki voi olla jännää? Yksisuuntainen varianssianalyysi: Onko eri ryhmien odotusarvoissa eroa? Kaksi(- tai useampi )suuntainen varianssianalyysi: Sama kuin yksi suuntainen, mutta luokitteluja on kaksi tai enemmän. Koeasetelmat, joissa toistetaan sama koe samoilla. koehenkilöillä tai mittauskohteilla useita kertoja eri aikoina. Koeasetelmat, joissa mitattavia muuttujia (selitettäviä muuttujia, tulosmuuttujia) on enemmän kuin yksi. Koeasetelmat, joissa on joko etukäteen määrätyt luokat (kokeen tekijä tekee käsittelyt ) tai joissa luokat määräytyvät satunnaisesti. Koeasetelmat, joissa on sekä määrättyjä että satunnaisia luokkia (kts. Baayenin viimeinen luku).... ja paljon muuta.
Luentokuulustelu
Luentokuulustelu 1. Oliko ensimmäisen tavun riimin pituuden odotusarvo sama kaikille tavutyypeille? 2. Anna esimerkki sinua kiinnostavasta ongelmasta, jonka tutkimiseen voisi käyttää ANOVAa?