Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012



Samankaltaiset tiedostot
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Harjoitus 7: NCSS - Tilastollinen analyysi

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Luottamusväli, määritelmä

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Otoskoko 107 kpl. a) 27 b) 2654

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Kvantitatiiviset tutkimusmenetelmät maantieteessä

2. Keskiarvojen vartailua

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

pisteet Frekvenssi frekvenssi Yhteensä

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1


Kandidaatintutkielman aineistonhankinta ja analyysi

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Testejä suhdeasteikollisille muuttujille

Väliestimointi (jatkoa) Heliövaara 1

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Perusnäkymä yksisuuntaiseen ANOVAaan

4.2 Useampi selittävä muuttuja (kertausta)

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

TESTINVALINTATEHTÄVIEN VASTAUKSET

Harha mallin arvioinnissa

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Kvantitatiiviset menetelmät

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Yleistetyistä lineaarisista malleista

Aki Taanila VARIANSSIANALYYSI

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Sovellettu todennäköisyyslaskenta B

Identifiointiprosessi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

2. TILASTOLLINEN TESTAAMINEN...

MTTTP1, luento KERTAUSTA

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen

10. laskuharjoituskierros, vko 14, ratkaisut

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

MTTTP1, luento KERTAUSTA

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

3. Yhden faktorin kokeet. 3.1 Varianssianalyysi. Yhden faktorin koeasetelma, jossa faktorilla on a tasoa (kokeessa on a käsittelyä).

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

T Luonnollisten kielten tilastollinen käsittely

Testit laatueroasteikollisille muuttujille

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Til.yks. x y z

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus KE (2014) 1

Yleisiä kommentteja kokeesta.

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Testit järjestysasteikollisille muuttujille

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Vertailutestien tulosten tulkinta Mikä on hyvä tulos?

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Mat Tilastollisen analyysin perusteet, kevät 2007

A250A0050 Ekonometrian perusteet Tentti

Transkriptio:

Puheentutkimuksen tilastoanalyysin perusteet 8. luento Pertti Palo 20.1.2012

Käytännön asioita Viimeisen seminaarin siirto: 2.3. 10-12 -> 2.3. 14-16. Miten seminaarin luentokuulustelun voi korvata?

Harjoitustöiden arvosanat Oletusarvosana on 3. Sitä muutetaan seuraavin perustein: Oppiminen ja osaamisen taso näkyy: -1 - +1 Perustelut: -1 - +1 Mielenkiintoisuus eli hyvin motivoitu: 0 - +1 Selkeys, järjestelmällisyys: 0 - +1

Lisäkriteerit Hyväksyttävältä työltä vaaditaan lisäksi, että: Analyysi on teknisesti ok. Työnjako ja ajankäyttö on raportoitu. Käytetyn ajan raportoinnin ei tarvitse olla orjallisen tarkka. Arvio kunkin ryhmän jäsenen tekemistä tunneista riittää. Lisäksi voi kertoa, jos joku teki jollain lailla merkittävemmän osan työstä ja sen pitäisikö tämän vaikuttaa arvosanoihin.

Seminaari Kullakin ryhmällä yksi esitelmä ja yksi posteri. Seminaarissa esitelmät 4*15 min ja posterit yht. 20 min. Kummallakin kerralla 10 min luentokuulustelu.

2. harjoitustyön datan esittely Katsotaan R:llä dataa...

5min happipaussi

Mikä on ANOVA ja mitä sillä tehdään? ANOVA on lyhenne sanoista ANalysis Of VAriance. Siis suomeksi varianssi- tai vaihteluanalyysi. Yksinkertaisimmillaan se on tilastollinen testi, joka yleistää odotusarvojen vertaamisen useammalle kuin kahdelle ryhmälle. Tämä on myös sen yleisin käyttötarkoitus.

No, jos se on testi, miten se tehdään? Yksisuuntainen varianssianalyysi: Taustaoletukset: (Seuraava koskee useita/tyypillisiä ANOVA-malleja, mutta ei kaikkia.) Kerätään otos joka luokittuu kolmeen tai useampaan luokkaan. Verrattavat ryhmät/luokat ovat riippumattomia Normaalisuus - residuaalit ovat normaalijakautuneita Varianssien homogeenisuus eli homoskedastisuus - sama varianssi eri ryhmissä.

No, jos se on testi, miten se tehdään? Yksisuuntainen varianssianalyysi: Taustaoletukset: (Seuraava koskee useita/tyypillisiä ANOVA-malleja, mutta ei kaikkia.) Kerätään otos joka luokittuu kolmeen tai useampaan luokkaan. Verrattavat ryhmät/luokat ovat riippumattomia Normaalisuus - residuaalit ovat normaalijakautuneita Varianssien homogeenisuus eli homoskedastisuus - sama varianssi eri ryhmissä. Hypoteesit: H 0 : Luokkien odotusarvot ovat yhtä suuret eli µ 1 = µ 2 =... = µ n. H 1 : Jonkin luokan odotusarvo on erisuuri kuin muiden.

Entäs jos data ei ole normaalijakautunutta? Kruskal-Wallis -testi: Taustaoletukset: Kerätään otos joka luokittuu kolmeen tai useampaan luokkaan. Verrattavat ryhmät/luokat ovat riippumattomia Varianssien homogeenisuus eli homoskedastisuus - sama varianssi eri ryhmissä.

Entäs jos data ei ole normaalijakautunutta? Kruskal-Wallis -testi: Taustaoletukset: Kerätään otos joka luokittuu kolmeen tai useampaan luokkaan. Verrattavat ryhmät/luokat ovat riippumattomia Varianssien homogeenisuus eli homoskedastisuus - sama varianssi eri ryhmissä. Hypoteesit: H 0 : Luokkien mediaanit ovat yhtä suuret. H 1 : Jonkin luokan mediaani on eri suuri kuin muiden.

ANOVA-esimerkki, osa I Esimerkki R:llä...

ANOVA-esimerkki, osa I Esimerkki R:llä... > aov ( du1~tcond, d u r a t i o n _ d a t a _ v a i n i o) >tavutyypin_ja_du1n_anova > summary ( tavutyypin_ja_ du1n_ anova ) Df Sum Sq Mean Sq F v a l u e Pr(>F ) tcond 5 10. 1930 2. 03860 1583. 8 < 2. 2 e 16 R e s i d u a l s 3294 4. 2398 0.00129 S i g n i f. c o d e s : 0 0. 0 0 1 0. 0 1 0. 0 5. 0. 1 1

ANOVA-esimerkki, osa II > summary ( t a v u t y y p i n _ j a _ d u 1 n _ l i n e a a r i m a l l i ) C a l l : lm ( f o r m u l a = du1 ~ tcond, data = d u r a t i o n _ d a t a _ v a i n i o ) R e s i d u a l s : Min 1Q Median 3Q Max 0.14886 0.02167 0.00290 0. 01783 0. 17667 C o e f f i c i e n t s : E s t i m a t e Std. E r r o r t v a l u e Pr ( > t ) ( I n t e r c e p t ) 0.096746 0.001465 6 6. 054 < 2e 16 t condcv2 0.003716 0. 002145 1.733 0. 0 833. t c o n d c v c 0.114851 0.002143 5 3. 595 < 2e 16 t c o n d c v v 0.118675 0.002071 5 7.294 < 2e 16 tcondvbx 0.013070 0. 002165 6.036 1. 7 6 e 09 tcondvby 0. 065902 0. 002124 3 1. 0 2 8 < 2e 16 S i g n i f. c o d e s : 0 0. 0 0 1 0. 0 1 0. 0 5. 0. 1 1 R e s i d u a l s t a n d a r d e r r o r : 0.03588 on 3294 d e g r e e s o f freedom M u l t i p l e R s q u a r e d : 0. 7 0 6 2, A d j u s t e d R s q u a r e d : 0. 7058 F s t a t i s t i c : 1584 on 5 and 3294 DF, p v a l u e : < 2. 2 e 16

Mikä kaikki voi olla jännää? Yksisuuntainen varianssianalyysi: Onko eri ryhmien odotusarvoissa eroa? Kaksi(- tai useampi )suuntainen varianssianalyysi: Sama kuin yksi suuntainen, mutta luokitteluja on kaksi tai enemmän. Koeasetelmat, joissa toistetaan sama koe samoilla. koehenkilöillä tai mittauskohteilla useita kertoja eri aikoina. Koeasetelmat, joissa mitattavia muuttujia (selitettäviä muuttujia, tulosmuuttujia) on enemmän kuin yksi. Koeasetelmat, joissa on joko etukäteen määrätyt luokat (kokeen tekijä tekee käsittelyt ) tai joissa luokat määräytyvät satunnaisesti. Koeasetelmat, joissa on sekä määrättyjä että satunnaisia luokkia (kts. Baayenin viimeinen luku).... ja paljon muuta.

Luentokuulustelu

Luentokuulustelu 1. Oliko ensimmäisen tavun riimin pituuden odotusarvo sama kaikille tavutyypeille? 2. Anna esimerkki sinua kiinnostavasta ongelmasta, jonka tutkimiseen voisi käyttää ANOVAa?