FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Samankaltaiset tiedostot
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Ilkka Mellin (2008) 1/5

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollinen aineisto Luottamusväli

Testejä suhdeasteikollisille muuttujille

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Todennäköisyyden ominaisuuksia

dx=5&uilang=fi&lang=fi&lvv=2014

Estimointi. Vilkkumaa / Kuusinen 1

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Tilastomatematiikka Kevät 2008

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Testit järjestysasteikollisille muuttujille

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Korrelaatiokertoinen määrittely 165

MTTTP1, luento KERTAUSTA

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

2. Keskiarvojen vartailua

MTTTP1, luento KERTAUSTA

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Teema 8: Parametrien estimointi ja luottamusvälit

Todennäköisyyslaskun kertaus. Heliövaara 1

HAVAITUT JA ODOTETUT FREKVENSSIT

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

c) A = pariton, B = ainakin 4. Nyt = silmäluku on5 Koska esim. P( P(A) P(B) =, eivät tapahtumat A ja B ole riippumattomia.

6. laskuharjoitusten vastaukset (viikot 10 11)

Parametrin estimointi ja bootstrap-otanta

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

10. laskuharjoituskierros, vko 14, ratkaisut

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

7. laskuharjoituskierros, vko 10, ratkaisut

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

riippumattomia ja noudattavat samaa jakaumaa.

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

POPULAATIO. Oikeastaan arvot, joista ollaan kiinnostuneita (mitatut numeeriset suureet, luokittelut).

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Moniulotteiset satunnaismuuttujat ja jakaumat

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Epäyhtälöt ovat yksi matemaatikon voimakkaimmista

Johdatus tn-laskentaan perjantai

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Osa 2: Otokset, otosjakaumat ja estimointi

Mat Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Mat Tilastollisen analyysin perusteet, kevät 2007

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Transkriptio:

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012

Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy palautetut työt sisältävä hakemisto. Myös harjoitustöiden arvostelu tapahtuu sähköpostilla. Noudattakaa ohjeita joka vaiheessa huolella: Ryhmiä on 17, eikä sooloiluun ole siksi varaa. Jos ohjeet ovat epäselviä tai monitulkintaisia, kertokaa siitä heti.

Kovarianssi Kovarianssi kuvaa kahden satunnaismuuttujan yhteisvaihtelua. Positiiviinen kovarianssi tarkoittaa, että toisen muuttujan kasvaessa toinenkin keskimäärin kasvaa. Negatiivien kovarianssi puolestaan tarkoittaa, että toisen muuttujan kasvaessa toinen keskimäärin pienenee. Jos kovarianssi on nolla, ei toisen muuttujan käytöksen perusteella voi sanoa, kasvaako vai pieneneekö toinen. X:n ja Y:n kovarianssi lasketaan (diskreetille) jakaumalle ja otokselle kaavoilla: n m Cov[X, Y ] = (x i E[X ])(y j E[Y ])P(X = x i ja Y = y j ) i=1 j=1 s xy = 1 n 1 n i=1 m (x i x)(y j y) j=1

Korrelaatio ja riippuvuus I Korrelaatio mittaa lineaarista riippuvuutta. (Pearsonin) korrelaatiokerroin lasketaan standardoimalla muuttujien X ja Y kovarianssi välille [-1, 1] (jakaumalle ja otokselle): ρ X,Y = Cov[X, Y ] Var[X ]Var[Y ] ja r X,Y = s xy s 2 X s 2 Y

Korrelaatio ja riippuvuus II Riippuvuus on ominaisuus joka kahdella muuttujalla joko on tai ei ole. Jos kaksi tapahtumaa ovat riippumattomia, ei toisen tapahtuminen tai tapahtumatta jääminen vaikuta toisen todennäköisyyteen tapahtua. Jos kaksi muuttujaa ovat riippumattomia, ei toisen arvon tietäminen auta mitenkään ennustamaan toisen arvoa. Korrelaatio kuvaa vain lineaarista riippuvuutta ja on siten vain osa mahdollisesti monimutkaisemmasta kuvasta.

Pari esimerkkiä korrelaatiosta ja riippuvuudesta -> Katsotaan Wikipediasta, kun siellä on niin kivat kuvat valmiina.

5min happipaussi

T-testi odotusarvolle (ja kertaus testaamisesta) Taustaoletukset: Kerätään yksi otos (n > 20) normaalijakautuneesta muuttujasta (tai muuttujasta, jota voidaan approksimoida normaalijakaumalla). Havainnot x i ovat riippumattomia. Hypoteesit: H 0 : µ = µ 0 (odotusarvo on oletuksen mukainen) H 1 : µ µ 0, H 1 : µ > µ 0 tai H 1 : µ < µ 0 Päättely: Lasketaan testisuureen arvo: t = x µ 0 s/ n Lasketaan testisuureen perusteella P-arvo. Verrataan P-arvoa riskitasoon (α) ja tehdään päätelmä.

T-testi odotusarvojen yhtäsuuruudelle Taustaoletukset: Kerätään kaksi otosta (n x, n y > 20) normaalijakautuneista muuttujista (tai muuttujista, joita voidaan approksimoida normaalijakaumalla). Havainnot x i ja y i ovat riippumattomia ryhmien välilla ja niiden sisällä. Testistä on kaksi eri versiota sen mukaan oletetaanko muuttujien varianssit yhtäsuuriksi. Tässä versiossa ei oleteta variansseista mitään. Hypoteesit: H 0 : µ x = µ y H 1 : µ x µ y, H 1 : µ x > µ y tai H 1 : µ x < µ y Testisuure: t = x y sx 2 /n x + sy 2 /n y

Esimerkki T-testistä Onko ensitavun pitkän ja lyhyen vokaalin kestoilla eroa normaalinopeudella lausutuissa sanoissa, jotka ovat tyyppejä cv.cv ja cvv.cv? Tehdään R:llä.

Luottamusvälit: Mitä ne ovat? On mahdotonta tuntea ilmiön teoreettisia parametreja varmuudella. Voidaan kuitenkin esittää arvioita parametrien arvosta. Jos lasketaan piste-estimaatti (keskiarvo odotusarvolle, otosvarianssi varianssille, otosmediaani mediaanille jne), ei epävarmuuden määrä ilmene arviosta mitenkään. Luottamusväli kertoo paitsi todennäköisen alueen, josta parametri löytyy, myös arvion luotettavuuden eli todennäköisyyden, jolla parametri annetulta väliltä löytyy. Tätä todennäköisyyttä kutsutaan luottamustasoksi. Kyse on ikään kuin testin kääntämisestä päin vastoin ja testejä vastaa usein luottamusväli ja päin vastoin.

Esimerkkejä luottamusväleistä Ehdokkaiden arvioitu kannatus. Tietyn ikä/sukupuoli-ryhmän pituuden odotusarvo. Tietyn ikä/sukupuoli/sosiaalinen konteksti -ryhmän keskimääräisen f 0 :n vaihteluväli. Mielikuvajaukaumien etäisyys Likert-asteikolla. Tehdään R:llä vielä pari laskua.

Luentokuulustelu 1. Mikä on korrelaation ja riippuvuuden välinen ero? 2. Mikä on luottamusväli?