FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Samankaltaiset tiedostot
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

tilastotieteen kertaus

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Harjoitus 2: Matlab - Statistical Toolbox

Mat Tilastollisen analyysin perusteet, kevät 2007

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Estimointi. Vilkkumaa / Kuusinen 1

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Johdatus tn-laskentaan perjantai

Mat Tilastollisen analyysin perusteet, kevät 2007

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

MTTTP1, luento KERTAUSTA

5.6.3 Matematiikan lyhyt oppimäärä

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

MTTTP1, luento KERTAUSTA

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Osa 2: Otokset, otosjakaumat ja estimointi

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Teema 8: Parametrien estimointi ja luottamusvälit

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

7. laskuharjoituskierros, vko 10, ratkaisut

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

dx=5&uilang=fi&lang=fi&lvv=2014

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Mat Tilastollisen analyysin perusteet, kevät 2007

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Sovellettu todennäköisyyslaskenta B

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

Regressioanalyysi. Kuusinen/Heliövaara 1

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Matemaatikot ja tilastotieteilijät

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisia peruskäsitteitä ja Monte Carlo

Yleistetyistä lineaarisista malleista

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Esimerkki 1: auringonkukan kasvun kuvailu

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

1. Tilastollinen malli??

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Todennäköisyyden ominaisuuksia

dx=2&uilang=fi&lang=fi&lvv=2015

Harjoitus 7: NCSS - Tilastollinen analyysi

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy 2010 Harjoitus 4

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Väliestimointi (jatkoa) Heliövaara 1

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Tutkimustiedonhallinnan peruskurssi

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Tilastollinen päättely. 5. Väliestimointi Johdanto Luottamusvälien konstruointi Luottamusvälien vertailu

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

&idx=2&uilang=fi&lang=fi&lvv=2015

&idx=2&uilang=fi&lang=fi&lvv=2015

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut

Sovellettu todennäköisyyslaskenta B

Kokonaisuudet johon opintojakso kuuluu Lang=fi&lang=fi&lvv=2014

Kandidaatintutkielman aineistonhankinta ja analyysi

Transkriptio:

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012

Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä. Ne saattavat olla epäselviä tai jopa virheellisiä, missä tapauksessa siitä saa kertoa luennoitsijalle. Kun jonkin luennon kuulustelun esimerkkivastaukset ovat netissä, ei sitä luentokuulustelua enää voi suorittaa paitsi erisopimuksella (ja eri kysymyksillä).

Luento 1. 1. Palautetta tästä luennosta: Mikä luennossa oli hyvää, mikä huonoa? 2. Mitä funktio tekee? Mihin funktioita voi käyttää? 1. Ensimmäiseen kysymykseen ei yllättäen ole mallivastausta. 2. Wikipedia sanoo näin: Funktio eli kuvaus kertoo olioiden välisistä riippuvuussuhteista. Yleensä siten, että se kytkee yhden muuttujan arvoon toisen muuttujan vastaavan arvon yksikäsitteisesti: tiettyä ensimmäisen muuttujan arvoa vastaa vain yksi toisen muuttujan arvo. Toisin sanoen muuttujan arvoa vastaa vain yksi funktion arvo. Funktioita voi käyttää paitsi jatkuvien muuttujien myös diskreettien muuttujien riippuvuussuhteiden tutkimisessa, kuvailussa ja mallintamisessa.

Luento 2. 1. Mitä tarkoitetaan ehdollisella todennäköisyydellä? 2. Mitä histogrammi kuvaa? 1. Ehdollinen todennäköisyys P(A B) on todennäköisyys tapahtumalle A sillä ehdolla eli siinä tilanteessa, että tapahtuman B tiedetään jo tapahtuneen. 2. Wikipedia: Histogrammi on graafinen esitys tilastollisesta jakaumasta. Histogrammi esittää tarkasteltavan muuttujan arvojen jakautumisen jonkin valitun luokkajaon mukaisesti. Se koostuu suorakulmionmuotoisista pinnoista, joiden pinta-ala esittää kyseiseen luokkaan kuuluvien tapausten määrää. Yleensä jokaisen suorakaiteen leveys asetetaan yhtä suureksi, jolloin suorakaiteen korkeus on suoraan verrannollinen luokkaan kuuluvien tapausten määrään.

Luento 3. 1. Mitä tarkoitetaan todennäköisyysjakaumalla? 2. Mihin tilastollisella testaamisella pyritään? 1. Wikipedia: Todennäköisyysjakauma on todennäköisyyslaskennan käsite, jolla kuvataan satunnaismuuttujan todennäköisyyttä saada tietty arvo. Todennäköisyysjakauma siis kuvaa todennäköisyyden tai todennäköisyystiheyden jakautumista muuttujan eri arvojen kesken. 2. Tilastollisen testaamisen tarkoitus on käyttää epävarmaa tietoa päätöksenteon apuna. Tilastollisella testaamisella ei todisteta mitään, vaan haetaan tietoa todennäköisestä asioiden tilasta.

Luento 4. 1. Palautetta kurssista tähän mennessä: Mikä oli hyvää, mikä huonoa? 2. Mitä yhteistä on odotusarvolla ja keskiarvolla? 1. Ei mallia - ilmeisistä syistä. 2. Odotusarvo ja keskiarvo kuvaavat samaa asiaa tai samantyyppistä asiaa, mutta eri maailman asioille: Molemmat ovat painopisteitä ja odotusarvo on (teoreettisen) jakauman painopiste, siinä missä keskiarvo on otoksen painopiste. Lisäksi keskiarvo on odotusarvon estimaattori ja siten sen arvo suurissa otoksissa lähestyy odotusarvoa.

Luento 5. 1. Mitä eroa on otoksen ja jakauman tunnusluvuilla? Entä miten ne liittyvät toisiinsa? 2. Anna esimerkki kysymyksestä, johon voisi vastata tilastollisen testin avulla. 1. Ero on periaatteessa sama kuin otoksella ja jakaumalla: Otos on reaalimaailman asia - se koostuu havainnoista. Jakauma puolestaan on abstraktio ja on olemassa vain ajatelun välineenä. Otoksen tunnusluvut kuvaavat reaalisen otoksen ominaisuuksia ja jakauman tunnusluvut abstraktion ominaisuuksia. Ne liittyvät toisiinsa siksi, että otoksen tunnusluvuilla voidaan estimoida jakauman tunnuslukuja. 2. Esimerkkejä: Onko kahdella eri terapiamuodolla saatu paranemista saman verran? Ovatko eri kaupunkien [lueteltu joukko] asukkaat samaa mieltä sukupuolineutraalin avioliittolain hyväksymisestä? Ovatko eri kaupunginosien / koulutuslaitosten asukkaiden / opiskelijoiden äänestysaikeet samanlaiset?

Luento 6. 1. Mikä on korrelaation ja riippuvuuden välinen ero? 2. Mikä on luottamusväli? 1. Jos satunnaismuuttujat ovat keskenään riippuvia, voidaan toisen saaman arvon perusteella päätellä jotain toisen keskimääräisistä arvoista. Jos muuttujat korreloivat, päättely tapahtuu lineaarisesti eli funktiolla joka on tyyppi y = a + bx. Korreloivuudesta voi päätellä riippuvuuden, mutta ei päinvastoin. Eli riippuvuus on yleisempi ilmiö kuin korreloivuus. Kummastakaan ei voi päätellä kausaliteettia. (Jätskin myynti ja hukkumiskuolemat.) 2. Luottamusväli on väliestimaatti eli arvio jonkin ilmiön jostakin parametrista (ehdokkaan kannatus, puheen perustaajuus tms.) siten, että annetaan vaihteluväli, jolta kyseinen parametri annetulla todennäköisyydellä löytyy.

Luento 7. 1. Voidaanko regressioanalyysillä todistaa kausaalinen syy-seuraus-yhteys? 2. Mihin oman alasi ongelmaan voisit soveltaa regressioanalyysiä? 1. Ei voida. Ongelma on kahdessa kohtaa: Regresioanalyysilla ei voi ylipäänsä todistaa sen enempää kuin millään muullakaan tilastollisella testillä. Sen lisäksi regressioanalyysi ei käsittele kausaliteetteja vaan korrelaatioita. Tulokset eivät kerro tapahtumisen mekanismeista vaan yhdessä tapahtumisesta. 2. Esimerkiksi: Onko vanhempiin liittyvillä mittareilla ja lapsen kielihäiriöllä riippuvuussuhde? Vaikuttaako perheen lasten lukumäärä vanhempien äänihäiriöiden esiintymiseen? Vaikuttaako äidin ikä lapsen puheen ja kielen kehitykseen? Miten puhealoitteet muuttuvat kuntoutuksen edetessä? Onko puhenopueden ja lukihäiriön välillä yhteys? (Ja mitään näistä ei voida pitää kausaliteettina... )

Luento 8. Seminaari. Mallivastauksia tuli sen verran vähän, ettei niistä ole mieltä tehdä listaa. Korjaanpa tämän seuraaviin ohjeisiin.

Luento 9. Julkaistaan myöhemmin.

Luento 10. Seminaari. Julkaistaan myöhemmin mahdollisesti.