Aki Taanila VARIANSSIANALYYSI

Koko: px
Aloita esitys sivulta:

Download "Aki Taanila VARIANSSIANALYYSI"

Transkriptio

1 Aki Taanila VARIANSSIANALYYSI

2 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen varianssianalyysi toistoin...9 SPSS ja yksisuuntainen varianssianalyysi...12 SPSS ja kaksisuuntainen varianssianalyysi ilman toistoja...14 SPSS ja kaksisuuntainen varianssianalyysi toistoin...15 LIITE: NORMAALIJAKAUTUNEISUUS...17 Yleistä...17 Onko jakauma normaali?...18

3 VARIANSSIANALYYSI 2 JOHDANTO Tilastollisen osuuden lisäksi dokumentti sisältää myös ohjeet Excelin käyttöön esitettyjen menetelmien yhteydessä. Excel-ohjeet erotat oikeassa marginaalissa olevasta pystyviivasta. SPSS-ohjeet on sijoitettu omiin lukuihin. Dokumentin lähteenä on käytetty verkkomateria Dokumenttiin liittyy Excel-esimerkki Aki Taanilan muita materiaaleja Kvantitatiivisen tutkimuksen suunnittelu Aineiston esittäminen ja kuvailu SPSS alkeet Matemaattisia malleja Tilastollinen päättely Kommentit ja parannusehdotukset Otan mielelläni vastaan kommentteja ja parannusehdotuksia sähköpostitse osoitteeseen aki.taanila(at)haaga-helia.fi.

4 VARIANSSIANALYYSI 3 VARIANSSIANALYYSI Kokeellista tutkimusasetelmaa käytettäessä vertaillaan ryhmiä toisiinsa. Jos vertailtavia ryhmiä on kaksi, niin keskiarvojen vertailuun voidaan käyttää kahden ryhmän t-testiä. Jos ryhmiä on useampia, niin keskiarvojen vertailuun voidaan käyttää varianssianalyysia. Huomaa, että ei ole hyväksyttävää käyttää kahden ryhmän t-testiä useamman ryhmän tapaukseen (siis vertailemalla ryhmiä pareittain). Tämä johtuu siitä, että toistettaessa t- testiä useampaan kertaan saman ryhmän kohdalla, virhepäätelmän riski kasvaa. Tässä esityksessä tarkastellaan kolmea varianssianalyysin tyyppiä: 1. Yksisuuntainen varianssianalyysi (completely randomized design): sopii tutkimusasetelmiin, joissa on yksi selittävä/riippumaton muuttuja. 2. Kaksisuuntainen varianssianalyysi ilman toistoja (randomized block design): sopii tutkimusasetelmiin, joissa on yksi selittävä/riippumaton muuttuja ja lisäksi halutaan kontrolloida satunnaisvaihtelun lähdettä. 3. Kaksisuuntainen varianssianalyysi toistoin (factorial design): sopii tutkimusasetelmiin, joissa tarkastellaan kahden selittävän muuttujan vaikutusta. Yksisuuntainen varianssianalyysi Käyttöedellytykset Yksisuuntaisen varianssianalyysin käyttöedellytykset ovat: 1. Otokset ovat toisistaan riippumattomat ja satunnaisesti valitut 2. Otokset ovat peräisin normaali jakautuneesta perusjoukosta 3. Perusjoukossa ryhmien varianssit ovat yhtä suuria. Jos sinulla on vahvat syyt epäillä käyttöedellytysten täyttymistä, niin voit käyttää yksisuuntaisen varianssianalyysin sijasta Kruskall-Wallis -testiä. Kruskall-Wallis -testin voit laskea tilasto-ohjelmaa (SPSS) käyttäen. 1 Otokset ovat toisistaan riippumattomat ja satunnaisesti valitut Jos kyseessä on asetelma, jossa vertailtavat ryhmät saavat tutkijan toimesta erilaiset käsittelyt, niin erilaisen käsittelyn saavat täytyy valita satunnaisesti samasta perusjoukosta. Esim. jos kokeillaan kolmen eri oppimateriaalin vaikutusta oppimistuloksiin, niin kullekin oppimateriaalille valitaan käyttäjät satunnaisesti samasta perusjoukosta. Jos kyseessä on asetelma, jossa verrataan ryhmiä, jotka ovat luonnostaan erilaisen "käsittelyn" saaneita (ilman tutkijan myötävaikutusta), niin tutkittavat täytyy valita satunnaisesti tietyn käsittelyn saaneista. Esim. jos verrataan eri ikäluokkiin kuuluvien reaktionopeutta, niin kustakin ikäluokasta valitaan otokset satunnaisesti.

5 VARIANSSIANALYYSI 4 2 Otokset ovat peräisin normaalijakautuneesta perusjoukosta Riippuvan muuttujan (muuttuja, jonka keskiarvoja ja variansseja tarkastellaan) täytyy noudattaa likimain normaalijakaumaa kussakin tarkasteltavista ryhmistä. Pienet poikkeamat normaalijakaumasta eivät ole vakavia. 3 Perusjoukossa ryhmien varianssit ovat yhtä suuria Esimerkki Riippuvan muuttujan täytyy omata likimain samansuuruiset varianssit kussakin tarkasteltavista ryhmistä. Jos kustakin ryhmästä valitaan samansuuruinen otos, niin pienet erot variansseissa eivät ole vakavia. Esim. Tarkastellaan kolmen eri automallin polttoaineenkulutusta. Selittävänä muuttujana on automalli. Arvotaan tietty määrä kuljettajia ajamaan kutakin automallia ja lasketaan kullekin automallille keskimääräinen polttoaineenkulutus. Vertailtavana on siis kolmen eri automallin keskimääräinen polttoaineenkulutus. A- ja B-autoilla oli siis kumpaisellakin 7 kuljettajaa ja C autolla 6 kuljettajaa. Polttoaineen kulutuksen vaihtelua voidaan havainnollistaa kuviolla:

6 VARIANSSIANALYYSI 5 Kuviosta nähdään, että samallakin automallilla esiintyy kuljettajasta johtuvaa vaihtelua. Kuljettajasta johtuva vaihtelu on tässä tutkimusasetelmassa satunnaisvaihtelua, koska sitä ei olla millään tavalla kontrolloitu. Automallien erot ovat tässä tapauksessa niin suuria, että ne erottuvat kuljettajasta johtuvasta vaihtelusta huolimatta (lukuun ottamatta mallien B ja C välistä eroa). Yksisuuntaisella varianssianalyysilla pyritään tunnistamaan ryhmien välinen vaihtelu, joka erottuu satunnaisvaihtelusta. Ideana on kokonaisvarianssin jakaminen ryhmien väliseen varianssiin ja ryhmien sisäiseen varianssiin. Jos ryhmien välinen varianssi ja ryhmien sisäinen varianssi ovat yhtä suuria, niin riippumaton muuttuja ei todennäköisesti ole aiheuttanut vaihtelua. Mitä suurempi ryhmien välinen varianssi on ryhmien sisäiseen varianssiin verrattuna sitä todennäköisempää on, että riippumaton muuttuja on aiheuttanut vaihtelua. Hypoteesit Päättelysääntö P-arvon laskeminen Yksisuuntainen varianssianalyysi on testimenetelmä, jonka hypoteesit ovat: Nollahypoteesi: Ryhmien keskiarvot ovat yhtä suuret. Vaihtoehtoinen hypoteesi: Ainakin kahden ryhmän välillä on merkitsevä ero. Hypoteesin testaus lähtee siitä olettamuksesta, että nollahypoteesi on totta. Testaus perustuu p-arvoon: todennäköisyys saada vähintään niin paljon toisistaan poikkeavat keskiarvot kuin otoksesta saadut. Yleensä päättelysääntönä käytetään: jos p-arvo on alle 5 %, niin nollahypoteesi hylätään, muussa tapauksessa nollahypoteesi jää voimaan. Päättelyn perusteluna on esitettävä laskettu p-arvo. Excelissä voit laskea yksisuuntaisen varianssianalyysin toiminnolla Tools-Data analysis-anova: Single Factor suom. Työkalut-Tietojen analysointi-anova: yksisuuntainen Jos Data Analysis -työkaluja ei ole valikossa, niin hae ne käyttöön Tools - Add Ins - toiminnolla (suom. Työkalut - Apuohjelmat).

7 VARIANSSIANALYYSI 6 Edellä on määritelty laskettavaksi varianssianalyysi solualueesta, jolla tieto on järjestetty sarakkeittain (yhden automallin polttoaineen kulutukset yhdessä sarakkeessa). Laskennan tuloksena saat yhteenvedon ja anova-taulukon. Yhteenvedosta löydät ryhmien keskiarvot ja varianssit. Anova-taulukossa vaihtelu on jaoteltu luokkien väliseen (esimerkissä automallien välinen) vaihteluun ja ryhmien sisäiseen vaihteluun. Yllä luokkien väliseen vaihteluun liittyvä p-arvo on 0, eli 0,0171%. Tässä tapauksessa nollahypoteesi hylätään, koska p-arvo on pienempi kuin 5%. Anovataulukon muihin lukuihin tutustuminen on vaivan arvoista ja auttaa paremmin ymmärtämään menetelmän perusidean. Monista tilastotieteen kirjoista löydät yksityiskohtaisen anova-taulukon johtamisen. Kaksisuuntainen varianssianalyysi ilman toistoja Käyttöedellytykset Yksisuuntainen varianssianalyysi on riippumattomien otosten t-testin vastine useamman ryhmän vertailuun. Kaksisuuntaista varianssianalyysiä ilman toistoja voidaan käyttää kahden riippuvan otoksen t-testin vastineena. Käyttöedellytykset ovat samat kuin yksisuuntaisella varianssianalyysillä (otosten riippumattomuutta lukuun ottamatta): 1. Otokset ovat satunnaisesti valitut

8 VARIANSSIANALYYSI 7 2. Otokset ovat peräisin normaali jakautuneesta perusjoukosta 3. Perusjoukossa ryhmien varianssit ovat yhtä suuria. Esimerkki Jos esim. kuljettajan ajotavan arvellaan vaikuttavan merkittävästi polttoaineenkulutukseen, niin voidaan toteuttaa tutkimusasetelma, jossa sama kuljettaja ajaa jokaista autoa. Alla olevassa esimerkissä on valittu satunnaisesti 6 kuljettajaa, joista jokainen ajaa jokaisella automallilla. Kuljettajien ajovuorot arvotaan, jolloin kaikki kuljettajat eivät aja autoja samassa järjestyksessä. Tällaisella asetelmalla voidaan erottaa kuljettajan vaikutus satunnaisvaihtelusta, jolloin satunnaisvaihtelu saadaan pienemmäksi. Tätä kautta saadaan myös automallin vaikutus paremmin erottumaan satunnaisvaihtelusta. Hypoteesit Päättelysääntö P-arvon laskeminen Nollahypoteesi: Ryhmien keskiarvot ovat yhtä suuret. Vaihtoehtoinen hypoteesi: Ainakin kahden ryhmän välillä on merkitsevä ero. Hypoteesin testaus lähtee siitä olettamuksesta, että nollahypoteesi on totta. Testaus perustuu p-arvoon: todennäköisyys saada vähintään niin paljon toisistaan poikkeavat keskiarvot kuin otoksesta saadut. Yleensä päättelysääntönä käytetään: jos p-arvo on alle 5 %, niin nollahypoteesi hylätään, muussa tapauksessa nollahypoteesi jää voimaan. Päättelyn perusteluna on esitettävä laskettu p-arvo. Excelissä kaksisuuntainen varianssianalyysi ilman toistoja lasketaan toiminnolla Tools-Data Analysis-Anova: Two-Factor Without Replication (Työkalut-Tietojen analysointi-anova: kaksisuuntainen ilman toistoa). Jos Data Analysis -työkaluja ei ole valikossa, niin hae ne käyttöön Tools - Add Ins - toiminnolla (suom. Työkalut - Apuohjelmat).

9 VARIANSSIANALYYSI 8 Esimerkkimme tulosteena saadaan keskiarvot ja varianssit sisältävä yhteenveto-taulukko sekä varsinainen anova-taulukko: Tässä tapauksessa sarakkeiden aiheuttamaan vaihteluun liittyvä p-arvo 0,1075 % on pienempi kuin 5%, joten nollahypoteesi hylätään. Taulukon mukaan myös kuljettajien välillä oli eroja, koska rivien aiheuttamaan vaihteluun liittyvä p-arvo on noin 1 %. Kuvion avulla voidaan havainnollistaa eroja:

10 VARIANSSIANALYYSI 9 Kuviosta nähdään, että automallin B kulutus on ollut alhaisin kuljettajaa 6 lukuun ottamatta. Kaksisuuntainen varianssianalyysi toistoin Käyttöedellytykset Esimerkki Jos tarkasteltavana on kaksi selittävää/riippumatonta muuttujaa, niin voidaan käyttää kaksisuuntaista varianssianalyysiä toistoin. Jos esim. ensimmäinen riippumaton muuttuja määrittää 3 ryhmää ja toinen 5 ryhmää, niin kaikkiaan ryhmiä on 3x5=15 kappaletta. Kustakin ryhmästä otetaan satunnaisesti valittu otos (seuraavassa oletetaan, että otokset ovat samansuuruisia). Kaksisuuntaisen varianssianalyysin käyttöedellytykset ovat samat kuin yksisuuntaisellakin: 1. Otokset ovat toisistaan riippumattomat ja satunnaisesti valitut 2. Otokset ovat peräisin normaali jakautuneesta perusjoukosta 3. Perusjoukossa ryhmien varianssit ovat yhtä suuria Seuraavassa taulukossa riippumattomina muuttujina ovat automalli (X, Y, Z) ja kuljettajan ikäluokka (1, 2, 3, 4, 5). Kustakin ryhmästä (automalli-ikäluokka yhdistelmä) on otettu 3 kappaleen otos.

11 VARIANSSIANALYYSI 10 Hypoteesit Päättelysääntö P-arvon laskeminen Nollahypoteesi: Ryhmien keskiarvot ovat yhtä suuret. Vaihtoehtoinen hypoteesi: Ainakin kahden ryhmän välillä on merkitsevä ero. Hypoteesin testaus lähtee siitä olettamuksesta, että nollahypoteesi on totta. Testaus perustuu p-arvoon: todennäköisyys saada vähintään niin paljon toisistaan poikkeavat keskiarvot kuin otoksesta saadut. Yleensä päättelysääntönä käytetään: jos p-arvo on alle 5%, niin nollahypoteesi hylätään, muussa tapauksessa nollahypoteesi jää voimaan. Päättelyn perusteluna on esitettävä laskettu p-arvo. Excelissä kaksisuuntainen varianssianalyysi toistoin lasketaan toiminnolla Tools-Data Analysis-Anova: Two Factor With Replication (Työkalut-Tietojen analysointi-anova: kaksisuuntainen, toistot sallittuja). Jos Data Analysis -työkaluja ei ole valikossa, niin hae ne käyttöön Tools - Add Ins - toiminnolla (suom. Työkalut - Apuohjelmat).

12 VARIANSSIANALYYSI 11 Huomaa, että määrittelyikkunaan täytyy antaa otoksen koko, joka esimerkkimme tapauksessa on 3. Tuloksena saadaan yhteenveto taulukko keskiarvoista ja variansseista sekä anova-taulukko. Anova-taulukossa kokonaisvaihtelu on jaettu rivien väliseen vaihteluun (päävaikutus) sarakkeiden väliseen vaihteluun (päävaikutus) riippumattomien muuttujien välisestä vuorovaikutuksesta aiheutuvaan vaihteluun otosten sisäiseen vaihteluun Tulosten tulkinta on vaativaa, koska mukana on myös riippumattomien muuttujien mahdollinen vuorovaikutus. Yllä olevassa esimerkissä vuorovaikutukseen liittyvä p-arvo on erittäin pieni (Excel esittää hyvin pienet luvut tieteellistä esitysmuotoa käyttäen kymmenen potensseina; 1,9E-10 tarkoittaa lukua 0, ). Aina, kun tilastollisesti merkitsevää vuorovaikutusta esiintyy, niin päävaikutuksiin on suhtauduttava kriittisesti. Päävaikutukset saattavat näyttää tilastollisesti merkitseviltä, mutta voivatkin olla vuorovaikutuksen aiheuttamia. Asiaa voi tarkastella ja ymmärtää kuvioiden avulla:

13 VARIANSSIANALYYSI 12 Kuvioissa vuorovaikutus ilmenee toisiaan leikkaavina viivoina. Esimerkkimme tapauksessa tilanne on melko sotkuinen ja vaikeasti tulkittava. Automallien välillä näyttäisi olevan eroa, mutta ikäluokissa 4 ja 5 havaittava vuorovaikutus sotkee tilannetta. Ikäluokkien kohdalla luokka 3 on selvästi tuhlailevin polttoaineen kulutuksen suhteen, mutta muiden ikäluokkien kohdalla erot eivät ole yhtä selviä. SPSS ja yksisuuntainen varianssianalyysi Esim. Jos vertaillaan kolmen eri automallin polttoaineenkulutusta arpomalla kullekin automallille satunnaisesti kuljettajia, niin SPSS-aineisto näyttää seuraavalta:

14 VARIANSSIANALYYSI 13 Yksisuuntainen varianssianalyysi lasketaan toiminnolla Analyze - Compare Means - One-Way ANOVA: Määrittelyikkunassa valitaan riippumaton muuttuja Factor-ruutuun ja riippuva(t) muuttuja(t) Dependent List -ruutuun. Tulosteena saat ANOVA-taulukon, josta löydät testin p-arvon Sig-sarakkeesta. Yllä p- arvo on 0,000 eli ainakin pienempi kuin 0,1%.

15 VARIANSSIANALYYSI 14 Jos epäilet, että varianssianalyysin käyttöedellytykset eivät ole voimassa, niin voit käyttää Kruskall-Wallis -testiä (Analyze-Nonparametric Tests-K Independent Samples). SPSS ja kaksisuuntainen varianssianalyysi ilman toistoja Esim. Jos vertaillaan eri automallien polttoaineenkulutusta siten että satunnaisesti valituista kuljettajista jokainen ajaa jokaista automallia, niin SPSS-aineisto näyttää seuraavalta: Kaksisuuntainen varianssianalyysi ilman toistoja lasketaan General Linear Model-Univariate: toiminnolla Analyze- Riippumattomat muuttujat siirretään Fixed Factor(s) -ruutuun ja riippuva muuttuja Dependent Variable -ruutuun. Model-painikkeen avulla määritellään käytettäväksi

16 VARIANSSIANALYYSI 15 malliksi Custom ja valitaan Model-kohtaan riippumattomat muuttujat. Laskettavaksi valitaan päävaikutukset (Main effects): Tuloksena saadaan anova-taulukko: Automalleihin liittyvä p-arvo on 0,001 eli 0,1%. SPSS ja kaksisuuntainen varianssianalyysi toistoin Esim. Jos vertaillaan eri automallien polttoaineenkulutusta eri ikäisten kuljettajien kuljettamana, niin riippumattomia muuttujia ovat automalli ja ikä. Kaksisuuntainen varianssinanalyysi lasketaan toiminnolla Analyze-General Linear Model-Univariate:

17 VARIANSSIANALYYSI 16 Lisätoimintona kannattaa hyödyntää kuvioita, joita voit määritellä piirrettäväksi Plotspainiketta käyttäen. Oletusasetuksilla saadaan anova-taulukko: Esimerkin tapauksessa vuorovaikutukseen liittyvä p-arvo on alle 0,1 %, joten päävaikutuksiin on suhtauduttava kriittisesti, vaikka niihin liittyvät p-arvot ovat pieniä. Asiaa kannattaa tarkastella kuvioiden avulla:

18 VARIANSSIANALYYSI 17 LIITE: NORMAALIJAKAUTUNEISUUS Yleistä Ihmisten fyysiset ja henkiset ominaisuudet, teollisesti valmistettujen tuotteiden ominaisuudet, mittausvirheet, pörssiosakkeiden päivätuotot jne. noudattavat yleensä likimain normaalijakaumaa. Ylipäätään määrälliset muuttujat, joiden arvo määräytyy monen eri tekijän perusteella noudattavat yleensä likimain normaalijakaumaa. Normaalijakaumassa suurin osa arvoista sijoittuu keskiarvon läheisyyteen, symmetrisesti keskiarvon molemmille puolille. Normaalijakauma määräytyy keskiarvon ja keskihajonnan perusteella. Keskiarvo määrää jakauman keskikohdan sijainnin ja keskihajonta määrää jakauman leveyden. Normaalijakaumassa noin 95% tapauksista sijaitsee korkeintaan kahden keskihajonnan päässä keskiarvosta. Yllä olevassa kuvassa jakaumalla A ja B on sama keskiarvo, mutta jakauman A keskihajonta on suurempi. Jakaumalla C on suurempi keskiarvo kuin jakaumalla A, mutta A:n ja C:n keskihajonnat ovat likimain samat. Normaalijakaumalla on keskeinen asema tilastotieteessä: Keskiarvo ja keskihajonta ovat jakaumaa hyvin kuvailevia tunnuslukuja vain likimain normaalijakautuneille muuttujille. Useiden tilastollisten testien edeltävyysehtona on muuttujien normaalijakautuneisuus.

19 VARIANSSIANALYYSI 18 Onko jakauma normaali? SPSS-tilasto-ohjelmalla voit tarkastella, noudattaako muuttuja normaalijakaumaa. Jakauman normaalisuutta voit arvioida silmämäärin histogrammin avulla: Valitse Graphs - Interactive - Histogram, jolloin aukenee Create Histogram - valintaikkuna. Siirrä tarkasteltava muuttuja koordinaatiston vaaka-akselille. Varmista, että Histrogram-välilehdeltä on valittuna Normal Curve -ruutu. Valitse OK. Yllä olevan histogrammin palkkajakauma ei vaikuta normaalijakautuneelta. SPSS:llä normaalijakautuneisuutta voidaan testata asettamalla hypoteesit: Nollahypoteesi: Muuttuja noudattaa normaalijakaumaa. Vaihtoehtoinen hypoteesi: Muuttuja ei noudata normaalijakaumaa. Testin laskeminen sujuu seuraavasti: Valitse Statistics - Descriptive Statistics - Explore. Siirrä muuttujat, joiden normaalijakautuneisuutta haluat tarkastella, Dependent List - ruutuun. Tarvittaessa voit siirtää Factors-ruutuun kategorisen muuttujan, jonka mukaan jaat aineiston luokkiin. Tällöin testaat normaalijakautuneisuutta erikseen kussakin luokassa. Napsauta Plots-painiketta, jolloin aukenee Explore: Plots -valintaikkuna.

20 VARIANSSIANALYYSI 19 Valitse Normality plots with tests -ruutu. Valitse Continue. Valitse OK. Monien muiden tulosten ohella saat Tests of Normality -taulukon: Testinä käytetään isoilla otoksilla Kolmogorov-Smirnov -testiä. Pienillä otoksilla (n<50) on suotavampaa käyttää Shapiro-Wilk -testiä. Päättelysääntö: jos testin p-arvo (taulukossa Sig.) on pienempi kuin 0,05 (5%), niin nollahypoteesi hylätään. Esimerkkitaulukon tapauksessa muuttuja ei ole normaalisti jakautunut ja tuloksen voi raportoida esim. seuraavasti: Current Salary -muuttuja ei ole normaalisti jakautunut (Kolmogorov-Smirnov testin p-arvo alle 0,001).

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aki Taanila TILASTOLLINEN PÄÄTTELY Aki Taanila TILASTOLLINEN PÄÄTTELY 17.6.2010 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 7 2.1 Normaalijakautuneisuuden testaaminen... 7 2.2 Keskiarvon luottamusväli...

Lisätiedot

Aki Taanila TILASTOLLINEN PÄÄTTELY

Aki Taanila TILASTOLLINEN PÄÄTTELY Aki Taanila TILASTOLLINEN PÄÄTTELY 14.4.2012 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 7 2.1 Normaalijakautuneisuuden testaaminen... 7 2.2 Keskiarvon luottamusväli...

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET 9.4.2010 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 1.1 Tiekartta... 4 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 5 2.1 Keskiarvon luottamusväli... 5 2.2

Lisätiedot

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen) 1 MTTTP3 Luento 29.1.2015 Luku 6 Hypoteesien testaus Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? H 0 : µ = µ 0 H 1 : µ < µ 0 Nollahypoteesi Vaihtoehtoinen hypoteesi

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET 21.5.2014 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 1.1 Tiekartta... 4 2 YHTÄ MUUTTUJAA KOSKEVA PÄÄTTELY... 5 2.1 Keskiarvon luottamusväli... 5 2.2

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

KAHDEN RYHMÄN VERTAILU

KAHDEN RYHMÄN VERTAILU 10.3.2015 KAHDEN RYHMÄN VERTAILU Jouko Miettunen Center for Life-Course and Systems Epidemiology jouko.miettunen@oulu.fi Luennon sisältö Luokitellut muuttujat Ristiintaulukko, prosentit Khiin neliötesti

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 5 viikko 42 6.10.2017 klo 10:42:20 Ryhmät: ke 08.30 10.00 LS C6 Paajanen ke 10.15 11.45 LS

Lisätiedot

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET

Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET Aki Taanila TILASTOLLISEN PÄÄTTELYN ALKEET 19.5.2016 SISÄLLYS 0 JOHDANTO... 1 1 TILASTOLLINEN PÄÄTTELY... 2 1.1 Tiekartta... 4 2 VIRHEMARGINAALI JA LUOTTAMUSVÄLI... 5 2.1 Keskiarvon virhemarginaali ja

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1 Johdatus varianssianalyysiin Vilkkumaa / Kuusinen 1 Motivointi Luento 4: kahden riippumattoman otoksen odotusarvoja voidaan vertailla t-testillä H 0 : μ 1 = μ 2, T = ˉX 1 ˉX 2 s 2 1 + s2 2 n 1 n 2 a t(min[(n

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas NORMAALIJAKATUNEISUUDEN TESTAUS H 0 : Muuttuja on perusjoukossa normaalisti jakautunut. H 1 : Muuttuja ei ole perusjoukossa normaalisti

Lisätiedot

2. TILASTOLLINEN TESTAAMINEN...

2. TILASTOLLINEN TESTAAMINEN... !" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...

Lisätiedot

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma Diskreetit todennäköisyysjakaumat Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma Satunnaismuuttuja Satunnaisilmiö on ilmiö, jonka lopputulokseen sattuma vaikuttaa Satunnaismuuttuja on muuttuja,

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely 3.12.2018/1 MTTTP5, luento 3.12.2018 6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely H 0 : = 0 Oletetaan, että populaatiossa viallisia %. Olkoon X 1, X

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu.

Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Ka6710000 TILASTOLLISEN ANALYYSIN PERUSTEET 2. VÄLIKOE 9.5.2007 / Anssi Tarkiainen Kaavakokoelma, testikaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1. a) Gallupissa

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) MTTTP5, luento 7.12.2017 7.12.2017/1 6.1.3 Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta) y = lepopulssi x = sukupuoli y = musikaalisuus x = sukupuoli

Lisätiedot

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. 9.10.2018/1 MTTTP1, luento 9.10.2018 KERTAUSTA TESTAUKSESTA, p-arvo Asetetaan H 0 H 1 Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi. Lasketaan otoksesta testisuureelle arvo. 9.10.2018/2

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

IBM SPSS Statistics 21 (= SPSS 21)

IBM SPSS Statistics 21 (= SPSS 21) Tarja Heikkilä IBM SPSS Statistics 21 (= SPSS 21) SPSS = Statistical Package for Social Sciences Ohjelman käynnistys Aloitusikkuna Päävalikot Työkalut Muuttujat (Variables) Tapaukset (Cases) Tyhjä datataulukko

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1

Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1 Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta 1 Summamuuttujat, aineiston pilkkominen ja osa-aineiston poiminta I Summamuuttujien muodostus Olemassa olevista muuttujista voidaan laskea

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas Keskivirheyksiköllä ilmaistuna voidaan erottaa otantajakaumalta kriittisiä kohtia: Keskimmäinen 95 % otoskeskiarvoista välillä [-1.96,+1.96] Keskimmäinen

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1 Kaksisuuntainen varianssianalyysi Vilkkumaa / Kuusinen 1 Motivointi Luennot 6 ja 7: yksisuuntaisella varianssianalyysilla testataan ryhmäkohtaisten odotusarvojen yhtäsuuruutta, kun perusjoukko on jaettu

Lisätiedot

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt TKK (c) Ilkka Mellin (005) Koesuunnittelu TKK (c) Ilkka Mellin (005) : Mitä opimme? Tarkastelemme tässä luvussa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan yhden tekijän vaikutusta vastemuuttujaan,

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

2. Aineiston kuvailua

2. Aineiston kuvailua 2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 2) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 2) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 2005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy

Lisätiedot

Kaksisuuntainen varianssianalyysi. Heliövaara 1

Kaksisuuntainen varianssianalyysi. Heliövaara 1 Kaksisuuntainen varianssianalyysi Heliövaara 1 Kaksi- tai useampisuuntainen varianssianalyysi Kaksi- tai useampisuuntaisessa varianssianalyysissa perusjoukko on jaettu ryhmiin kahden tai useamman tekijän

Lisätiedot

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat: Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,

Lisätiedot

Aineistokoko ja voima-analyysi

Aineistokoko ja voima-analyysi TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 24.4.2017 1 Kategoriset muuttujat Lukumääriä Prosentteja (muista n-arvot) Pylväitä 2 Yhteenvetotaulukko (frekvenssitaulukko) TAULUKKO 1. Asunnon tyyppi

Lisätiedot

Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003

Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Nimi Opiskelijanumero Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Normaalisti jakautuneiden yhdistyksessä on useita tuhansia jäseniä. Yhdistyksen sääntöjen mukaan sääntöihin tehtävää muutosta

Lisätiedot

Teema 9: Tilastollinen merkitsevyystestaus

Teema 9: Tilastollinen merkitsevyystestaus Teema 9: Tilastollinen merkitsevyystestaus Tärkeä päättelyn osa-alue on tilastollinen merkitsevyystestaus, johon päästään luontevasti edellisen teeman aiheista: voidaan kysyä, menevätkö kahden vertailtavan

Lisätiedot

, Määrälliset tutkimusmenetelmät 2 4 op

, Määrälliset tutkimusmenetelmät 2 4 op 6206209, Määrälliset tutkimusmenetelmät 2 4 op Jyrki Reunamo, Helsingin yliopisto, Opettajankoulutuslaitos 19.2.2015 1 Varianssianalyysi (Pallant 2007, Tähtinen & Isoaho 2001) Verrataan ryhmien keskiarvoja.

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on?

Tulkitse tulokset. Onko muuttujien välillä riippuvuutta? Jos riippuvuutta on, niin millaista se on? Tilastollinen tietojenkäsittely / SPSS Harjoitus 4 Tarkastellaan ensin aineistoa KUNNAT. Koska kyseessä on kokonaistutkimus, riittää, että tutkit tunnuslukujen arvoja ja teet niiden perusteella päätelmiä.

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 7.11.2011 1 Muuttujat Aineiston esittämisen kannalta muuttujat voidaan jaotella kolmeen tyyppiin: Kategoriset (esimerkiksi sukupuoli, koulutus) Asteikolla

Lisätiedot

Otoskoon arviointi. Tero Vahlberg

Otoskoon arviointi. Tero Vahlberg Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

Aki Taanila AIKASARJOJEN ESITTÄMINEN

Aki Taanila AIKASARJOJEN ESITTÄMINEN Aki Taanila AIKASARJOJEN ESITTÄMINEN 4.12.2012 Viivakaavio Excelissä voit toteuttaa viivakaavion kaaviolajilla Line (Viiva). Viivakaavio onnistuu varmimmin, jos taulukon ensimmäisessä sarakkeessa ovat

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Tilastomenetelmien lopputyö

Tilastomenetelmien lopputyö Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin

/1. MTTTP5, luento Kertausta. Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin 30.11.2017/1 MTTTP5, luento 30.11.2017 Kertausta H 0 : µ = µ 0 Olk. X 1, X 2,..., X n on satunnaisotos N(µ, ):sta, missä tunnettu. Jos H 0 on tosi, niin = / ~ 0,1. Kaava 5.1 30.11.2017/2 Esim. Tutkija

Lisätiedot

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja:

RISKITASO. Riskitaso (α) määrittää virhepäätelmän todennäköisyyden. Käytettyjä riskitasoja: RISKITASO Riskitaso (α) määrittää virhepäätelmän todennäköisyyden testattaessa Todennäköisyys, jolla tutkija on valmis hylkäämään nollahypoteesin, vaikka se saattaisikin pitää perusjoukossa paikkansa Käytettyjä

Lisätiedot