Nuoruusiän vaikutus aikuisen painoindeksiin Data-analyysin perusmenetelmät Harjoitustyö. Lassi Miinalainen

Koko: px
Aloita esitys sivulta:

Download "Nuoruusiän vaikutus aikuisen painoindeksiin Data-analyysin perusmenetelmät Harjoitustyö. Lassi Miinalainen"

Transkriptio

1 Nuoruusiän vaikutus aikuisen painoindeksiin Data-analyysin perusmenetelmät Harjoitustyö Lassi Miinalainen

2 Sisältö 1 Aineisto Muuttujat Painoindeksi Tutkimusongelma Analyysi Hypoteesi Menetelmät Tilastollisten mallien muodostus ja vertailu Vaihtoehtoiset lineaariset mallit aikuisiän painoindeksille Onko teini-iän paino tai pituus kovin hyvä selittäjä? Aikuisiän ylipainolle altistavat tekijät Johtopäätökset A Liitteet 10 A.1 Lineaariset mallit aikuisiän painoindeksille A.2 Ajovirta A.3 R-koodi mallin testiaineiston tutkimiseen liittyen A.4 Python-koodi satunnaisvektorin muodostamiseksi A.5 Ajovirta F-testiin liittyen A.6 Ajovirta riskitasoon liittyen

3 Luku 1 Aineisto Aineistoni on osa vuonna 1966 Lapin ja Oulun läänissä syntyneistä lapsista kerättyä kohorttiaineistoa.[4] Aineisto sisältää 300 tilastoyksikköä. Tietojen keräämistä ei ole kuitenkaan voitu syystä tai toisesta viedä loppuun kaikkien lasten tapauksessa ja niinpä tässä tutkielmassa esitettyjen tilastollisten mallien estimointiin soveltuu vain 201 tilastoyksikköä. Syynä tähän katoon lienee 60- ja 70-luvun maaltapako Helsinkiin ja Ruotsiin suuntautunut muuttoliike. Etenkin Lappi oli tähän aineistoon kuuluvien lasten syntymisen aikaan huomattavasti vähemmän kehittynyttä aluetta kuin muu Suomi.[1] [2] Terveyskeskusjärjestelmä luotiin suomessa 1970-luvun alussa ja aineistoon kuuluvat mittaukset 14-vuotiaana lieneekin toteutettu juuri kuntien terveyskeskuksissa 80-luvun alussa. Aineistosta tai tehtävänannosta ei selviä mitä tarkalleen ottaen tarkoittaa "paino aikuisena". Ilmeisesti nämä nämä mittaukset on kuitenkin tehty 90-luvun kuluessa. 1.1 Muuttujat Koko aineistossa on 146 poikaa ja 154 tyttöä. Mallien estimointiin soveltuvassa osassa on 97 poikaa 104 tyttöä. Aineisto sisältää seuraavat muuttujat: Muuttujan nimi aineistossa yksikkö äidin ikä syntymähetkellä aidika vuodet syntymäpaino syntpain grammat syntymäpituus syntpit senttimetrit paino 14-vuotiaana paino14v kilogrammat pituus 14-vuotiaana paino14v senttimetrit paino aikuisena paino kilogrammat pituus aikuisena pituus senttimetrit 2

4 Muuttujan keskiarvo koko aineistossa tutkimuksessa käytetyssä osassa äidin ikä syntymähetkellä syntymäpaino syntymäpituus paino 14-vuotiaana pituus 14-vuotiaana paino aikuisena pituus aikuisena Vaikuttaisi siltä, että epätäydellisten ja täydellisten tilastoyksiköiden välillä ei ole merkittäviä eroja. Muuttujien väliset korrelaatiot ovat seuraavanlaiset: aidika syntpain syntpit paino14v pit14v paino pituus aidika syntpain syntpit paino14v pit14v paino pituus Painoindeksi Painoindeksi määritellään seuraavalla kaavalla: paino kiloina (pituus metreinä) 2 Tällä tavalla aineistoon saadaan kaksi muuttujaa lisää: bmi eli painoindeksi aikuisena ja bmi14 eli painoindeksi 14-vuotiaana. Havaitaan, että aikuisen painoindeksi korreloi kohtalaisesti 14-vuotiaan painon ja painoindeksin kanssa (ρ = 0, 364 ja ρ = 0, 375). Korrelaatiokerroin 14-vuotiaan pituuden kanssa on yllätyksekseni positiivinen (ρ = 0.169). 14-vuotiaan paino ja pituus ovat kuitenkin keskenään korreloivia, joten on syytä laskea ehdollinen korrelaatiokerroin, joka onkin negatiivinen (ρ X,Y Z = 0.142). Normaalipainoisen ihmisen painoindeksi on alle 25, mutta yli Painoindeksi välillä on merkitsee lievää ylipainoa ja välillä merkittävää ylipainoa. Lähes koko tutkimusaineisto on normaalipainoista tai enintään lievästi ylipainoista. Nämä lukurajat pätevät kuitenkin vain aikuisille. Teini-ikäisille asia on monimutkaisempi. Yhdysvaltojen viranomaisten Center for disease Control and Prevention määrittelee 14-vuotiaan olevan alipainoinen, jos hän kuuluu 5-persentiiliin; normaalipainoinen, jos hän kuuluu persentiiliin; ylipainoinen jos hän kuuluu persentiiliin ja liikalihava jos 95-persentiiliin. [3] Olen estimoinut nämä persentiilirajat tutkimusaineistosta ja verrannut niitä netistä löytämiini virallisissa taulukoissa esitettyihin rajoihin allaolevassa taulukossa. lähde estimoitu aineistosta CDC 5-persentiili persentiili persentiili Ylipainon lisääntyminen viime vuosikymmeninä näkyy selkeästi persentiilien eroissa. 3

5 1.2 Tutkimusongelma Tavoitteena on tutkia 14-vuotiaana mitatun painon ja pituuden vaikutusta aikuisen painoindeksiin. Koska liikalihavuus altistaa esimerkiksi sydän- ja verisuonisairauksille, koetetaan myös tunnistaa aineistosta aikuisiän liikalihavuudelle altistavia tekijöitä. 4

6 Luku 2 Analyysi 2.1 Hypoteesi Koska murrosikä alkaa tavallisesti huomattavasti ennen 14. ikävuotta, voidaan aikuisen ihmisen ruumiinrakennetta jo ennakoida murrosikäisen pituudesta ja painosta. Etenkin tytöillä pituuskasvu on 14-vuotiaana jo lähes pysähtynyt. Ruokailutottumukset, liikkumistavat ja muut painoon vaikuttavat ympäristötekijät ovat yleensä vakiintuneet jo teini-iässä. Vaikka ne voivatkin muuttua aikuistumisen yhteydessä, niin yleistyksenä voidaan sanoa, että teini-iässä lihavat ovat lihavia myös aikuisena: tietokonepelejä pelannut ja sipsejä mussutellut teini on myös aikuisena ylipainoinen, ellei huomattavaa tahdonvoimaa elämäntaparemonttiin löydy. Hypoteesina esitän, että 14-vuotiaan painon ja aikuisen painoindeksin välillä on positiivinen korrelaatio ja 14-vuotiaan pituuden ja aikuisen BMI:n välillä negatiivinen korrelaatio. 2.2 Menetelmät Muodostetaan erilaisia aikuisiän painoindeksiä ennustavia lineaarisia malleja ja tarkastellaan muuttujien kertoimia eri malleissa. Mikäli jokaisessa mallissa 14-vuotiaan painolle ja pituudelle estimoitu painokerroin on saman merkkinen tai jopa samaa suuruusluokkaa, voidaan katsoa tämän sulkevan pois "pelkän"tilastollisen korrelaation ja viittaavan aitoon syy-seuraus-suhteeseen. Ongelmana on, että 14-vuotiaiden painon ja pituuden välillä huomattava tilastollinen riippuvuus. Tämä kollineaarisuus monimutkaistaa tutkimustulosten tulkitsemista. 5

7 Kuva 2.1: hypoteesi muuttujien välisistä kausaalisuhteista 2.3 Tilastollisten mallien muodostus ja vertailu Vaihtoehtoiset lineaariset mallit aikuisiän painoindeksille Yrityksen ja erehdyksen avulla löydetään neljä vaihtoehtoista mallia: Malli 1: bmi paino14v pit14v Malli 2: bmi paino14v sukuptytt pit14v syntpain aidika syntpain aidika Malli 3: bmi bmi e aidika syntpain sukuptytt aidika : syntpain Malli 4: log bmi log paino14v log pit14v sukuptytt Kaikkien mallien determinaatiokerroin R 2 on suunnilleen 0, 2 ja ne vaihtelevat välillä 0, 195 0, 22. Eri mallien sovitteetkin ovat suunnilleen samoja eri tilastoyksiköille. On syytä huomata, että kaikkien mallien 14-vuotiaan painon lineaarikerroin on positiivinen ja vastaavasti pituuden kerroin negatiivinen. Tä- 6

8 mä tukee esitettyä hypoteesia. Mallien tarkemmat tunnusluvut ja muut yksityiskohdat löytyvät liitteestä A.1. Mallista 4 näkee, että mallissa 3 voisi painoindeksin neliöjuuri olla hieman parempi selittäjä. Tämä kuitenkin vaikeuttaisi mallin tulkintaa, eikä parantaisi merkittävästä sen selityskykyä. Mallien QQ-kuvaajissa ei näy merkittäviä anomalioita muutamaa outlieria lukuunottamatta. Determinaatiokerroin on tunnettu kyvyttömyydestään erottaa hyödyllisiä malleja hyödyttömistä. Sen lisäksi on olemassa useita vaihtoehtoisia mallin hyvyyttä mittaavia tunnuslukuja. Yksi näistä on keskihajonta testiaineistossa. Olen liitteessä A.4 esittänyt python-skriptin joka jakaa aineiston satunnaisesti testi- ja opetusaineistoon. Tilastoyksiköistä noin 75% sijoitetaan opetusaineistoon ja loput testiaineistoon. Lineaarinen malli estimoidaan käyttäen opetusaineistoa, minkä jälkeen estimoidulla mallilla koetetaan ennustaa testiaineiston tilastoyksiköitä. Tunnuslukuna mallin toimivuudelle on keskineliösumma tai keskihajonta mallin residuaaleille testiaineistossa. Malli 4 menestyy parhaiten tällä kriteerillä, sen keskihajonta testiaineistossa on 8, 2, kun taas kaikilla muilla malleilla se on noin 8, Onko teini-iän paino tai pituus kovin hyvä selittäjä? Koko tämän tutkielmän lävitse kulkee punaisena lankana, että teini-iän painolla ja pituudella olisi jotain tekemistä aikuisen painon ja pituuden kanssa. Ihmisten elämässä tapahtuu kuitenkin useita muutoksia aikuistumisen yhteydessä, minkä vuoksi tutkimushypoteesin mielekkyyttä on syytä testata. Tämä tapahtuu F-testin avulla. Liitteessä A.5 on esitetty yksityiskohdat. Periaatteena kuitenkin on, että muodostetaan pelkästään syntymäpainon, äidin iän ja sukupuolen avulla aikuisen painoindeksiä ennustava lineaarinen malli. Tämän mallin jäännösvarianssia verrataan tässä tutkielmassa aiemmin esitettyyn malliin 3. Nollahypoteesina on, että mallit ovat yhtä hyviä ennustamaan aikuisen painoindeksiä, eli että teini-ikäisen painoindeksi ei olisi merkittävä selittäjä aikuisen painoindeksille. Tätä nollahypoteesia ei pystytä täysin sulkemaan pois, mutta ei myöskään ole syytä pitää sitä totena (p-arvo 0.22). Vastaava testisuure muodostetaan myös mallille 4, lopputulos on suunnilleen sama (p-arvo 0.13). Tämä viittaisi siihen, että vaikka teini-iän painolla ja pituudella onkin jonkin verran korrelaatiota aikuisen painon ja pituuden kanssa, niin paljon merkittävämpiä tekijöitä ovat esimerkiksi omat elämäntavat Aikuisiän ylipainolle altistavat tekijät Tutkitaan miten aikuisena ainakin lievästi ylipainoiset eroavat normaalipainoisista taustamuuttujiensa suhteen. Huomataan, että ainoa todella merkittävä ero on 14-vuotiaan painoindekseissä. Miehet ovat myös keskimäärin hieman naisia tukevampia, mutta tämän vuoksi jotkin lähteet määrittelevät ylipainon rajan miehille ja naisille hieman eri kohtaan. Arvioidaan miten paljon teini-ikäisen ylipaino altistaa ylipainolle aikuisena. 7

9 bmi14 21,2 bmi14 > 21,2 bmi > bmi n Yksinkertaisella laskutoimituksella nähdään, että teini-iässä ylipainoisilla on kaksinkertainen riski olla myös aikuisena ylipainoisia verrattuna normaalipainoisiin. Toisaalta esimerkiksi molempien vanhempien ylipaino kahdeksankertaistaa ylipainon riskin verrattuna normaalipainoisiin vanhempiin. ([5], s. 122) 2.4 Johtopäätökset Kaikki vaihtoehtoiset mallit viittaavat samansuuntaisiin tuloksiin: 14-vuotiaan pituus korreloi negatiivisesti ja paino positiivisesti aikuisiän painoindeksin kanssa. Ei ole paljoakaan merkitystä mallin selityskyvyn kannalta käytetäänkö mallissa selittävänä tekijänä 14-vuotiaan painoindeksiä vai painoa ja pituutta, sillä molemmat mallit antavat pääsääntöisesti lähes samat sovitteet eri tilastoyksiköille. Koska aineistossa on 14-vuotiaiden painon ja pituuden välillä huomattava korrelaatio (ρ = 0, 64), ei niiden vaikutusta voida erottaa toisistaan täydellisesti tai ainakaan tuloksia ei voida yleistää tämän osapopulaation ulkopuolelle, etenkin kun varsinaisen mallin determinaatiokerroin jää melko vaatimattomaksi. Tämä tarkoittaa, että esimerkiksi nuoruusiän anoreksian vaikutuksesta aikuisiän painoindeksiin ei voida tehdä johtopäätöksiä tämän tutkimusaineiston pohjalta. Itseasiassa F-testissä osassa ei nollahypoteesia voida sulkea kokonaan pois. Tämä ei tarkoita, että syntymäpaino olisi kovin hyvä ennustaja aikuisen painoindeksille, vaan että 14-vuotiaan painoa ja pituutta tärkeämmät taustatekijät aikuisen terveydelle ovat, paitsi perintötekijät, niin etenkin omat elämäntavat ja ruokailutottumukset. Nykyajan nuoriso elää monella tavalla erilaisessa yhteiskunnassa kuin tutkimusaineiston nuoret: tietokoneet ja Internet ovat nousseet television rinnalle ei-fyysisenä ajanvietteenä, pikaruoka on nykyään yleisempää kuin 80-luvulla. Tämän vuoksi tässä tutkielmassa esitettyjä tilastollisia malleja ei voida soveltaa sellaisenaan nykymaailmaan. Arvioisin kuitenkin, että korrelaatiot ovat samanmerkkisiä nykyäänkin eli että teini-iän ylipaino korreloi positiivisesti aikuisiän ylipainon kanssa. 8

10 Tiivistelmä Muodostettiin kolme vaihtoehtoista mallia aikuisen painoindeksin ennustamista varten, jotka kaikki toimivat suunnilleen yhtä hyvin. Tutkimuksessa havaittiin kohtalainen korrelaatio 14-vuotiaan ja aikuisen ylipainon välillä. Ylipainoisella 14-vuotiaalla on kaksinkertainen riski olla aikuisena liikalihava normaalipainoiseen verrattuna. Löydettiin myös viitteitä, että teini-iän painoa merkityksellisempää aikuisen ylipainolle ovat muut tekijät, luultavasti esimerkiksi ruokavalio, geenit ja elämäntavat. 9

11 Liite A Liitteet A.1 Lineaariset mallit aikuisiän painoindeksille Call: lm(formula = bmi paino14v + pit14v, data = aineisto) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-07 *** paino14v e-08 *** --- pit14v * Signif. codes: 0 *** ** 0.01 * Residual standard error: on 199 degrees of freedom (98 observations deleted due to missingness) Multiple R-squared: , Adjusted R-squared: F-statistic: 19.3 on 2 and 199 DF, p-value: 2.188e-08 Call: lm(formula = bmi paino14v + sukup + pit14v + syntpain * aidika, data = aineisto) Residuals: 10

12 Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 1.345e e paino14v 2.145e e e-09 *** sukuptyttö e e * pit14v e e * syntpain 5.200e e * aidika 6.422e e * syntpain:aidika e e * Signif. codes: 0 *** ** 0.01 * Residual standard error: on 194 degrees of freedom (99 observations deleted due to missingness) Multiple R-squared: , Adjusted R-squared: F-statistic: on 6 and 194 DF, p-value: 5.901e-09 Call: lm(formula = bmi bmi14 + aidika * syntpain + sukup, data = aineisto) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e bmi e e e-09 *** aidika 5.926e e * syntpain 4.852e e * sukuptyttö e e ** aidika:syntpain e e * Signif. codes: 0 *** ** 0.01 * Residual standard error: on 195 degrees of freedom (99 observations deleted due to missingness) Multiple R-squared: 0.217, Adjusted R-squared: F-statistic: on 5 and 195 DF, p-value: 3.456e-09 > formula <- "log(bmi) log(paino14v) + log(pit14v) + sukup" > m1<-lm(formula, data=subset(aineisto2, aineisto2$random==1)) > summary(m1) Call: lm(formula = formula, data = subset(aineisto2, aineisto2$random == 1)) 11

13 Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-05 *** log(paino14v) e-07 *** log(pit14v) ** sukuptyttö * Signif. codes: 0 *** ** 0.01 * Residual standard error: on 149 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 149 DF, p-value: 5.909e-07 A.2 Ajovirta aineisto<-read.table("/home/lassimii/desktop/dataapm/aineisto.txt", header=true) aineisto2<-subset(aineisto,!is.na(aineisto$aidika) &!is.na(aineisto$sukup) &!is.na(aineisto$paino14v) &!is.na(aineisto$pit14v) &!is.na(aineisto$paino) &!is.na(aineisto$pituus)) aineisto2$bmi<-aineisto2$paino/((aineisto2$pituus/100)ˆ2) aineisto2$bmi14<-aineisto2$paino14v/((aineisto2$pit14v/100)ˆ2) > (cor(aineisto2$bmi, aineisto2$pit14v)-cor(aineisto2$bmi, aineisto2$paino14v)* cor(aineisto2$pit14v, aineisto2$paino14v))/(sqrt(1-cor(aineisto2$bmi, aineisto2$paino14v)ˆ2) sqrt(1-cor(aineisto2$pit14v, aineisto2$paino14v)ˆ2)) aineisto2$random<-c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1) formula<-"bmi > CV formula<-"bmi > CV pit14v + paino14v" paino14v + sukup + pit14v + syntpain * aidika" 12

14 formula <- "bmi > CV bmi14 + aidika * syntpain + sukup" formula <- "log(bmi) log(paino14v) + log(pit14v) + sukup" > CV<-var(exp(sovite)-aineisto2$bmi[aineisto2$random==0]) > CV > cor(aineisto2$bmi, exp(sovite))ˆ A.3 R-koodi mallin testiaineiston tutkimiseen liittyen m1<-lm(formula, data=subset(aineisto2, aineisto2$random==1)) X=model.matrix(m1, data=subset(aineisto2, aineisto2$random==0)) sovite=x%*%m1$coeff CV<-var(sovite-aineisto2$bmi[aineisto2$random==0]) A.4 Python-koodi satunnaisvektorin muodostamiseksi import random vector = c( a=0 while a < 201: a+=1 vector+= ) if random.randint(0, 3)!= 0: vector += 1 else: vector += 0 if a!=201: vector +=, 13

15 A.5 Ajovirta F-testiin liittyen > m1<-lm(formula = bmi sukup + aidika * syntpain) > m2<-lm(formula = bmi sukup + aidika * syntpain + bmi14) > var.test(m1, m2) F test to compare two variances data: m1 and m2 F = , num df = 227, denom df = 195, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances > m1<-lm(formula = bmi sukup + aidika * syntpain, data=aineisto2) > m2<-lm(log(bmi) log(paino14v)+log(pit14v)+sukup,data=aineisto2) > summary(m2) t(aineisto2$bmi-exp(m2$fitted.values))%*%(aineisto2$bmi-exp(m2$fitted.values))/ > summary(m1) Residual standard error: on 196 degrees of freedom > 3.222ˆ2/ A.6 Ajovirta riskitasoon liittyen > length(aineisto2$bmi[aineisto2$bmi14<21.2 &aineisto2$bmi>=25]) 55 > length(aineisto2$bmi[aineisto2$bmi14>=21.2 &aineisto2$bmi>=25]) 21 > length(aineisto2$bmi[aineisto2$bmi14<21.2 &aineisto2$bmi<25]) 114 > length(aineisto2$bmi[aineisto2$bmi14>=21.2 &aineisto2$bmi<25]) 11 14

16 Kirjallisuutta [1] Elävä arkisto: Lapin kehityksen ongelmat, raportti kehitysalueelta, Yle, alkuperäinen esitys: [2] Wikipedia, Suomi 1960-luvulla [3] Centers for disease Control and Prevention [4] Pohjois-Suomen syntymäkohortti tutkimus [5] Kolata,Gina Rethinking thin: The new science of weight loss - and the myths and realities of dieting Picador, 2007, ISBN

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä 806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2011 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Eräässä suuressa yrityksessä

Lisätiedot

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen! 8069 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2013 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOLLA 9! Ilmoittaudu Weboodissa 4.3.2013 klo

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

Opiskelija viipymisaika pistemäärä

Opiskelija viipymisaika pistemäärä 806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2012 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Jatkoa harjoituksen 5 tehtävään

Lisätiedot

2. Tietokoneharjoitukset

2. Tietokoneharjoitukset 2. Tietokoneharjoitukset Demotehtävät 2.1 Jatkoa kotitehtävälle. a) Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora. KULUTUS on selitettävä muuttuja. b) Määrää estimoidusta

Lisätiedot

Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli

Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli MS-C2128 Ennustaminen ja aikasarja-analyysi 1. harjoitukset / Tehtävät Kotitehtävät: 2 Aiheet: Aluksi Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli Tällä kurssilla käytetään

Lisätiedot

MS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4

MS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4 MS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4 Tehtävä 2.1. Jatkoa tietokonetehtävälle 1.2: (a) Piirrä aineistosta pisteparvikuvaaja (KULUTUS, SAIRAST) ja siihen

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Tehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset

Tehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset 12.05.2009 Tehtävä 1 (a) x

Lisätiedot

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede

Lisätiedot

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011

Lisätiedot

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

R: mikä, miksi ja miten?

R: mikä, miksi ja miten? R: mikä, miksi ja miten? Ilmari Ahonen Matematiikan ja tilastotieteen laitos, Turun yliopisto SSL R-Webinaari 2015 Vähän minusta Valmistuin maisteriksi Turun yliopistossa 2012 Teen neljättä vuotta väitöskirjaa

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

1. Tietokoneharjoitukset

1. Tietokoneharjoitukset 1. Tietokoneharjoitukset Aluksi Tällä kurssilla käytetään R-ohjelmistoa, jonka käyttämisestä lienee muutama sana paikallaan. R-ohjelmisto on laajasti käytetty vapaassa levityksessä oleva ammattimaiseen

Lisätiedot

b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta.

b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta. 806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 9.3.2012 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Esimerkkiaineisto ALKOKULU Olemme käyttäneet 3. harjoituksissa esimerkkinä aineistoa, joka käsittelee yksityisiä kulutusmenoja

Esimerkkiaineisto ALKOKULU Olemme käyttäneet 3. harjoituksissa esimerkkinä aineistoa, joka käsittelee yksityisiä kulutusmenoja MS-C2128 Ennustaminen ja aikasarja-analyysi 6. harjoitukset / Tehtävät Kotitehtävä: 4 Esimerkkiaineisto ALKOKULU Olemme käyttäneet 3. harjoituksissa esimerkkinä aineistoa, joka käsittelee yksityisiä kulutusmenoja

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

Usean selittävän muuttujan regressioanalyysi

Usean selittävän muuttujan regressioanalyysi Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Load

Load Tampereen yliopisto Tilastollinen mallintaminen Mikko Alivuotila ja Anne Puustelli Lentokoneiden rakennuksessa käytettävien metallinkiinnittimien puristuskestävyys Matematiikan, tilastotieteen ja filosofian

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa Oulun yliopiston matemaattisten tieteiden tutkimusyksikkö/tilastotiede 805306A JOHDATUS MONIMUUTTUJAMENETELMIIN, sl 2017 (Jari Päkkilä) Harjoitus 3, viikko 47 (19.20.11.): kotitehtävät Ratkaisuja 1. Floridan

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

Lasten ylipaino ja kasvunseurannan merkitys ylipainon ehkäisyssä. 26.10.2012 Jarmo Salo, LT, lastentautien erikoislääkäri, THL

Lasten ylipaino ja kasvunseurannan merkitys ylipainon ehkäisyssä. 26.10.2012 Jarmo Salo, LT, lastentautien erikoislääkäri, THL Lasten ylipaino ja kasvunseurannan merkitys ylipainon ehkäisyssä 26.10.2012 Jarmo Salo, LT, lastentautien erikoislääkäri, THL TAUSTAA 27.10.2012 2 Taustaa Ylipainolla tarkoitetaan kehon lisääntynyttä rasvan

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. TEHTÄVÄ 1 Taulukko 1 Kuvailevat tunnusluvut pääkaupunkiseudun terveystutkimuksesta vuonna 2007 (n=941) Keskiarvo (keskihajonta) Ikä

Lisätiedot

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset

1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept

Lisätiedot

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,

Lisätiedot

TA4b Taloudellinen kasvu Harjoitus 1

TA4b Taloudellinen kasvu Harjoitus 1 TA4b Taloudellinen kasvu Harjoitus Heikki Korpela 9. huhtikuuta 207 Tehtävä. Maan taloutta kuvataan Solowin mallilla, jossa työntekijää kohden laskettu tuotantofunktio on y k 2. Olkoon nyt k 900, investointiaste

Lisätiedot

LASTEN JA NUORTEN YLIPAINO JA LIHAVUUS

LASTEN JA NUORTEN YLIPAINO JA LIHAVUUS LASTEN JA NUORTEN YLIPAINO JA LIHAVUUS sekä pituus- ja painotietojen kattavuus Avohilmo-rekisterissä (kerätty lastenneuvoloiden ja kouluterveydenhuollon terveystarkastuksissa) 1 AINEISTO JA MENETELMÄT

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Eläkeläisten elämäntyytyväisyyden tekijät

Eläkeläisten elämäntyytyväisyyden tekijät Eläkeläisten elämäntyytyväisyyden tekijät petri.palmu@proliitto.fi (08/2014) Aineisto: Ammattiliitto Pron senioritutkimukset 2010 ja 2012 Perustilastojakaumat: http://tiedostot.proliitto.fi/tmt/tutk_elakelaiset.html

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Ylipainoinen lapsi terveydenhuollossa. Päivi Tapanainen Lasten ja nuorten klinikka, OYS 15.01.2009

Ylipainoinen lapsi terveydenhuollossa. Päivi Tapanainen Lasten ja nuorten klinikka, OYS 15.01.2009 Ylipainoinen lapsi terveydenhuollossa Päivi Tapanainen Lasten ja nuorten klinikka, OYS 15.01.2009 Määritelmiä Lihavuus =kehon rasvakudoksen liian suuri määrä Pituuspaino (suhteellinen paino) = pituuteen

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Palauteluento. 9. elokuuta 12

Palauteluento. 9. elokuuta 12 Palauteluento Kehonkoostumus Paino (Weight) Koko kehon mitattu paino. Painoindeksi (Bmi)! Paino (kg) jaettuna pituuden neliöillä (m2). Ihanteellinen painoindeksi on välillä 20-25. Rasvaprosentti (Fat%)!!

Lisätiedot

Mitä uutta koululaisten kasvun seurannasta

Mitä uutta koululaisten kasvun seurannasta Mitä uutta koululaisten kasvun seurannasta TAMPERE 29.3.2012 LL Antti Saari Tutkija, erikoistuva lääkäri Lastenklinikka Itä-Suomen yliopisto Kuopion yliopistollinen sairaala Ei sidonnaisuuksia SIDONNAISUUDET

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

1 Johdatus varianssianalyysiin

1 Johdatus varianssianalyysiin Tilastollisia malleja 1 & 2: Varianssianalyysi Jarkko Isotalo Y131A & Y132A 15.1.2013 1 Johdatus varianssianalyysiin 1.1 Milloin varianssianalyysiä käytetään? Varianssianalyysi on tilastotieteellinen menetelmä,

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Pienten lasten ylipaino ja sen mittaaminen. Kansanterveyspäivät Jarmo Salo

Pienten lasten ylipaino ja sen mittaaminen. Kansanterveyspäivät Jarmo Salo Pienten lasten ylipaino ja sen mittaaminen Kansanterveyspäivät 12.12.2011 Jarmo Salo TAUSTAA Taustaa Ylipainolla tarkoitetaan kehon lisääntynyttä rasvan määrää Ylipainoa hoidetaan ja ehkäistään, koska

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitukset 4 : Paneelidata (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Lasten lihavuuden määrittely ja mittaaminen uudet suomalaiset lasten BMI-rajat. Neuvolapäivät 18.10.2012 Jarmo Salo

Lasten lihavuuden määrittely ja mittaaminen uudet suomalaiset lasten BMI-rajat. Neuvolapäivät 18.10.2012 Jarmo Salo Lasten lihavuuden määrittely ja mittaaminen uudet suomalaiset lasten BMI-rajat Neuvolapäivät 18.10.2012 Jarmo Salo TAUSTAA Taustaa Ylipainolla tarkoitetaan kehon lisääntynyttä rasvan määrää Ylipainoa hoidetaan

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Harjoittele tulkintoja

Harjoittele tulkintoja Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45. Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto 9.6.2003

Männyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto 9.6.2003 Männyn laaturajojen integrointi runkokäyrän ennustamisessa Laura Koskela Tampereen yliopisto 9.6.2003 Johdantoa Pohjoismaisen käytännön mukaan rungot katkaistaan tukeiksi jo metsässä. Katkonnan ohjauksessa

Lisätiedot

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012 Puheentutkimuksen tilastoanalyysin perusteet 8. luento Pertti Palo 20.1.2012 Käytännön asioita Viimeisen seminaarin siirto: 2.3. 10-12 -> 2.3. 14-16. Miten seminaarin luentokuulustelun voi korvata? Harjoitustöiden

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Lappeenrannassa on annettu liikuntaneuvontaa vuodesta 2012 alkaen. Aluksi. liikuntaneuvonta oli suunnattu työikäisille vuotiaille.

Lappeenrannassa on annettu liikuntaneuvontaa vuodesta 2012 alkaen. Aluksi. liikuntaneuvonta oli suunnattu työikäisille vuotiaille. ESITYS LASTEN JA NUORTEN BMI-KORTISTA Liikuntatoimi nyt Lappeenrannassa on annettu liikuntaneuvontaa vuodesta 2012 alkaen. Aluksi liikuntaneuvonta oli suunnattu työikäisille 18-64 vuotiaille. Lappeenrannan

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

Hyvinvointimittaukset Oulun kutsunnoissa v.2009-2013. Jaakko Tornberg LitM, Tutkimuskoordinaattori ODL Liikuntaklinikka

Hyvinvointimittaukset Oulun kutsunnoissa v.2009-2013. Jaakko Tornberg LitM, Tutkimuskoordinaattori ODL Liikuntaklinikka Hyvinvointimittaukset Oulun kutsunnoissa v.2009-2013 Jaakko Tornberg LitM, Tutkimuskoordinaattori ODL Liikuntaklinikka Taustaa - MOPO hankkeen tavoitteena on edistää nuorten miesten hyvinvointia ja terveyttä

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30. FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011

Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011 Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011 Higgsin bosoni on ainoa hiukkasfysiikan standardimallin (SM) ennustama hiukkanen, jota ei ole vielä löydetty

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

VARIANSSIANALYYSI ANALYSIS OF VARIANCE VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot