Nuoruusiän vaikutus aikuisen painoindeksiin Data-analyysin perusmenetelmät Harjoitustyö. Lassi Miinalainen
|
|
- Tuula Haavisto
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Nuoruusiän vaikutus aikuisen painoindeksiin Data-analyysin perusmenetelmät Harjoitustyö Lassi Miinalainen
2 Sisältö 1 Aineisto Muuttujat Painoindeksi Tutkimusongelma Analyysi Hypoteesi Menetelmät Tilastollisten mallien muodostus ja vertailu Vaihtoehtoiset lineaariset mallit aikuisiän painoindeksille Onko teini-iän paino tai pituus kovin hyvä selittäjä? Aikuisiän ylipainolle altistavat tekijät Johtopäätökset A Liitteet 10 A.1 Lineaariset mallit aikuisiän painoindeksille A.2 Ajovirta A.3 R-koodi mallin testiaineiston tutkimiseen liittyen A.4 Python-koodi satunnaisvektorin muodostamiseksi A.5 Ajovirta F-testiin liittyen A.6 Ajovirta riskitasoon liittyen
3 Luku 1 Aineisto Aineistoni on osa vuonna 1966 Lapin ja Oulun läänissä syntyneistä lapsista kerättyä kohorttiaineistoa.[4] Aineisto sisältää 300 tilastoyksikköä. Tietojen keräämistä ei ole kuitenkaan voitu syystä tai toisesta viedä loppuun kaikkien lasten tapauksessa ja niinpä tässä tutkielmassa esitettyjen tilastollisten mallien estimointiin soveltuu vain 201 tilastoyksikköä. Syynä tähän katoon lienee 60- ja 70-luvun maaltapako Helsinkiin ja Ruotsiin suuntautunut muuttoliike. Etenkin Lappi oli tähän aineistoon kuuluvien lasten syntymisen aikaan huomattavasti vähemmän kehittynyttä aluetta kuin muu Suomi.[1] [2] Terveyskeskusjärjestelmä luotiin suomessa 1970-luvun alussa ja aineistoon kuuluvat mittaukset 14-vuotiaana lieneekin toteutettu juuri kuntien terveyskeskuksissa 80-luvun alussa. Aineistosta tai tehtävänannosta ei selviä mitä tarkalleen ottaen tarkoittaa "paino aikuisena". Ilmeisesti nämä nämä mittaukset on kuitenkin tehty 90-luvun kuluessa. 1.1 Muuttujat Koko aineistossa on 146 poikaa ja 154 tyttöä. Mallien estimointiin soveltuvassa osassa on 97 poikaa 104 tyttöä. Aineisto sisältää seuraavat muuttujat: Muuttujan nimi aineistossa yksikkö äidin ikä syntymähetkellä aidika vuodet syntymäpaino syntpain grammat syntymäpituus syntpit senttimetrit paino 14-vuotiaana paino14v kilogrammat pituus 14-vuotiaana paino14v senttimetrit paino aikuisena paino kilogrammat pituus aikuisena pituus senttimetrit 2
4 Muuttujan keskiarvo koko aineistossa tutkimuksessa käytetyssä osassa äidin ikä syntymähetkellä syntymäpaino syntymäpituus paino 14-vuotiaana pituus 14-vuotiaana paino aikuisena pituus aikuisena Vaikuttaisi siltä, että epätäydellisten ja täydellisten tilastoyksiköiden välillä ei ole merkittäviä eroja. Muuttujien väliset korrelaatiot ovat seuraavanlaiset: aidika syntpain syntpit paino14v pit14v paino pituus aidika syntpain syntpit paino14v pit14v paino pituus Painoindeksi Painoindeksi määritellään seuraavalla kaavalla: paino kiloina (pituus metreinä) 2 Tällä tavalla aineistoon saadaan kaksi muuttujaa lisää: bmi eli painoindeksi aikuisena ja bmi14 eli painoindeksi 14-vuotiaana. Havaitaan, että aikuisen painoindeksi korreloi kohtalaisesti 14-vuotiaan painon ja painoindeksin kanssa (ρ = 0, 364 ja ρ = 0, 375). Korrelaatiokerroin 14-vuotiaan pituuden kanssa on yllätyksekseni positiivinen (ρ = 0.169). 14-vuotiaan paino ja pituus ovat kuitenkin keskenään korreloivia, joten on syytä laskea ehdollinen korrelaatiokerroin, joka onkin negatiivinen (ρ X,Y Z = 0.142). Normaalipainoisen ihmisen painoindeksi on alle 25, mutta yli Painoindeksi välillä on merkitsee lievää ylipainoa ja välillä merkittävää ylipainoa. Lähes koko tutkimusaineisto on normaalipainoista tai enintään lievästi ylipainoista. Nämä lukurajat pätevät kuitenkin vain aikuisille. Teini-ikäisille asia on monimutkaisempi. Yhdysvaltojen viranomaisten Center for disease Control and Prevention määrittelee 14-vuotiaan olevan alipainoinen, jos hän kuuluu 5-persentiiliin; normaalipainoinen, jos hän kuuluu persentiiliin; ylipainoinen jos hän kuuluu persentiiliin ja liikalihava jos 95-persentiiliin. [3] Olen estimoinut nämä persentiilirajat tutkimusaineistosta ja verrannut niitä netistä löytämiini virallisissa taulukoissa esitettyihin rajoihin allaolevassa taulukossa. lähde estimoitu aineistosta CDC 5-persentiili persentiili persentiili Ylipainon lisääntyminen viime vuosikymmeninä näkyy selkeästi persentiilien eroissa. 3
5 1.2 Tutkimusongelma Tavoitteena on tutkia 14-vuotiaana mitatun painon ja pituuden vaikutusta aikuisen painoindeksiin. Koska liikalihavuus altistaa esimerkiksi sydän- ja verisuonisairauksille, koetetaan myös tunnistaa aineistosta aikuisiän liikalihavuudelle altistavia tekijöitä. 4
6 Luku 2 Analyysi 2.1 Hypoteesi Koska murrosikä alkaa tavallisesti huomattavasti ennen 14. ikävuotta, voidaan aikuisen ihmisen ruumiinrakennetta jo ennakoida murrosikäisen pituudesta ja painosta. Etenkin tytöillä pituuskasvu on 14-vuotiaana jo lähes pysähtynyt. Ruokailutottumukset, liikkumistavat ja muut painoon vaikuttavat ympäristötekijät ovat yleensä vakiintuneet jo teini-iässä. Vaikka ne voivatkin muuttua aikuistumisen yhteydessä, niin yleistyksenä voidaan sanoa, että teini-iässä lihavat ovat lihavia myös aikuisena: tietokonepelejä pelannut ja sipsejä mussutellut teini on myös aikuisena ylipainoinen, ellei huomattavaa tahdonvoimaa elämäntaparemonttiin löydy. Hypoteesina esitän, että 14-vuotiaan painon ja aikuisen painoindeksin välillä on positiivinen korrelaatio ja 14-vuotiaan pituuden ja aikuisen BMI:n välillä negatiivinen korrelaatio. 2.2 Menetelmät Muodostetaan erilaisia aikuisiän painoindeksiä ennustavia lineaarisia malleja ja tarkastellaan muuttujien kertoimia eri malleissa. Mikäli jokaisessa mallissa 14-vuotiaan painolle ja pituudelle estimoitu painokerroin on saman merkkinen tai jopa samaa suuruusluokkaa, voidaan katsoa tämän sulkevan pois "pelkän"tilastollisen korrelaation ja viittaavan aitoon syy-seuraus-suhteeseen. Ongelmana on, että 14-vuotiaiden painon ja pituuden välillä huomattava tilastollinen riippuvuus. Tämä kollineaarisuus monimutkaistaa tutkimustulosten tulkitsemista. 5
7 Kuva 2.1: hypoteesi muuttujien välisistä kausaalisuhteista 2.3 Tilastollisten mallien muodostus ja vertailu Vaihtoehtoiset lineaariset mallit aikuisiän painoindeksille Yrityksen ja erehdyksen avulla löydetään neljä vaihtoehtoista mallia: Malli 1: bmi paino14v pit14v Malli 2: bmi paino14v sukuptytt pit14v syntpain aidika syntpain aidika Malli 3: bmi bmi e aidika syntpain sukuptytt aidika : syntpain Malli 4: log bmi log paino14v log pit14v sukuptytt Kaikkien mallien determinaatiokerroin R 2 on suunnilleen 0, 2 ja ne vaihtelevat välillä 0, 195 0, 22. Eri mallien sovitteetkin ovat suunnilleen samoja eri tilastoyksiköille. On syytä huomata, että kaikkien mallien 14-vuotiaan painon lineaarikerroin on positiivinen ja vastaavasti pituuden kerroin negatiivinen. Tä- 6
8 mä tukee esitettyä hypoteesia. Mallien tarkemmat tunnusluvut ja muut yksityiskohdat löytyvät liitteestä A.1. Mallista 4 näkee, että mallissa 3 voisi painoindeksin neliöjuuri olla hieman parempi selittäjä. Tämä kuitenkin vaikeuttaisi mallin tulkintaa, eikä parantaisi merkittävästä sen selityskykyä. Mallien QQ-kuvaajissa ei näy merkittäviä anomalioita muutamaa outlieria lukuunottamatta. Determinaatiokerroin on tunnettu kyvyttömyydestään erottaa hyödyllisiä malleja hyödyttömistä. Sen lisäksi on olemassa useita vaihtoehtoisia mallin hyvyyttä mittaavia tunnuslukuja. Yksi näistä on keskihajonta testiaineistossa. Olen liitteessä A.4 esittänyt python-skriptin joka jakaa aineiston satunnaisesti testi- ja opetusaineistoon. Tilastoyksiköistä noin 75% sijoitetaan opetusaineistoon ja loput testiaineistoon. Lineaarinen malli estimoidaan käyttäen opetusaineistoa, minkä jälkeen estimoidulla mallilla koetetaan ennustaa testiaineiston tilastoyksiköitä. Tunnuslukuna mallin toimivuudelle on keskineliösumma tai keskihajonta mallin residuaaleille testiaineistossa. Malli 4 menestyy parhaiten tällä kriteerillä, sen keskihajonta testiaineistossa on 8, 2, kun taas kaikilla muilla malleilla se on noin 8, Onko teini-iän paino tai pituus kovin hyvä selittäjä? Koko tämän tutkielmän lävitse kulkee punaisena lankana, että teini-iän painolla ja pituudella olisi jotain tekemistä aikuisen painon ja pituuden kanssa. Ihmisten elämässä tapahtuu kuitenkin useita muutoksia aikuistumisen yhteydessä, minkä vuoksi tutkimushypoteesin mielekkyyttä on syytä testata. Tämä tapahtuu F-testin avulla. Liitteessä A.5 on esitetty yksityiskohdat. Periaatteena kuitenkin on, että muodostetaan pelkästään syntymäpainon, äidin iän ja sukupuolen avulla aikuisen painoindeksiä ennustava lineaarinen malli. Tämän mallin jäännösvarianssia verrataan tässä tutkielmassa aiemmin esitettyyn malliin 3. Nollahypoteesina on, että mallit ovat yhtä hyviä ennustamaan aikuisen painoindeksiä, eli että teini-ikäisen painoindeksi ei olisi merkittävä selittäjä aikuisen painoindeksille. Tätä nollahypoteesia ei pystytä täysin sulkemaan pois, mutta ei myöskään ole syytä pitää sitä totena (p-arvo 0.22). Vastaava testisuure muodostetaan myös mallille 4, lopputulos on suunnilleen sama (p-arvo 0.13). Tämä viittaisi siihen, että vaikka teini-iän painolla ja pituudella onkin jonkin verran korrelaatiota aikuisen painon ja pituuden kanssa, niin paljon merkittävämpiä tekijöitä ovat esimerkiksi omat elämäntavat Aikuisiän ylipainolle altistavat tekijät Tutkitaan miten aikuisena ainakin lievästi ylipainoiset eroavat normaalipainoisista taustamuuttujiensa suhteen. Huomataan, että ainoa todella merkittävä ero on 14-vuotiaan painoindekseissä. Miehet ovat myös keskimäärin hieman naisia tukevampia, mutta tämän vuoksi jotkin lähteet määrittelevät ylipainon rajan miehille ja naisille hieman eri kohtaan. Arvioidaan miten paljon teini-ikäisen ylipaino altistaa ylipainolle aikuisena. 7
9 bmi14 21,2 bmi14 > 21,2 bmi > bmi n Yksinkertaisella laskutoimituksella nähdään, että teini-iässä ylipainoisilla on kaksinkertainen riski olla myös aikuisena ylipainoisia verrattuna normaalipainoisiin. Toisaalta esimerkiksi molempien vanhempien ylipaino kahdeksankertaistaa ylipainon riskin verrattuna normaalipainoisiin vanhempiin. ([5], s. 122) 2.4 Johtopäätökset Kaikki vaihtoehtoiset mallit viittaavat samansuuntaisiin tuloksiin: 14-vuotiaan pituus korreloi negatiivisesti ja paino positiivisesti aikuisiän painoindeksin kanssa. Ei ole paljoakaan merkitystä mallin selityskyvyn kannalta käytetäänkö mallissa selittävänä tekijänä 14-vuotiaan painoindeksiä vai painoa ja pituutta, sillä molemmat mallit antavat pääsääntöisesti lähes samat sovitteet eri tilastoyksiköille. Koska aineistossa on 14-vuotiaiden painon ja pituuden välillä huomattava korrelaatio (ρ = 0, 64), ei niiden vaikutusta voida erottaa toisistaan täydellisesti tai ainakaan tuloksia ei voida yleistää tämän osapopulaation ulkopuolelle, etenkin kun varsinaisen mallin determinaatiokerroin jää melko vaatimattomaksi. Tämä tarkoittaa, että esimerkiksi nuoruusiän anoreksian vaikutuksesta aikuisiän painoindeksiin ei voida tehdä johtopäätöksiä tämän tutkimusaineiston pohjalta. Itseasiassa F-testissä osassa ei nollahypoteesia voida sulkea kokonaan pois. Tämä ei tarkoita, että syntymäpaino olisi kovin hyvä ennustaja aikuisen painoindeksille, vaan että 14-vuotiaan painoa ja pituutta tärkeämmät taustatekijät aikuisen terveydelle ovat, paitsi perintötekijät, niin etenkin omat elämäntavat ja ruokailutottumukset. Nykyajan nuoriso elää monella tavalla erilaisessa yhteiskunnassa kuin tutkimusaineiston nuoret: tietokoneet ja Internet ovat nousseet television rinnalle ei-fyysisenä ajanvietteenä, pikaruoka on nykyään yleisempää kuin 80-luvulla. Tämän vuoksi tässä tutkielmassa esitettyjä tilastollisia malleja ei voida soveltaa sellaisenaan nykymaailmaan. Arvioisin kuitenkin, että korrelaatiot ovat samanmerkkisiä nykyäänkin eli että teini-iän ylipaino korreloi positiivisesti aikuisiän ylipainon kanssa. 8
10 Tiivistelmä Muodostettiin kolme vaihtoehtoista mallia aikuisen painoindeksin ennustamista varten, jotka kaikki toimivat suunnilleen yhtä hyvin. Tutkimuksessa havaittiin kohtalainen korrelaatio 14-vuotiaan ja aikuisen ylipainon välillä. Ylipainoisella 14-vuotiaalla on kaksinkertainen riski olla aikuisena liikalihava normaalipainoiseen verrattuna. Löydettiin myös viitteitä, että teini-iän painoa merkityksellisempää aikuisen ylipainolle ovat muut tekijät, luultavasti esimerkiksi ruokavalio, geenit ja elämäntavat. 9
11 Liite A Liitteet A.1 Lineaariset mallit aikuisiän painoindeksille Call: lm(formula = bmi paino14v + pit14v, data = aineisto) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-07 *** paino14v e-08 *** --- pit14v * Signif. codes: 0 *** ** 0.01 * Residual standard error: on 199 degrees of freedom (98 observations deleted due to missingness) Multiple R-squared: , Adjusted R-squared: F-statistic: 19.3 on 2 and 199 DF, p-value: 2.188e-08 Call: lm(formula = bmi paino14v + sukup + pit14v + syntpain * aidika, data = aineisto) Residuals: 10
12 Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 1.345e e paino14v 2.145e e e-09 *** sukuptyttö e e * pit14v e e * syntpain 5.200e e * aidika 6.422e e * syntpain:aidika e e * Signif. codes: 0 *** ** 0.01 * Residual standard error: on 194 degrees of freedom (99 observations deleted due to missingness) Multiple R-squared: , Adjusted R-squared: F-statistic: on 6 and 194 DF, p-value: 5.901e-09 Call: lm(formula = bmi bmi14 + aidika * syntpain + sukup, data = aineisto) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e bmi e e e-09 *** aidika 5.926e e * syntpain 4.852e e * sukuptyttö e e ** aidika:syntpain e e * Signif. codes: 0 *** ** 0.01 * Residual standard error: on 195 degrees of freedom (99 observations deleted due to missingness) Multiple R-squared: 0.217, Adjusted R-squared: F-statistic: on 5 and 195 DF, p-value: 3.456e-09 > formula <- "log(bmi) log(paino14v) + log(pit14v) + sukup" > m1<-lm(formula, data=subset(aineisto2, aineisto2$random==1)) > summary(m1) Call: lm(formula = formula, data = subset(aineisto2, aineisto2$random == 1)) 11
13 Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-05 *** log(paino14v) e-07 *** log(pit14v) ** sukuptyttö * Signif. codes: 0 *** ** 0.01 * Residual standard error: on 149 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 149 DF, p-value: 5.909e-07 A.2 Ajovirta aineisto<-read.table("/home/lassimii/desktop/dataapm/aineisto.txt", header=true) aineisto2<-subset(aineisto,!is.na(aineisto$aidika) &!is.na(aineisto$sukup) &!is.na(aineisto$paino14v) &!is.na(aineisto$pit14v) &!is.na(aineisto$paino) &!is.na(aineisto$pituus)) aineisto2$bmi<-aineisto2$paino/((aineisto2$pituus/100)ˆ2) aineisto2$bmi14<-aineisto2$paino14v/((aineisto2$pit14v/100)ˆ2) > (cor(aineisto2$bmi, aineisto2$pit14v)-cor(aineisto2$bmi, aineisto2$paino14v)* cor(aineisto2$pit14v, aineisto2$paino14v))/(sqrt(1-cor(aineisto2$bmi, aineisto2$paino14v)ˆ2) sqrt(1-cor(aineisto2$pit14v, aineisto2$paino14v)ˆ2)) aineisto2$random<-c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 0, 0, 1) formula<-"bmi > CV formula<-"bmi > CV pit14v + paino14v" paino14v + sukup + pit14v + syntpain * aidika" 12
14 formula <- "bmi > CV bmi14 + aidika * syntpain + sukup" formula <- "log(bmi) log(paino14v) + log(pit14v) + sukup" > CV<-var(exp(sovite)-aineisto2$bmi[aineisto2$random==0]) > CV > cor(aineisto2$bmi, exp(sovite))ˆ A.3 R-koodi mallin testiaineiston tutkimiseen liittyen m1<-lm(formula, data=subset(aineisto2, aineisto2$random==1)) X=model.matrix(m1, data=subset(aineisto2, aineisto2$random==0)) sovite=x%*%m1$coeff CV<-var(sovite-aineisto2$bmi[aineisto2$random==0]) A.4 Python-koodi satunnaisvektorin muodostamiseksi import random vector = c( a=0 while a < 201: a+=1 vector+= ) if random.randint(0, 3)!= 0: vector += 1 else: vector += 0 if a!=201: vector +=, 13
15 A.5 Ajovirta F-testiin liittyen > m1<-lm(formula = bmi sukup + aidika * syntpain) > m2<-lm(formula = bmi sukup + aidika * syntpain + bmi14) > var.test(m1, m2) F test to compare two variances data: m1 and m2 F = , num df = 227, denom df = 195, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances > m1<-lm(formula = bmi sukup + aidika * syntpain, data=aineisto2) > m2<-lm(log(bmi) log(paino14v)+log(pit14v)+sukup,data=aineisto2) > summary(m2) t(aineisto2$bmi-exp(m2$fitted.values))%*%(aineisto2$bmi-exp(m2$fitted.values))/ > summary(m1) Residual standard error: on 196 degrees of freedom > 3.222ˆ2/ A.6 Ajovirta riskitasoon liittyen > length(aineisto2$bmi[aineisto2$bmi14<21.2 &aineisto2$bmi>=25]) 55 > length(aineisto2$bmi[aineisto2$bmi14>=21.2 &aineisto2$bmi>=25]) 21 > length(aineisto2$bmi[aineisto2$bmi14<21.2 &aineisto2$bmi<25]) 114 > length(aineisto2$bmi[aineisto2$bmi14>=21.2 &aineisto2$bmi<25]) 11 14
16 Kirjallisuutta [1] Elävä arkisto: Lapin kehityksen ongelmat, raportti kehitysalueelta, Yle, alkuperäinen esitys: [2] Wikipedia, Suomi 1960-luvulla [3] Centers for disease Control and Prevention [4] Pohjois-Suomen syntymäkohortti tutkimus [5] Kolata,Gina Rethinking thin: The new science of weight loss - and the myths and realities of dieting Picador, 2007, ISBN
Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotSuhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä
806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2011 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Eräässä suuressa yrityksessä
LisätiedotIlmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!
8069 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2013 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOLLA 9! Ilmoittaudu Weboodissa 4.3.2013 klo
Lisätiedot(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.
2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja
LisätiedotOpiskelija viipymisaika pistemäärä
806109 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2012 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOILLA 8 JA 9! 1. Jatkoa harjoituksen 5 tehtävään
Lisätiedot2. Tietokoneharjoitukset
2. Tietokoneharjoitukset Demotehtävät 2.1 Jatkoa kotitehtävälle. a) Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora. KULUTUS on selitettävä muuttuja. b) Määrää estimoidusta
LisätiedotYleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli
MS-C2128 Ennustaminen ja aikasarja-analyysi 1. harjoitukset / Tehtävät Kotitehtävät: 2 Aiheet: Aluksi Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli Tällä kurssilla käytetään
LisätiedotMS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4
MS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4 Tehtävä 2.1. Jatkoa tietokonetehtävälle 1.2: (a) Piirrä aineistosta pisteparvikuvaaja (KULUTUS, SAIRAST) ja siihen
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotTUTKIMUSOPAS. SPSS-opas
TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien
Lisätiedotxi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =
1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
Lisätiedotpisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
LisätiedotTehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset
JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset 12.05.2009 Tehtävä 1 (a) x
LisätiedotResiduaalit. Residuaalit. UK Ger Fra US Austria. Maat
TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede
LisätiedotATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011
Lisätiedot[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen
LisätiedotEsim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501
Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662
LisätiedotR: mikä, miksi ja miten?
R: mikä, miksi ja miten? Ilmari Ahonen Matematiikan ja tilastotieteen laitos, Turun yliopisto SSL R-Webinaari 2015 Vähän minusta Valmistuin maisteriksi Turun yliopistossa 2012 Teen neljättä vuotta väitöskirjaa
LisätiedotRegressioanalyysi. Kuusinen/Heliövaara 1
Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin
Lisätiedot1. Tietokoneharjoitukset
1. Tietokoneharjoitukset Aluksi Tällä kurssilla käytetään R-ohjelmistoa, jonka käyttämisestä lienee muutama sana paikallaan. R-ohjelmisto on laajasti käytetty vapaassa levityksessä oleva ammattimaiseen
Lisätiedotb1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta.
806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 9.3.2012 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta
Lisätiedot1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
LisätiedotEsimerkkiaineisto ALKOKULU Olemme käyttäneet 3. harjoituksissa esimerkkinä aineistoa, joka käsittelee yksityisiä kulutusmenoja
MS-C2128 Ennustaminen ja aikasarja-analyysi 6. harjoitukset / Tehtävät Kotitehtävä: 4 Esimerkkiaineisto ALKOKULU Olemme käyttäneet 3. harjoituksissa esimerkkinä aineistoa, joka käsittelee yksityisiä kulutusmenoja
Lisätiedot1. Tutkitaan tavallista kahden selittäjän regressiomallia
TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa
LisätiedotUsean selittävän muuttujan regressioanalyysi
Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön
Lisätiedotvoidaan hylätä, pienempi vai suurempi kuin 1 %?
[TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine
LisätiedotTilastollisen analyysin perusteet Luento 7: Lineaarinen regressio
Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen
LisätiedotA130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala
Kaavakokoelma, testinvalintakaaviot ja jakaumataulukot liitteinä. Ei omia taulukoita! Laskin sallittu. Tehtävä 1 a) Konepajan on hyväksyttävä alihankkijalta saatu tavaraerä, mikäli viallisten komponenttien
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
LisätiedotLoad
Tampereen yliopisto Tilastollinen mallintaminen Mikko Alivuotila ja Anne Puustelli Lentokoneiden rakennuksessa käytettävien metallinkiinnittimien puristuskestävyys Matematiikan, tilastotieteen ja filosofian
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
Lisätiedot(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa
Oulun yliopiston matemaattisten tieteiden tutkimusyksikkö/tilastotiede 805306A JOHDATUS MONIMUUTTUJAMENETELMIIN, sl 2017 (Jari Päkkilä) Harjoitus 3, viikko 47 (19.20.11.): kotitehtävät Ratkaisuja 1. Floridan
LisätiedotAalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,
Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten
LisätiedotLuentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012
Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko
LisätiedotLasten ylipaino ja kasvunseurannan merkitys ylipainon ehkäisyssä. 26.10.2012 Jarmo Salo, LT, lastentautien erikoislääkäri, THL
Lasten ylipaino ja kasvunseurannan merkitys ylipainon ehkäisyssä 26.10.2012 Jarmo Salo, LT, lastentautien erikoislääkäri, THL TAUSTAA 27.10.2012 2 Taustaa Ylipainolla tarkoitetaan kehon lisääntynyttä rasvan
LisätiedotTA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET
TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen
LisätiedotHarjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..
Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä.. TEHTÄVÄ 1 Taulukko 1 Kuvailevat tunnusluvut pääkaupunkiseudun terveystutkimuksesta vuonna 2007 (n=941) Keskiarvo (keskihajonta) Ikä
Lisätiedot1. Tutkitaan regressiomallia Y i = β 0 + β 1 X i + u i ja oletetaan, että tavanomaiset
TA7, Ekonometrian johdantokurssi HARJOITUS 7 RATKAISUEHDOTUKSET 16.3.2015 1. Tutkitaan regressiomallia Y i = β 0 + X i + u i ja oletetaan, että tavanomaiset regressiomallin oletukset pätevät (Key Concept
Lisätiedot1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Usean selittäjän lineaarinen regressiomalli Estimaatti, Estimaattori, Estimointi, Jäännösneliösumma, Jäännöstermi, Jäännösvarianssi,
LisätiedotTA4b Taloudellinen kasvu Harjoitus 1
TA4b Taloudellinen kasvu Harjoitus Heikki Korpela 9. huhtikuuta 207 Tehtävä. Maan taloutta kuvataan Solowin mallilla, jossa työntekijää kohden laskettu tuotantofunktio on y k 2. Olkoon nyt k 900, investointiaste
LisätiedotLASTEN JA NUORTEN YLIPAINO JA LIHAVUUS
LASTEN JA NUORTEN YLIPAINO JA LIHAVUUS sekä pituus- ja painotietojen kattavuus Avohilmo-rekisterissä (kerätty lastenneuvoloiden ja kouluterveydenhuollon terveystarkastuksissa) 1 AINEISTO JA MENETELMÄT
LisätiedotA250A0050 Ekonometrian perusteet Tentti
A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu
5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017
LisätiedotEläkeläisten elämäntyytyväisyyden tekijät
Eläkeläisten elämäntyytyväisyyden tekijät petri.palmu@proliitto.fi (08/2014) Aineisto: Ammattiliitto Pron senioritutkimukset 2010 ja 2012 Perustilastojakaumat: http://tiedostot.proliitto.fi/tmt/tutk_elakelaiset.html
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
LisätiedotYlipainoinen lapsi terveydenhuollossa. Päivi Tapanainen Lasten ja nuorten klinikka, OYS 15.01.2009
Ylipainoinen lapsi terveydenhuollossa Päivi Tapanainen Lasten ja nuorten klinikka, OYS 15.01.2009 Määritelmiä Lihavuus =kehon rasvakudoksen liian suuri määrä Pituuspaino (suhteellinen paino) = pituuteen
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
LisätiedotTilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle
Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
LisätiedotMatemaatikot ja tilastotieteilijät
Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat
LisätiedotPalauteluento. 9. elokuuta 12
Palauteluento Kehonkoostumus Paino (Weight) Koko kehon mitattu paino. Painoindeksi (Bmi)! Paino (kg) jaettuna pituuden neliöillä (m2). Ihanteellinen painoindeksi on välillä 20-25. Rasvaprosentti (Fat%)!!
LisätiedotMitä uutta koululaisten kasvun seurannasta
Mitä uutta koululaisten kasvun seurannasta TAMPERE 29.3.2012 LL Antti Saari Tutkija, erikoistuva lääkäri Lastenklinikka Itä-Suomen yliopisto Kuopion yliopistollinen sairaala Ei sidonnaisuuksia SIDONNAISUUDET
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
LisätiedotTilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit
Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli
Lisätiedot1 Johdatus varianssianalyysiin
Tilastollisia malleja 1 & 2: Varianssianalyysi Jarkko Isotalo Y131A & Y132A 15.1.2013 1 Johdatus varianssianalyysiin 1.1 Milloin varianssianalyysiä käytetään? Varianssianalyysi on tilastotieteellinen menetelmä,
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotTavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.
Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,
LisätiedotPienten lasten ylipaino ja sen mittaaminen. Kansanterveyspäivät Jarmo Salo
Pienten lasten ylipaino ja sen mittaaminen Kansanterveyspäivät 12.12.2011 Jarmo Salo TAUSTAA Taustaa Ylipainolla tarkoitetaan kehon lisääntynyttä rasvan määrää Ylipainoa hoidetaan ja ehkäistään, koska
LisätiedotMTTTP1, luento KERTAUSTA
26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään
LisätiedotSPSS-perusteet. Sisältö
SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn
LisätiedotHarjoitukset 4 : Paneelidata (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
LisätiedotLasten lihavuuden määrittely ja mittaaminen uudet suomalaiset lasten BMI-rajat. Neuvolapäivät 18.10.2012 Jarmo Salo
Lasten lihavuuden määrittely ja mittaaminen uudet suomalaiset lasten BMI-rajat Neuvolapäivät 18.10.2012 Jarmo Salo TAUSTAA Taustaa Ylipainolla tarkoitetaan kehon lisääntynyttä rasvan määrää Ylipainoa hoidetaan
LisätiedotPerusnäkymä yksisuuntaiseen ANOVAaan
Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja
LisätiedotHarjoittele tulkintoja
Harjoittele tulkintoja Syksy 9: KT (55 op) Kvantitatiivisen aineiston keruu ja analyysi SPSS tulosteiden tulkintaa/til Analyysit perustuvat aineistoon: Haavio-Mannila, Elina & Kontula, Osmo (1993): Suomalainen
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
LisätiedotPylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.
Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
LisätiedotOngelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?
Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus
LisätiedotMännyn laaturajojen integrointi runkokäyrän ennustamisessa. Laura Koskela Tampereen yliopisto 9.6.2003
Männyn laaturajojen integrointi runkokäyrän ennustamisessa Laura Koskela Tampereen yliopisto 9.6.2003 Johdantoa Pohjoismaisen käytännön mukaan rungot katkaistaan tukeiksi jo metsässä. Katkonnan ohjauksessa
LisätiedotPuheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012
Puheentutkimuksen tilastoanalyysin perusteet 8. luento Pertti Palo 20.1.2012 Käytännön asioita Viimeisen seminaarin siirto: 2.3. 10-12 -> 2.3. 14-16. Miten seminaarin luentokuulustelun voi korvata? Harjoitustöiden
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotLappeenrannassa on annettu liikuntaneuvontaa vuodesta 2012 alkaen. Aluksi. liikuntaneuvonta oli suunnattu työikäisille vuotiaille.
ESITYS LASTEN JA NUORTEN BMI-KORTISTA Liikuntatoimi nyt Lappeenrannassa on annettu liikuntaneuvontaa vuodesta 2012 alkaen. Aluksi liikuntaneuvonta oli suunnattu työikäisille 18-64 vuotiaille. Lappeenrannan
LisätiedotTilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä
Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien
LisätiedotHyvinvointimittaukset Oulun kutsunnoissa v.2009-2013. Jaakko Tornberg LitM, Tutkimuskoordinaattori ODL Liikuntaklinikka
Hyvinvointimittaukset Oulun kutsunnoissa v.2009-2013 Jaakko Tornberg LitM, Tutkimuskoordinaattori ODL Liikuntaklinikka Taustaa - MOPO hankkeen tavoitteena on edistää nuorten miesten hyvinvointia ja terveyttä
Lisätiedot1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotKvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan
LisätiedotTestit laatueroasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
LisätiedotSisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...
Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13
LisätiedotHiggsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011
Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011 Higgsin bosoni on ainoa hiukkasfysiikan standardimallin (SM) ennustama hiukkanen, jota ei ole vielä löydetty
LisätiedotRISTIINTAULUKOINTI JA Χ 2 -TESTI
RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN
Lisätiedot1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotVARIANSSIANALYYSI ANALYSIS OF VARIANCE
VARIANSSIANALYYSI ANALYSIS OF VARIANCE 1 Suomalaisten aikuisten pituusjakauma:.8.7.6.5.4.3.2.1 14 15 16 17 18 19 2 21 Jakauma ei ole normaali, sen olettaminen sellaiseksi johtaa virheellisiin päätelmiin.
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy
Lisätiedot