Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi.

Koko: px
Aloita esitys sivulta:

Download "Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi."

Transkriptio

1 Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi Taustaa Otoksen ositus kunnittain ja maahanmuuttajaryhmittäin Katso otospoiminnasta, Maamu-raportin ( luku 2. Koska painokertoimet on kalibroitu maahanmuuttajaryhmittäin, tuloksia ei tule esittää maahanmuuttajat yhteensä -tyyppisesti. Otos on joissakin ositteissa huomattavan suuri suhteessa perusjoukon kokoon. Tällöin alueiden/kuntien välinen vertailu on mahdollista, koska eri alueilla/kunnissa perusjoukon koko vaihtelee huomattavasti, mutta kaikista kunnista on poimittu vähintään tietty minimimäärä henkilöitä tutkimusotokseen. Suorat keskiarvot ovat virheellisiä yhdistettäessä ositteita analyyseissa tarvitaan painokertoimet kuntakohtaisia tietoja yhdistettäessä Ositettu otanta ja kunnittain sekä tutkimusryhmittäin vaihtelevat poimintatodennäköisyydet vaikuttavat varianssiestimaatteihin p-arvot pienempiä ja luottamusvälit kapeampia Tarvitaan äärellisen populaation korjaus Äärellisen populaation korjaus (FPC) Miksi populaation rajallisuus vaikuttaa tulosten tarkkuuteen? Jos koko perusjoukko tutkittaisiin, saisimme tarkan tiedon väestön senhetkisestä tilasta, koska otannasta johtuvaa vaihtelua ei olisi esim. keskiarvon luottamusvälin leveys olisi nolla Jos otoksen osuus perusjoukosta on suuri kuten Maamu -aineistossa, niin tutkimatta jääneiden vaikutus väestökeskiarvoon on pieni, jolloin keskivirheet ja p-arvot ovat pääsääntöisesti pienempiä sekä luottamusvälit kapeampia kuin oletettaessa tavanomainen satunnaisotos (äärettömän) suuresta populaatiosta. Jos otos olisi vain pieni osa perusjoukosta, niin kyseessä olisi likimain tavallinen yksinkertainen satunnaisotanta (SRS), eikä FPC:ta tarvita. Painokertoimien taustaa: kato Osallistumisaktiivisuus vaihtelee ryhmittäin. Tarkemmat tiedot kadosta löytyvät Maamu-raportin luvusta 2, joka kuvaa myös miten kato on huomioitu painokertoimien muodostamisessa. Jos aktiivisuuteen vaikuttavat tekijät voidaan mitata sekä osallistuneista että katotapauksista, erot voidaan korjata hyvin (esim. rekisteritiedot: ikä, sukupuoli ja koulutus) oletus osallistuneiden ja katoon jääneiden henkilöiden samankaltaisuudesta vain osallistuneista, erojen huomioiminen on vaikeaa (esim. terveyteen ja toimintakykyyn liittyvät tekijät) kadon vaikutuksia ei voida täysin korjata painokertoimien avulla vaihtoehtoisia menetelmiä (esim. imputointi) on syytä harkita kadon vaikutuksien korjaamiseksi

2 Erilaiset painokertoimet Osallistuminen voidaan määritellä erilaisten kriteerien mukaan, jolloin saadaan erilaisia painokertoimia: Terveystarkastus Analysoitaessa terveystarkastusmuuttujia käytetään w_analysis_tt-painokerrointa. Haastattelut Analysoitaessa haastattelumuuttujia käytetään w_analysis_lhaa painokerrointa, jos muuttuja löytyy sekä pitkästä että lyhyestä lomakkeesta. Jos kysymys on ollut vain pitkässä lomakkeessa, käytetään w_analysis_haa-painokerrointa. Kun samassa analyysissä on sekä terveystarkastus- että haastattelumuuttujia, käytetään vastemuuttujan (selitettävä muuttuja) mukaista painokerrointa. Terveystarkastuksen painokertoimia voi käyttää myös haastattelukysymyksiin jos tutkimus rajautuu vain terveystarkastukseen osallistuneisiin. Edellä mainituista painoista on olemassa myös kahdenlaiset versiot: Analyysipainoja käytetään estimoitaessa erilaisia kuvailevia tunnuslukuja (esim. keskiarvoja) ja regressioanalyyseissä, eli lähes kaikissa analyyseissä. Korottavia painoja käytetään estimoitaessa väestössä olevia kokonaismääriä, esim. perusjoukossa olevien, tiettyä sairautta sairastavien henkilöiden lukumääriä. Nämä kertoimet tutkija voi tilata tarvittaessa tutkimusaineistoon. Painokertoimien kalibrointitavan takia kaikki ryhmät saa laittaa samaan malliin vain ryhmien välisiä eroja tutkittaessa (OSITUS muuttuja mallissa selittäjänä). Kaikki muut analyysit tulee tehdä kullekin ryhmälle erikseen. Muuta huomioitavaa Suositeltavia ohjelmistoja ovat SAS, SUDAAN sekä Stata. Näillä pystytään huomioimaan monimutkaiset otanta-asetelmat sekä tekemään mallivakiointia. SPSS:n ominaisuudet eivät ole riittäviä otanta-asetelman huomioitiin ilman Complex Samples lisämoduulia. R:llä ei toistaiseksi pysty tekemään mallivakiointia, mutta otanta-asetelman pystyy huomioimaan survey-paketin avulla. Jos mielenkiinnon kohteena on vain jokin tietty väestöryhmä, aineistosta ei saa poistaa kohderyhmään kuulumattomia havaintoja, jotta varianssiestimointi tapahtuu oikein. Jos tutkimus rajautuu esim. vain nuoriin naisiin, niin aineistosta ei saa poistaa miesten tai vanhempien ikäryhmien havaintoja. Osa-aineistoja saa käyttää vain maahanmuuttajaryhmittäin (esim. OSITUS = 1), joiden otoskoot ovat ennalta määrättyjä Tehtäessä vertailuja koko maan väestöön (Terveys2011-tutkimuksesta poimittu verrokkiaineisto mukana analyyseissa) tulee kiinnittää huomioita muuttujien vastaavuuteen ja otoskoon riittävyyteen. Erityisesti T2011:n osalta alle 30 vuotiaista on hyvin vähän terveystarkastuksessa käyneitä. Tutkijoiden käyttöön annettavaan aineistoon on valittu mukaan vain sellaisia muuttujia, joissa kysymysmuodot ovat riittävän vertailukelpoisia Maamu- ja Terveys 2011 tutkimuksissa. Tutkijan kannattaa kuitenkin aina tarkastaa kysymysten vastaavuus alkuperäisistä tutkimuslomakkeista ( ja ja huomioida myös erot tarkasteltavaa kysymystä edeltävissä kysymyksissä. Aineisto on tarkastettu, mutta virheitä ja epätarkkuuksia on silti voinut jäädä havaitsematta. Ennen analyysejä on syytä verrata aineistoa (analyyseissa käytettävien muuttujien frekvenssit, jakaumat, ristiintaulukointi) ja lomaketta sekä tarkastaa, että hyppykäskyt yms. on huomioitu ja kirjattu aineistoon oikein. Dataan valmiiksi luodut yhdistelmämuuttujat on myös syytä tarkistaa ennen analyysejä.

3 Analyysiesimerkkejä SAS/Sudaan-ohjelmistolla Muuttujan uudelleen luokittelu Tässä esimerkkinä jatkuvan ikä-muuttujan luokittelu. DATA MAAMU; SET MAAMU; IF NOT MISSING (IKA2) THEN DO; IF IKA2 <= 24 THEN IKA_LUOK = 1; ELSE IF (IKA2 > 24 AND IKA2 <= 34) THEN IKA_LUOK = 2; ELSE IF (IKA2 > 34 AND IKA2 <= 44) THEN IKA_LUOK = 3; ELSE IF (IKA2 > 44 AND IKA2 <= 54) THEN IKA_LUOK = 4; ELSE IF (IKA2 > 54 AND IKA2 <= 64) THEN IKA_LUOK = 5; END; Esimerkki moniluokkaisen muuttujan muuntamisesta kaksiluokkaiseksi. DATA MAAMU; SET MAAMU; IF NOT MISSING (A104_LUOK) THEN DO; IF A104_LUOK = 1 THEN A104_LUOK_YHD = 1; ELSE IF A104_LUOK in (2,3,4,5) THEN A104_LUOK_YHD = 0; END; Muuttujamuunnoksen toimivuus on syytä tarkastaa vielä FREQ-proseduurin avulla. proc freq data=maamu; table A104_LUOK*A104_LUOK_YHD / list missing; Esivalmistelut SAS ja SUDAANin analyysejä varten aineisto pitää järjestää STRATA/NEST-lauseessa olevan muuttujan mukaisesti. Osajoukkoanalyyseissa aineisto pitää järjestää myös osajoukon määrittävän muuttujan mukaan (esim. sukupuoli). proc sort data=maamu; by osite sukupuoli; SAS-analyysien äärellisen populaation korjausta varten ositteiden koot pitää viedä erilliseen tiedostoon. Sudaan osaa lukea ne suoraan datasta. proc freq data=maamu ; tables N*osite*ositus / out=nnn noprint; data NNN; set NNN; _TOTAL_ = N ; drop N COUNT PERCENT ; proc sort data=nnn; by osite;

4 Aineiston kuvailu DESIGN-optio ja TOTCNT/TOTAL-lause huomioivat äärellisen populaation korjauksen. NEST/STRATA-lause huomioi alue- ja tutkimusryhmäosituksen. WEIGHT-lauseella otetaan käyttöön painokertoimet, joilla huomioidaan ositekohtaiset poimintatodennäköisyydet ja kadon vaikutuksia. CLASS-lauseella kerrotaan analyysissä olevat luokitellut muuttujat. VAR-lause kertoo analysoitavan muuttujan. Jos muuttuja ei ole jatkuva, se tulee laittaa myös CLASSlauseeseen. Jos luvut halutaan laskea jonkin muun muuttujan eri tasoilla (esim. sukupuolittain), tulee käyttää TABLES/DOMAIN lausetta. Tällöin varianssiestimointi tapahtuu oikein. Tähteä(*) käyttämällä voidaan ristiintaulukoida tuloksia. Esim. SUKUPUOLI*IKA_3LK. SAS:ssa tulostettavat luvut määritellään SURVEYMEANS proseduurin PROC lauseessa ja SURVEYFREQ -proseduurin TABLES lauseessa. SETENV-lauseella määritellään desimaalien lukumäärä Sudaanin tulosteessa. PRINT-lauseella, joka on vapaaehtoinen, määritetään Sudaanissa tulostettavat sarakkeet ja niiden muotoilu. Tällä lauseella tulosteet voi myös viedä omaan tiedostoon filename ja filetype -optioilla. Tulosteet näkyvät oletuksena Output -ikkunassa. SAS:ssa tulokset voi viedä omaan tiedostoon lisäämällä alkuun ja loppuun ods-komennot. Print- ja ods-komennot toimivat samalla tavalla kaikissa SAS- ja Sudaanajoissa. Alla lihavoinnilla korostetut kohdat pitää sisällyttää kaikkia analyysiproseduureja käytettäessä, jotta otantaasetelma tulee huomioiduksi oikein. Tunnusluvut PROC DESCRIPT DATA=MAAMU DESIGN=STRWOR; CLASS koettuterveys SUKUPUOLI OSITUS; VAR koettuterveys; TABLES OSITUS*SUKUPUOLI; PRINT NSUM MEAN SEMEAN LOWMEAN UPMEAN / STYLE=NCHS filename="c:\desc_terv.rtf" filetype=rtf; proc surveymeans data=maamu total=nnn mean median nobs var clm ; strata osite; class koettuterveys ; var koettuterveys ; domain ositus*sukupuoli; Ristiintaulukointi, frekvenssit luokitelluilla muuttujilla PROC CROSSTAB DATA=MAAMU DESIGN=STRWOR; CLASS ositus A104_LUOK_YHD; TABLES sukupuoli*a104_luok_yhd; RBY ositus; PRINT NSUM WSUM ROWPER SEROW / STYLE=NCHS filename="c:\desc_a104.rtf" filetype=rtf; ods rtf file="c:\desc_a104.rtf"; proc surveyfreq data=maamu total=nnn; tables sukupuoli*a104_luok_yhd / OR row col chisq; by ositus; ods rtf close;

5 Regressioanalyysit CLASS-lauseella kerrotaan analyysissä olevat luokitellut selittävät muuttujat. MODEL-lauseella määritetään malli. TEST-lauseella, voidaan valita suoritettavat testit. EFFECTS/ESTIMATE lausetta käytetään kun halutaan testata luokitellun muuttujan eri luokkien välisiä yhteyksiä. Testisuureet ja niiden p-arvot lasketaan oletuksena vain referenssiluokan suhteen ja globaalisti. Sudaanin tulosteen Contrast-tauluun tulee kolme riviä lisää, jossa testataan valitun selittävän muuttujan eri luokkien välisiä eroja. Lineaarinen regressioanalyysi WEIGHT w_analysis_tt; CLASS IKA_3LK A201; MODEL R_BMI = IKA_3LK A201; RBY OSITUS; EFFECTS A201=(-1,1,0,0,0) / NAME="A201 1 vs 2"; EFFECTS A201=(0,0,-1,1,0) / NAME="A201 3 vs 4"; EFFECTS A201=(-1,0,0,0,1) / NAME="A201 1 vs 5"; proc surveyreg data=maamu total=nnn; weight w_analysis_tt; class IKA_3LK A201 ; model R_BMI = IKA_3LK A201 / solution; domain ositus; estimate "A201 1 vs 2" A ; estimate "A201 3 vs 4" A ; estimate "A201 1 vs 5" A ; Logistinen regressioanalyysi MULTILOG proseduurissa myös selitettävä muuttuja pitää laittaa CLASS-lauseeseen. Logistinen regressio tuottaa vetokertoimet (Odds Ratios (OR)). SAS:n CLASS lauseen param=ref optiolla voidaan säätää moniluokkaisen selittävän muuttujan referenssiluokka. Sudaanissa se onnistuu REFLEVEL lauseella. Alla olevissa koodeissa iän referenssiluokaksi on valittu alin luokka. Oletusarvo on aina ylin luokka. PROC MULTILOG DATA=MAAMU DESIGN=STRWOR; CLASS A601_LUOK IKA_3LK OSITUS; MODEL A601_LUOK = IKA_3LK OSITUS; REFLEVEL IKA_3LK = 1; EFFECTS ositus=(-1,1,0) / NAME="Venäjä vs Somali"; EFFECTS ositus=(-1,0,1) / NAME="Venäjä vs Kurdi"; EFFECTS ositus=(0,-1,1) / NAME="Somali vs Kurdi"; proc surveylogistic data=maamu total=nnn; class IKA_3LK (ref='1') OSITUS / param=ref; model A601_LUOK = IKA_3LK OSITUS ; estimate "Venäjä vs Somali" ositus ; estimate "Venäjä vs Kurdi" ositus ; estimate Somali vs Kurdi" ositus 0-1 1;

6 Mallivakiointi Mallivakioidut keskiarvot ja prevalenssit ovat saatavilla vain Sudaanissa. Regressioanalyysin avulla tapahtuva mallivakiointi (predictive margins, Graubard&Korn 1999, Biometrics) tapahtuu Sudaanin regressioproseduureissa PREDMARG-lauseen avulla. PREDMARG-lauseella kerrotaan muuttujat joille halutaan mallivakiointi. REGRESS proseduurissa lause tuottaa mallivakioidut keskiarvot ja MULTILOG proseduurissa mallivakioidut prevalenssit. Alla oleva koodi tuottaa ikävakioidut keskiarvot tutkimusryhmittäin. CLASS IKA_3LK OSITUS; MODEL Y = IKA_3LK OSITUS; PREDMARG OSITUS; Mallivakiointiin sukupuolittain on kaksi tapaa, jotka tuottavat keskenään hieman erilaiset luvut. Ensimmäinen tapa, joka tuottaa molempien sukupuolien luvut saman mallin avulla, on pääsääntöisesti suositeltavampi. Toinen tapa laskee luvut sukupuolittain erillisten mallien avulla. Jälkimmäistä tapaa on syytä käyttää jos tutkittava ilmiö on miehillä ja naisilla huomattavan erilainen. *Tapa 1; CLASS IKA_3LK OSITUS SUKUPUOLI; MODEL Y = IKA_3LK OSITUS*SUKUPUOLI; PREDMARG OSITUS*SUKUPUOLI; *Tapa 2; CLASS IKA_3LK OSITUS SUKUPUOLI; MODEL Y = IKA_3LK OSITUS*SUKUPUOLI; RBY SUKUPUOLI; PREDMARG OSITUS; Osajoukkoanalyysit Analyysit pitää tehdä aina erillisinä kullekin maahanmuuttajaryhmälle muulloin kuin maahanmuuttajatyhmien välisiä eroja tutkittaessa (jolloin OSITUS-muuttuja on mallissa selittävänä tekijänä). Kullekin osajoukolle erilliset analyysit saadaan RBY/DOMAIN lauseen avulla. Tällöin keskivirheisiin, p- arvoihin ja luottamusväleihin vaikuttava varianssiestimointi tapahtuu oikein. Jos analyysit halutaan tehdä vain jollekin tietylle osajoukolle (esim. tutkittaessa vain miehiä), se onnistuu Sudaanin SUBPOPN lauseen avulla. RBY ja SUBPOPN lauseita voi käyttää myös yhtä aikaa. Alla oleva Sudaan-koodi tuottaa analyysin vain miehille, kullekin maahanmuuttajaryhmälle erikseen. SAS-koodi tuottaa analyysin molemmille sukupuolille erikseen. PROC MULTILOG DATA=MAAMU DESIGN=STRWOR; CLASS A601_LUOK IKA_3LK A507_LUOK; MODEL A601_LUOK = IKA_3LK A507_LUOK; RBY OSITUS; SUBPOPN SUKUPUOLI=1; proc surveylogistic data=maamu total=nnn; class IKA_3LK A507_LUOK; model A601_LUOK = IKA_3LK A507_LUOK ; domain ositus*sukupuoli;

7 Analyysiesimerkkejä Stata-ohjelmistolla Otanta-asetelma kuvataan Stataa käytettäessä yhdellä komennolla aineiston lukemisen jälkeen, esim. haastattelupainot saadaan käyttöön komennolla svyset _n [pw=w_analysis_lhaa], strata(osite) fpc(n) Vastaavasti terveystarkastuspainot muuttamalla [pw=w_analysis_tt]. Tämän jälkeen analyysit tehdään kirjoittamalla kunkin analyysikomennon eteen svy: -etuliite. Tässä esimerkkeinä kahden proseduurin käyttö. Vastaavat, alla lihavoinnilla korostetut kohdat pitää sisällyttää myös muita proseduureja käytettäessä. fpc(n)-optio huomioi äärellisen populaation korjauksen. strata(osite) huomioi alue- ja tutkimusryhmäosituksen. [pw=w_analysis_lhaa] otetaan käyttöön painokertoimet, joilla huomioidaan ositekohtaiset poimintatodennäköisyydet ja kadon vaikutuksia. Kuvailevat tunnusluvut Haastattelupaino: svy: mean ika Regressioanalyysi svy: regress y i.ika_3lk ositus Mallivakiointi Regressioanalyysin avulla tapahtuva mallivakiointi (predictive margins, Graubard&Korn 1999, Biometrics) tapahtuu Statassa regressioanalyysin jälkeen annettavalla margins-komennolla. Esim. edellisessä kohdassa olevan lineaarisen regressioanalyysin jälkeen margins ositus, vce(unconditional) tuottaa ikävakioidut vastemuuttujan y keskiarvot tutkimusryhmittäin. Osajoukkoanalyysit Jos analyysit tehdään jossakin osajoukossa, esim. ikä-, sukupuoli- tai muita rajauksia käytettäessä, rajaus on suoritettava subpop()-optiota käyttämällä. Tällöin keskivirheisiin, p-arvoihin ja luottamusväleihin vaikuttava varianssiestimointi tapahtuu oikein. Esim. keskiarvot sukupuolittain: svy: mean weight, over(sex) Regressioanalyysi pelkästään miehille: svy, subpop(if sex==1): regress weight height

ATH-koulutus THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelma Ositus ja 75 vuotta täyttäneiden ylipoiminta Painokertoimet Tulosten esittäminen: mallivakiointi Esimerkit

Lisätiedot

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: Stata 11 THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen Stata 11:llä Perustunnusluvut Regressioanalyysit Mallivakiointi 16. 2. 2011 ATH-koulutus

Lisätiedot

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä

Lisätiedot

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl.

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl. Health 2000/2011 Surveys Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013 Esa Virtala etunimi.sukunimi@thl.fi Terveyden ja hyvinvoinnin laitos (THL) PL 30 00271 Helsinki Puhelin:

Lisätiedot

1 Aineiston rakenne ja erikoisvaatimukset

1 Aineiston rakenne ja erikoisvaatimukset TH, PK 13.01.2005 Tilastollisten ohjelmistojen käyttö Terveys 2000 tutkimuksen yhteydessä 1 Aineiston rakenne ja erikoisvaatimukset Aineiston keräämiskustannusten pienentämiseksi havaintoyksilöt poimittiin

Lisätiedot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien

Lisätiedot

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011

Lisätiedot

Otanta-aineistojen analyysi

Otanta-aineistojen analyysi Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 2 Estimaattoreiden varianssien estimointi Survey-analyysin lähestymistavat Kuvaileva survey Descriptive survey

Lisätiedot

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2 Otantamenetelmät (78143) Syksy 2009 TEEMAT 3 & 4 Risto Lehtonen risto.lehtonen@helsinki.fi Teema 3 ERITYISKYSYMYKSIÄ Risto Lehtonen 2 1 Otannan erityiskysymyksiä Ryväsotanta Survey sampling reference guidelines

Lisätiedot

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1

ATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1 ATH-aineiston tilastolliset analyysit SPSS/PASW 16.2.2011 SPSS analyysit / Risto Sippola 1 Aineiston avaaminen Aineisto on saatu SPSS-muotoon ja tallennettu koneelle sijaintiin, josta sitä voidaan käyttää

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

Maahanmuuttajien terveys- ja hyvinvointitutkimus MAAMU

Maahanmuuttajien terveys- ja hyvinvointitutkimus MAAMU Maahanmuuttajien terveys- ja hyvinvointitutkimus MAAMU Lappeenranta 20.3.2013 1 Maahanmuuttajien terveys- ja hyvinvointitutkimus MAAMU THL:n koordinoiman laajan yhteistyöverkoston valmistelema ja toteuttama

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina. [MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =

Lisätiedot

Dynaamista ja joustavaa ohjelmointia - maukasta makrokielellä www.turkuamk.fi

Dynaamista ja joustavaa ohjelmointia - maukasta makrokielellä www.turkuamk.fi Markku Suni Turun ammattikorkeakoulu Dynaamista ja joustavaa ohjelmointia - maukasta makrokielellä SAS Makrokieli SAS Makrokieli on kieli SAS-kielen laajennus datavaihetta muistuttavia lauseita ja funktioita

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Makrojen mystinen maailma lyhyt oppimäärä

Makrojen mystinen maailma lyhyt oppimäärä Makrojen mystinen maailma lyhyt oppimäärä Makrot osana SAS-teknologiaa Yleiskuva Jouni Javanainen Aureolis lyhyesti Aureolis on jatkuvia Business Intelligence -palveluita tuottava asiantuntijaorganisaatio

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

2. Aineiston kuvailua

2. Aineiston kuvailua 2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

Monitasomallit koulututkimuksessa

Monitasomallit koulututkimuksessa Metodifestivaali 9.5.009 Monitasomallit koulututkimuksessa Mitä ihmettä? Antero Malin Koulutuksen tutkimuslaitos Jyväskylän yliopisto 009 1 Tilastollisten analyysien lähtökohta: Perusjoukolla on luonnollinen

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Liite artikkeliin Intohimo tasa-arvoon

Liite artikkeliin Intohimo tasa-arvoon Liite artikkeliin Intohimo tasa-arvoon Menetelmäkuvaus Artikkelissa käytetty regressiomalli on ns. binäärinen logistinen monitasoregressiomalli. Monitasoanalyysien ideana on se, että yksilöiden vastauksiin

Lisätiedot

DATA-vaiheen ohjelmoijan yleissivistys helposti unohtuvia asioita

DATA-vaiheen ohjelmoijan yleissivistys helposti unohtuvia asioita Markku Suni Factotum emeritus Turun ammattikorkeakoulu DATA-vaiheen ohjelmoijan yleissivistys helposti unohtuvia asioita Aivan ensimmäiseksi haluan kiittää kuulijoita kuuntelusta Kuten tunnettu poliitikko

Lisätiedot

Yleistetyistä lineaarisista malleista

Yleistetyistä lineaarisista malleista Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit

Lisätiedot

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

IDL - proseduurit. ATK tähtitieteessä. IDL - proseduurit

IDL - proseduurit. ATK tähtitieteessä. IDL - proseduurit IDL - proseduurit 25. huhtikuuta 2017 Viimeksi käsiteltiin IDL:n interaktiivista käyttöä, mutta tämä on hyvin kömpelöä monimutkaisempia asioita tehtäessä. IDL:llä on mahdollista tehdä ns. proseduuri-tiedostoja,

Lisätiedot

IBM SPSS Statistics 21 (= SPSS 21)

IBM SPSS Statistics 21 (= SPSS 21) Tarja Heikkilä IBM SPSS Statistics 21 (= SPSS 21) SPSS = Statistical Package for Social Sciences Ohjelman käynnistys Aloitusikkuna Päävalikot Työkalut Muuttujat (Variables) Tapaukset (Cases) Tyhjä datataulukko

Lisätiedot

ATK tähtitieteessä. Osa 3 - IDL proseduurit ja rakenteet. 18. syyskuuta 2014

ATK tähtitieteessä. Osa 3 - IDL proseduurit ja rakenteet. 18. syyskuuta 2014 18. syyskuuta 2014 IDL - proseduurit Viimeksi käsiteltiin IDL:n interaktiivista käyttöä, mutta tämä on hyvin kömpelöä monimutkaisempia asioita tehtäessä. IDL:llä on mahdollista tehdä ns. proseduuri-tiedostoja,

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät

Lisätiedot

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitukset 4 : Paneelidata (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Risto Lehtonen risto.lehtonen@helsini.fi Analyysimenetelmiä ja työaluja Lineaariset mallit Regressioanalyysi

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

5 Lisa materiaali. 5.1 Ristiintaulukointi

5 Lisa materiaali. 5.1 Ristiintaulukointi 5 Lisa materiaali 5.1 Ristiintaulukointi 270. a) Aineiston koko nähdään frekvenssitaulukon oikeasta alakulmasta: N = 559. Tilastotieteen johdantokurssille osallistui yhteensä 559 opiskelijaa. Huomaa: Opiskelijoiden

Lisätiedot

Harjoitukset 2 : Monimuuttujaregressio (Palautus )

Harjoitukset 2 : Monimuuttujaregressio (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30. FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.

Lisätiedot

4.2 Useampi selittävä muuttuja (kertausta)

4.2 Useampi selittävä muuttuja (kertausta) 14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat

Lisätiedot

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N 11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation

Lisätiedot

Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi

Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Risto Lehtonen, Helsingin yliopisto Metodifestivaali Jyväskylän yliopisto 27.5.2009 Keskiviikko 27.5 10-12 Hierarkkisuus otanta- asetelmaperusteisessa

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen

Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen 29.10.2009 Survey aineistot (lomaketutkimukset) Kyselyaineistot posti(kirje)kysely informoitu kysely tietokoneavusteinen

Lisätiedot

Muuttujien määrittely

Muuttujien määrittely Tarja Heikkilä Muuttujien määrittely Määrittele muuttujat SPSS-ohjelmaan lomakkeen kysymyksistä. Harjoitusta varten lomakkeeseen on muokattu kysymyksiä kahdesta opiskelijoiden tekemästä Joupiskan rinneravintolaa

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Todennäköisyyslaskennan kertaus Satunnaismuuttujat ja tn-jakaumat Tunnusluvut χ 2 -, F- ja t-jakauma Riippumattomuus Tilastotieteen

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Hieman linkkejä: http://cs.stadia.fi/~kuivanen/linux/kom.php, lyhyt ohje komentoriviohjelmointiin.

Hieman linkkejä: http://cs.stadia.fi/~kuivanen/linux/kom.php, lyhyt ohje komentoriviohjelmointiin. Linux-harjoitus 9 Linuxin mukana tulevat komentotulkit (mm. bash, tcsh, ksh, jne ) sisältävät ohjelmointikielen, joka on varsin tehokas ja ilmaisuvoimainen. Tähän yhdistettynä unix-maailmasta tutut tehokkaat

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Tilastomenetelmien lopputyö

Tilastomenetelmien lopputyö Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Johdatus monimuuttujamenetelmiin Luennot 30.10.13.12.-18 Tiistaina klo 12-14 (30.10., BF119-1) Keskiviikkoisin klo 10-12 (MA101,

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Laskelmia puoluekannatuksesta Seppo

Laskelmia puoluekannatuksesta Seppo Laskelmia puoluekannatuksesta Seppo 19.10.2011 Taustalla on luonnollisesti surveyaineisto. Sen tavoiteperusjoukko on itse vaaleissa 18+ -vuotias suomalainen rekisterin mukaan. Ulkomaalaisillakin on tietyin

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Usean selittävän muuttujan regressioanalyysi

Usean selittävän muuttujan regressioanalyysi Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto Metodifestivaali 28.5.2009 1 1 Mitä ihmettä on bootstrap? Webster: 1. a loop of leather or cloth sewn at the top rear, or sometimes on each side of a boot

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

TAPAUS-VERROKKITUTKIMUS

TAPAUS-VERROKKITUTKIMUS TAPAUS-VERROKKI TUTKIMUKSEN TYYPIT JA TULOSTEN ANALYYSI Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting.3.4.2007 TAPAUS-VERROKKITUTKIMUS Idea Tutkimusryhmät

Lisätiedot

Maahanmuuttajien terveys- ja hyvinvointitutkimus. Tutkimusprofessori Seppo Koskinen, THL

Maahanmuuttajien terveys- ja hyvinvointitutkimus. Tutkimusprofessori Seppo Koskinen, THL Maahanmuuttajien terveys- ja hyvinvointitutkimus Tutkimusprofessori Seppo Koskinen, THL Ulkomaalaistaustaisten suomalaisten määrä kasvaa nopeasti 1990 2011 Ulkomailla syntyneitä 65 000 266 000 (5 %) Vieraskielisiä

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.

Lisätiedot

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0. 806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ

Lisätiedot

riippumattomia ja noudattavat samaa jakaumaa.

riippumattomia ja noudattavat samaa jakaumaa. 12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa Oulun yliopiston matemaattisten tieteiden tutkimusyksikkö/tilastotiede 805306A JOHDATUS MONIMUUTTUJAMENETELMIIN, sl 2017 (Jari Päkkilä) Harjoitus 3, viikko 47 (19.20.11.): kotitehtävät Ratkaisuja 1. Floridan

Lisätiedot

SPSS OPAS. Metropolia Liiketalous

SPSS OPAS. Metropolia Liiketalous 1 Metropolia Liiketalous SPSS OPAS Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio 8 8.Korrelaatio

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12

Lisätiedot

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää

Lisätiedot

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja

Lisätiedot

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja

FSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja FSD2404 Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen 1988-1997 Koodikirja TIETOARKISTO Tämän koodikirjan viittaustiedot: Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta... JHS 160 Paikkatiedon laadunhallinta Liite III: Otanta-asetelmat Sisällysluettelo 1. Johdanto... 2 2. Todennäköisyysotanta... 2 2.1 Yksinkertainen satunnaisotanta... 3 2.2 Ositettu otanta... 3 2.3 Systemaattinen

Lisätiedot

I. Ristiintaulukointi Excelillä / Microsoft Office 2010

I. Ristiintaulukointi Excelillä / Microsoft Office 2010 Savonia-ammattikorkeakoulu Liiketalous Kuopio Tutkimusmenetelmät Likitalo & Mäkelä I. Ristiintaulukointi Excelillä / Microsoft Office 2010 Tässä ohjeessa on mainittu ensi Excelin valinnan/komennon englanninkielinen

Lisätiedot

Mediatutkimuskoulu 2009 Yleisimmät tunnusluvut

Mediatutkimuskoulu 2009 Yleisimmät tunnusluvut tutkimuskoulu 2009 Yleisimmät tunnusluvut Marja Ikonen 10.02.2009 tutkimuksista Yleistä Menetelmä ja haastattelujen määrä Vaihtelee: TNS Atlas: puhelin 20.000; kirje n. 8.000 TNS PäättäjäAtlas puhelininformoitu

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla 17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2

Lisätiedot