Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi.
|
|
- Tommi Karvonen
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 Tommi Härkänen, Teppo Juntunen, Eero Lilja Analyysiohjeita Maahanmuuttajien terveys- ja hyvinvointitutkimusaineiston käsittelemiseksi Taustaa Otoksen ositus kunnittain ja maahanmuuttajaryhmittäin Katso otospoiminnasta, Maamu-raportin ( luku 2. Koska painokertoimet on kalibroitu maahanmuuttajaryhmittäin, tuloksia ei tule esittää maahanmuuttajat yhteensä -tyyppisesti. Otos on joissakin ositteissa huomattavan suuri suhteessa perusjoukon kokoon. Tällöin alueiden/kuntien välinen vertailu on mahdollista, koska eri alueilla/kunnissa perusjoukon koko vaihtelee huomattavasti, mutta kaikista kunnista on poimittu vähintään tietty minimimäärä henkilöitä tutkimusotokseen. Suorat keskiarvot ovat virheellisiä yhdistettäessä ositteita analyyseissa tarvitaan painokertoimet kuntakohtaisia tietoja yhdistettäessä Ositettu otanta ja kunnittain sekä tutkimusryhmittäin vaihtelevat poimintatodennäköisyydet vaikuttavat varianssiestimaatteihin p-arvot pienempiä ja luottamusvälit kapeampia Tarvitaan äärellisen populaation korjaus Äärellisen populaation korjaus (FPC) Miksi populaation rajallisuus vaikuttaa tulosten tarkkuuteen? Jos koko perusjoukko tutkittaisiin, saisimme tarkan tiedon väestön senhetkisestä tilasta, koska otannasta johtuvaa vaihtelua ei olisi esim. keskiarvon luottamusvälin leveys olisi nolla Jos otoksen osuus perusjoukosta on suuri kuten Maamu -aineistossa, niin tutkimatta jääneiden vaikutus väestökeskiarvoon on pieni, jolloin keskivirheet ja p-arvot ovat pääsääntöisesti pienempiä sekä luottamusvälit kapeampia kuin oletettaessa tavanomainen satunnaisotos (äärettömän) suuresta populaatiosta. Jos otos olisi vain pieni osa perusjoukosta, niin kyseessä olisi likimain tavallinen yksinkertainen satunnaisotanta (SRS), eikä FPC:ta tarvita. Painokertoimien taustaa: kato Osallistumisaktiivisuus vaihtelee ryhmittäin. Tarkemmat tiedot kadosta löytyvät Maamu-raportin luvusta 2, joka kuvaa myös miten kato on huomioitu painokertoimien muodostamisessa. Jos aktiivisuuteen vaikuttavat tekijät voidaan mitata sekä osallistuneista että katotapauksista, erot voidaan korjata hyvin (esim. rekisteritiedot: ikä, sukupuoli ja koulutus) oletus osallistuneiden ja katoon jääneiden henkilöiden samankaltaisuudesta vain osallistuneista, erojen huomioiminen on vaikeaa (esim. terveyteen ja toimintakykyyn liittyvät tekijät) kadon vaikutuksia ei voida täysin korjata painokertoimien avulla vaihtoehtoisia menetelmiä (esim. imputointi) on syytä harkita kadon vaikutuksien korjaamiseksi
2 Erilaiset painokertoimet Osallistuminen voidaan määritellä erilaisten kriteerien mukaan, jolloin saadaan erilaisia painokertoimia: Terveystarkastus Analysoitaessa terveystarkastusmuuttujia käytetään w_analysis_tt-painokerrointa. Haastattelut Analysoitaessa haastattelumuuttujia käytetään w_analysis_lhaa painokerrointa, jos muuttuja löytyy sekä pitkästä että lyhyestä lomakkeesta. Jos kysymys on ollut vain pitkässä lomakkeessa, käytetään w_analysis_haa-painokerrointa. Kun samassa analyysissä on sekä terveystarkastus- että haastattelumuuttujia, käytetään vastemuuttujan (selitettävä muuttuja) mukaista painokerrointa. Terveystarkastuksen painokertoimia voi käyttää myös haastattelukysymyksiin jos tutkimus rajautuu vain terveystarkastukseen osallistuneisiin. Edellä mainituista painoista on olemassa myös kahdenlaiset versiot: Analyysipainoja käytetään estimoitaessa erilaisia kuvailevia tunnuslukuja (esim. keskiarvoja) ja regressioanalyyseissä, eli lähes kaikissa analyyseissä. Korottavia painoja käytetään estimoitaessa väestössä olevia kokonaismääriä, esim. perusjoukossa olevien, tiettyä sairautta sairastavien henkilöiden lukumääriä. Nämä kertoimet tutkija voi tilata tarvittaessa tutkimusaineistoon. Painokertoimien kalibrointitavan takia kaikki ryhmät saa laittaa samaan malliin vain ryhmien välisiä eroja tutkittaessa (OSITUS muuttuja mallissa selittäjänä). Kaikki muut analyysit tulee tehdä kullekin ryhmälle erikseen. Muuta huomioitavaa Suositeltavia ohjelmistoja ovat SAS, SUDAAN sekä Stata. Näillä pystytään huomioimaan monimutkaiset otanta-asetelmat sekä tekemään mallivakiointia. SPSS:n ominaisuudet eivät ole riittäviä otanta-asetelman huomioitiin ilman Complex Samples lisämoduulia. R:llä ei toistaiseksi pysty tekemään mallivakiointia, mutta otanta-asetelman pystyy huomioimaan survey-paketin avulla. Jos mielenkiinnon kohteena on vain jokin tietty väestöryhmä, aineistosta ei saa poistaa kohderyhmään kuulumattomia havaintoja, jotta varianssiestimointi tapahtuu oikein. Jos tutkimus rajautuu esim. vain nuoriin naisiin, niin aineistosta ei saa poistaa miesten tai vanhempien ikäryhmien havaintoja. Osa-aineistoja saa käyttää vain maahanmuuttajaryhmittäin (esim. OSITUS = 1), joiden otoskoot ovat ennalta määrättyjä Tehtäessä vertailuja koko maan väestöön (Terveys2011-tutkimuksesta poimittu verrokkiaineisto mukana analyyseissa) tulee kiinnittää huomioita muuttujien vastaavuuteen ja otoskoon riittävyyteen. Erityisesti T2011:n osalta alle 30 vuotiaista on hyvin vähän terveystarkastuksessa käyneitä. Tutkijoiden käyttöön annettavaan aineistoon on valittu mukaan vain sellaisia muuttujia, joissa kysymysmuodot ovat riittävän vertailukelpoisia Maamu- ja Terveys 2011 tutkimuksissa. Tutkijan kannattaa kuitenkin aina tarkastaa kysymysten vastaavuus alkuperäisistä tutkimuslomakkeista ( ja ja huomioida myös erot tarkasteltavaa kysymystä edeltävissä kysymyksissä. Aineisto on tarkastettu, mutta virheitä ja epätarkkuuksia on silti voinut jäädä havaitsematta. Ennen analyysejä on syytä verrata aineistoa (analyyseissa käytettävien muuttujien frekvenssit, jakaumat, ristiintaulukointi) ja lomaketta sekä tarkastaa, että hyppykäskyt yms. on huomioitu ja kirjattu aineistoon oikein. Dataan valmiiksi luodut yhdistelmämuuttujat on myös syytä tarkistaa ennen analyysejä.
3 Analyysiesimerkkejä SAS/Sudaan-ohjelmistolla Muuttujan uudelleen luokittelu Tässä esimerkkinä jatkuvan ikä-muuttujan luokittelu. DATA MAAMU; SET MAAMU; IF NOT MISSING (IKA2) THEN DO; IF IKA2 <= 24 THEN IKA_LUOK = 1; ELSE IF (IKA2 > 24 AND IKA2 <= 34) THEN IKA_LUOK = 2; ELSE IF (IKA2 > 34 AND IKA2 <= 44) THEN IKA_LUOK = 3; ELSE IF (IKA2 > 44 AND IKA2 <= 54) THEN IKA_LUOK = 4; ELSE IF (IKA2 > 54 AND IKA2 <= 64) THEN IKA_LUOK = 5; END; Esimerkki moniluokkaisen muuttujan muuntamisesta kaksiluokkaiseksi. DATA MAAMU; SET MAAMU; IF NOT MISSING (A104_LUOK) THEN DO; IF A104_LUOK = 1 THEN A104_LUOK_YHD = 1; ELSE IF A104_LUOK in (2,3,4,5) THEN A104_LUOK_YHD = 0; END; Muuttujamuunnoksen toimivuus on syytä tarkastaa vielä FREQ-proseduurin avulla. proc freq data=maamu; table A104_LUOK*A104_LUOK_YHD / list missing; Esivalmistelut SAS ja SUDAANin analyysejä varten aineisto pitää järjestää STRATA/NEST-lauseessa olevan muuttujan mukaisesti. Osajoukkoanalyyseissa aineisto pitää järjestää myös osajoukon määrittävän muuttujan mukaan (esim. sukupuoli). proc sort data=maamu; by osite sukupuoli; SAS-analyysien äärellisen populaation korjausta varten ositteiden koot pitää viedä erilliseen tiedostoon. Sudaan osaa lukea ne suoraan datasta. proc freq data=maamu ; tables N*osite*ositus / out=nnn noprint; data NNN; set NNN; _TOTAL_ = N ; drop N COUNT PERCENT ; proc sort data=nnn; by osite;
4 Aineiston kuvailu DESIGN-optio ja TOTCNT/TOTAL-lause huomioivat äärellisen populaation korjauksen. NEST/STRATA-lause huomioi alue- ja tutkimusryhmäosituksen. WEIGHT-lauseella otetaan käyttöön painokertoimet, joilla huomioidaan ositekohtaiset poimintatodennäköisyydet ja kadon vaikutuksia. CLASS-lauseella kerrotaan analyysissä olevat luokitellut muuttujat. VAR-lause kertoo analysoitavan muuttujan. Jos muuttuja ei ole jatkuva, se tulee laittaa myös CLASSlauseeseen. Jos luvut halutaan laskea jonkin muun muuttujan eri tasoilla (esim. sukupuolittain), tulee käyttää TABLES/DOMAIN lausetta. Tällöin varianssiestimointi tapahtuu oikein. Tähteä(*) käyttämällä voidaan ristiintaulukoida tuloksia. Esim. SUKUPUOLI*IKA_3LK. SAS:ssa tulostettavat luvut määritellään SURVEYMEANS proseduurin PROC lauseessa ja SURVEYFREQ -proseduurin TABLES lauseessa. SETENV-lauseella määritellään desimaalien lukumäärä Sudaanin tulosteessa. PRINT-lauseella, joka on vapaaehtoinen, määritetään Sudaanissa tulostettavat sarakkeet ja niiden muotoilu. Tällä lauseella tulosteet voi myös viedä omaan tiedostoon filename ja filetype -optioilla. Tulosteet näkyvät oletuksena Output -ikkunassa. SAS:ssa tulokset voi viedä omaan tiedostoon lisäämällä alkuun ja loppuun ods-komennot. Print- ja ods-komennot toimivat samalla tavalla kaikissa SAS- ja Sudaanajoissa. Alla lihavoinnilla korostetut kohdat pitää sisällyttää kaikkia analyysiproseduureja käytettäessä, jotta otantaasetelma tulee huomioiduksi oikein. Tunnusluvut PROC DESCRIPT DATA=MAAMU DESIGN=STRWOR; CLASS koettuterveys SUKUPUOLI OSITUS; VAR koettuterveys; TABLES OSITUS*SUKUPUOLI; PRINT NSUM MEAN SEMEAN LOWMEAN UPMEAN / STYLE=NCHS filename="c:\desc_terv.rtf" filetype=rtf; proc surveymeans data=maamu total=nnn mean median nobs var clm ; strata osite; class koettuterveys ; var koettuterveys ; domain ositus*sukupuoli; Ristiintaulukointi, frekvenssit luokitelluilla muuttujilla PROC CROSSTAB DATA=MAAMU DESIGN=STRWOR; CLASS ositus A104_LUOK_YHD; TABLES sukupuoli*a104_luok_yhd; RBY ositus; PRINT NSUM WSUM ROWPER SEROW / STYLE=NCHS filename="c:\desc_a104.rtf" filetype=rtf; ods rtf file="c:\desc_a104.rtf"; proc surveyfreq data=maamu total=nnn; tables sukupuoli*a104_luok_yhd / OR row col chisq; by ositus; ods rtf close;
5 Regressioanalyysit CLASS-lauseella kerrotaan analyysissä olevat luokitellut selittävät muuttujat. MODEL-lauseella määritetään malli. TEST-lauseella, voidaan valita suoritettavat testit. EFFECTS/ESTIMATE lausetta käytetään kun halutaan testata luokitellun muuttujan eri luokkien välisiä yhteyksiä. Testisuureet ja niiden p-arvot lasketaan oletuksena vain referenssiluokan suhteen ja globaalisti. Sudaanin tulosteen Contrast-tauluun tulee kolme riviä lisää, jossa testataan valitun selittävän muuttujan eri luokkien välisiä eroja. Lineaarinen regressioanalyysi WEIGHT w_analysis_tt; CLASS IKA_3LK A201; MODEL R_BMI = IKA_3LK A201; RBY OSITUS; EFFECTS A201=(-1,1,0,0,0) / NAME="A201 1 vs 2"; EFFECTS A201=(0,0,-1,1,0) / NAME="A201 3 vs 4"; EFFECTS A201=(-1,0,0,0,1) / NAME="A201 1 vs 5"; proc surveyreg data=maamu total=nnn; weight w_analysis_tt; class IKA_3LK A201 ; model R_BMI = IKA_3LK A201 / solution; domain ositus; estimate "A201 1 vs 2" A ; estimate "A201 3 vs 4" A ; estimate "A201 1 vs 5" A ; Logistinen regressioanalyysi MULTILOG proseduurissa myös selitettävä muuttuja pitää laittaa CLASS-lauseeseen. Logistinen regressio tuottaa vetokertoimet (Odds Ratios (OR)). SAS:n CLASS lauseen param=ref optiolla voidaan säätää moniluokkaisen selittävän muuttujan referenssiluokka. Sudaanissa se onnistuu REFLEVEL lauseella. Alla olevissa koodeissa iän referenssiluokaksi on valittu alin luokka. Oletusarvo on aina ylin luokka. PROC MULTILOG DATA=MAAMU DESIGN=STRWOR; CLASS A601_LUOK IKA_3LK OSITUS; MODEL A601_LUOK = IKA_3LK OSITUS; REFLEVEL IKA_3LK = 1; EFFECTS ositus=(-1,1,0) / NAME="Venäjä vs Somali"; EFFECTS ositus=(-1,0,1) / NAME="Venäjä vs Kurdi"; EFFECTS ositus=(0,-1,1) / NAME="Somali vs Kurdi"; proc surveylogistic data=maamu total=nnn; class IKA_3LK (ref='1') OSITUS / param=ref; model A601_LUOK = IKA_3LK OSITUS ; estimate "Venäjä vs Somali" ositus ; estimate "Venäjä vs Kurdi" ositus ; estimate Somali vs Kurdi" ositus 0-1 1;
6 Mallivakiointi Mallivakioidut keskiarvot ja prevalenssit ovat saatavilla vain Sudaanissa. Regressioanalyysin avulla tapahtuva mallivakiointi (predictive margins, Graubard&Korn 1999, Biometrics) tapahtuu Sudaanin regressioproseduureissa PREDMARG-lauseen avulla. PREDMARG-lauseella kerrotaan muuttujat joille halutaan mallivakiointi. REGRESS proseduurissa lause tuottaa mallivakioidut keskiarvot ja MULTILOG proseduurissa mallivakioidut prevalenssit. Alla oleva koodi tuottaa ikävakioidut keskiarvot tutkimusryhmittäin. CLASS IKA_3LK OSITUS; MODEL Y = IKA_3LK OSITUS; PREDMARG OSITUS; Mallivakiointiin sukupuolittain on kaksi tapaa, jotka tuottavat keskenään hieman erilaiset luvut. Ensimmäinen tapa, joka tuottaa molempien sukupuolien luvut saman mallin avulla, on pääsääntöisesti suositeltavampi. Toinen tapa laskee luvut sukupuolittain erillisten mallien avulla. Jälkimmäistä tapaa on syytä käyttää jos tutkittava ilmiö on miehillä ja naisilla huomattavan erilainen. *Tapa 1; CLASS IKA_3LK OSITUS SUKUPUOLI; MODEL Y = IKA_3LK OSITUS*SUKUPUOLI; PREDMARG OSITUS*SUKUPUOLI; *Tapa 2; CLASS IKA_3LK OSITUS SUKUPUOLI; MODEL Y = IKA_3LK OSITUS*SUKUPUOLI; RBY SUKUPUOLI; PREDMARG OSITUS; Osajoukkoanalyysit Analyysit pitää tehdä aina erillisinä kullekin maahanmuuttajaryhmälle muulloin kuin maahanmuuttajatyhmien välisiä eroja tutkittaessa (jolloin OSITUS-muuttuja on mallissa selittävänä tekijänä). Kullekin osajoukolle erilliset analyysit saadaan RBY/DOMAIN lauseen avulla. Tällöin keskivirheisiin, p- arvoihin ja luottamusväleihin vaikuttava varianssiestimointi tapahtuu oikein. Jos analyysit halutaan tehdä vain jollekin tietylle osajoukolle (esim. tutkittaessa vain miehiä), se onnistuu Sudaanin SUBPOPN lauseen avulla. RBY ja SUBPOPN lauseita voi käyttää myös yhtä aikaa. Alla oleva Sudaan-koodi tuottaa analyysin vain miehille, kullekin maahanmuuttajaryhmälle erikseen. SAS-koodi tuottaa analyysin molemmille sukupuolille erikseen. PROC MULTILOG DATA=MAAMU DESIGN=STRWOR; CLASS A601_LUOK IKA_3LK A507_LUOK; MODEL A601_LUOK = IKA_3LK A507_LUOK; RBY OSITUS; SUBPOPN SUKUPUOLI=1; proc surveylogistic data=maamu total=nnn; class IKA_3LK A507_LUOK; model A601_LUOK = IKA_3LK A507_LUOK ; domain ositus*sukupuoli;
7 Analyysiesimerkkejä Stata-ohjelmistolla Otanta-asetelma kuvataan Stataa käytettäessä yhdellä komennolla aineiston lukemisen jälkeen, esim. haastattelupainot saadaan käyttöön komennolla svyset _n [pw=w_analysis_lhaa], strata(osite) fpc(n) Vastaavasti terveystarkastuspainot muuttamalla [pw=w_analysis_tt]. Tämän jälkeen analyysit tehdään kirjoittamalla kunkin analyysikomennon eteen svy: -etuliite. Tässä esimerkkeinä kahden proseduurin käyttö. Vastaavat, alla lihavoinnilla korostetut kohdat pitää sisällyttää myös muita proseduureja käytettäessä. fpc(n)-optio huomioi äärellisen populaation korjauksen. strata(osite) huomioi alue- ja tutkimusryhmäosituksen. [pw=w_analysis_lhaa] otetaan käyttöön painokertoimet, joilla huomioidaan ositekohtaiset poimintatodennäköisyydet ja kadon vaikutuksia. Kuvailevat tunnusluvut Haastattelupaino: svy: mean ika Regressioanalyysi svy: regress y i.ika_3lk ositus Mallivakiointi Regressioanalyysin avulla tapahtuva mallivakiointi (predictive margins, Graubard&Korn 1999, Biometrics) tapahtuu Statassa regressioanalyysin jälkeen annettavalla margins-komennolla. Esim. edellisessä kohdassa olevan lineaarisen regressioanalyysin jälkeen margins ositus, vce(unconditional) tuottaa ikävakioidut vastemuuttujan y keskiarvot tutkimusryhmittäin. Osajoukkoanalyysit Jos analyysit tehdään jossakin osajoukossa, esim. ikä-, sukupuoli- tai muita rajauksia käytettäessä, rajaus on suoritettava subpop()-optiota käyttämällä. Tällöin keskivirheisiin, p-arvoihin ja luottamusväleihin vaikuttava varianssiestimointi tapahtuu oikein. Esim. keskiarvot sukupuolittain: svy: mean weight, over(sex) Regressioanalyysi pelkästään miehille: svy, subpop(if sex==1): regress weight height
ATH-koulutus THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelma Ositus ja 75 vuotta täyttäneiden ylipoiminta Painokertoimet Tulosten esittäminen: mallivakiointi Esimerkit
LisätiedotATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1
ATH-koulutus: Stata 11 THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen Stata 11:llä Perustunnusluvut Regressioanalyysit Mallivakiointi 16. 2. 2011 ATH-koulutus
LisätiedotOtanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä
LisätiedotHealth 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl.
Health 2000/2011 Surveys Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013 Esa Virtala etunimi.sukunimi@thl.fi Terveyden ja hyvinvoinnin laitos (THL) PL 30 00271 Helsinki Puhelin:
Lisätiedot1 Aineiston rakenne ja erikoisvaatimukset
TH, PK 13.01.2005 Tilastollisten ohjelmistojen käyttö Terveys 2000 tutkimuksen yhteydessä 1 Aineiston rakenne ja erikoisvaatimukset Aineiston keräämiskustannusten pienentämiseksi havaintoyksilöt poimittiin
LisätiedotTilastollisten menetelmien käyttö Kelan tutkimustoiminnassa
Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien
LisätiedotATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1
ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011
LisätiedotOtanta-aineistojen analyysi
Helsingin yliopisto Otanta-aineistojen analyysi Kevät 2010 Periodi III Risto Lehtonen Teema 2 Estimaattoreiden varianssien estimointi Survey-analyysin lähestymistavat Kuvaileva survey Descriptive survey
Lisätiedot(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2
Otantamenetelmät (78143) Syksy 2009 TEEMAT 3 & 4 Risto Lehtonen risto.lehtonen@helsinki.fi Teema 3 ERITYISKYSYMYKSIÄ Risto Lehtonen 2 1 Otannan erityiskysymyksiä Ryväsotanta Survey sampling reference guidelines
LisätiedotATH-aineiston tilastolliset analyysit SPSS/PASW SPSS analyysit / Risto Sippola 1
ATH-aineiston tilastolliset analyysit SPSS/PASW 16.2.2011 SPSS analyysit / Risto Sippola 1 Aineiston avaaminen Aineisto on saatu SPSS-muotoon ja tallennettu koneelle sijaintiin, josta sitä voidaan käyttää
LisätiedotKvantitatiiviset menetelmät
Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan
LisätiedotMaahanmuuttajien terveys- ja hyvinvointitutkimus MAAMU
Maahanmuuttajien terveys- ja hyvinvointitutkimus MAAMU Lappeenranta 20.3.2013 1 Maahanmuuttajien terveys- ja hyvinvointitutkimus MAAMU THL:n koordinoiman laajan yhteistyöverkoston valmistelema ja toteuttama
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, kevät 2019 https://coursepages.uta.fi/mtttp1/kevat-2019/ HARJOITUS 3 Joitain ratkaisuja 1. x =(8+9+6+7+10)/5 = 8, s 2 = ((8 8) 2 + (9 8) 2 +(6 8) 2 + (7 8) 2 ) +
LisätiedotOngelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?
Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus
LisätiedotNäistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.
[MTTTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2017 http://www.uta.fi/sis/mtt/mtttp1/syksy_2017.html HARJOITUS 3 viikko 40 Joitain ratkaisuja 1. Suoritetaan standardointi. Standardoidut arvot ovat z 1 =
LisätiedotDynaamista ja joustavaa ohjelmointia - maukasta makrokielellä www.turkuamk.fi
Markku Suni Turun ammattikorkeakoulu Dynaamista ja joustavaa ohjelmointia - maukasta makrokielellä SAS Makrokieli SAS Makrokieli on kieli SAS-kielen laajennus datavaihetta muistuttavia lauseita ja funktioita
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.
LisätiedotHAVAITUT JA ODOTETUT FREKVENSSIT
HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies
LisätiedotMakrojen mystinen maailma lyhyt oppimäärä
Makrojen mystinen maailma lyhyt oppimäärä Makrot osana SAS-teknologiaa Yleiskuva Jouni Javanainen Aureolis lyhyesti Aureolis on jatkuvia Business Intelligence -palveluita tuottava asiantuntijaorganisaatio
LisätiedotJY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT
JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos
LisätiedotTilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä
Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien
Lisätiedot2. Aineiston kuvailua
2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien
LisätiedotTUTKIMUSOPAS. SPSS-opas
TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien
LisätiedotMonitasomallit koulututkimuksessa
Metodifestivaali 9.5.009 Monitasomallit koulututkimuksessa Mitä ihmettä? Antero Malin Koulutuksen tutkimuslaitos Jyväskylän yliopisto 009 1 Tilastollisten analyysien lähtökohta: Perusjoukolla on luonnollinen
LisätiedotLisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?
MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
LisätiedotLiite artikkeliin Intohimo tasa-arvoon
Liite artikkeliin Intohimo tasa-arvoon Menetelmäkuvaus Artikkelissa käytetty regressiomalli on ns. binäärinen logistinen monitasoregressiomalli. Monitasoanalyysien ideana on se, että yksilöiden vastauksiin
LisätiedotDATA-vaiheen ohjelmoijan yleissivistys helposti unohtuvia asioita
Markku Suni Factotum emeritus Turun ammattikorkeakoulu DATA-vaiheen ohjelmoijan yleissivistys helposti unohtuvia asioita Aivan ensimmäiseksi haluan kiittää kuulijoita kuuntelusta Kuten tunnettu poliitikko
LisätiedotYleistetyistä lineaarisista malleista
Yleistetyistä lineaarisista malleista Tilastotiede käytännön tutkimuksessa -kurssi, kesä 2001 Reijo Sund Klassinen lineaarinen malli y = Xb + e eli E(Y) = m, jossa m = Xb Satunnaiskomponentti: Y:n komponentit
LisätiedotLumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I
Lumipallo regressioanalyysista jokainen kirjoittaa lapulle yhden lauseen regressioanalyysista ja antaa sen seuraavalle Logistinen regressioanalyysi Y250. Kvantitatiiviset menetelmät (6 op) Hanna Wass tutkijatohtori
LisätiedotSPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö
SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin
LisätiedotIDL - proseduurit. ATK tähtitieteessä. IDL - proseduurit
IDL - proseduurit 25. huhtikuuta 2017 Viimeksi käsiteltiin IDL:n interaktiivista käyttöä, mutta tämä on hyvin kömpelöä monimutkaisempia asioita tehtäessä. IDL:llä on mahdollista tehdä ns. proseduuri-tiedostoja,
LisätiedotIBM SPSS Statistics 21 (= SPSS 21)
Tarja Heikkilä IBM SPSS Statistics 21 (= SPSS 21) SPSS = Statistical Package for Social Sciences Ohjelman käynnistys Aloitusikkuna Päävalikot Työkalut Muuttujat (Variables) Tapaukset (Cases) Tyhjä datataulukko
LisätiedotATK tähtitieteessä. Osa 3 - IDL proseduurit ja rakenteet. 18. syyskuuta 2014
18. syyskuuta 2014 IDL - proseduurit Viimeksi käsiteltiin IDL:n interaktiivista käyttöä, mutta tämä on hyvin kömpelöä monimutkaisempia asioita tehtäessä. IDL:llä on mahdollista tehdä ns. proseduuri-tiedostoja,
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen
LisätiedotTutkimustiedonhallinnan peruskurssi
Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,
LisätiedotHarjoitukset 3 : Monimuuttujaregressio 2 (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus 7.2.2017) Tämän harjoituskerran tehtävät
LisätiedotHarjoitukset 4 : Paneelidata (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä
Lisätiedot(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.
2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja
LisätiedotOtanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi Risto Lehtonen risto.lehtonen@helsini.fi Analyysimenetelmiä ja työaluja Lineaariset mallit Regressioanalyysi
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
LisätiedotSPSS-perusteet. Sisältö
SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn
Lisätiedot5 Lisa materiaali. 5.1 Ristiintaulukointi
5 Lisa materiaali 5.1 Ristiintaulukointi 270. a) Aineiston koko nähdään frekvenssitaulukon oikeasta alakulmasta: N = 559. Tilastotieteen johdantokurssille osallistui yhteensä 559 opiskelijaa. Huomaa: Opiskelijoiden
LisätiedotHarjoitukset 2 : Monimuuttujaregressio (Palautus )
31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 2 : Monimuuttujaregressio (Palautus 24.1.2017) Tämän harjoituskerran tarkoitus
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
Lisätiedot4.2 Useampi selittävä muuttuja (kertausta)
14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat
LisätiedotPopulaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N
11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation
LisätiedotHierarkkisen aineiston mallintaminen ja otanta/pre-kurssi
Hierarkkisen aineiston mallintaminen ja otanta/pre-kurssi Risto Lehtonen, Helsingin yliopisto Metodifestivaali Jyväskylän yliopisto 27.5.2009 Keskiviikko 27.5 10-12 Hierarkkisuus otanta- asetelmaperusteisessa
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotTutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen
Tutkiva ja kehittävä osaaja (3 op) Kyselyaineisto keruumenetelmänä opinnäytetyössä Ismo Vuorinen 29.10.2009 Survey aineistot (lomaketutkimukset) Kyselyaineistot posti(kirje)kysely informoitu kysely tietokoneavusteinen
LisätiedotMuuttujien määrittely
Tarja Heikkilä Muuttujien määrittely Määrittele muuttujat SPSS-ohjelmaan lomakkeen kysymyksistä. Harjoitusta varten lomakkeeseen on muokattu kysymyksiä kahdesta opiskelijoiden tekemästä Joupiskan rinneravintolaa
LisätiedotMat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
LisätiedotRegressioanalyysi. Vilkkumaa / Kuusinen 1
Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,
LisätiedotMS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Todennäköisyyslaskennan kertaus Satunnaismuuttujat ja tn-jakaumat Tunnusluvut χ 2 -, F- ja t-jakauma Riippumattomuus Tilastotieteen
Lisätiedotpisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotRISTIINTAULUKOINTI JA Χ 2 -TESTI
RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotHieman linkkejä: http://cs.stadia.fi/~kuivanen/linux/kom.php, lyhyt ohje komentoriviohjelmointiin.
Linux-harjoitus 9 Linuxin mukana tulevat komentotulkit (mm. bash, tcsh, ksh, jne ) sisältävät ohjelmointikielen, joka on varsin tehokas ja ilmaisuvoimainen. Tähän yhdistettynä unix-maailmasta tutut tehokkaat
Lisätiedot1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi
LisätiedotTilastomenetelmien lopputyö
Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Johdatus monimuuttujamenetelmiin Luennot 30.10.13.12.-18 Tiistaina klo 12-14 (30.10., BF119-1) Keskiviikkoisin klo 10-12 (MA101,
LisätiedotMatemaatikot ja tilastotieteilijät
Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat
LisätiedotLaskelmia puoluekannatuksesta Seppo
Laskelmia puoluekannatuksesta Seppo 19.10.2011 Taustalla on luonnollisesti surveyaineisto. Sen tavoiteperusjoukko on itse vaaleissa 18+ -vuotias suomalainen rekisterin mukaan. Ulkomaalaisillakin on tietyin
Lisätiedot54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):
Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Logistinen regressioanalyysi Vastemuuttuja Y on luokiteltu muuttuja Pyritään mallittamaan havaintoyksikön todennäköisyyttä kuulua
LisätiedotOHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3
OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotTilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä
Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),
LisätiedotLuottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.
6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla
LisätiedotUsean selittävän muuttujan regressioanalyysi
Tarja Heikkilä Usean selittävän muuttujan regressioanalyysi Yhden selittävän muuttujan regressioanalyysia on selvitetty kirjan luvussa 11, jonka esimerkissä18 muodostettiin lapsen syntymäpainolle lineaarinen
LisätiedotMitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto
Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen
LisätiedotBOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali
BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto Metodifestivaali 28.5.2009 1 1 Mitä ihmettä on bootstrap? Webster: 1. a loop of leather or cloth sewn at the top rear, or sometimes on each side of a boot
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotTAPAUS-VERROKKITUTKIMUS
TAPAUS-VERROKKI TUTKIMUKSEN TYYPIT JA TULOSTEN ANALYYSI Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting.3.4.2007 TAPAUS-VERROKKITUTKIMUS Idea Tutkimusryhmät
LisätiedotMaahanmuuttajien terveys- ja hyvinvointitutkimus. Tutkimusprofessori Seppo Koskinen, THL
Maahanmuuttajien terveys- ja hyvinvointitutkimus Tutkimusprofessori Seppo Koskinen, THL Ulkomaalaistaustaisten suomalaisten määrä kasvaa nopeasti 1990 2011 Ulkomailla syntyneitä 65 000 266 000 (5 %) Vieraskielisiä
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.
Lisätiedot806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.
806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy 2012 1. Olkoon (X 1,X 2,...,X 25 ) satunnaisotos normaalijakaumasta N(µ,3 2 ) eli µ
Lisätiedotriippumattomia ja noudattavat samaa jakaumaa.
12.11.2015/1 MTTTP5, luento 12.11.2015 Luku 4 Satunnaisotos, otossuure ja otosjakauma 4.1. Satunnaisotos X 1, X 2,, X n on satunnaisotos, jos X i :t ovat riippumattomia ja noudattavat samaa jakaumaa. Sanonta
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
Lisätiedot(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa
Oulun yliopiston matemaattisten tieteiden tutkimusyksikkö/tilastotiede 805306A JOHDATUS MONIMUUTTUJAMENETELMIIN, sl 2017 (Jari Päkkilä) Harjoitus 3, viikko 47 (19.20.11.): kotitehtävät Ratkaisuja 1. Floridan
LisätiedotSPSS OPAS. Metropolia Liiketalous
1 Metropolia Liiketalous SPSS OPAS Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio 8 8.Korrelaatio
Lisätiedot1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi
Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,
LisätiedotMS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)
LisätiedotMS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)
MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12
LisätiedotSAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009
SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää
LisätiedotPienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto
Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja
LisätiedotFSD2404. Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen Koodikirja
FSD2404 Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen 1988-1997 Koodikirja TIETOARKISTO Tämän koodikirjan viittaustiedot: Naistutkimus - Kvinnoforskning -lehden ensimmäinen vuosikymmen
Lisätiedotr = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.
A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät
Lisätiedot1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...
JHS 160 Paikkatiedon laadunhallinta Liite III: Otanta-asetelmat Sisällysluettelo 1. Johdanto... 2 2. Todennäköisyysotanta... 2 2.1 Yksinkertainen satunnaisotanta... 3 2.2 Ositettu otanta... 3 2.3 Systemaattinen
LisätiedotI. Ristiintaulukointi Excelillä / Microsoft Office 2010
Savonia-ammattikorkeakoulu Liiketalous Kuopio Tutkimusmenetelmät Likitalo & Mäkelä I. Ristiintaulukointi Excelillä / Microsoft Office 2010 Tässä ohjeessa on mainittu ensi Excelin valinnan/komennon englanninkielinen
LisätiedotMediatutkimuskoulu 2009 Yleisimmät tunnusluvut
tutkimuskoulu 2009 Yleisimmät tunnusluvut Marja Ikonen 10.02.2009 tutkimuksista Yleistä Menetelmä ja haastattelujen määrä Vaihtelee: TNS Atlas: puhelin 20.000; kirje n. 8.000 TNS PäättäjäAtlas puhelininformoitu
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
Lisätiedot/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla
17.11.2016/1 MTTTP5, luento 17.11.2016 3.5.5 Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla likimain Jos X ~ Bin(n, p), niin X ~ N(np, np(1 p)), kun n suuri. 17.11.2016/2
Lisätiedot