Surveymetodiikka Helsingin yliopisto, Syksy 2012 Seppo Laaksonen



Samankaltaiset tiedostot
Surveymetodiikka Helsingin yliopisto, Syksy 2013 Seppo Laaksonen

Surveymetodiikka Helsingin yliopisto, Syksy 2011 Seppo Laaksonen

Surveymetodiikka Helsingin yliopisto, Syksy 2009 Seppo Laaksonen

Sosiaalitutkimuksen tilastolliset menetelmät, kevät 2012 Jakso 2: Päivä 1 Seppo Laaksonen

TILASTOLLINEN LAADUNVALVONTA

Johdatus diskreettiin matematiikkaan Harjoitus 7,

Luento 6. June 1, Luento 6

Luonnollisten lukujen laskutoimitusten määrittely Peanon aksioomien pohjalta

Matematiikan tukikurssi

Helsingin yliopisto, Syksy 2009 Seppo Laaksonen

Sähköpostiohjeet. Tehokas ja huoleton sähköposti

YKSILÖLLINEN ELÄMÄNSUUNNITTELU

Moodle HOPS-työskentelyn tukena

Empatiaosamäärä. Nimi: ********************************************************************************

monissa laskimissa luvun x käänteisluku saadaan näyttöön painamalla x - näppäintä.

II- luento. Etiikan määritelmiä. Eettisen ajattelu ja käytänteet. 1 Etiikka on oikean ja väärän tutkimusta

KiVa Koulu tilannekartoituskysely 2016 sivu 1/31. KiVa Koulu tilannekartoituskysely 2016 sivu 2/31. KiVa Koulu tilannekartoituskysely 2016 sivu 3/31

Tietoturva langattomissa verkoissa. Anekdootti

Sisällysluettelo. Kysymyksiä ja vastauksia (Q&A) - Sisäpiiriluettelot (MAR 18 artikla) MAR-asetukseen liittyvät tulkinnat ja kannanotot

MUUTOS 14! - Sosiaaliset kriteerit julkisissa hankinnoissa!

Epäyhtälön molemmille puolille voidaan lisätä sama luku: kaikilla reaaliluvuilla a, b ja c on voimassa a < b a + c < b + c ja a b a + c b + c.

Asukastoimikuntien lausuntojen yhteenveto käyttöarvon mukaisesta vuokrien tasauksesta

Henkilötietojen suojasta kiinteistökaupan verkkopalvelussa

String-vertailusta ja Scannerin käytöstä (1/2) String-vertailusta ja Scannerin käytöstä (2/2) Luentoesimerkki 4.1

OHJ-1151 Ohjelmointi IIe

Tytöt LVI-alalla - Perusraportti

Miten korkeakoulujen yhteishaun ja erillishakujen kokonaisuutta tulisi kehittää?

Perusopetuksen aamu- ja iltapäivätoiminnan laadun arviointi 2016 Västankvarns skola/ Tukiyhdistys Almus ry.

Opintotuen palauttaminen, peruminen ja lakkautus sähköisen muutosilmoituksen täyttöohje

Asukkaiden ääni Siun sotessa. Kuntalaiset keskiöön- seminaari /Heli Aalto

Aluksi Kahden muuttujan lineaarinen epäyhtälö

Mihin kotityöpalvelu perustuu asiakkaan kanssa tehtyyn sopimukseen

ZA4727. Flash Eurobarometer 194 (Urban Audit Perception Survey) Country Specific Questionnaire Finland

Työtapaturman ilmoittaminen 2016-> Uusi sähköinen lomake, täyttäminen esimies ja palkkahallinto

- Kommentoi koodisi. Koodin kommentointiin kuuluu kuvata metodien toiminta ja pääohjelmassa tapahtuvat tärkeimmät toiminnat. Esim.

Lisää segmenttipuusta

Kokemusasiantuntijan tarina. Kasvamista kokemusasiantuntijaksi

Antavatko Kelan standardit mahdollisuuden toteuttaa hyvää kuntoutusta työssä uupuneille ja mielenterveysongelmaisille?

KTKP040 TIETEELLINEN AJATTELU JA TIETO

Ajankohtaista laboratoriorintamalla Pasila Emilia Savolainen, Suunnittelu- ja ohjausyksikkö

Matematiikan tukikurssi

Algoritmit ja tietorakenteet Copyright Hannu Laine. 1, kun n= 0. n*(n-1)!, kun n>0;

Hyvä vesihuoltohanke, suunnittelijan näkökulma

Lapin innovaatioassistentti -valmennuskokonaisuus 2016

Induktio kaavan pituuden suhteen

TIKKAKOSKEN ALUEEN VARHAISKASVATUSSUUNNITELMA

2.2 Täydellinen yhtälö. Ratkaisukaava

Eksponenttifunktion Laplace muunnos Lasketaan hetkellä nolla alkavan eksponenttifunktion Laplace muunnos eli sijoitetaan muunnoskaavaan

Info B2: Global Mindedness -kysely. Muuttaako vaihto-opiskelu opiskelijoiden asenteita ja voiko muutosta mitata? Irma Garam, CIMO

Pohjoismainen työturvallisuusilmapiirikyselylomake

Mielestämme hyvä kannustus ja mukava ilmapiiri on opiskelijalle todella tärkeää.

Tämä opas on tarkoitettu opettajaylläpitäjille, jotka eivät ole ennen käyttäneet TwinSpacea. Neuvomme, kuinka:

Windows Live SkyDrive - esittely

Itä-Suomen. työturvallisuuskilpailu. Kuopio Iso-Valkeinen

Tilintarkastusyhteisön valvontatiedot 1 (4)

TimeEdit henkilökunnan ohje

Toimialan ja yritysten uudistuminen

Mitä lapsen tulisi varhaiskasvatuksesta saada? Leikki-ikäisen hyvän kasvun eväät MLL Helsinki Marjatta Kalliala

Jäsenluettelo ja henkilörekisterit. Olli Välke Opintokeskus Visio

Onnistunut liikkumissuunnitelma - ohjeet liikkumissuunnitelman tekemiseen

MIELENTERVEYSTYÖN OMAISSEMINAARI

Imputoi puuttuvat kohdat

Esimerkkejä derivoinnin ketjusäännöstä

Väli- ja loppuraportointi

Tutkimusdatanhallinnan suunnittelu ja DMPTuuli-työkalu

Lupapiste-palvelua koskeva Yritystilisopimus

Esityksen tiivistelmä Elina Hiltunen

Lue ohjeet huolellisesti ennen laitteen käyttöä.

Huomaathan, että ohjeessa olevat näytöistä otetut kuvat voivat poiketa sinun koulutuksesi vastaavien sivujen kuvista.

Painotusmenetelmät survey-datalle Helsingin yliopiston lyhytkurssi, kevät 2009 Seppo Laaksonen

Outlook Microsoft Outlook 2007 PIKAOHJE: SÄHKÖPOSTIN UUSI ILME. Kieliversio: suomi Materiaaliversio 1.0 päivitetty

Ratkaisuehdotukset Kesäyliopisto Kuvassa on esitetty erään ravintolan lounasbuffetin kysyntäfunktio.

Prosessit etyön kehittämisessä

EUROOPAN YHTEISÖJEN KOMISSIO. Ehdotus: NEUVOSTON ASETUS. neljännesvuosittaista julkista velkaa koskevien tietojen laatimisesta ja toimittamisesta

Suomen Lions-liitto ry Käyttäjätunnus ja sisäänkirjautuminen MyLCI - Käyttäjäohje Versio

Joukkoistuuko työ Suomessa ja mitä siitä seuraa?

Asia T-237/00. Patrick Reynolds vastaan Euroopan parlamentti

Oletetaan, että funktio f on määritelty jollakin välillä ]x 0 δ, x 0 + δ[. Sen derivaatta pisteessä x 0 on

Nimi ja yhteystiedot (osoite, puhelin ) Suoma Sihto Osaston johtaja Liikennejärjestelmäosasto HSL

SEURAKÄYTTÄJÄN OHJEITA PELIPAIKASSA

Sähköpostiosoite: Postiosoite: PL HELSINGIN KAUPUNKI

PÄIHDEHAASTATTELU osio 2 - Päihdekartoitus

Hae Opiskelija käyttöohje

Esitelmä saattohoidosta

KUNTIEN ROOLI MUUTOKSESSA Vaikuttamisiltapäivä ja EK-foorumi 3.2.

Asiakaspalvelun uusi toimintamalli autetaan asiakasta digitaalisten palveluiden käytössä (AUTA)

TieVie-hanke Saksan kieli. Ritva Huurtomaa

REKISTERISELOSTE Henkilötietolaki (523/99) 10

Sosiaalisten verkostojen data

PÄÄASIALLINEN SISÄLTÖ

Valtion varoista maksettava. korvaus rikoksen uhrille. Valtion maksama. korvaus rikoksen uhrille. Ennen vuotta 2006 rikoksella aiheutetut vahingot

KAMPANJAOHJEISTUS 2017 VIRKOIHIN

YLIOPISTOARVOSANOJEN LINJA. Opetussuunnitelma

Syksyn aloituskampanjat lippukunnissa

Dynaamisen järjestelmän siirtofunktio

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

Tarjoajalla on oltava hankinnan kohteen laatu ja laajuus huomioon ottaen kokemusta seuraavilla alueilla:

Lausuntopyyntö STM 2015

Yrityssuomi.fi:n toiminnallisuus ja ontologian hyödyntäminen Yritys-Suomen verkkopalveluissa. Eeva Koivisto, Yritys-Suomen verkkotoimitus 1.11.

Usein kysytyt kysymykset

Transkriptio:

Surveymetodiikka Helsingin yliopisto, Syksy 2012 Seppo Laaksonen Tämän materiaalin copyright on tekijän. Sitä voi käyttää asianmukaisella viittauksella (sivut jos tarkempi viittaus on tarpeen). Laajempi versio on nettikirjana nimellä mikä sopii myös lähdeluetteloon; jos viittaat johonkin kohtaan, sivunumerot tai luvun nimi on paikallaan mainita: Laaksonen, Seppo (2010). Surveymetodiikka. Ventus Publishing. http://bookboon.com/fi/student/statistics 1 12.9.2012 SurveyMetodiikka 2012 Seppo 1

Surveymetodiikka Helsingin yliopisto, Syksy 2012 Seppo Laaksonen Luennot joihin sisältyy keskustelua, pieniä ryhmätöitä ja kysymyksiä: Keskiviikkoisin Porthaniassa P673, alkaen 12.9. klo 16.15 ja jatkuen noin kolme luentotuntia. Luennot pidetään suurin piirtein yhteen menoon, tarvittaessa pieni hengähdystauko. Istunto päättyy siten hieman yli puoli seitsemän. Torstaisin pidetään harjoituksia (paitsi yksi poikkeus). On kaksi vaihtoehtoista aikaa ja paikkaa. Näistä voi valita sopivimman sillä ehdolla että tilan kanssa ei tule vaikeuksia. Toivon sopeutumista siinä tapauksessa, esimerkiksi kaksi henkilöä voi olla samallakin koneella. Ajat joko klo 12-14 (Aleksandria K131) tai klo 16-18 (Exactum C128). Poikkeus on että ekakerta on maanantaina klo 16-18 samassa paikassa. 12.9.2012 2 SurveyMetodiikka 2012 Seppo 2

Mikroluokkaharjoituksissa käydään osa luentomateriaalista mahdollisimman konkreettisesti läpi eli siis oikeita aineistoja hyväksi käyttäen. Harjoituksissa voimme myös keskustella luennoilla esillä olleista aiheista. Minulta voi toki kysyä myös sähköpostitse epäselvistä tai muista tärkeistä aiheista, ja kommentoida esittämääni. Harjoitustehtävien määrää ei vielä tarkasti tiedetä. Yksittäiset tehtävät ovat aika pienimuotoisia joitain poikkeuksia lukuun ottamatta. Ne kyettäneen tekemään pääosin harjoitusten aikana, mutta kokemattomammalta voi vaatia hieman muutakin aikaa. Luultavasti on niin, että lähetän sähköpostilla tehtävät ennen harjoituksia ja sitten niitä ryhdytään käymään siis läpi. Alussa on oleva ihan helppoja mutta tärkeitä orientointitehtäviä. 3 12.9.2012 SurveyMetodiikka 2012 Seppo 3

Mikroluokkaharjoituksissa Kaikkiin tehtäviin vastataan raportin muodossa. Voin katsoa kunkin suorituksia kurssin aikana mutta lopussa odotan koko pakettia kerralla spostilla lähettäen minulle. Tavoiteaika lähettämiselle on ennen koetta eli 31.10. mutta joustoa löytynee tarvittaessa. Jos kaikkia osia ei aio tehdä kurssista, niin vastaavat harjoitukset voi myös jättää väliin. Saalis on silloin vähemmän kuin 8 opintopistettä. Selostan ensimmäisissä harjoituksissa raportointitavan periaatteet. Toki jokainen voi kehittää näistä vielä upeampia ratkaisuja. 4 12.9.2012 SurveyMetodiikka 2012 Seppo 4

Surveymetodiikka aihepiirit kirjan mukaan Kirjan rungon sisällys 1. Mitä tarkoitan surveyllä 2. Surveyn vaiheet 3. Tiedonkeruu ja lomakesuunnittelu 4. Survey-aineiston peruskäsitteistö 5. Otantamenetelmät 6. Otantamenetelmien tekniikkaa 7. Yksinkertaista estimointia ja otantaasetelmavaikutus 8. Otoskoko 9. Puuttuneisuus 10. Tilastollinen Editointi 11. Uudelleenpainotus 12. Imputointimenetelmät 13. Puhdistettu surveyaineisto Liitteet Esimerkkisurveyden liite Asteikko- ja muunnosliite Lomakeliite Analyysiliite Sanastoliite Myös liitteet kuuluvat kurssiaineistoon. Aluksia katsomme erityisesti Asteikko- ja muunnosliitettä. 5 12.9.2012 SurveyMetodiikka 2012 Seppo 5

Mikä on survey? 1 Surveytutkimuksella tai surveyllä tarkoitan kyselyä tai tiedustelua, jossa tiedon antaa tai siitä vastaa ihminen. Se ei tule siis suoraan esimerkiksi koneesta. Tiedon ei toki tarvitse koskea ihmistä itseään, vaan kysymykseen tulevat esimerkiksi yritys, kunta, jokin muu maantieteellinen alue tai ihmisten muodostama kokonaisuus kuten kotitalous tai perhe sekä myös ihmisen jokin osa. Tämä on varmaankin hieman epämääräinen määritelmä, mutta selkenee kurssin aikana. Yleisesti ottaen oma määritelmäni on laaja, laajempi kuin monen muun. Siten esimerkiksi väestörekisteri on minusta surveytietoa, sillä se kerätään ihmisten itsensä (vaikkapa muuttoilmoitus) tai heidän edustajiensa (syntymän tai kuoleman tai avioliiton vahvistaja) kautta. Kun se on rekisterissä, se ei ehkä enää näytä surveytiedolta mutta on sitä. Tällainen rekisteritieto on periaatteessa täysin oikeata mutta takeita ei ole onko se päivitetty ajan tasalle. Asenteita tai muuta ei-faktatietoa sen sijaan ei rekisteröidä eikä vastaaja itse aina muistane jälkeenpäin mitä on kertonut kyselijälle esimerkiksi koskien sitä, kuinka kauan aikaa on käyttänyt television ajankohtaisohjelmien katseluun viime aikoina? 6 12.9.2012 SurveyMetodiikka 2012 Seppo 6

Alphabetic List of Variables and Attributes # Variable Type Len Format Informat Label 42 AALUE Char 4 Äänestysalue 57 AEPV Char 8 Avioeropäivä 14 AMMS Char 35 Ammattinimike 53 BLKM Char 2 Biol. lasten lkm 9 EDKANS Char 3 Edellinen kansalaisuus 50 EKATUOS Char 50 Edell. katuosoite 51 EKATUOSN Char 7 Edell. osoitenumero 17 EN Char 50 Etunimet 52 EPOSNO Char 5 Edell. postinumero 16 ESN Char 20 Entinen sukunimi 2 HT Char 11 Henkilötunnus 28 HUKO Char 2 Huoneiston käytössäolo 31 HUONEL Char 2 Huoneluku 29 HUPA Char 3 Huoneiston pinta-ala 27 HUPE Char 1 Huoneistotiet. peruste 40 HUTIVAR Char 5 Huoneiston varusteet 30 HUTY Char 1 Huoneistotyyppi 35 IKOORD Char 6 I-koordinaatti 6 KANS1 Char 3 Kansalaisuus 7 KANS2 Char 3 Kansalaisuus - 2 8 KANS3 Char 3 Kansalaisuus - 3 10 KANSS Char 10 Kansalais. selväkielisenä Alkuosa Väestöreskisterin muuttujista 12.9.2012 7 SurveyMetodiikka 2012 Seppo 7

Mikä on survey? 2 Survey-aineiston kuten monen muunkin tilastoaineiston keruussa hyödynnetään yleisesti otantaa. Tämä merkitsee sitä, että ainakin osa aineiston tilastoyksiköistä on poimittu otannalla. Otannan käytön luonnollisia syitä ovat kustannusten pienentäminen ja tietojen nopeampi käyttöönotto sekä myös, että tutkittava joukko eli perusjoukko on usein epätarkasti etukäteen hahmotettavissa, ja tiedot siitä kerättävissä. Kaikissa tilanteissa kuitenkin tavoitteena on tuottaa tuloksia jonkin perusjoukon tasolle. Tilastotieteen näkökulmasta tässä on kysymys estimoinnista. Estimointi pitää olennaisena osana sisällään myös tuloksen eli estimaatin epävarmuuden mittaamisen (keskivirhe, luottamusväli, ). Kysely tai tiedustelu voidaan toteuttaa vaihtelevin välinein, kuten postitse, puhelimitse (sekä kiinteällä että kuljetettavalla), käyntihaastatteluin tai sähköisen viestimen kuten netin/webin avulla. Kaikissa tapauksissa vastaus pyrkii kuvaamaan halutun tilastoyksikön ominaisuuksia. Toki on kyselyjä, joissa ei ole erityisiä estimointitavoitteita mutta niistä en juurikaan puhu tällä kurssilla, ehkä joskus kritisoin. 8 12.9.2012 SurveyMetodiikka 2012 Seppo 8

Surveymetodiikka Keskeiset aineistot: - European Social Survey (ESS), ks. www.europeansocialsurvey.org: Lomakkeen tutkimiseen, otannan tarkasteluun, tiedoston luontiin ja analyysiin. Uusimmat tiedot ovat kierrokselta (ROUND 5) mikä koskee vuosien 2010 ja 2011 tiedonkeruita (maasta riippuen mikä ajankohta). - PISA (Programme for International Student Assessment of the OECD), ks. http://www.pisa.oecd.org/ Otantakin käydään läpi mutta painotus on analyysissä. Uusin PISA on vuodelta 2009 ja tätä varmaan eniten katsellaan. -TNS Gallupin aineisto (jota en jaa mutta näytän) - KatuMetro-tutkimus jossa käytetään myös ruutuaineistoja eli 250mx250m ruutuja Helsingistä ja lähikunnista. Tämä on aika uutta maailmassa. - Etiopian surveyden aineiston luonnin periaatteet - Ajankohtaisia esimerkkejä kun tullee mediasta esille - Osanottajien esimerkkejä (olisi mukava saada) 9 12.9.2012 SurveyMetodiikka 2012 Seppo 9

2. Surveyn vaiheet Aluksi täsmennän surveyn eli tilastollisen luotauksen käsitteistöä laajalla luettelolla sen vaiheista. Järjestys on peruslinjaltaan toimintajärjestys mutta käytännössä monia kohtia toteutetaan samanaikaisesti tai useissa jaksoissa. On luonnollista, että lukija ei tässä vaiheessa jokaista käsitettä ymmärrä. Se ei ole haitaksi. Luettelosta saa kuitenkin mielikuvan kokonaisuudesta. Palaa tähän osaan aika ajoin uudelleen kun olet oppinut sen käsitteitä ja niihin liittyviä sisältöjä. A.Tavoitteiden määrittely tutkimukselle ja sen pohjalta tarvittavalle surveylle ja aineistolle. On huomattava että useimmat tutkimukset sisältävät paljon muutakin kuin surveyn. Eli survey voi olla vain pieni mutta tärkeä osa koko hanketta. B. Survey-asetelman määrittely, johon sisältyvät periaatteessa kaikki jatkossa olevat kohdat, osaa kohdista ei vielä tässä vaiheessa kyetä määrittelemään tarkasti eli asetelmaa täsmennetään ja jopa muutetaan hankkeen aikana. C. Tavoiteperusjoukon määrittely: tämä on tehtävä mahdollisimman täsmällisesti ja asiakkaan tarpeisiin mahdollisimman hyvin vastaten ja tämän kanssa keskustellen. Tätä ennen tutkijalla on mielessään kiinnostusperusjoukko joka realisoidaan tavoiteperusjoukoksi. D. Kehikkoperusjoukkopohjan määrittely ja itse kehikon luonti ml. tarvittavien apumuuttujien luonti ja niiden arvojen sisällyttäminen kehikkoon tai muuhun tiedostoon jatkokäyttöä varten. Hyvin tyypillinen ongelma on, ettei heti aluksi kerätä mahdollisia potentiaalisesti hyödyllisiä apumuuttujia aineistoon. Myöhemmin niiden hakeminen samastakin lähteestä voi tulla kalliimmaksi ja käytännössä hankalammaksi. Kehikkoperusjoukko päivitetään mikäli mahdollista estimointivaiheessa. 12.9.2012 SurveyMetodiikka 2012 Seppo 10

2. Surveyn vaiheet jatkuu E. Otanta-asetelman määrittely jos käytetään otantaa. Pyrkimys on saada kuhunkin tilanteeseen mahdollisimman yksinkertainen ja hyvin hallittavissa oleva asetelma. Tämä ei tarkoita sitä etteikö olisi hyvä fokusoida otosta surveyn tavoitteiden mukaan. Taustalla on efektiivisen otoskoon käsite. Tältä pohjalta määritellään brutto-otos. F. Tiedonkeruun suunnittelu mukaan lukien tarvittava kenttätyö, tiedonkeruumuodot, kustannukset, tietosuojakysymykset ja onko tarkoitus toistaa tutkimusta. Toistaa voidaan sekä poikkileikkaus- että pitkittäismielessä. Jälkimmäinen on vaativampi. G. Tietosisällön määrittely ja operationalisointi lomaketasolle ottaen huomioon ajatellun tiedonkeruutavan tai useita samallekin surveylle. Tämä tapahtuu tutkimustiimissä mikä voi olla laaja verkko, mutta vielä ei kontaktoida tutkimusyksikköjä. H. Lomakkeen ja tiedonkeruujärjestelmän testaus (pilottitutkimukset) sekä parannukset tiedonkeruujärjestelmään ja lomakkeeseen. Alkutestaus tehdään omassa piirissä mutta myöhemmin kontaktoidaan tutkimusyksiköitä sekä keruuta toteuttavia tahoja. I. Otanta ja ensimmäisen vaiheen otanta-aineiston luonti: Otanta-asetelman pohjalta poimitaan joko valmiina olevasta lähteestä (rekisteri tai vastaava) tai kenttätyöhön yhteydessä kun yksikkötason kehikkoa ei ole. Tässä vaiheessa muodostetaan myös ensimmäisen vaiheen otantatiedosto joka kattaa koko bruttootoksen. Tähän sisältyy myös kaikki saatavissa oleva aputieto otoskehikkolähteestä. 12.9.2012 SurveyMetodiikka 2012 Seppo 11

2. Surveyn vaiheet jatkuu J. Tiedonkeruu organisoidusti ja tehokkaasti, tarvittaessa virheitä korjaten saadun palautteen (esim. haastattelijoilta) pohjalta. K. Tiedontallennus (jos mahdollista yhtäaikaisesti tiedonkeruun kanssa) ainakin siten, ettei mahdottomia tietoja tiedostoon synny siis tallennukseen yhdistetään mikäli mahdollista ensi vaiheen tilastollinen editointi, ja mikäli mahdollista kohtuullisesti automatisoituna (tallennusohjelma on siis intelligentti). L. Otantatiedoston viimeistely. Tiedosto siis kattaa brutto-otoksen ja sisältää otanta-asetelmassa käytettyjen muuttujien lisäksi muuta ulkopuolelta saatua aputietoa sekä kenttätyön yhteydessä kerättyä. Luonnollisesti myös surveyn tulostiedot ovat mukana eli ketkä vastasivat, ketkä eivät ja mistä syystä sekä ylipeiton. Aputietoa voidaan kerätä vielä lisää vaikkapa rekistereistä tai tilastoista. Myös kehikon päivitystiedot on syytä sisällyttää otantatiedostoon. On mahdollista että lisää aputietoa saadaan myöhemmin, jolloin otantatiedostoa yhä päivitetään. M. Tilastollisen editoinnin systemaattiset muodot. Toteutetaan yleensä integroidusti imputoinnin kanssa. Tähän liittyy myös linjaus siitä mihin editointi painottuu ellei resurssien puitteissa ole mahdollista tehdä kaikkea yhtä laadukkaasti. Edelleen sen yhteydessä saadaan tietoa koko surveyprosessin evaluointiin, ja siis oppimiseen seuraavia surveytä varten. N. Puuttuvien tietojen käsittely siten että erottuvat muiden muassa nollatieto, puuttuva tieto ja mahdoton tieto. 12.9.2012 SurveyMetodiikka 2012 Seppo 12

2. Surveyn vaiheet jatkuu O. Imputointi eli puuttuvien tietojen paikkaus ja lisäeditointi jos tarpeen. P. Otos- ja muiden painojen muodostaminen aputietoja hyödyntäen. Q. Aineiston asentaminen mahdollisimman käyttökelpoiseen muotoon sen analyysiä ja muuta jatkokäyttöä varten. Tällöin muodostetaan yksi tai useampi elektroninen tiedosto. Yleensä on hyvä tehdä tiedostomuoto jossa sitä tullaan eniten käyttämään, esimerkiksi SAS-, SPSS- tai Stata-tiedosto, mikseipä Excel:kin, ja lisäksi sellainen, josta se on luettavissa melkein millä välineellä tahansa myös tulevaisuudessa (tekstitiedosto plus sen lukuohjelma em. tiedostoille). Huomaa että hyvä tiedosto sisältää myös dokumentoinnin ja mahdollisimman kätevässä muodossa, käyttäen hyväksi sekä metatietoa että paratietoa. Näin sinulla on PUHDISTETTU surveyn mikroaineisto eli sellainen jota voidaan ilman huolia ryhtyä analysoimaan otanta-asetelma oikein huomioiden. 12.9.2012 SurveyMetodiikka 2012 Seppo 13

3 Survey-aineiston peruskäsitteistö Lähden liikkeelle perusjoukon käsitteestä. Survey-tutkimuksessa perusjoukko ei ole yksikäsitteinen, vaan tarvitaan viisi käsitettä. Ensimmäistä, alimman tason käsitettä, kutsun kiinnostusperusjoukoksi. Tällainen tutkijaryhmällä on väistämättä mielessä heti hankkeen alussa. Se on ensin aika yleinen mutta pikku hiljaa täsmentyy. Kun täsmentyminen on edennyt riittävän pitkälle, ollaan valmiita määrittelemään kaikkien empiiristen havaintojenkeruututkimusten avainkäsite eli se joukko, jota todella yritetään tutkia vaikkei ole takeita että sen avulla saadaan kiinnostusperusjoukko hyvin haltuun. Tällaista kutsutaan tavoiteperusjoukoksi tai myös ideaali- tai ihanne- tai kohdeperusjoukoksi. On huomattava, että tämän ei tule olla niin ideaali tavoitejoukko, että sitä ei mitenkään voida kunnolla tavoittaa. Siis sen tulee olla silti realistinen ja jo mahdollisimman tarkasti rajattu ja aikaan sidottu. Kun tavoiteperusjoukko on valittu ja määritelty, kiinnostusperusjoukko voidaan joksikin aikaa unohtaa. 12.9.2012 SurveyMetodiikka 2012 Seppo 14

4 Survey-aineiston peruskäsitteistö jatkuu Tavoiteperusjoukkoa yritetään lähestyä käyttämällä sopivaa kehikkoa eli etsimällä paras mahdollinen kehikkoperusjoukko, josta poimitaan kaikki tai osa haluttua tiedustelua varten. Kehikkoperusjoukon yksikkö voi olla esimerkiksi henkilö, yritys, kunta, kotitalous, eläin, aika tai alue. Se ei tavallisesti ole saatavissa samalta ajankohdalta kuin miltä itse tiedustelu halutaan tehdä (paitsi jos on aika kehikkona), vaan enemmän tai vähemmän aikaisemmalta ajalta. Sen vuoksi kehikko usein muuttuu ja tarvitaan kolmas perusjoukko eli päivitetty kehikkoperusjoukko, jota käytetään estimoinnissa hyväksi. Lopulta keräämme itse aineiston, jonka pohjalta me voimme muodostaa ns. tutkimusperusjoukon. 12.9.2012 SurveyMetodiikka 2012 Seppo 15

5 Survey-aineiston peruskäsitteistö jatkuu Tavoiteperusjoukon ja tutkimusperusjoukon yksiköt ovat ainakin joltakin osin samoja, kutsun niitä tutkimusyksiköiksi. Tutkimusyksiköitä voi olla useanlaisia samassa surveyssä, kuten esimerkiksi - kotitaloussurveyssä kotitaloudet ja kotitalouden jäsenet tai - yrityssurveyssä yritykset ja yritysten työntekijät. Huomautus: Tavoiteperusjoukkoja ja myös kehikkoperusjoukkoja voi samassa surveyssä tarvita useampiakin kuin yksi. Esimerkiksi palkkatutkimuksessa sekä yritysten palkat että työntekijöiden palkat voivat olla kiinnostavia. Kehikkoja tarvitaan useiden maiden ESS:issä useita: Luettelo kunnista tai muista alueellisista hallintoyksiköistä, luettelo osoitteista joissa tavoiteperusjoukon jäseniä saattaa asua ja lopulta luettelo itse jäsenistä eli ESS:n tapauksessa 15+ -ikäisistä maassa asuvista ihmisistä (ei siis kansalaisista). Suomen väestörekisteristä päästään sen sijaan suoraan noihin ihmisiin edellyttäen ettei mitään virhettä rekisterissä ole. 12.9.2012 SurveyMetodiikka 2012 Seppo 16

6 Survey-aineiston peruskäsitteistö jatkuu Kehikon tai päivitetyn kehikon yksiköt voivat sen sijaan erota olennaisestikin tavoiteperusjoukon yksiköistä. Kehikosta voimme erottaa kahdenlaisia yksiköitä, toisaalta poimintayksiköitä joita käytetään tiedustelun otoksen poiminnassa, ja toisaalta keruuyksiköitä (joiden sisältä voi vielä löytyä eri raportoijat eli raportointiyksiköt) joilta tiedot kerätään. Keruuyksiköitäkin voi olla useanlaisia samassa tiedustelussa. Poimintayksiköiden ja tutkimusyksiköiden erot havainnollistuvat paremmin otannan yhteydessä. Kaikkien viiden perusjoukon ollessa samat tilanne on helppo. Käytännössä näin ei ole vaan löytyy virhetekijöitä, joista -kehikkovirheitä ovat alipeittävyys (alipeitto), ylipeittävyys (ylipeitto), ja luokitteluvirheet kehikkojen osalta; myös kehikon aito muutos voidaan eritellä tätä kautta -vastauskatoa löytyy toisaalta yksikkö- ja toisaalta erä- eli muuttujatasolta (yksikkövastauskato ja erävastauskato). Yksikkövastauskato tarkoittaa yksikköjä joista ei saada mitään tietoa itse kyselyssä mutta kehikkotasolta tietoja on. Myös täysin epäkelpo vastaus voidaan luokitella tähän ryhmään. Erävastauskato tarkoittaa vastauksen puuttumista yksittäisen muuttujan osalta. 12.9.2012 SurveyMetodiikka 2012 Seppo 17

7 Survey-aineiston peruskäsitteistö jatkuu Edellä survey on yksitasoinen. Jos tiedustelu on useampitasoinen eli tutkimusyksiköitä on hierarkkisesti useampia, voi hyvinkin olla niin, että vastaus saadaan ylemmältä tasolta, esimerkiksi perheen tai palvelusyksikön tasolta, mutta yksi tai useampi vastaus jää puuttumaan seuraavaksi alemmalta tasolta, esimerkiksi koskien perheen jäseniä tai palveluyksikön työntekijöitä tai asiakkaita. Vastaavasti voidaan puhua ensimmäisen ja toisen asteen tai tason vastauskadosta. Vielä erityisempi on tilanne jos vastauskadon tarkemmaksi tutkimiseksi on päätetty ottaa (osa)otos vastaamattomista ja tiedustella näiltä joitakin avainkysymyksiä tai kenties koko lomake mutta käyttäen parempaa tiedustelumenetelmää kuin aikaisemmassa vaiheessa (esim. jos perustiedustelu on postitiedustelu, tämä erityistiedustelu voidaan hoitaa käyntihaastattelulla). Tällöin on kyseessä kaksivaiheinen surveytutkimus. Kaksivaiheinen tutkimus voidaan tehdä myös muista syistä, esimerkiksi tekemällä suppea tiedustelu isolle joukolle ja samalla kartoittaa ilmiötä karkeasti, ja toisessa vaiheessa laajempi tiedustelu suppealle joukolle, jonka otos voi olla kohdennettu tutkimuksen päätavoitteiden mukaan. 12.9.2012 SurveyMetodiikka 2012 Seppo 18

8 Survey-aineiston peruskäsitteistö jatkuu Otospohjaisen surveyaineiston kuvaus _ Poikkileikkausaineisto 12.9.2012 SurveyMetodiikka 2012 Seppo 19

9 Survey-aineiston peruskäsitteistö jatkuu Muuttujat Surveyaineistossa varsinaisia muuttujia on kahta tyyppiä, ns. X-muuttujia eli apu- tai lisämuuttujia ja Y-muuttujia eli tulos- tai tutkimusmuuttujia. Jälkimmäiset on tyypillisesti kerätty tässä surveyssä, mutta mukana voi olla muuttujia myös aikaisemmista tiedusteluista. Ne ovat siis analyysissä suurimman kiinnostuksen kohteena, mutta toki X-muuttujiakin voi käyttää tulosmuuttujina. X-muuttujia voi olla monenlaisia. Kuviossa niitä on esitetty kahdenlaisia: (i) sellaisia joita käytetään otannassa ja (ii) muita. Otannan X- muuttujat ovat väistämättä saatavissa (kehikko)perusjoukon tasolta. Muutkin apumuuttujat voivat olla tältä tasolta mutta usein riittävää on hankkia ne brutto-otoksen tasolta, siis koskien myös vastaamattomia. Y-muuttujat ovat pääsääntöisesti siis kerättyjä mutta mukana voi olla myös muuttujien luonnetta kuvaavia muuttujia. Yksi tyyppi näitä ovat ns. lippumuuttujat joilla kerrotaan aineiston ja eri muuttujien ominaisuuksista, jolleivät ne muuten ilmene valistuneelle lukijalle. Esimerkiksi, että tällainen muuttuja voi kertoa että arvo on imputoitu, epävarma, korjattu tai ennustettu. Lippumuuttuja on esimerkki paradatasta. Itse lippua koskeva tieto on metadataa. 12.9.2012 SurveyMetodiikka 2012 Seppo 20

10 Survey-aineiston peruskäsitteistö jatkuu Muuttujat Oma erikoislajinsa muuttujia ovat tiedonkeruuseen liittyvät tiedot. Edellä on jo mainittu merkinnät joita haastattelija tekee tiedostoon koskien vastauksen uskottavuutta tai epävarmuutta. Myös haastattelun ajankohta ja kesto on hyvä merkitä aineistoon, kuten myös haastattelijaa itseään koskevat tiedot. Luonnollisesti haastattelun tulos myös merkitään ja se kuinka monta kertaa on yritetty vastaajaa tavoittaa ja suostutella tutkimukseen. Tämäntyyppistä tietoa kutsutaan nykyään paradataksi. Sillä on suuri merkitys tiedon laadun arvioinnissa ja tulevien tiedustelujen kehittämisessä. Toinen tietotyyppi on metadata joka tarkoittaa tietoa tiedosta. Kyse on siis hyvästä tiedon dokumentoinnista ja mielellään sellaisesta että se voidaan kätevästi hyödyntää aineiston käsittelyssä. Palaan sekä para- että metadataan esimerkeillä useita kertoja. Harjoitusten ekakerrallakin ne tulevat esille. 12.9.2012 SurveyMetodiikka 2012 Seppo 21

Käsitteiden lisätarkasteluja: Paneliaineisto 1 Edellä oleva kaavio on poikkileikkausaineistosta. Se on perustyyppi mutta yhtä tärkeitä ovat myös pitkittäisaineistot joita on kahta päätyyppiä. Kummassakin on tietoa samasta tilastoyksiköstä eri ajankohtina. (i) Retrospektiivinen eli taaksepäin suuntautuva paneli tai tutkimus Tässä aineisto tuotetaan jälkikäteen kysymällä tietoja vastaajien menneestä historiasta. Ongelmana on muun muassa muistin pettäminen, mistä syystä menneitä muistoja voidaan kullata tai päinvastoin mustamaalata. Retrospektiivinen näkökulma on kuitenkin erittäin yleinen, koska surveyllä on käyttökelpoista kysellä edeltävistä ajoista. Esimerkiksi kulutustutkimuksissa on tapana pyytää arvioita viimeisen viikon, kuukauden tai vuoden kulutuksesta. Myös palkka- ja tulotietoja kysytään edeltäviltä ajankohdilta. Kysymyslomakkeiden suunnittelijan olisi hyvä löytää mahdollisimman oikean pituinen edeltävä periodi (viiteaikaväli, referenssiperiodi) siten, että estimaatti itse olisi luotettava ja että muistivirhe olisi mahdollisimman pieni. 12.9.2012 SurveyMetodiikka 2012 Seppo 22

Käsitteiden lisätarkasteluja: Paneliaineisto 2 (i) Retrospektiivinen eli taaksepäin suuntautuva paneli Retrospektiivinen tutkimus voi mennä kauaskin taaksepäin. Sukupolvitutkimuksissa voidaan esimerkiksi kysyä henkilöhistorian avainkohtia (avioituminen, eroaminen, lasten syntymät, leskeytyminen ja muut kuolemat perheessä, muuttaminen) kymmenien vuosien takaa. Kohtuullinen luotettavuus on mahdollista jos haastateltavan kanssa on saavutettu hyvä luottamus. Vaikka retrospektiivisen tutkimusasetelman viiteaikavälit ja muut asetelmatekijät onnistuttaisiinkin saamaan hyviksi tai vaikka vieläpä tutkimus käyttäisi faktatietoa esimerkiksi rekistereistä, tämä lähestymistapa ei ole ongelmaton. Syynä on, että alkuperusjoukko (se mistä lähdetään seuraamaan tilannetta taaksepäin) voi olla harhainen tutkimusasetelman kannalta, sillä retrospektiivisessa tutkimuksessa on myös aineisto harhautunut, koska se kerätään joukosta jotka ovat eräänä ajankohtana käytettävissä. Siten kiinnostavia ja ilmiön kannalta tärkeitä yksiköitä voi olla mukana epäedustavasti. 12.9.2012 SurveyMetodiikka 2012 Seppo 23

Käsitteiden lisätarkasteluja: Paneliaineisto 3 (ii) Prospektiivinen eli eteenpäin suuntautuva paneli (seurantatukimus) Puhdas tai jatkuva paneli tai kohorttitutkimus, jolloin tiettyä aluksi valittua joukkoa seurataan tietty aika. Aineisto yleensä supistuu joko ylipeiton (panelikuoleman) tai vastauskadon johdosta. Tämä johtaa sitä jännittävämpiin tilanteisiin mitä monimutkaisempi on tutkittava ja seurattava yksikkö. Rotatoiva paneli, jolloin aineistoa täydennetään määrävälein ja osa alkuperäisistä vapautetaan. Tämän strategian tarkoitus on että aineistosta voitaisiin kohtuullisesti estimoida sekä poikkileikkaus- että muutostietoja. Edellisten sekoitus (sekapaneli), jolloin toisaalta seurataan tiettyä joukkoa ja toisaalta poimitaan riippumaton rinnakkaisaineisto, jolloin jälkimmäisestä saadaan poikkileikkaustiedot luotettavasti ja edellisestä muutostiedot. Kaikista näistä voidaan muodostaa tasapainotettu (balanced) paneli, jolloin mukaan hyväksytään vain ne joista on tietoja jokaiselta ajankohdalta. Vastaavasti muut panelit ovat tasapainottamattomia (unbalanced). 12.9.2012 SurveyMetodiikka 2012 Seppo 24

Katsopa vielä uudelleen havainnollistustani surveyaineistosta Se kattaa koko kehikkoperusjoukon ja sitten otoksella kerätyn vastaajien aineiston. Tällaista aineistoa ei varsinaisesti käsitellä eikä sitä ole olemassa mutta on hyvä miettiä tilannetta tältä kannalta. Oikeasti tärkeitä ovat kaksi aineistoa: - Otantatiedosto joka sisältää brutto-otoksen ja siihen saadut muuttujat. Katsopa niitä tuosta kaaviosta ja mieti mitä siellä on sellaista. - Varsinainen analyysiaineisto joka sen sijaan kattaa vastaajat ja heille saadut ja kerätyt tiedot, sekä alkuperäiset että muokatut ja myös tarpeellisiksi katsotut X-muuttujat. Lisäksi tuon otantatiedoston avulla on tähän yhdistetty tarpeelliset painot. Katso tältäkin osalta tuota havainnollistusta. Kun ryhdymme harjoituksissa katselemaan surveyaineistoja, meillä on tarjolla juuri tuo jälkimmäinen tiedostotyyppi. Huomaa siis kuitenkin että sitä varten voi olla ollut tarpeen tehdä monenlaista, aloittaen otantatiedostosta, jonka muodostamisessa on käytetty hyväksi ns kenttätyötä ja kenttätyötiedostoa. Tämän ominaisuudet riippuvat paljon tiedonkeruutavasta. Tähän palataan varmaan jo ensi kerralla. 12.9.2012 SurveyMetodiikka 2012 Seppo 25

Tässä vaiheessa lopetan peruskäsitteistön mutta aihe toki jatkuu. Siirryn nyt toisenlaisiin peruskäsitteisiin joihin törmätään väistämättä myös muussa tilastoaineistossa kuin surveyaineistossa. Avaan nyt Kirjani liitteen Asteikkoja muunnosliite. Käyn tätä läpi nopeahkosti. Lue itse myös aihetta. Esillä olevia aiheita käsitellään, erityisesti muunnoksia, heti harjoitusten alkaessakin mutta toki koko ajan. Ne kun koskaan eivät ole helppoja, eivät ainakaan minulle. Muuntamista on syytä huolella miettiä että ratkaisu on sellainen että tulosten tulkinta on oikea ja vaivaton. Hyvin usein on niin että kerätty data ei ole tähän hyvin soveltuva. Eli keruudata ei aina ole sellaisenaan hyvä analyysissä. 12.9.2012 SurveyMetodiikka 2012 Seppo 26

Aika tylsän mutta kauniin näköinen havaintoaineisto tai havaintomatriisi. 12.9.2012 SurveyMetodiikka 2012 Seppo 27