Helsingin yliopisto Sosiaalitieteiden laitos Seppo Tammikuu 2013 Surveymetodiikan koe

Samankaltaiset tiedostot
Perusestimointi 5 Analyysiä survey-datalla Tee Suomen datalla jokin oma kokeilu käyttäen tätä mallia Esimerkki PISA 2006:sta SAS:lla


Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Nuorisotyöttömyys Euroopassa. Eurooppafoorumi: Työläisten Eurooppa, Tampere, Liisa Larja

MEETING PEOPLE COMMUNICATIVE QUESTIONS

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Choose Finland-Helsinki Valitse Finland-Helsinki

TTIP-tutkimuksen tulokset: Pohjoismaiden kansalaisten näkemyksiä vapaakaupasta ja TTIP:stä Heinä-elokuu 2015

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Perusnäkymä yksisuuntaiseen ANOVAaan

Harjoitukset 3 : Monimuuttujaregressio 2 (Palautus )

A250A0050 Ekonometrian perusteet Tentti

(78143) Syksy 2009 TEEMAT 3 & 4. Risto Lehtonen Teema 3 ERITYISKYSYMYKSIÄ. Risto Lehtonen 2

Visit Finland Global Sales Promotion. Heli Mende

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

System.out.printf("%d / %d = %.2f%n", ekaluku, tokaluku, osamaara);

Viherseinien efekti Tilastoanalyysi

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

SAS ja R yhteiskäyttö

Elämää PISA:n varjossa

Lihavuuden kustannuksia. Markku Pekurinen, osastojohtaja, tutkimusprofessori

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

System.out.printf("%d / %d = %.2f%n", ekaluku, tokaluku, osamaara);

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Uusi Ajatus Löytyy Luonnosta 4 (käsikirja) (Finnish Edition)

Harjoitus 6. Käytä String-luokasta vain charat- ja length-operaatioita.

Teollisuustuotannon määrä kuukausittain

Kansaianvälinen aikuistutkimus PIAAC 2012

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

pitkittäisaineistoissa

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Maahanmuuton ja kotoutumisen lähitulevaisuuden haasteet. Tuomas Martikainen

DECIPHER Development & Export of Cultural Initiatives for the Promotion & Harmonisation of Employer-led Resources

pitkittäisaineistoissa

On instrument costs in decentralized macroeconomic decision making (Helsingin Kauppakorkeakoulun julkaisuja ; D-31)

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

Porvoon matkailun tunnuslukuja huhtikuu 2012

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Sovellettu todennäköisyyslaskenta B

Peruskoulu - nousu, huippu (AAA) ja lasku?

EU-rikosuhritutkimus (Turvallisuus Suomessa) - pilottitutkimus. Vastauskato ja painotus Jenni Nikula

Valtiovarain controller toiminto riskienhallinnan kehittäjänä Esko Mustonen

Vaihtoon lähdön motiivit ja esteet Pohjoismaissa. Siru Korkala

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Teema 8: Parametrien estimointi ja luottamusvälit

4. KORKEA VEROTUS VIE MITALISIJAN HYVINVOINTIKILPAILUSSA

Harjoitus 2 (viikko 45)

Kaikkiin kysymyksiin vastataan kysymys paperille pyri pitämään vastaukset lyhyinä, voit jatkaa paperien kääntöpuolille tarvittaessa.

Porvoon matkailun tunnuslukuja Marraskuu 2012

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Harjoitus 6 (viikko 42)

Porvoon matkailun tunnuslukuja tammikuu 2012

Kvantitatiiviset menetelmät

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Harjoitus 1 (viikko 44)

Operatioanalyysi 2011, Harjoitus 3, viikko 39

SUOMEN JA MUIDEN MAIDEN ASUNTOMARKKINOITA KOSKEVIA KUVIOITA

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Paradoxes of educational improvement: The Finnish experience

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Matkustaminen Yleistä

Matkustaminen Yleistä

Matkustaminen Yleistä

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Poistavatko kannustimet ja sanktiot työttömyyttä? Heikki Ervasti

Harjoitus 3 (viikko 39)

Capacity Utilization

1. Liikkuvat määreet

Väliestimointi (jatkoa) Heliövaara 1

30A02000 Tilastotieteen perusteet

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages Esa Virtala.

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Opiskelija viipymisaika pistemäärä

Laboratorioanalyysit, vertailunäytteet ja tilastolliset menetelmät

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Epävarmuuden hallinta bootstrap-menetelmillä

Mitä on GLP? Pirkko Puranen, ylitarkastaja, FT Fimea, Luvat ja tarkastukset

OLS for refugees webinaari

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

Pricing policy: The Finnish experience

Metsien luonnontuotteet ja luomu. Rainer Peltola, MTT Rovaniemi / LAPPI LUO

Harjoitukset 4 : Paneelidata (Palautus )

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Ovatko globalisaation vaikutukset luonnonlaki? Lisääkö globalisaatio eriarvoisuutta?

Laskelmia puoluekannatuksesta Seppo

muutos *) %-yks. % 2016

KYSELYLOMAKE: FSD2209 TAMPEREEN YLIOPISTON SOSIAALITYÖN JA PSYKOLOGIAN OPISKELIJOIDEN KOKEMUKSIA KANSAINVÄLISESTÄ OPISKELIJAVAIHDOSTA 2006

Me olemme Metsä Fibre

TUTKIMUSOPAS. SPSS-opas

Ohjelmointi 1 C#, kevät 2013, 2. tentti

Transkriptio:

Helsingin yliopisto Sosiaalitieteiden laitos Seppo Tammikuu 2013 Surveymetodiikan koe Päätä viimeistään silloin kun jätät vastauksesi, kuinka moneen opintopisteeseen pyrit. Jos haluat saavuttaa perusmäärän, vastaa kahdeksaan (8) kysymykseen, jos vähemmän niin vastaavasti vähempään, minimissään neljään (4). Huomaa kuitenkin että harjoitustöiden ja tentin laajuuden pitää olla oikeassa balanssissa. Laita sposti ainakin yhteen paperiin ellei weboodin sposti ole paras, ja jokaiseen nimesi ja opiskelijanumerosi. Kerron tuloksesta siis spostilla. 1. Eräs melko kokematon tutkija teki pienimuotoisen kyselyn tietylle rajatulle tavoiteperusjoukolle. Hän jakeli kyselylomakkeet suoraan taloihin joista toivoi omistajan tai pääasujan täyttävän sen. Hän saikin yli 500 täytettyä lomaketta paperisina, ollen siis tyytyväinen. Nyt hänelle tuli ongelma, mitä tehdä seuraavaksi, koska hän halusi innolla analysoida tuloksia, minkä asiantuntija hän ei vielä myöskään ole. Yksi tehtävä hänelle on muodostaa lomakkeen vastauksista muuttujat ja antaa näille arvot (koodit) ja tallentaa kaikki asianmukaisesti tiedostoon. Liitteenä on lomakkeesta kolme kysymystä. Tee kunkin niistä osalta malli tallennusta varten. 2. Kehitysmaissa tehdään paljonkin surveytutkimuksia, joita rahoitetaan vaikkapa Suomen kehitysyhteistyörahoista. Toki Maailmanpankki ja myös ehkä EU ovat merkittävämpiä rahoittajia, ja konsultoijina on usein korkean tason asiantuntijoita. Tästä syystä kehitysmaiden surveyasetelmat ovat yleensä hyviä, joiltakin osin jopa parempia kuin kehittyneissä maissa. Tätä edistää muun muassa halvahko työvoima. Kerro Etiopian otanta-asetelman keskeiset ominaisuudet siltä osin kuin niistä kerroin kurssilla ja sen nettisivulla. Keskity siis otantaasetelmaan. Tammikuu 2013 1

3. Surveyn synonyymina tietyissä tilanteissa käytetään nimeä gallup. Hyväksyn sen, vaikkei se olekaan tyylikäs. Mistähän nimi tulee? Oikeasta vastauksesta tuohon saat pienen bonuksen, mutta olennaisinta on selostaa antamani selostuksen perusteella: - Mitä tiedon keruumenetelmää puoluekannatusgallupeissa nykyisin Suomessa käytetään? - Mikä on alkuperäisen otospainotuksen (peruspainon muodostamisen) idea? - Miten tuon otospainon avulla saatua kannatusmittausta edelleen parannetaan jotta saataisiin mahdollisimman luotettava tulos eli siis tuotetaan uusi parannettu paino? Mihin se siis perustuu? 4. Surveyestimaatin (piste-estimaatin kuten keskiarvon ja frekvenssin) hyvä osuvuus on toki erinomaisen tärkeä, mutta sille pitäisi saada myös estimaatin epävarmuutta kuvaava tunnusluku. Kerro mitä tällaisia tunnuslukuja on kurssilla käyty läpi ja selosta myös lyhyesti mitä mikäkin tarkoittaa. Sano myös jotain epävarmuuden todennäköisyydestä. 5. Alla on viisi käsitettä. Selosta niistä ainakin neljä mahdollisimman napakasti ja oikein: (a) Ensisijainen poimintayksikkö (psu). (b) Yksiasteinen otanta (c) Kaksivaiheinen otanta (d) Otoksen allokointi (kiintiöinti) (e) Pitkittäisaineisto. 6. Otantatiedosto on erittäin tärkeä jonka muodostaminen tapahtuu useassa vaiheessa. Kerro näistä vaiheista. Ja vielä tärkeämpänä, selosta minkälainen on hyvä otantatiedosto? 7. Sivulla 4 on ESS:stä kaksi kysymystä. Valitan että ne ovat englanniksi. Ei tässä ihmeellistä kielitaitoa tosin tarvita, kun pyydän tekemään noista kahdesta sellaisen yhdistemuuttujan joka kertoo myötämielisestä suhtautumisesta immigrantteja (maahan muuttaneita) kohtaan siten että hyvin kielteinen saa arvon=0 ja hyvin myönteinen arvon=100. Jos mahdollista, esitä asia laskulausekkeena eli sellaisena jonka saa helposti SAS:iin, SPSS:ään ym ohjelmistoon. Anna muuttujalle myös osuva nimi. Tammikuu 2013 2

8. Ota vaikkapa edellinen tehtävä pohjaksi ja kerro erilaisista mahdollisuuksista asetella asteikkoja asenteita koskeviin kysymyksiin. Ota kriittinen asennekin mukaan kun pohdit asteikkoja. 9. Nettisurveyden (nettikyselyjen) toteuttamisessa huomioon otettavia seikkoja. Selosta myös mitä ongelmia näissä kyselyissä voi tulla vastaan, ja miten ongelmista voitaisiin selvitä kohtuudella? 10. Tilastollisen editoinnin tarkoitus ja keskeiset tehtävät. 11. Viimeisellä sivulla on otanta-asetelman huomioon ottaneella regressiomallilla selitetty äidinkielellä ilmaistun tekstin ymmärtämistä = READING (PISA-testi) muutamilla muuttujilla joita on ollut myös harjoituksissa. Annapa lyhyt ja napakka tulkinta tulokselle kertoen kaikista selittäjistäkin jotain. Olennaista on myös kertoa mitä mikäkin estimaatti tarkoittaa tilastollisesti. Huomioi myös epävarmuus. 12. Otanta-asetelmana on kaksiasteinen ryväsotanta siten että on käytetty alueellisia (pieniä) ryppäitä. Tästä syystä alueiden sisällä ovat vastaukset jossain määrin samankaltaisia eli ryppäät ovat sisäkorreloituneita. Edellisistä tiedusteluista on päätelty että sisäkorrelaatio on 0,025 (laskettu usean muuttujan mediaanina). Päätettiin poimia pps:llä ryppäitä yhteensä 250 ja kustakin 10 poimintayksikköä eli kehikon mukaan tavoiteperusjoukon jäsentä. Siten brutto-otoskoko on 2500. Todellisuudessa kävi niin että vastauksia saatiin 60 prosentilta. Lisäksi havaittiin isohko 10 prosentin ylipeitto johtuen kuolemisesta tai muuttamisesta tavoiteperusjoukon ulkopuolelle ja myös kehikon virheistä. Lopulta oli myös niin, että otoksen poiminta ei ollut täysin satunnainen vaan tiettyjä ryhmiä otettiin mukaan suhteellisesti enemmän kuin toisia. Tällöin voitiin laskea että asetelmavaikutus johtuen erisuurista todennäköisyyksistä DEFFp = 1,2. Laske näillä perusteilla efektiivinen otoskoko. Tammikuu 2013 3

How about people of a different race or ethnic group from most [country] people? Instruction(s): Pre: STILL CARD 14 Post: Still use this card Variable name and label: IMDFETN Allow many/few immigrants of different race/ethnic group from majority Values and categories 1 Allow many to come and live here 2 Allow some 3 Allow a few 4 Allow none 7 Refusal 8 Don't know Would you say it is generally bad or good for [country]'s economy that people come to live here from other countries? Instruction(s): Pre: CARD 15 Post: Please use this card Variable name and label: IMBGECO Immigration bad or good for country's economy Values and categories 00 Bad for the economy 01 1 02 2 03 3 04 4 05 5 06 6 07 7 08 8 09 9 10 Good for the economy 77 Refusal 88 Don't know Tammikuu 2013 4

Liite tehtävään 1: Kysymys 3. Oliko siirtolapuutarhatoiminta teille tuttua jo ennen oman palstan vuokraamista? Kyllä Ei Kysymys 4. Mikäli vastasitte edelliseen kysymykseen kyllä, niin millä tavoin olitte tutustunut toimintaan? Vanhemmilla on/oli siirtopuutarhapalsta Muilla sukulaisillani on/oli siirtolapuutarhapalsta Tuttavillani oli/on siirtolapuutarhapalsta Toiminta oli minulle muulla tavoin tuttua, miten Kysymys 7. Mihin ikäluokkaan kuuluvat perheenjäsenenne, jotka käyttävät palstaa lisäksenne Merkitkää lukumäärä kyseisen ikäluokan kohdalle Ikäluokka a) Vuokraaja itse b) Muut perheenjäsenet 0-7 8-16 17-24 25-34 35-44 45-54 55-64 65-74 75+ Tammikuu 2013 5

Tests of Model Effects SELITETTÄVÄNÄ READING eli tekstin ymmärtäminen Effect Num DF F Value Pr>F Intercept 1 2.97E7 <.0001 ST04Q01 1 168241 <.0001 CNT 9 1.515E9 <.0001 JOYREAD (Lukemisen määrä nautinnolla) 1 1963038 <.0001 IC02Q03 (Onko internet ja jos niin käyttääkö?) 2 525897 <.0001 IMMIG 2 143711 <.0001 FAMSTRUC 2 150952 <.0001 R-square 0.3043 Estimated Regression Coefficients Parameter Estimate Standard t Value Pr > t Error Intercept 459.368929 0.10538746 4358.86 <.0001 ST04Q01 Female 18.957657 0.04621878 410.17 <.0001 ST04Q01 Male 0.000000 0.00000000.. CNT Belgium 19.504312 1.24224357 15.70 <.0001 CNT Denmark -5.393639 0.00436523-1235.6 <.0001 CNT Estonia -0.848748 0.01403510-60.47 <.0001 CNT Finland 28.600972 0.00735594 3888.15 <.0001 CNT Germany 1.124552 0.01532890 73.36 <.0001 CNT Japan 9.303739 0.01838094 506.16 <.0001 CNT Korea 28.509005 0.01185313 2405.19 <.0001 CNT Netherlands 18.265993 0.00670833 2722.88 <.0001 CNT Norway 5.766525 0.00507325 1136.65 <.0001 CNT Russian Federation -41.674812 0.01764202-2362.2 <.0001 CNT Sweden 0.000000 0.00000000.. JOYREAD 35.182123 0.02511064 1401.08 <.0001 IC02Q03 No -37.809599 0.03694231-1023.5 <.0001 IC02Q03 Yes, I use it -8.307090 0.04368077-190.18 <.0001 IC02Q03 Yes, but I don't use it 0.000000 0.00000000.. IMMIG First-Generation 0.383632 0.10880263 3.53 0.0004 IMMIG Native 38.131355 0.07281776 523.65 <.0001 IMMIG Second-Generation 0.000000 0.00000000.. FAMSTRUC Mixed -23.205060 0.07649796-303.34 <.0001 FAMSTRUC Nuclear family 13.378338 0.03565884 375.18 <.0001 FAMSTRUC Single parent family 0.000000 Tammikuu 2013 0.00000000.. 6