Tilastotieteen johdantokurssin harjoitustyö. 1 Johdanto...2. 2 Aineiston kuvaus...3. 3 Riippuvuustarkastelut...4



Samankaltaiset tiedostot
MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

voidaan hylätä, pienempi vai suurempi kuin 1 %?

RISTIINTAULUKOINTI JA Χ 2 -TESTI

KARTTAVARASTO: SISÄLLYSLUETTELO

Harjoittele tulkintoja

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Kulttuuri-, mielipide- ja tiedelehtien liitto Kultti ry:n jäsenkyselyyn osallistui 75 lehteä kesällä 2005

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Til.yks. x y z

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Til.yks. x y z

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Luento JOHDANTO

YLEISKUVA - Kysymykset

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Maailman metsäteollisuuden kohtalonkysymykset

Teknologiateollisuuden henkilöstö

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

TUTKIMUSOPAS. SPSS-opas

HAVAITUT JA ODOTETUT FREKVENSSIT

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

Tilastokatsaus 6:2014

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Kvantitatiiviset menetelmät

MONISTE 2 Kirjoittanut Elina Katainen

Väestö. GE2 Yhteinen maailma Leena Kangas-Järviluoma

Opinnäytetyön kvantitatiivinen osuus

Teknologiateollisuuden tilanne ja näkymät

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

YKYY2 Yhteiskunnan mittaaminen Kertauskuulustelu

Kandidaatintutkielman aineistonhankinta ja analyysi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Suomen koulutustaso kansainvälisessä vertailussa

Tutkimus peliohjaimen käytöstä Super Smash Bros. Melee pelissä. Aleksanteri Karanka

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Talouden näkymistä tulevalle vuosikymmenelle

Education at a Glance 2013: Sukupuolten väliset erot tasoittumassa

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

TIETOISKU TUOTANTO LASKI VARSINAIS-SUOMESSA VUONNA 2012

TESTINVALINTATEHTÄVIEN VASTAUKSET

Osa 15 Talouskasvu ja tuottavuus

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

Talouden rakenteet 2011 VALTION TALOUDELLINEN TUTKIMUSKESKUS (VATT)

Huippu Kertaus Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Ohjeita kvantitatiiviseen tutkimukseen

ULKOMAALAISTAUSTAISET TYÖMARKKINOILLA

Globaaleja kasvukipuja

Kvantitatiiviset menetelmät

Reino Hjerppe. Vihreiden väestöseminaari Eduskunnan kansalaisinfossa

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

I Keskiarvot ja hajonnat muuttujista 3-26 niin, että luokittelevana muuttujana on muuttuja 2 eli sukupuoli

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

PISA 2012 ENSITULOKSIA Pekka Kupari Jouni Välijärvi Koulutuksen tutkimuslaitos Jyväskylän yliopisto

ULKOMAALAISTAUSTAISET TYÖELÄMÄSSÄ 2007

Mikä ennustaa kalliiseen hoitoon päätymistä? -Alueellisen palvelujärjestelmän näkökulma

SUOMEN KEHITYSYHTEIS TYÖ MÄÄRÄRAHAT EU JÄSENYYDEN AIKANA SUOMEN KEHY MÄÄRÄRAHAT...

Miten suomalainen maitoyritys pärjää Euroopan hintamarkkinoilla? Tuloksia ja vertailutietoa EDF tuotantokustannustiloista

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Maailmantalouden ennustetaan kasvavan 3,4 % vuonna 2016 Bkt:n kasvu 2016 / 2015, %

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Väestömäärän kehitys, ikärakenne ja kielijakauma Hyvinkään kaupunki Talousosasto

5 Lisa materiaali. 5.1 Ristiintaulukointi

Ulkomaiset matkailijat Suomessa ja pääkaupunkiseudulla v. 2015

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Kvantitatiivinen genetiikka moniste s. 56

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla

SAIKA Suomen aineeton pääoma kansallisen talouden ajurina Tulevaisuuden tutkimuskeskus Turun yliopisto

OP-Local Emerging Market Debt -erikoissijoitusrahasto

Materiaali sisältää Powerpoint-diojen selitykset ja oppilaille monistettavia tehtäviä.

SENEGALIN METSÄT AAVIKOITUMASSA?

GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus

Makrotaloustiede 31C00200 Kevät 2016 Rahamäärä, hintataso ja valuuttakurssit

Metsäteollisuuden globaalit muutosajurit. Päättäjien Metsäakatemia Majvik, Rainer Häggblom, Vision Hunters Ltd. Oy

Pertti Vilpas Metropolia 1. KVANTITATIIVINEN TUTKIMUS

Määrällisen aineiston esittämistapoja. Aki Taanila

Transkriptio:

TILTP1 Tilastotieteen johdantokurssin harjoitustyö Tampereen yliopisto 5.11.2007 Perttu Kaijansinkko (84813) perttu.kaijansinkko@uta.fi Pääaine matematiikka/tilastotiede Tarkastaja Tarja Siren 1 Johdanto...2 2 Aineiston kuvaus...3 3 Riippuvuustarkastelut...4 3.1 Lukutaito eri maanosissa...4 3.2 Lääkärit ja elinajanodote...5 3.3 Bruttokansantuote eri maanosissa...6 4 Yhteenveto...7 LIITE 1 Muuttujaluettelo...8

Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 2 1 Johdanto Harjoitustyössäni tutkin maailman maita sosiaalisten indikaattoreiden avulla. Nämä indikaattorit ovat tilastomuuttujia, jotka kertovat yhteiskunnan tilasta kuten väestöstä, koulutuksesta ja terveydestä. Aineisto on osa-aineisto Tilastokeskuksen Maailma numeroina -aineistosta. Aineisto on peräisin Menetelmäopetuksen tietovarannon harjoitusaineistoista *. Aineiston tilastoyksikkö on maa. Poistin aineistosta epäitsenäisiä, ilman maanosaa ilmoitettuja alueita kuten kaikki Etelämantereen maat, Yhdysvaltain pienet erillissaaret, EU-15:n, Guernseyn ja Jerseyn sekä Palestiinan tietoihin sisältyvät Gazan kaistan ja Länsirannan. Aineistossa on paljon kvantitatiivisia muuttujia. Tarkastelen seuraavanlaisia tutkimusongelmia ja riippuvuuksia: 1. Millainen lukutaidon taso on eri maanosissa. 2. Onko niissä maissa, joissa on enemmän lääkäreitä, pidempi elinajanodote. 3. Miten eri maanosat eroavat toisistaan maiden bruttokansantuotteen perusteella. * http://www.fsd.uta.fi/menetelmaopetus/spss/hakuohje.html

Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 3 2 Aineiston kuvaus Siistittyäni aineiston siinä oli 235 maata. Valitsin ositetulla otannalla maanosittain kaksi kolmasosaa maista mukaan otokseen. Otoksessa maita on 156: Aasiasta 34, Afrikasta 39, Euroopasta 32, Latinalaisesta Amerikasta 30, Oseaniasta 18 ja Pohjois-Amerikasta 3. Lukutaidottomuus yhteensä -muuttuja kertoo, montako prosenttia maan aikuisväestöstä on lukutaidottomia. Lukutaidottomuuden minimiarvo on 0,0 % ja maksimiarvo 86,6 %. Keskiarvo on 20,8 % ja mediaani 10,2 %. Moodi on 1,0 %, ja frekvenssihistogrammin perusteella yli puolessa maista lukutaidottomuus on alle 5 %. Tein henkilöä kohti jaetusta bruttokansantuotteesta kategorisen muuttujan. Luokitukseen käytin apuna frekvenssihistogrammia (kuva 1), josta päädyin ensin seuraavaan luokitteluun: alhainen, alle 1500 Yhdysvaltain dollaria; keskitaso 1500 2500 dollaria; korkea yli 2500 dollaria. Tällaisella jaolla alhaisesta ja korkeasta BKT:sta tuli likimain yhtä suuret luokat, mutta keskitason maita taas oli vain vähän. Muutin luokitusta niin, että keskitasoon kuuluu BKT välillä 1200 3000 dollaria/henkilö. Tällä jaolla alhainen bruttokansantuote on 37 prosentilla, keskitasoinen 18 prosentilla ja korkea 37 prosentilla otoksen maista. Elinajanodotteen minimiarvo on 36,3 ja maksimiarvo 81,5 vuotta. Keskiarvo on 66 ja mediaani 69 vuotta. Lääkärien määrän keskiarvo on 130 ja mediaani 79. Näiden eron selittää se, että vähälääkärisiä maita on paljon, mutta toisaalta maissa, joissa lääkäreitä on paljon, heitä on todella suuri määrä, mikä vetää keskiarvoa ylöspäin. Kuva 1. Frekvenssihistogrammi bruttokansantuotteesta henkilöä kohden otoksen maissa.

Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 4 3 Riippuvuustarkastelut 3.1 Lukutaito eri maanosissa Laatikko jana-kuviossa (kuva 2) on selittävänä muuttujana maanosa. Euroopan ja Pohjois-Amerikan laatikko janat ovat kuviossa hyvin alhaalla, siis lähellä nollan prosentin lukutaidottomuutta. Euroopan maiden joukossa on muutamia poikkeuksellisen suuren lukutaidottomuuden maita, ja lukutaidottomuus näyttäisi olevan korkeimmillaan 15 %. Pohjois-Amerikan maiden laatikko jana taas on aivan alhaalla, mutta täytyykin muistaa, että Pohjois-Amerikasta on otoksessa vain kolme maata. 100,0 80,0 lukutaidottomuus yhteensä (%) 60,0 40,0 20,0 77 97 100 126 150 153 0,0 Aasia Afrikka Eurooppa Latinala Oseania Pohjois- maanosa Kuva 2. Lukutaidottomuus maanosan mukaan. Maanosissa, joissa on kehitysmaita, on kuten arvata saattaa enemmän lukutaidottomuutta ja laatikko janat ovat keskittyneet ylemmäs kuviossa. Aasian tapauksessa vaihtelu on suurta ja laatikon alaosa (alakvartiili) on 5 prosentin luokkaa ja minimiarvo vielä vähän alempana, minkä selittävät Aasian kehittyneet maat kuten Venäjä ja Japani. Huonomman lukutaidon maita puolestaan ovat köyhät, väkiluvultaan suuret maat kuten Intia.

Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 5 Vastaavanlaista vaihtelua on Afrikan laatikko janassa, mutta siellä lukutaidottomuus on selvästi Aasiaa korkeammalla. Afrikan lukutaidottomuuden alakvartiili on suurempi kuin Aasian mediaani. Näyttäisi siis siltä, että Afrikan maissa on kokonaisuutena huonompi lukutaito kuin Aasian maissa. Latinalaisen Amerikan ja Oseanian lukutaidottomuusprosentit ovat suuremmat kuin Euroopan ja Pohjois-Amerikan, mutta laatikko janan perusteella kuitenkin selvästi pienemmät kuin Afrikan ja Aasian. 3.2 Lääkärit ja elinajanodote Voisi ajatella, että maissa, joissa on paljon lääkäreitä, on edistyneempi terveydenhoitojärjestelmä ja siksi myös pidempi elinajanodote. Kun lääkärien lukumäärä tuhatta asukasta kohti valitaan pisteparven x-akselille ja elinajanodote y-akselille, saadaan pisteparvi, joka ei näyttäisi korreloivan lineaarisesti (kuva 3). Positiivinen korrelaatiokerroin on 0,565. Korrelaation merkitsevyyden testaus elinajan odote yhteensä 1999 80,0 70,0 60,0 50,0 40,0 30,0 H0: Populaatiossa ei ole lineaarista riippuvuutta lääkärien määrän ja elinajanodotteen välillä. H1: Populaatiossa on lineaarista riippuvuutta. 0 100 200 300 lääkärit (kpl/100 000 henk) Kuva 3. Pisteparvi lääkärien määrän (100 000 henkeä kohti) ja elinajanodotteen välisestä yhteydestä. 400 500 600 SPSS:n laskema p-arvo on 0,000, joten H0 hylätään 0 prosentin riskillä. Siis riippuvuutta on. Pisteparvea silmin katsomalla näyttää kuitenkin ilmiselvältä, että pisteparveen sopisi oikein hyvin osa paraabelia. Näyttäisi myös siltä, että osassa maita, joissa lääkäreitä on väkilukuun lähden vähän, on hyvin alhainen elinajanodote, osassa korkea. Kaikissa maissa, joissa on yli 100 lääkäriä 100 000 asukasta kohden, on selvästi vain yli 60 vuoden elinajanodotteita. Siis pieni lääkärien määrä ei automaattisesti tarkoita pientä

Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 6 elinajanodotetta, mutta suuri lääkärien määrä jossain maassa tarkoittaa myös suurta elinajanodotetta. (Silläkään ei pisteparven perusteella näyttäisi olevan merkitystä, onko lääkäreitä 100 200 vai vaikkapa 300 400.) 3.3 Bruttokansantuote eri maanosissa Kolmirivinen (BKT-taso alhainen, keskitaso ja korkea) ja viisisarakkeinen (maanosa Aasia, Afrikka, Amerikka, Eurooppa ja Oseania) ristiintaulukko (taulu 1) paljastaa selkeitä eroja maanosien välillä. Köyhin maanosa bruttokansantuotteen perusteella on Afrikka, jossa 71 prosentilla maista on alhainen BKT. Korkea BKT on vain kahdeksasosalla Afrikan maista, kun taas Aasian maista (joihin Afrikkaa voi prosenttiosuuksien perusteella parhaiten verrata) siihen yltää kolmasosa. Aasiankin maista hieman yli puolet ovat alhaisen BKT:n maita. Muut maanosat poikkeavat Aasiasta ja Afrikasta merkittävästi. Euroopan maista alhainen BKT on 17 prosentilla, Latinalaisen Amerikan maista 14 prosentilla ja Oseanian maista 29 prosentilla. Korkea bruttokansantuote on yleisin Euroopassa, jonka maista 63 prosentilla BKT on korkea. Latinalaisessa Amerikassa selvästi yli puolet (59 %) maista yltävät korkeaan bruttokansantuotteeseen. Oseanian maat ovat jakautuneet hyvin tasaisesti alhaisen, keskitasoisen ja korkean bruttokansantuotteen luokkiin. Pohjois-Amerikasta oli alun alkaenkin otoksessa vain kolme maata, ja niistä vain yhdeltä oli aineistossa BKT, joten Pohjois-Amerikan tulosten arviointi ei ole mielekästä. Mainittakoon kuitenkin, että tuo yksi maa kuuluu BKT:nsa osalta luokkaan korkea. Taulu 1. Ristiintaulukko BKT-luokista maanosittain. BKT-luokka * maanosa Crosstabulation BKT-luokka Total alhainen keskitaso korkea Count % within maanosa Count % within maanosa Count % within maanosa Count % within maanosa maanosa Latinalainen Pohjois- Aasia Afrikka Eurooppa Amerikka Oseania Amerikka Total 18 27 5 4 4 0 58 56,3% 71,1% 16,7% 13,8% 28,6%,0% 40,3% 3 6 6 8 5 0 28 9,4% 15,8% 20,0% 27,6% 35,7%,0% 19,4% 11 5 19 17 5 1 58 34,4% 13,2% 63,3% 58,6% 35,7% 100,0% 40,3% 32 38 30 29 14 1 144 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 7 4 Yhteenveto Sekä lukutaidottomuuden että bruttokansantuotteen maanosakohtaisissa vertailuissa oli nähtävissä maanosien välisiä eroja. Lukutaitoanalyysin perusteella maanosat voitaisiin jakaa kolmeen luokkaan: Eurooppa ja Amerikka kuuluvat lukutaitoisimpaan luokkaan, Latinalainen Amerikka ja Oseania jäävät niistä hieman jälkeen ja Aasia ja Afrikka ovat lukutaidon osalta vähiten kehittyneet. Bruttokansantuotteen vertailussa, jos Pohjois-Amerikka jätetään huomiotta, Eurooppa ja Latinalainen Amerikka ovat melko tasaveroiset, Oseania jää niistä jälkeen. Aasiassa on vielä enemmän BKT:ltaan alhaisia maita, kun taas Afrikka on BKT:ltaan, kuten lukutaidoltaan, eniten muita maanosia jäljessä. Lääkäreiden määrän ja elinajanodotteen välisen korrelaation laatu oli mielenkiintoinen. Havainto, että välillä 100 500 lääkäriä / 100 000 asukasta ei lääkärien määrän kasvu vaikuta mitenkään maan elinajanodotteeseen, saa pohtimaan, mitkä terveydenhuoltojärjestelmän tekijät ovat enemmän elinajan taustalla. Lisäksi herää kysymys, miten alle sadalla lääkärillä 100 000 asukasta kohti voidaan saada aikaan yli 70 vuoden elinajanodote, ja onko esimerkiksi Suomessa keskustelu väärillä raiteilla, kun lääkärien enempi koulutus on nostettu erääksi tärkeimmistä ratkaisuista terveydenhuollon parantamiseksi.

Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 8 LIITE 1 Muuttujaluettelo Muuttuja Selite Mitta-asteikko Keskiarvo Hajonta maanosa Sen maanosan nimi, Luokitteluasteikko jossa maa on lukutaidottomuus Miesten ja naisten Intervalliasteikko 20,828 22,6248 lukutaidottomuus yhteensä prosenttia bkthlo Bruttokansantuote Intervalliasteikko 5595,35 8436,437 Yhdysvaltain dollaria / henkilö elinajanodote Elinajanodote vuotta Intervalliasteikko 66,683 10,4171 bkt laakarit Luokka BKT:n perusteella: matala, keskitaso, korkea Lääkärien määrä 100 000 asukasta kohden Järjestysasteikko Absoluuttinen 129,71 135,866

Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 9 Correlations lääkärit (kpl/100 000 henk) elinajan odote yhteensä 1999 lääkärit (kpl/100 000 henk) elinajan odote yhteensä 1999 Pearson Correlation 1,565(**) Sig. (2-tailed),000 N 126 125 Pearson Correlation,565(**) 1 Sig. (2-tailed),000 N 125 147 ** Correlation is significant at the 0.01 level (2-tailed).