TILTP1 Tilastotieteen johdantokurssin harjoitustyö Tampereen yliopisto 5.11.2007 Perttu Kaijansinkko (84813) perttu.kaijansinkko@uta.fi Pääaine matematiikka/tilastotiede Tarkastaja Tarja Siren 1 Johdanto...2 2 Aineiston kuvaus...3 3 Riippuvuustarkastelut...4 3.1 Lukutaito eri maanosissa...4 3.2 Lääkärit ja elinajanodote...5 3.3 Bruttokansantuote eri maanosissa...6 4 Yhteenveto...7 LIITE 1 Muuttujaluettelo...8
Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 2 1 Johdanto Harjoitustyössäni tutkin maailman maita sosiaalisten indikaattoreiden avulla. Nämä indikaattorit ovat tilastomuuttujia, jotka kertovat yhteiskunnan tilasta kuten väestöstä, koulutuksesta ja terveydestä. Aineisto on osa-aineisto Tilastokeskuksen Maailma numeroina -aineistosta. Aineisto on peräisin Menetelmäopetuksen tietovarannon harjoitusaineistoista *. Aineiston tilastoyksikkö on maa. Poistin aineistosta epäitsenäisiä, ilman maanosaa ilmoitettuja alueita kuten kaikki Etelämantereen maat, Yhdysvaltain pienet erillissaaret, EU-15:n, Guernseyn ja Jerseyn sekä Palestiinan tietoihin sisältyvät Gazan kaistan ja Länsirannan. Aineistossa on paljon kvantitatiivisia muuttujia. Tarkastelen seuraavanlaisia tutkimusongelmia ja riippuvuuksia: 1. Millainen lukutaidon taso on eri maanosissa. 2. Onko niissä maissa, joissa on enemmän lääkäreitä, pidempi elinajanodote. 3. Miten eri maanosat eroavat toisistaan maiden bruttokansantuotteen perusteella. * http://www.fsd.uta.fi/menetelmaopetus/spss/hakuohje.html
Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 3 2 Aineiston kuvaus Siistittyäni aineiston siinä oli 235 maata. Valitsin ositetulla otannalla maanosittain kaksi kolmasosaa maista mukaan otokseen. Otoksessa maita on 156: Aasiasta 34, Afrikasta 39, Euroopasta 32, Latinalaisesta Amerikasta 30, Oseaniasta 18 ja Pohjois-Amerikasta 3. Lukutaidottomuus yhteensä -muuttuja kertoo, montako prosenttia maan aikuisväestöstä on lukutaidottomia. Lukutaidottomuuden minimiarvo on 0,0 % ja maksimiarvo 86,6 %. Keskiarvo on 20,8 % ja mediaani 10,2 %. Moodi on 1,0 %, ja frekvenssihistogrammin perusteella yli puolessa maista lukutaidottomuus on alle 5 %. Tein henkilöä kohti jaetusta bruttokansantuotteesta kategorisen muuttujan. Luokitukseen käytin apuna frekvenssihistogrammia (kuva 1), josta päädyin ensin seuraavaan luokitteluun: alhainen, alle 1500 Yhdysvaltain dollaria; keskitaso 1500 2500 dollaria; korkea yli 2500 dollaria. Tällaisella jaolla alhaisesta ja korkeasta BKT:sta tuli likimain yhtä suuret luokat, mutta keskitason maita taas oli vain vähän. Muutin luokitusta niin, että keskitasoon kuuluu BKT välillä 1200 3000 dollaria/henkilö. Tällä jaolla alhainen bruttokansantuote on 37 prosentilla, keskitasoinen 18 prosentilla ja korkea 37 prosentilla otoksen maista. Elinajanodotteen minimiarvo on 36,3 ja maksimiarvo 81,5 vuotta. Keskiarvo on 66 ja mediaani 69 vuotta. Lääkärien määrän keskiarvo on 130 ja mediaani 79. Näiden eron selittää se, että vähälääkärisiä maita on paljon, mutta toisaalta maissa, joissa lääkäreitä on paljon, heitä on todella suuri määrä, mikä vetää keskiarvoa ylöspäin. Kuva 1. Frekvenssihistogrammi bruttokansantuotteesta henkilöä kohden otoksen maissa.
Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 4 3 Riippuvuustarkastelut 3.1 Lukutaito eri maanosissa Laatikko jana-kuviossa (kuva 2) on selittävänä muuttujana maanosa. Euroopan ja Pohjois-Amerikan laatikko janat ovat kuviossa hyvin alhaalla, siis lähellä nollan prosentin lukutaidottomuutta. Euroopan maiden joukossa on muutamia poikkeuksellisen suuren lukutaidottomuuden maita, ja lukutaidottomuus näyttäisi olevan korkeimmillaan 15 %. Pohjois-Amerikan maiden laatikko jana taas on aivan alhaalla, mutta täytyykin muistaa, että Pohjois-Amerikasta on otoksessa vain kolme maata. 100,0 80,0 lukutaidottomuus yhteensä (%) 60,0 40,0 20,0 77 97 100 126 150 153 0,0 Aasia Afrikka Eurooppa Latinala Oseania Pohjois- maanosa Kuva 2. Lukutaidottomuus maanosan mukaan. Maanosissa, joissa on kehitysmaita, on kuten arvata saattaa enemmän lukutaidottomuutta ja laatikko janat ovat keskittyneet ylemmäs kuviossa. Aasian tapauksessa vaihtelu on suurta ja laatikon alaosa (alakvartiili) on 5 prosentin luokkaa ja minimiarvo vielä vähän alempana, minkä selittävät Aasian kehittyneet maat kuten Venäjä ja Japani. Huonomman lukutaidon maita puolestaan ovat köyhät, väkiluvultaan suuret maat kuten Intia.
Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 5 Vastaavanlaista vaihtelua on Afrikan laatikko janassa, mutta siellä lukutaidottomuus on selvästi Aasiaa korkeammalla. Afrikan lukutaidottomuuden alakvartiili on suurempi kuin Aasian mediaani. Näyttäisi siis siltä, että Afrikan maissa on kokonaisuutena huonompi lukutaito kuin Aasian maissa. Latinalaisen Amerikan ja Oseanian lukutaidottomuusprosentit ovat suuremmat kuin Euroopan ja Pohjois-Amerikan, mutta laatikko janan perusteella kuitenkin selvästi pienemmät kuin Afrikan ja Aasian. 3.2 Lääkärit ja elinajanodote Voisi ajatella, että maissa, joissa on paljon lääkäreitä, on edistyneempi terveydenhoitojärjestelmä ja siksi myös pidempi elinajanodote. Kun lääkärien lukumäärä tuhatta asukasta kohti valitaan pisteparven x-akselille ja elinajanodote y-akselille, saadaan pisteparvi, joka ei näyttäisi korreloivan lineaarisesti (kuva 3). Positiivinen korrelaatiokerroin on 0,565. Korrelaation merkitsevyyden testaus elinajan odote yhteensä 1999 80,0 70,0 60,0 50,0 40,0 30,0 H0: Populaatiossa ei ole lineaarista riippuvuutta lääkärien määrän ja elinajanodotteen välillä. H1: Populaatiossa on lineaarista riippuvuutta. 0 100 200 300 lääkärit (kpl/100 000 henk) Kuva 3. Pisteparvi lääkärien määrän (100 000 henkeä kohti) ja elinajanodotteen välisestä yhteydestä. 400 500 600 SPSS:n laskema p-arvo on 0,000, joten H0 hylätään 0 prosentin riskillä. Siis riippuvuutta on. Pisteparvea silmin katsomalla näyttää kuitenkin ilmiselvältä, että pisteparveen sopisi oikein hyvin osa paraabelia. Näyttäisi myös siltä, että osassa maita, joissa lääkäreitä on väkilukuun lähden vähän, on hyvin alhainen elinajanodote, osassa korkea. Kaikissa maissa, joissa on yli 100 lääkäriä 100 000 asukasta kohden, on selvästi vain yli 60 vuoden elinajanodotteita. Siis pieni lääkärien määrä ei automaattisesti tarkoita pientä
Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 6 elinajanodotetta, mutta suuri lääkärien määrä jossain maassa tarkoittaa myös suurta elinajanodotetta. (Silläkään ei pisteparven perusteella näyttäisi olevan merkitystä, onko lääkäreitä 100 200 vai vaikkapa 300 400.) 3.3 Bruttokansantuote eri maanosissa Kolmirivinen (BKT-taso alhainen, keskitaso ja korkea) ja viisisarakkeinen (maanosa Aasia, Afrikka, Amerikka, Eurooppa ja Oseania) ristiintaulukko (taulu 1) paljastaa selkeitä eroja maanosien välillä. Köyhin maanosa bruttokansantuotteen perusteella on Afrikka, jossa 71 prosentilla maista on alhainen BKT. Korkea BKT on vain kahdeksasosalla Afrikan maista, kun taas Aasian maista (joihin Afrikkaa voi prosenttiosuuksien perusteella parhaiten verrata) siihen yltää kolmasosa. Aasiankin maista hieman yli puolet ovat alhaisen BKT:n maita. Muut maanosat poikkeavat Aasiasta ja Afrikasta merkittävästi. Euroopan maista alhainen BKT on 17 prosentilla, Latinalaisen Amerikan maista 14 prosentilla ja Oseanian maista 29 prosentilla. Korkea bruttokansantuote on yleisin Euroopassa, jonka maista 63 prosentilla BKT on korkea. Latinalaisessa Amerikassa selvästi yli puolet (59 %) maista yltävät korkeaan bruttokansantuotteeseen. Oseanian maat ovat jakautuneet hyvin tasaisesti alhaisen, keskitasoisen ja korkean bruttokansantuotteen luokkiin. Pohjois-Amerikasta oli alun alkaenkin otoksessa vain kolme maata, ja niistä vain yhdeltä oli aineistossa BKT, joten Pohjois-Amerikan tulosten arviointi ei ole mielekästä. Mainittakoon kuitenkin, että tuo yksi maa kuuluu BKT:nsa osalta luokkaan korkea. Taulu 1. Ristiintaulukko BKT-luokista maanosittain. BKT-luokka * maanosa Crosstabulation BKT-luokka Total alhainen keskitaso korkea Count % within maanosa Count % within maanosa Count % within maanosa Count % within maanosa maanosa Latinalainen Pohjois- Aasia Afrikka Eurooppa Amerikka Oseania Amerikka Total 18 27 5 4 4 0 58 56,3% 71,1% 16,7% 13,8% 28,6%,0% 40,3% 3 6 6 8 5 0 28 9,4% 15,8% 20,0% 27,6% 35,7%,0% 19,4% 11 5 19 17 5 1 58 34,4% 13,2% 63,3% 58,6% 35,7% 100,0% 40,3% 32 38 30 29 14 1 144 100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 7 4 Yhteenveto Sekä lukutaidottomuuden että bruttokansantuotteen maanosakohtaisissa vertailuissa oli nähtävissä maanosien välisiä eroja. Lukutaitoanalyysin perusteella maanosat voitaisiin jakaa kolmeen luokkaan: Eurooppa ja Amerikka kuuluvat lukutaitoisimpaan luokkaan, Latinalainen Amerikka ja Oseania jäävät niistä hieman jälkeen ja Aasia ja Afrikka ovat lukutaidon osalta vähiten kehittyneet. Bruttokansantuotteen vertailussa, jos Pohjois-Amerikka jätetään huomiotta, Eurooppa ja Latinalainen Amerikka ovat melko tasaveroiset, Oseania jää niistä jälkeen. Aasiassa on vielä enemmän BKT:ltaan alhaisia maita, kun taas Afrikka on BKT:ltaan, kuten lukutaidoltaan, eniten muita maanosia jäljessä. Lääkäreiden määrän ja elinajanodotteen välisen korrelaation laatu oli mielenkiintoinen. Havainto, että välillä 100 500 lääkäriä / 100 000 asukasta ei lääkärien määrän kasvu vaikuta mitenkään maan elinajanodotteeseen, saa pohtimaan, mitkä terveydenhuoltojärjestelmän tekijät ovat enemmän elinajan taustalla. Lisäksi herää kysymys, miten alle sadalla lääkärillä 100 000 asukasta kohti voidaan saada aikaan yli 70 vuoden elinajanodote, ja onko esimerkiksi Suomessa keskustelu väärillä raiteilla, kun lääkärien enempi koulutus on nostettu erääksi tärkeimmistä ratkaisuista terveydenhuollon parantamiseksi.
Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 8 LIITE 1 Muuttujaluettelo Muuttuja Selite Mitta-asteikko Keskiarvo Hajonta maanosa Sen maanosan nimi, Luokitteluasteikko jossa maa on lukutaidottomuus Miesten ja naisten Intervalliasteikko 20,828 22,6248 lukutaidottomuus yhteensä prosenttia bkthlo Bruttokansantuote Intervalliasteikko 5595,35 8436,437 Yhdysvaltain dollaria / henkilö elinajanodote Elinajanodote vuotta Intervalliasteikko 66,683 10,4171 bkt laakarit Luokka BKT:n perusteella: matala, keskitaso, korkea Lääkärien määrä 100 000 asukasta kohden Järjestysasteikko Absoluuttinen 129,71 135,866
Tilastotieteen johdantokurssin harjoitustyö 5.11.2007 Perttu Kaijansinkko 9 Correlations lääkärit (kpl/100 000 henk) elinajan odote yhteensä 1999 lääkärit (kpl/100 000 henk) elinajan odote yhteensä 1999 Pearson Correlation 1,565(**) Sig. (2-tailed),000 N 126 125 Pearson Correlation,565(**) 1 Sig. (2-tailed),000 N 125 147 ** Correlation is significant at the 0.01 level (2-tailed).