Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Samankaltaiset tiedostot
Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Otannasta ja mittaamisesta

Salkin poliorokotekoe Ryhmän koko Sairastuvuus (per ) Hoitoryhmä Vertailuryhmä Ei saanut rokottaa

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Testit laatueroasteikollisille muuttujille

Harjoitus 2: Matlab - Statistical Toolbox

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Osa 2: Otokset, otosjakaumat ja estimointi

MONISTE 2 Kirjoittanut Elina Katainen

Testit järjestysasteikollisille muuttujille

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Testejä suhdeasteikollisille muuttujille

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

B. Siten A B, jos ja vain jos x A x

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ohjeita kvantitatiiviseen tutkimukseen

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

(x, y) 2. heiton tulos y

Väliestimointi (jatkoa) Heliövaara 1

Teema 8: Parametrien estimointi ja luottamusvälit

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Kvantitatiivisen aineiston analyysi

Ohjeita kvantitatiiviseen tutkimukseen

pitkittäisaineistoissa

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Ohjeita kvantitatiiviseen tutkimukseen

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Monitasomallit koulututkimuksessa

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

ABHELSINKI UNIVERSITY OF TECHNOLOGY

D ( ) Var( ) ( ) E( ) [E( )]

Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Sovellettu todennäköisyyslaskenta B

30A02000 Tilastotieteen perusteet

Sovellettu todennäköisyyslaskenta B

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

7. Tutkimuksen teko. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Tutkimusasetelma, mittaaminen ja otanta

Sovellettu todennäköisyyslaskenta B

Matemaatikot ja tilastotieteilijät

pitkittäisaineistoissa

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kuvaaminen

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Lohkoasetelmat. Kuusinen/Heliövaara 1

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Kvantitatiiviset menetelmät

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden aksioomat

7. laskuharjoituskierros, vko 10, ratkaisut

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

Mat Tilastollisen analyysin perusteet, kevät 2007

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Teema 7: Todennäköisyyksien laskentaa

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Transkriptio:

TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Johdatus tilastotieteeseen ja mittaaminen TKK (c) Ilkka Mellin (2004) 2 ja mittaaminen: Mitä opimme? 1/3 Tilastollisen tutkimuksen kaikki mahdolliset kohteet muodostavat tutkimuksen perusjoukon. Tilastollinen tutkimusaineisto muodostuu perusjoukon alkioita koskevista numeerisista tiedoista. Tutkimusta sanotaan kokeeksi, jos tavoitteena on selvittää, miten kohteiden olosuhteiden aktiivinen muuttaminen vaikuttaa kohteisiin. Tutkimus perustuu suoriin havaintoihin, jos tutkimuksessa seurataan kohteiden olosuhteisiin puuttumatta, miten kohteiden olosuhteet ja niiden muuttuminen vaikuttavat kohteisiin. Vain kontrolloidut kokeet mahdollistavat kausaalipäätelmien teon. Jos kaikki perusjoukon alkiot tutkitaan, tutkimusta sanotaan kokonaistutkimukseksi. Jos vain osa perusjoukon alkioista tutkitaan, tutkimusta sanotaan otantatutkimukseksi. TKK (c) Ilkka Mellin (2004) 3 ja mittaaminen: Mitä opimme? 2/3 Tiedot tutkimuksen kohteista saadaan mittaamalla kohteiden ominaisuudet ja olosuhteet, joissa kohteet ovat. Mittaaminen tarkoittaa numeeristen arvojen liittämistä tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Hyvä mittari on validi ja reliaabeli. Mittaamisessa käytettävä mitta-asteikko kuvaa mittaamisen tarkkuutta. Mitta-asteikot ovat nominaali- eli laatueroasteikko, ordinaali- eli järjestysasteikko, intervalli- eli välimatka-asteikko ja suhdeasteikko. Tutkimuksen kohteiden ominaisuudet ja niitä vastaavat tilastolliset muuttujat voidaan jakaa kvalitatiivisiin ja kvantitatiivisiin. Tutkimuksen kohteita kuvaavat tilastolliset muuttujat voidaan jakaa diskreetteihin ja jatkuviin. TKK (c) Ilkka Mellin (2004) 4 ja mittaaminen: Mitä opimme? 3/3 Tilastolliset menetelmät voidaan luokitella tutkimuksen kohteena olevien muuttujien mitta-asteikollisten ominaisuuksien suhteen. ja mittaaminen >> TKK (c) Ilkka Mellin (2004) 5 TKK (c) Ilkka Mellin (2004) 6

TKK (c) Ilkka Mellin (2004) 7 Perusjoukko, tilastollinen aineisto, havainto Avainsanat Havainto Havaintoarvo Havaintoyksikkö Koe Kokonaistutkimus Kontrolloitu koe Otanta Otantamenetelmät Moniasteinen otanta Ositettu otanta Ryväsotanta Yksinkertainen satunnaisotanta Otantatutkimus Perusjoukko Satunnaisotanta Satunnaistus Suorat havainnot Tilastollinen aineisto Tilastollisten aineistojen kerääminen Tilastollisen tutkimuksen kaikkien mahdollisten kohteet muodostavat tutkimuksen (kohde-) perusjoukon. Tutkimuksen kohteita tarkastellaan aina jonkin perusjoukon muodostamassa kehikossa. Tutkimuksen kohteiksi valittuja perusjoukon alkioita kutsutaan havaintoyksiköiksi. Tilastollinen aineisto koostuu havaintoyksiköiden ominaisuuksia ja olosuhteita kuvaavista numeerisista tai kvantitatiivisista tiedoista. Havaintoyksiköitä koskevia numeerisia tai kvantitatiivisia tietoja kutsutaan havaintoarvoiksi tai havainnoiksi. TKK (c) Ilkka Mellin (2004) 8 Miten tilastollisia aineistoja kerätään? 1/2 Miten tilastollisia aineistoja kerätään? 2/2 Muutetaanko tutkimuksessa aktiivisesti tutkimuksen kohteiden olosuhteita? (i) Tutkimus on koe, jos tutkimuksen tavoitteena on selvittää, miten olosuhteiden aktiivinen muuttaminen vaikuttaa kohteisiin. (ii) Tutkimus perustuu suoriin havaintoihin, jos tutkimuksen tavoitteena on ainoastaan seurata, miten kohteiden olosuhteet ja niiden muutokset vaikuttavat kohteisiin. Kohdistuuko tutkimus kaikkiin perusjoukon alkioihin vai johonkin perusjoukon osaan? (i) Tutkimusta kutsutaan kokonaistutkimukseksi, jos kaikki perusjoukon alkiot tutkitaan. (ii) Tutkimusta kutsutaan otantatutkimukseksi, jos tutkimus kohdistuu johonkin perusjoukon osajoukkoon. TKK (c) Ilkka Mellin (2004) 9 TKK (c) Ilkka Mellin (2004) 10 Koe Koeasetelmat Kokeellisessa tutkimuksessa tavoitteena on selvittää, millaisia vaikutuksia tutkimuksen kohteisiin kohdistetuilla erilaisilla käsittelyillä on kohteisiin. Käsittelyllä tarkoitetaan tutkimuksen kohteiden olosuhteiden aktiivista, suunnitelmallista ja järjestelmällistä muuttamista. Tiukasti ottaen vain kokeiden perusteella voidaan tehdä kausaalisia eli syy-yhteyksiä koskevia päätelmiä. Tutkimus perustuu suorien havaintojen tekemiseen, jos havaintojen kohteiden olosuhteisiin ei tutkimuksessa puututa. Koeasetelmalla tarkoitetaan kokeen tekemiseen liittyviä periaatteita ja sääntöjä: (i) Mitä käsittelyitä kokeen kohteisiin sovelletaan? (ii) Miten kokeen kohteet valitaan? (iii) Mikä on tehtävien koetoistojen lukumäärä? TKK (c) Ilkka Mellin (2004) 11 TKK (c) Ilkka Mellin (2004) 12

TKK (c) Ilkka Mellin (2004) 13 Kontrolloidut kokeet Yksinkertainen kontrolloitu koe Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: (i) Koetuloksiin vaikuttavien ulkopuolisten sekoittavien tekijöiden kontrolloimiseksi kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. (ii) Erilaisten käsittelyiden kohteiksi valittavien perusjoukon alkioiden välisten systemaattisten erojen kontrolloimiseksi käsittelyiden kohdistamisessa on käytettävä satunnaistusta. (iii) Koetuloksiin liittyvän satunnaisvaihtelun kontrolloimiseksi kokeessa on tehtävä riittävästi koetoistoja. Alla oleva kaavio kuvaa yksinkertaista kontrolloitua koetta: (1) Jaetaan kokeen kohteet satunnaisesti kahteen ryhmään. (2) Kohdistetaan ryhmiin erilaiset käsittelyt. (3) Vertaillaan käsittelyiden vaikutuksia. Satunnaistus Ryhmä 1 Ryhmä 2 Käsittely 1 Käsittely 2 Vertailu TKK (c) Ilkka Mellin (2004) 14 Yksinkertainen kontrolloitu koe: Esimerkki Oletetaan, että haluamme tutkia vastakehitetyn lääkkeen tehoa tautiin, johon aikaisemmin ei ole ollut lääkettä, mutta josta osa potilaista saattaa parantua myös ilman hoitoa. Tällöin lääkkeen tehon selvittämiseksi voidaan järjestää kontrolloitu koe esimerkiksi seuraavalla tavalla: (1) Jaetaan riittävän suuri joukko potilaita satunnaisesti kahteen ryhmään. (2) Annetaan toiselle ryhmälle uutta lääkettä ja toiselle ryhmälle plaseboa eli lumelääkettä. (3) Vertaillaan parantuneiden suhteellisia osuuksia. Pohdi seuraavia kysymyksiä: Miksi potilaita pitää olla riittävästi? Miksi potilaat jaetaan ryhmiin satunnaisesti? Miksi toiselle ryhmälle annetaan plaseboa? Kontrolloidut kokeet: Kommentteja 1/3 Jos koe on kontrolloitu eli kokeessa on käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistusta ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin on mahdollista. Jos koe on kontrolloitu, koetuloksiin liittyvät systemaattiset ja satunnaiset tekijät voidaan erottaa ja kuvata ja kuvauksen luotettavuus voidaan arvioida. Jos koe on kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin voidaan tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2004) 15 TKK (c) Ilkka Mellin (2004) 16 Kontrolloidut kokeet: Kommentteja 2/3 Jos koe ei ole kontrolloitu eli kokeessa ei ole käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistusta ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin ei ole mahdollista. Jos koe ei ole kontrolloitu, koetuloksiin liittyviä systemaattisia ja satunnaisia tekijöitä ei voida erottaa ja kuvata ja kuvauksen luotettavuutta ei voida arvioida. Jos koe ei ole kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin ei voida tehdä luotettavia johtopäätöksiä. Kontrolloidut kokeet: Kommentteja 3/3 Jos koe ei ole kontrolloitu, koeasetelma saattaa systemaattisesti suosia joitakin tulosvaihtoehtoja. Jos koeasetelma suosii systemaattisesti joitakin tulosvaihtoehtoja, asetelmaa sanotaan harhaiseksi. Harhaisten koeasetelmien perusteella ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2004) 17 TKK (c) Ilkka Mellin (2004) 18

TKK (c) Ilkka Mellin (2004) 19 Kontrolloidut kokeet ja satunnaistus 1/2 Kontrolloidut kokeet ja satunnaistus 2/2 Kokeen satunnaistus tarkoittaa sitä, että käsittelyiden kohdistamisessa käytetään arvontaa. Arvonta on ainoa puolueeton tapa kohdistaa käsittelyitä, koska arpominen ei suosi mitään perusjoukon osaa. Satunnaistettujen kokeiden tulosten analysointiin voidaan soveltaa tilastollisia menetelmiä, koska arvonta noudattaa todennäköisyyslaskennan lakeja. Satunnaistus takaa suurella todennäköisyydellä sen, että kokeessa erilaisten käsittelyiden kohteiksi joutuvat perusjoukon osajoukot ovat ennen käsittelyiden soveltamista ominaisuuksiltaan keskimäärin samankaltaisia. Satunnaistus takaa suurella todennäköisyydellä sen, että kokeen tuloksista voidaan tehdä kausaalipäätelmiä: Jos koe on satunnaistettu, kokeen tuloksissa havaitut systemaattisten erojen on johduttava erilaisista käsittelyistä. TKK (c) Ilkka Mellin (2004) 20 Suorat havainnot Suorat havainnot ja satunnaisotanta Suoriin havaintoihin perustuvassa tutkimuksessa tavoitteena on saada selville tutkimuksen kohteiden olosuhteisiin puuttumatta, mitä vaikutuksia kohteiden olosuhteilla ja niissä tapahtuvilla muutoksilla on kohteisiin. Tiukasti ottaen suoriin havaintoihin perustuvien tutkimusten perusteella ei voida tehdä kausaalisia eli syy-yhteyksiä koskevia johtopäätöksiä. Tutkimus on koe, jos kohteiden olosuhteita muutetaan aktiivisesti tutkimuksen aikana. TKK (c) Ilkka Mellin (2004) 21 Suoria havaintoja tehtäessä havaintojen tulokset saattavat olla harhaisia. Havaintojen tulokset ovat harhaisia, jos havaintoja tehtäessä suositaan systemaattisesti joitakin tulosvaihtoehtoja. Harhaisten havaintotulosten perusteella ei voida tehdä luotettavia johtopäätöksiä. Harhan välttämiseksi havaintojen kohteet on valittava perusjoukosta satunnaisesti (ellei tavoitteena ole tutkia kaikkia perusjoukon alkioita). Tämä merkitsee satunnaisotannan soveltamista havaintojen kohteiden valintaan. TKK (c) Ilkka Mellin (2004) 22 Kokonaistutkimus Otantatutkimus Tutkimus on kokonaistutkimus, jos se kohdistuu kaikkiin (kohde-) perusjoukon alkioihin. Huomautuksia: Kokonaistutkimuksen tekeminen on vain harvoin mahdollista. Jos perusjoukko on ääretön, kokonaistutkimuksen tekeminen on jopa periaatteessa mahdotonta. Äärelliseen perusjoukkoon kohdistuvat kokonaistutkimukset voidaan aina tulkita otantatutkimuksiksi: Tällöin tutkimuksen kohteena oleva perusjoukko tulkitaan otokseksi hypoteettisesta äärettömästä perusjoukosta. Tutkimus on otantatutkimus, jos se kohdistuu johonkin perusjoukon osajoukkoon. Otantatutkimuksessa perusjoukon osajoukosta tehdyt johtopäätökset pyritään yleistämään koko perusjoukkoon. Tutkimuksen kohteeksi valittua perusjoukon osajoukkoa kutsutaan otokseksi. Otoksen valitsemista eli poimimista kutsutaan otannaksi. Otoksen poiminnassa käytettyjä menetelmiä kutsutaan otantamenetelmiksi. TKK (c) Ilkka Mellin (2004) 23 TKK (c) Ilkka Mellin (2004) 24

TKK (c) Ilkka Mellin (2004) 25 Satunnaisotanta Otantamenetelmät Perusjoukosta voidaan tehdä luotettavia johtopäätöksiä otoksen perustella vain, jos otos muodostaa perusjoukon edustavan pienoiskuvan. Otoksen poimiminen satunnaisesti takaa suurella todennäköisyydellä sen, että otos muodostaa perusjoukon edustavan pienoiskuvan. Otoksen poiminta satunnaisesti merkitsee otokseen poimittavien havaintoyksiköiden arpomista perusjoukon alkioiden joukosta. Arvonta on ainoa puolueeton tapa poimia otos, koska arpominen ei suosi mitään perusjoukon osaa. Arvonta noudattaa todennäköisyyslaskennan lakeja. Tilastollisessa tutkimuksessa sovelletaan tutkimusasetelmasta riippuen erilaisia otantamenetelmiä. Otannan perusmuoto: Yksinkertainen satunnaisotanta Muita otantamenetelmiä: Systemaattinen otanta Ositettu otanta Ryväsotanta Moniasteinen otanta TKK (c) Ilkka Mellin (2004) 26 Yksinkertainen satunnaisotanta 1/2 Yksinkertainen satunnaisotanta on otannan perusmuoto, jossa jokaisella perusjoukon alkiolla on sama todennäköisyys tulla valituksi otokseen. Jos otos poimitaan yksinkertaisella satunnaisotannalla, myös jokaisella perusjoukon samankokoisella osajoukolla on sama todennäköisyys tulla valituksi otokseksi. Yksinkertainen satunnaisotanta voidaan aina tulkita arvonnaksi. TKK (c) Ilkka Mellin (2004) 27 Yksinkertainen satunnaisotanta 2/2 Arvonta yksinkertaisessa satunnaisotannassa: (i) Alkiot arvotaan perusjoukosta otokseen yksi alkio kerrallaan. (ii) Jokaisella perusjoukon alkiolla on arvonnassa yhtä suuri todennäköisyys tulla valituksi otokseen. Huomautuksia: Yksinkertaisessa satunnaisotannassa alkiot poimitaan otokseen palauttaen: Poimittu alkio palautetaan välittömästi takaisin perusjoukkoon, jolloin on mahdollista, että se tulee poimituksi uudelleen. Yksinkertaisessa satunnaisotannassa arvonnat ovat toisistaan riippumattomia: Alkion todennäköisyys tulla valituksi otokseen ei riipu siitä mitä alkiota otokseen on jo poimittu. TKK (c) Ilkka Mellin (2004) 28 Systemaattinen otanta Systemaattisessa otannassa otokseen poimitaan joka k. alkio perusjoukon alkioiden järjestetystä jonosta. Systemaattista otantaa sovelletaan usein yksinkertaisen satunnaisotannan sijasta, jos perusjoukon alkioista on käytettävissä tietorekisteri tai luettelo tai havaintoja kerätään ajassa tai tilassa. Systemaattisen otannan tulos vastaa täysin yksinkertaisen satunnaisotannan tulosta, jos perusjoukon alkioiden järjestys on tutkittavan ilmiön kannalta satunnainen. Ositettu otanta Ositettua otantaa voidaan soveltaa tilanteissa, joissa perusjoukko koostuu jonkin perusjoukon alkioiden ominaisuuden suhteen homogeenisista ryhmistä. Tällöin otos kerätään siten, että jokaisesta ryhmästä eli ositteesta poimitaan osaotos, jotka yhdistetään yhdeksi otokseksi. Esimerkki: Oletetaan, että maassa on useita erikokoisia kieliryhmiä ja tavoitteena on vertailla eri kieliryhmiin kuuluvien taloudellista asemaa. Jokaisesta ryhmästä saadaan otokseen riittävä edustus poimimalla jokaisesta ryhmästä samankokoinen osaotos. TKK (c) Ilkka Mellin (2004) 29 TKK (c) Ilkka Mellin (2004) 30

TKK (c) Ilkka Mellin (2004) 31 Ryväsotanta Ryväsotantaa voidaan soveltaa tilanteissa, joissa perusjoukko voidaan jakaa ryppäisiin eli ryhmiin. Tällöin otos kerätään kahdessa vaiheessa: (1) Poimitaan ensin joukko ryppäitä kaikkien ryppäiden joukosta. (2) Poimitaan jokaisesta vaiheessa (1) poimitusta ryppäästä joukko perusjoukon alkioita ja yhdistetään alkiot yhdeksi otokseksi. Vaiheissa (1) ja (2) voidaan soveltaa yksinkertaista satunnaisotantaa tai systemaattista otantaa. Moniasteinen otanta Moniasteista otantaa voidaan soveltaa tilanteissa, joissa perusjoukko voidaan jakaa ryppäisiin eli ryhmiin hierarkkisesti eli perusjoukko voidaan jakaa ryppäisiin, jotka puolestaan voidaan jakaa aliryppäisiin jne. Esimerkki: Läänit, Kunnat, Koulupiirit, Koulut, Luokat Otos kerätään vaiheittain poimimalla 1. asteen ryppäiden joukosta joukko ryppäitä, joista jokaisesta poimitaan joukko aliryppäitä jne. kunnes päästään poimimaan perusjoukon alkioita. Poiminnan eri vaiheissa voidaan soveltaa yksinkertaista satunnaisotantaa tai systemaattista otantaa. TKK (c) Ilkka Mellin (2004) 32 >> Avainsanat Diskreetit muuttujat Jatkuvat muuttujat Kvalitatiiviset muuttujat Kvantitatiiviset muuttujat Mittaaminen Mitta-asteikot Intervalli- eli välimatka-asteikko Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Suhdeasteikko Mitta-asteikot ja tilastolliset menetelmät Mittarin tarkkuus Mittarin validiteetti Mittarit TKK (c) Ilkka Mellin (2004) 33 TKK (c) Ilkka Mellin (2004) 34 Mittaaminen ja mittari 1/2 Mittaaminen ja mittari 2/2 Tilastollisen tutkimuksen kohteiden ominaisuuksia ja olosuhteita sekä niiden muutoksia kuvaavat numeeriset tai kvantitatiiviset tiedot saadaan mittaamalla. Mittaaminen tarkoittaa numeeristen arvojen liittämistä tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Mittari on funktio, joka liittää numeeriset arvot tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Ominaisuus Mittari Numeerinen arvo Mittauksen tulos voidaan aina ilmaista jonkin tutkimuksen kohteen ominaisuutta tai olosuhdetta kuvaavan muuttujan arvona. Ominaisuus Muuttuja Tutkimuksen kohteiden ominaisuudet ja olosuhteet kuvataan siis mittaustapahtumassa numeerisilla muuttujilla. TKK (c) Ilkka Mellin (2004) 35 TKK (c) Ilkka Mellin (2004) 36

TKK (c) Ilkka Mellin (2004) 37 Mittareiden validiteetti ja tarkkuus Mitta-asteikot Mittari on validi, jos se esittää mittauksen kohteena olevaa ominaisuutta tai olosuhdetta oikein, merkityksellisesti ja tarkoituksenmukaisesti. Mittari on tarkka, jos se on harhaton ja reliaabeli: (i) Mittari on harhaton, jos se ei systemaattisesti ali- tai yliarvioi mitattavaa ominaisuuden tai olosuhteen määrää. (ii) Mittari on reliaabeli eli luotettava, jos mittaustulos ei muutu, kun mittausta toistetaan. Mittaamisessa voidaan käyttää seuraavia mitta-asteikoita: (i) Nominaali- eli laatueroasteikko (ii) Ordinaali- eli järjestysasteikko (iii) Intervalli- eli välimatka-asteikko (iv) Suhdeasteikko Jos ominaisuutta voidaan mitata kaikilla neljällä mittaasteikoilla, mittaustuloksen informatiivisuus, mutta samalla myös mittauksen vaativuus kasvaa seuraavassa järjestyksessä: (i) (ii) (iii) (iv) TKK (c) Ilkka Mellin (2004) 38 Nominaaliasteikko ja ordinaaliasteikko Intervalliasteikko ja suhdeasteikko Mittaus on tehty nominaali- eli laatueroasteikolla, jos mittaus kertoo mihin luokkaan mittauksen kohde kuuluu. Esimerkkejä: Sukupuoli, Asuinpaikka, Väri, Viallisuus Mittaus on tehty intervalli- eli välimatka-asteikolla, jos mittaus kertoo kuinka paljon kahden mitattavan kohteen ominaisuudet eroavat toisistaan. Esimerkkejä: Lämpötila Celsius-asteissa Mittaus on tehty ordinaali- eli järjestysasteikolla, jos mittaus kertoo onko mittauksen kohteella mitattavaa ominaisuutta enemmän tai vähemmän kuin jollakin toisella kohteella. Esimerkkejä: Kouluarvosanat, Aineen kovuus Mittaus on tehty suhdeasteikolla, jos mittaus kertoo kuinka monta kertaa enemmän tai vähemmän mittauksen kohteella on mitattavaa ominaisuutta kuin jollakin toisella kohteella. Esimerkkejä: Lukumäärä, Pituus, Pinta-ala, Tilavuus, Paino, Aika, Nopeus, Paine, Rahamäärä, Korko TKK (c) Ilkka Mellin (2004) 39 TKK (c) Ilkka Mellin (2004) 40 Intervalliasteikko ja suhdeasteikko: Kommentteja Tilastotieteessä ei yleensä ole tarpeen erottaa intervalli- ja suhdeasteikollisia muuttujia. Intervalli- ja suhdeasteikollisten muuttujien mittaasteikoilla on kuitenkin seuraava ero: (i) Intervalliasteikollisten muuttujien mitta-asteikossa ei ole luonnollista nollapistettä. (ii) Suhdeasteikollisten muuttujien mitta-asteikossa on luonnollinen nollapiste, jota pienempiä arvoja muuttuja ei voi saada. Kvalitatiiviset ja kvantitatiiviset muuttujat Ominaisuutta ja sitä kuvaavaa muuttujaa kutsutaan kvalitatiiviseksi, jos mittauksen kohteet voidaan luokitella mittauksen perusteella toisistaan eroaviin kategorioihin tai luokkiin. Kvalitatiivisia ominaisuuksia kuvataan laatueroasteikollisilla muuttujilla. Ominaisuutta ja sitä kuvaavaa muuttujaa kutsutaan kvantitatiiviseksi, jos mittaus tuottaa ominaisuuden määrällisen arvon. Kvantitatiivisia ominaisuuksia kuvataan välimatka-tai suhdeasteikollisilla muuttujilla. TKK (c) Ilkka Mellin (2004) 41 TKK (c) Ilkka Mellin (2004) 42

TKK (c) Ilkka Mellin (2004) 43 Diskreetit ja jatkuvat muuttujat Mitta-asteikot ja tilastolliset menetelmät Mitattavaa ominaisuutta vastaava muuttuja on diskreetti, jos se voi saada vain erillisiä arvoja. Esimerkkejä: Laatueroasteikolliset muuttujat, Järjestysasteikolliset muuttujat, Lukumäärämuuttujat Mitattavaa ominaisuutta vastaava muuttuja on jatkuva, jos se voi saada kaikki arvot joltakin väliltä. Esimerkkejä: Pituus, Pinta-ala, Tilavuus, Paino, Aika, Nopeus, Paine, Rahamäärä, Korko Tilastolliset menetelmät voidaan ryhmitellä tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mittaasteikon mukaan. Tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mitta-asteikot määräävät sen, mitä tilastollisia menetelmiä tutkimuksessa saa soveltaa ja/tai mitkä menetelmät ovat suositeltavia. Tässä esityksessä tilastolliset tunnusluvut ja tilastolliset testit on ryhmitelty tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mitta-asteikon mukaan. TKK (c) Ilkka Mellin (2004) 44