Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Samankaltaiset tiedostot
Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Otannasta ja mittaamisesta

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Salkin poliorokotekoe Ryhmän koko Sairastuvuus (per ) Hoitoryhmä Vertailuryhmä Ei saanut rokottaa

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Testit laatueroasteikollisille muuttujille

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

Harjoitus 2: Matlab - Statistical Toolbox

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Osa 2: Otokset, otosjakaumat ja estimointi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Testit järjestysasteikollisille muuttujille

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Testejä suhdeasteikollisille muuttujille

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

MONISTE 2 Kirjoittanut Elina Katainen

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

B. Siten A B, jos ja vain jos x A x

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

Ohjeita kvantitatiiviseen tutkimukseen

(x, y) 2. heiton tulos y

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Väliestimointi (jatkoa) Heliövaara 1

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

Teema 8: Parametrien estimointi ja luottamusvälit

Monitasomallit koulututkimuksessa

Kvantitatiivisen aineiston analyysi

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

pitkittäisaineistoissa

Sovellettu todennäköisyyslaskenta B

Ohjeita kvantitatiiviseen tutkimukseen

Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1

Ohjeita kvantitatiiviseen tutkimukseen

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

Sovellettu todennäköisyyslaskenta B

D ( ) Var( ) ( ) E( ) [E( )]

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

30A02000 Tilastotieteen perusteet

7. Tutkimuksen teko. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Tutkimusasetelma, mittaaminen ja otanta

Mat Tilastollisen analyysin perusteet, kevät 2007

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Kandidaatintutkielman aineistonkeruu ja analyysi

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Tilastollisten aineistojen kuvaaminen

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Sovellettu todennäköisyyslaskenta B

Matemaatikot ja tilastotieteilijät

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

pitkittäisaineistoissa

Tehtävä 1. Hypoteesi: Liikuntaneuvonta on hyvä keino vaikuttaa terveydentilaan. Onko edellinen hypoteesi hyvä tutkimushypoteesi? Kyllä.

Mat Tilastollisen analyysin perusteet, kevät 2007

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

7. laskuharjoituskierros, vko 10, ratkaisut

Mat Tilastollisen analyysin perusteet, kevät 2007

Kvantitatiiviset menetelmät

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden aksioomat

Lohkoasetelmat. Kuusinen/Heliövaara 1

Viestinnän mentelmät I: sisällön erittely. Sisällönanalyysi/sisällön erittely. Sisällön erittely. Juha Herkman

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Transkriptio:

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1

ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c) Ilkka Mellin (2004) 2

ja mittaaminen: Mitä opimme? 1/3 Tilastollisen tutkimuksen kaikki mahdolliset kohteet muodostavat tutkimuksen perusjoukon. Tilastollinen tutkimusaineisto muodostuu perusjoukon alkioita koskevista numeerisista tiedoista. Tutkimusta sanotaan kokeeksi, jos tavoitteena on selvittää, miten kohteiden olosuhteiden aktiivinen muuttaminen vaikuttaa kohteisiin. Tutkimus perustuu suoriin havaintoihin, jos tutkimuksessa seurataan kohteiden olosuhteisiin puuttumatta, miten kohteiden olosuhteet ja niiden muuttuminen vaikuttavat kohteisiin. Vain kontrolloidut kokeet mahdollistavat kausaalipäätelmien teon. Jos kaikki perusjoukon alkiot tutkitaan, tutkimusta sanotaan kokonaistutkimukseksi. Jos vain osa perusjoukon alkioista tutkitaan, tutkimusta sanotaan otantatutkimukseksi. TKK (c) Ilkka Mellin (2004) 3

ja mittaaminen: Mitä opimme? 2/3 Tiedot tutkimuksen kohteista saadaan mittaamalla kohteiden ominaisuudet ja olosuhteet, joissa kohteet ovat. Mittaaminen tarkoittaa numeeristen arvojen liittämistä tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Hyvä mittari on validi ja reliaabeli. Mittaamisessa käytettävä mitta-asteikko kuvaa mittaamisen tarkkuutta. Mitta-asteikot ovat nominaali- eli laatueroasteikko, ordinaali- eli järjestysasteikko, intervalli- eli välimatka-asteikko ja suhdeasteikko. Tutkimuksen kohteiden ominaisuudet ja niitä vastaavat tilastolliset muuttujat voidaan jakaa kvalitatiivisiin ja kvantitatiivisiin. Tutkimuksen kohteita kuvaavat tilastolliset muuttujat voidaan jakaa diskreetteihin ja jatkuviin. TKK (c) Ilkka Mellin (2004) 4

ja mittaaminen: Mitä opimme? 3/3 Tilastolliset menetelmät voidaan luokitella tutkimuksen kohteena olevien muuttujien mitta-asteikollisten ominaisuuksien suhteen. TKK (c) Ilkka Mellin (2004) 5

ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c) Ilkka Mellin (2004) 6

Avainsanat Havainto Havaintoarvo Havaintoyksikkö Koe Kokonaistutkimus Kontrolloitu koe Otanta Otantamenetelmät Moniasteinen otanta Ositettu otanta Ryväsotanta Yksinkertainen satunnaisotanta Otantatutkimus Perusjoukko Satunnaisotanta Satunnaistus Suorat havainnot Tilastollinen aineisto Tilastollisten aineistojen kerääminen TKK (c) Ilkka Mellin (2004) 7

Perusjoukko, tilastollinen aineisto, havainto Tilastollisen tutkimuksen kaikkien mahdollisten kohteet muodostavat tutkimuksen (kohde-) perusjoukon. Tutkimuksen kohteita tarkastellaan aina jonkin perusjoukon muodostamassa kehikossa. Tutkimuksen kohteiksi valittuja perusjoukon alkioita kutsutaan havaintoyksiköiksi. Tilastollinen aineisto koostuu havaintoyksiköiden ominaisuuksia ja olosuhteita kuvaavista numeerisista tai kvantitatiivisista tiedoista. Havaintoyksiköitä koskevia numeerisia tai kvantitatiivisia tietoja kutsutaan havaintoarvoiksi tai havainnoiksi. TKK (c) Ilkka Mellin (2004) 8

Miten tilastollisia aineistoja kerätään? 1/2 Muutetaanko tutkimuksessa aktiivisesti tutkimuksen kohteiden olosuhteita? (i) Tutkimus on koe, jos tutkimuksen tavoitteena on selvittää, miten olosuhteiden aktiivinen muuttaminen vaikuttaa kohteisiin. (ii) Tutkimus perustuu suoriin havaintoihin, jos tutkimuksen tavoitteena on ainoastaan seurata, miten kohteiden olosuhteet ja niiden muutokset vaikuttavat kohteisiin. TKK (c) Ilkka Mellin (2004) 9

Miten tilastollisia aineistoja kerätään? 2/2 Kohdistuuko tutkimus kaikkiin perusjoukon alkioihin vai johonkin perusjoukon osaan? (i) Tutkimusta kutsutaan kokonaistutkimukseksi, jos kaikki perusjoukon alkiot tutkitaan. (ii) Tutkimusta kutsutaan otantatutkimukseksi, jos tutkimus kohdistuu johonkin perusjoukon osajoukkoon. TKK (c) Ilkka Mellin (2004) 10

Koe Kokeellisessa tutkimuksessa tavoitteena on selvittää, millaisia vaikutuksia tutkimuksen kohteisiin kohdistetuilla erilaisilla käsittelyillä on kohteisiin. Käsittelyllä tarkoitetaan tutkimuksen kohteiden olosuhteiden aktiivista, suunnitelmallista ja järjestelmällistä muuttamista. Tiukasti ottaen vain kokeiden perusteella voidaan tehdä kausaalisia eli syy-yhteyksiä koskevia päätelmiä. Huomautus: Tutkimus perustuu suorien havaintojen tekemiseen, jos havaintojen kohteiden olosuhteisiin ei tutkimuksessa puututa. TKK (c) Ilkka Mellin (2004) 11

Koeasetelmat Koeasetelmalla tarkoitetaan kokeen tekemiseen liittyviä periaatteita ja sääntöjä: (i) Mitä käsittelyitä kokeen kohteisiin sovelletaan? (ii) Miten kokeen kohteet valitaan? (iii) Mikä on tehtävien koetoistojen lukumäärä? TKK (c) Ilkka Mellin (2004) 12

Kontrolloidut kokeet Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: (i) Koetuloksiin vaikuttavien ulkopuolisten sekoittavien tekijöiden kontrolloimiseksi kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. (ii) Erilaisten käsittelyiden kohteiksi valittavien perusjoukon alkioiden välisten systemaattisten erojen kontrolloimiseksi käsittelyiden kohdistamisessa on käytettävä satunnaistusta. (iii) Koetuloksiin liittyvän satunnaisvaihtelun kontrolloimiseksi kokeessa on tehtävä riittävästi koetoistoja. TKK (c) Ilkka Mellin (2004) 13

Yksinkertainen kontrolloitu koe Alla oleva kaavio kuvaa yksinkertaista kontrolloitua koetta: (1) Jaetaan kokeen kohteet satunnaisesti kahteen ryhmään. (2) Kohdistetaan ryhmiin erilaiset käsittelyt. (3) Vertaillaan käsittelyiden vaikutuksia. Ryhmä 1 Käsittely 1 Satunnaistus Vertailu Ryhmä 2 Käsittely 2 TKK (c) Ilkka Mellin (2004) 14

Yksinkertainen kontrolloitu koe: Esimerkki Oletetaan, että haluamme tutkia vastakehitetyn lääkkeen tehoa tautiin, johon aikaisemmin ei ole ollut lääkettä, mutta josta osa potilaista saattaa parantua myös ilman hoitoa. Tällöin lääkkeen tehon selvittämiseksi voidaan järjestää kontrolloitu koe esimerkiksi seuraavalla tavalla: (1) Jaetaan riittävän suuri joukko potilaita satunnaisesti kahteen ryhmään. (2) Annetaan toiselle ryhmälle uutta lääkettä ja toiselle ryhmälle plaseboa eli lumelääkettä. (3) Vertaillaan parantuneiden suhteellisia osuuksia. Pohdi seuraavia kysymyksiä: Miksi potilaita pitää olla riittävästi? Miksi potilaat jaetaan ryhmiin satunnaisesti? Miksi toiselle ryhmälle annetaan plaseboa? TKK (c) Ilkka Mellin (2004) 15

Kontrolloidut kokeet: Kommentteja 1/3 Jos koe on kontrolloitu eli kokeessa on käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistusta ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin on mahdollista. Jos koe on kontrolloitu, koetuloksiin liittyvät systemaattiset ja satunnaiset tekijät voidaan erottaa ja kuvata ja kuvauksen luotettavuus voidaan arvioida. Jos koe on kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin voidaan tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2004) 16

Kontrolloidut kokeet: Kommentteja 2/3 Jos koe ei ole kontrolloitu eli kokeessa ei ole käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistusta ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin ei ole mahdollista. Jos koe ei ole kontrolloitu, koetuloksiin liittyviä systemaattisia ja satunnaisia tekijöitä ei voida erottaa ja kuvata ja kuvauksen luotettavuutta ei voida arvioida. Jos koe ei ole kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2004) 17

Kontrolloidut kokeet: Kommentteja 3/3 Jos koe ei ole kontrolloitu, koeasetelma saattaa systemaattisesti suosia joitakin tulosvaihtoehtoja. Jos koeasetelma suosii systemaattisesti joitakin tulosvaihtoehtoja, asetelmaa sanotaan harhaiseksi. Harhaisten koeasetelmien perusteella ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2004) 18

Kontrolloidut kokeet ja satunnaistus 1/2 Kokeen satunnaistus tarkoittaa sitä, että käsittelyiden kohdistamisessa käytetään arvontaa. Arvonta on ainoa puolueeton tapa kohdistaa käsittelyitä, koska arpominen ei suosi mitään perusjoukon osaa. Satunnaistettujen kokeiden tulosten analysointiin voidaan soveltaa tilastollisia menetelmiä, koska arvonta noudattaa todennäköisyyslaskennan lakeja. TKK (c) Ilkka Mellin (2004) 19

Kontrolloidut kokeet ja satunnaistus 2/2 Satunnaistus takaa suurella todennäköisyydellä sen, että kokeessa erilaisten käsittelyiden kohteiksi joutuvat perusjoukon osajoukot ovat ennen käsittelyiden soveltamista ominaisuuksiltaan keskimäärin samankaltaisia. Satunnaistus takaa suurella todennäköisyydellä sen, että kokeen tuloksista voidaan tehdä kausaalipäätelmiä: Jos koe on satunnaistettu, kokeen tuloksissa havaitut systemaattisten erojen on johduttava erilaisista käsittelyistä. TKK (c) Ilkka Mellin (2004) 20

Suorat havainnot Suoriin havaintoihin perustuvassa tutkimuksessa tavoitteena on saada selville tutkimuksen kohteiden olosuhteisiin puuttumatta, mitä vaikutuksia kohteiden olosuhteilla ja niissä tapahtuvilla muutoksilla on kohteisiin. Tiukasti ottaen suoriin havaintoihin perustuvien tutkimusten perusteella ei voida tehdä kausaalisia eli syy-yhteyksiä koskevia johtopäätöksiä. Huomautus: Tutkimus on koe, jos kohteiden olosuhteita muutetaan aktiivisesti tutkimuksen aikana. TKK (c) Ilkka Mellin (2004) 21

Suorat havainnot ja satunnaisotanta Suoria havaintoja tehtäessä havaintojen tulokset saattavat olla harhaisia. Havaintojen tulokset ovat harhaisia, jos havaintoja tehtäessä suositaan systemaattisesti joitakin tulosvaihtoehtoja. Harhaisten havaintotulosten perusteella ei voida tehdä luotettavia johtopäätöksiä. Harhan välttämiseksi havaintojen kohteet on valittava perusjoukosta satunnaisesti (ellei tavoitteena ole tutkia kaikkia perusjoukon alkioita). Tämä merkitsee satunnaisotannan soveltamista havaintojen kohteiden valintaan. TKK (c) Ilkka Mellin (2004) 22

Kokonaistutkimus Tutkimus on kokonaistutkimus, jos se kohdistuu kaikkiin (kohde-) perusjoukon alkioihin. Huomautuksia: Kokonaistutkimuksen tekeminen on vain harvoin mahdollista. Jos perusjoukko on ääretön, kokonaistutkimuksen tekeminen on jopa periaatteessa mahdotonta. Äärelliseen perusjoukkoon kohdistuvat kokonaistutkimukset voidaan aina tulkita otantatutkimuksiksi: Tällöin tutkimuksen kohteena oleva perusjoukko tulkitaan otokseksi hypoteettisesta äärettömästä perusjoukosta. TKK (c) Ilkka Mellin (2004) 23

Otantatutkimus Tutkimus on otantatutkimus, jos se kohdistuu johonkin perusjoukon osajoukkoon. Otantatutkimuksessa perusjoukon osajoukosta tehdyt johtopäätökset pyritään yleistämään koko perusjoukkoon. Tutkimuksen kohteeksi valittua perusjoukon osajoukkoa kutsutaan otokseksi. Otoksen valitsemista eli poimimista kutsutaan otannaksi. Otoksen poiminnassa käytettyjä menetelmiä kutsutaan otantamenetelmiksi. TKK (c) Ilkka Mellin (2004) 24

Satunnaisotanta Perusjoukosta voidaan tehdä luotettavia johtopäätöksiä otoksen perustella vain, jos otos muodostaa perusjoukon edustavan pienoiskuvan. Otoksen poimiminen satunnaisesti takaa suurella todennäköisyydellä sen, että otos muodostaa perusjoukon edustavan pienoiskuvan. Otoksen poiminta satunnaisesti merkitsee otokseen poimittavien havaintoyksiköiden arpomista perusjoukon alkioiden joukosta. Arvonta on ainoa puolueeton tapa poimia otos, koska arpominen ei suosi mitään perusjoukon osaa. Arvonta noudattaa todennäköisyyslaskennan lakeja. TKK (c) Ilkka Mellin (2004) 25

Otantamenetelmät Tilastollisessa tutkimuksessa sovelletaan tutkimusasetelmasta riippuen erilaisia otantamenetelmiä. Otannan perusmuoto: Yksinkertainen satunnaisotanta Muita otantamenetelmiä: Systemaattinen otanta Ositettu otanta Ryväsotanta Moniasteinen otanta TKK (c) Ilkka Mellin (2004) 26

Otantamenetelmät: Yksinkertainen satunnaisotanta 1/2 Yksinkertainen satunnaisotanta on otannan perusmuoto, jossa jokaisella perusjoukon alkiolla on sama todennäköisyys tulla valituksi otokseen. Jos otos poimitaan yksinkertaisella satunnaisotannalla, myös jokaisella perusjoukon samankokoisella osajoukolla on sama todennäköisyys tulla valituksi otokseksi. Yksinkertainen satunnaisotanta voidaan aina tulkita arvonnaksi. TKK (c) Ilkka Mellin (2004) 27

Otantamenetelmät: Yksinkertainen satunnaisotanta 2/2 Arvonta yksinkertaisessa satunnaisotannassa: (i) Alkiot arvotaan perusjoukosta otokseen yksi alkio kerrallaan. (ii) Jokaisella perusjoukon alkiolla on arvonnassa yhtä suuri todennäköisyys tulla valituksi otokseen. Huomautuksia: Yksinkertaisessa satunnaisotannassa alkiot poimitaan otokseen palauttaen: Poimittu alkio palautetaan välittömästi takaisin perusjoukkoon, jolloin on mahdollista, että se tulee poimituksi uudelleen. Yksinkertaisessa satunnaisotannassa arvonnat ovat toisistaan riippumattomia: Alkion todennäköisyys tulla valituksi otokseen ei riipu siitä mitä alkiota otokseen on jo poimittu. TKK (c) Ilkka Mellin (2004) 28

Otantamenetelmät: Systemaattinen otanta Systemaattisessa otannassa otokseen poimitaan joka k. alkio perusjoukon alkioiden järjestetystä jonosta. Systemaattista otantaa sovelletaan usein yksinkertaisen satunnaisotannan sijasta, jos perusjoukon alkioista on käytettävissä tietorekisteri tai luettelo tai havaintoja kerätään ajassa tai tilassa. Huomautus: Systemaattisen otannan tulos vastaa täysin yksinkertaisen satunnaisotannan tulosta, jos perusjoukon alkioiden järjestys on tutkittavan ilmiön kannalta satunnainen. TKK (c) Ilkka Mellin (2004) 29

Otantamenetelmät: Ositettu otanta Ositettua otantaa voidaan soveltaa tilanteissa, joissa perusjoukko koostuu jonkin perusjoukon alkioiden ominaisuuden suhteen homogeenisista ryhmistä. Tällöin otos kerätään siten, että jokaisesta ryhmästä eli ositteesta poimitaan osaotos, jotka yhdistetään yhdeksi otokseksi. Esimerkki: Oletetaan, että maassa on useita erikokoisia kieliryhmiä ja tavoitteena on vertailla eri kieliryhmiin kuuluvien taloudellista asemaa. Jokaisesta ryhmästä saadaan otokseen riittävä edustus poimimalla jokaisesta ryhmästä samankokoinen osaotos. TKK (c) Ilkka Mellin (2004) 30

Otantamenetelmät: Ryväsotanta Ryväsotantaa voidaan soveltaa tilanteissa, joissa perusjoukko voidaan jakaa ryppäisiin eli ryhmiin. Tällöin otos kerätään kahdessa vaiheessa: (1) Poimitaan ensin joukko ryppäitä kaikkien ryppäiden joukosta. (2) Poimitaan jokaisesta vaiheessa (1) poimitusta ryppäästä joukko perusjoukon alkioita ja yhdistetään alkiot yhdeksi otokseksi. Huomautus: Vaiheissa (1) ja (2) voidaan soveltaa yksinkertaista satunnaisotantaa tai systemaattista otantaa. TKK (c) Ilkka Mellin (2004) 31

Otantamenetelmät: Moniasteinen otanta Moniasteista otantaa voidaan soveltaa tilanteissa, joissa perusjoukko voidaan jakaa ryppäisiin eli ryhmiin hierarkkisesti eli perusjoukko voidaan jakaa ryppäisiin, jotka puolestaan voidaan jakaa aliryppäisiin jne. Esimerkki: Läänit, Kunnat, Koulupiirit, Koulut, Luokat Otos kerätään vaiheittain poimimalla 1. asteen ryppäiden joukosta joukko ryppäitä, joista jokaisesta poimitaan joukko aliryppäitä jne. kunnes päästään poimimaan perusjoukon alkioita. Huomautus: Poiminnan eri vaiheissa voidaan soveltaa yksinkertaista satunnaisotantaa tai systemaattista otantaa. TKK (c) Ilkka Mellin (2004) 32

Tilastollisten aineistojen kerääminen >> Mittaaminen ja mitta-asteikot TKK (c) Ilkka Mellin (2004) 33

Mittaaminen ja mitta-asteikot Avainsanat Diskreetit muuttujat Jatkuvat muuttujat Kvalitatiiviset muuttujat Kvantitatiiviset muuttujat Mittaaminen Mitta-asteikot Intervalli- eli välimatka-asteikko Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Suhdeasteikko Mitta-asteikot ja tilastolliset menetelmät Mittarin tarkkuus Mittarin validiteetti Mittarit TKK (c) Ilkka Mellin (2004) 34

Mittaaminen ja mitta-asteikot Mittaaminen ja mittari 1/2 Tilastollisen tutkimuksen kohteiden ominaisuuksia ja olosuhteita sekä niiden muutoksia kuvaavat numeeriset tai kvantitatiiviset tiedot saadaan mittaamalla. Mittaaminen tarkoittaa numeeristen arvojen liittämistä tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Mittari on funktio, joka liittää numeeriset arvot tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Ominaisuus Mittari Numeerinen arvo TKK (c) Ilkka Mellin (2004) 35

Mittaaminen ja mitta-asteikot Mittaaminen ja mittari 2/2 Mittauksen tulos voidaan aina ilmaista jonkin tutkimuksen kohteen ominaisuutta tai olosuhdetta kuvaavan muuttujan arvona. Ominaisuus Muuttuja Tutkimuksen kohteiden ominaisuudet ja olosuhteet kuvataan siis mittaustapahtumassa numeerisilla muuttujilla. TKK (c) Ilkka Mellin (2004) 36

Mittaaminen ja mitta-asteikot Mittareiden validiteetti ja tarkkuus Mittari on validi, jos se esittää mittauksen kohteena olevaa ominaisuutta tai olosuhdetta oikein, merkityksellisesti ja tarkoituksenmukaisesti. Mittari on tarkka, jos se on harhaton ja reliaabeli: (i) Mittari on harhaton, jos se ei systemaattisesti ali- tai yliarvioi mitattavaa ominaisuuden tai olosuhteen määrää. (ii) Mittari on reliaabeli eli luotettava, jos mittaustulos ei muutu, kun mittausta toistetaan. TKK (c) Ilkka Mellin (2004) 37

Mittaaminen ja mitta-asteikot Mitta-asteikot Mittaamisessa voidaan käyttää seuraavia mitta-asteikoita: (i) Nominaali- eli laatueroasteikko (ii) Ordinaali- eli järjestysasteikko (iii) Intervalli- eli välimatka-asteikko (iv) Suhdeasteikko Huomautus: Jos ominaisuutta voidaan mitata kaikilla neljällä mittaasteikoilla, mittaustuloksen informatiivisuus, mutta samalla myös mittauksen vaativuus kasvaa seuraavassa järjestyksessä: (i) (ii) (iii) (iv) TKK (c) Ilkka Mellin (2004) 38

Mittaaminen ja mitta-asteikot Nominaaliasteikko ja ordinaaliasteikko Mittaus on tehty nominaali-eli laatueroasteikolla, jos mittaus kertoo mihin luokkaan mittauksen kohde kuuluu. Esimerkkejä: Sukupuoli, Asuinpaikka, Väri, Viallisuus Mittaus on tehty ordinaali-eli järjestysasteikolla, jos mittaus kertoo onko mittauksen kohteella mitattavaa ominaisuutta enemmän tai vähemmän kuin jollakin toisella kohteella. Esimerkkejä: Kouluarvosanat, Aineen kovuus TKK (c) Ilkka Mellin (2004) 39

Mittaaminen ja mitta-asteikot Intervalliasteikko ja suhdeasteikko Mittaus on tehty intervalli- eli välimatka-asteikolla, jos mittaus kertoo kuinka paljon kahden mitattavan kohteen ominaisuudet eroavat toisistaan. Esimerkkejä: Lämpötila Celsius-asteissa Mittaus on tehty suhdeasteikolla, jos mittaus kertoo kuinka monta kertaa enemmän tai vähemmän mittauksen kohteella on mitattavaa ominaisuutta kuin jollakin toisella kohteella. Esimerkkejä: Lukumäärä, Pituus, Pinta-ala, Tilavuus, Paino, Aika, Nopeus, Paine, Rahamäärä, Korko TKK (c) Ilkka Mellin (2004) 40

Mittaaminen ja mitta-asteikot Intervalliasteikko ja suhdeasteikko: Kommentteja Tilastotieteessä ei yleensä ole tarpeen erottaa intervalli- ja suhdeasteikollisia muuttujia. Intervalli- ja suhdeasteikollisten muuttujien mittaasteikoilla on kuitenkin seuraava ero: (i) Intervalliasteikollisten muuttujien mitta-asteikossa ei ole luonnollista nollapistettä. (ii) Suhdeasteikollisten muuttujien mitta-asteikossa on luonnollinen nollapiste, jota pienempiä arvoja muuttuja ei voi saada. TKK (c) Ilkka Mellin (2004) 41

Mittaaminen ja mitta-asteikot Kvalitatiiviset ja kvantitatiiviset muuttujat Ominaisuutta ja sitä kuvaavaa muuttujaa kutsutaan kvalitatiiviseksi, jos mittauksen kohteet voidaan luokitella mittauksen perusteella toisistaan eroaviin kategorioihin tai luokkiin. Kvalitatiivisia ominaisuuksia kuvataan laatueroasteikollisilla muuttujilla. Ominaisuutta ja sitä kuvaavaa muuttujaa kutsutaan kvantitatiiviseksi, jos mittaus tuottaa ominaisuuden määrällisen arvon. Kvantitatiivisia ominaisuuksia kuvataan välimatka-tai suhdeasteikollisilla muuttujilla. TKK (c) Ilkka Mellin (2004) 42

Mittaaminen ja mitta-asteikot Diskreetit ja jatkuvat muuttujat Mitattavaa ominaisuutta vastaava muuttuja on diskreetti, jos se voi saada vain erillisiä arvoja. Esimerkkejä: Laatueroasteikolliset muuttujat, Järjestysasteikolliset muuttujat, Lukumäärämuuttujat Mitattavaa ominaisuutta vastaava muuttuja on jatkuva, jos se voi saada kaikki arvot joltakin väliltä. Esimerkkejä: Pituus, Pinta-ala, Tilavuus, Paino, Aika, Nopeus, Paine, Rahamäärä, Korko TKK (c) Ilkka Mellin (2004) 43

Mittaaminen ja mitta-asteikot Mitta-asteikot ja tilastolliset menetelmät Tilastolliset menetelmät voidaan ryhmitellä tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mittaasteikon mukaan. Tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mitta-asteikot määräävät sen, mitä tilastollisia menetelmiä tutkimuksessa saa soveltaa ja/tai mitkä menetelmät ovat suositeltavia. Tässä esityksessä tilastolliset tunnusluvut ja tilastolliset testit on ryhmitelty tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mitta-asteikon mukaan. TKK (c) Ilkka Mellin (2004) 44