Tilastollisten aineistojen kerääminen ja mittaaminen



Samankaltaiset tiedostot
Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Otannasta ja mittaamisesta

Salkin poliorokotekoe Ryhmän koko Sairastuvuus (per ) Hoitoryhmä Vertailuryhmä Ei saanut rokottaa

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Testit järjestysasteikollisille muuttujille

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

Testit laatueroasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

MONISTE 2 Kirjoittanut Elina Katainen

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

B. Siten A B, jos ja vain jos x A x

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

Ohjeita kvantitatiiviseen tutkimukseen

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Teema 8: Parametrien estimointi ja luottamusvälit

Harjoitus 2: Matlab - Statistical Toolbox

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

Väliestimointi (jatkoa) Heliövaara 1

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Harjoitus 7: NCSS - Tilastollinen analyysi

30A02000 Tilastotieteen perusteet

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

pitkittäisaineistoissa

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ilkka Mellin Aikasarja-analyysi Aikasarjat

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

D ( ) Var( ) ( ) E( ) [E( )]

Tutkimusasetelma, mittaaminen ja otanta

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

(x, y) 2. heiton tulos y

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Kvantitatiivisen aineiston analyysi

pitkittäisaineistoissa

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Lohkoasetelmat. Kuusinen/Heliövaara 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Sovellettu todennäköisyyslaskenta B

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Ohjeita kvantitatiiviseen tutkimukseen

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Til.yks. x y z

Matemaatikot ja tilastotieteilijät

7. laskuharjoituskierros, vko 10, ratkaisut

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

7. Tutkimuksen teko. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Ohjeita kvantitatiiviseen tutkimukseen

Sovellettu todennäköisyyslaskenta B

Vaikutusten mittaaminen. Hannes Enlund Fimea Lääkehoitojen arviointi

Sovellettu todennäköisyyslaskenta B

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Tilastollinen aineisto Luottamusväli

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Lohkoasetelmat. Heliövaara 1

Kuvittele, että olet Jyväskylän yliopiston tutkija Suomen Akatemia on julkaissut tutkimusohjelman, jossa myönnetään rahaa koululaisten terveyden

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Monitasomallit koulututkimuksessa

Transkriptio:

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1

ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c) Ilkka Mellin (2007) 2

Perusjoukko, tilastollinen aineisto, havainto Tilastollisen tutkimuksen kaikki mahdolliset kohteet muodostavat tutkimuksen (kohde-) perusjoukon. Tutkimuksen kohteita on aina tarkasteltava jonkin perusjoukon muodostamassa kehikossa. Tutkimuksen kohteiksi valittuja perusjoukon alkioita kutsutaan havaintoyksiköiksi. Tilastollinen aineisto koostuu havaintoyksiköiden ominaisuuksia ja olosuhteita kuvaavista numeerisista tai kvantitatiivisista tiedoista. Havaintoyksiköitä koskevia numeerisia tai kvantitatiivisia tietoja kutsutaan havaintoarvoiksi tai havainnoiksi. TKK (c) Ilkka Mellin (2007) 3

Miten tilastollisia aineistoja kerätään? 1/2 Muutetaanko tutkimuksessa tutkimuksen kohteiden olosuhteita aktiivisesti? (i) Tutkimus on koe, jos tutkimuksen tavoitteena on selvittää, miten kohteiden olosuhteiden aktiivinen muuttaminen vaikuttaa tutkimuksen kohteisiin. (ii) Tutkimus perustuu suoriin havaintoihin, jos tutkimuksen tavoitteena on ainoastaan seurata, miten kohteiden olosuhteet ja niissä tapahtuvat muutokset vaikuttavat tutkimuksen kohteisiin. TKK (c) Ilkka Mellin (2007) 4

Miten tilastollisia aineistoja kerätään? 2/2 Kohdistuuko tutkimus kaikkiin perusjoukon alkioihin vai vain johonkin perusjoukon osaan? (i) Tutkimusta kutsutaan kokonaistutkimukseksi, jos kaikki perusjoukon alkiot tutkitaan. (ii) Tutkimusta kutsutaan otantatutkimukseksi, jos tutkimus kohdistuu johonkin perusjoukon osajoukkoon. TKK (c) Ilkka Mellin (2007) 5

Koe Kokeellisen tutkimuksen tavoitteena on selvittää, millaisia vaikutuksia tutkimuksen kohteisiin kohdistetuilla käsittelyillä on kohteisiin. Käsittelyllä tarkoitetaan tutkimuksen kohteiden olosuhteiden aktiivista, suunnitelmallista ja järjestelmällistä muuttamista. Tiukasti ottaen vain kokeiden perusteella voidaan tehdä kausaalisia eli syy-yhteyksiä koskevia päätelmiä. Huomautus: Tutkimus perustuu suoriin havaintoihin, jos tutkimuksen kohteiden olosuhteita ei tutkimuksessa muuteta aktiivisesti. TKK (c) Ilkka Mellin (2007) 6

Koeasetelmat Koeasetelmalla tarkoitetaan kokeen tekemiseen liittyviä periaatteita ja sääntöjä: (i) Mitä käsittelyitä kokeen kohteisiin sovelletaan? (ii) Miten kokeen kohteet valitaan? (iii) Mikä on tehtävien koetoistojen lukumäärä? TKK (c) Ilkka Mellin (2007) 7

Kontrolloidut kokeet 1/2 Kokeesta voidaan tehdä luotettavia johtopäätöksiä vain, jos koe on kontrolloitu: (i) Koetuloksiin vaikuttavien ulkopuolisten sekoittavien tekijöiden kontrolloimiseksi kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. (ii) Erilaisten käsittelyiden kohteiksi valittavien perusjoukon alkioiden välisten systemaattisten erojen kontrolloimiseksi käsittelyiden kohdistamisessa on käytettävä satunnaistamista. (iii) Koetuloksiin liittyvän satunnaisvaihtelun kontrolloimiseksi kokeessa on tehtävä riittävästi koetoistoja. TKK (c) Ilkka Mellin (2007) 8

Kontrolloidut kokeet 2/2 Kutsumme kontrolloituja kokeita tavallisesti tilastollisiksi kokeiksi. Huomautus: Tilastollisten kokeiden suunnittelua ja analysointia käsitellään kurssilla Koesuunnittelu ja tilastolliset mallit. TKK (c) Ilkka Mellin (2007) 9

Yksinkertainen kontrolloitu koe Alla oleva kaavio kuvaa yksinkertaista kontrolloitua koetta: (1) Jaetaan kokeen kohteet satunnaisesti kahteen ryhmään. (2) Kohdistetaan ryhmiin erilaiset käsittelyt. (3) Vertaillaan käsittelyiden vaikutuksia. Ryhmä 1 Käsittely 1 Satunnaistaminen Vertailu Ryhmä 2 Käsittely 2 TKK (c) Ilkka Mellin (2007) 10

Yksinkertainen kontrolloitu koe: Esimerkki Oletetaan, että haluamme tutkia vastakehitetyn lääkkeen tehoa tautiin, johon aikaisemmin ei ole ollut lääkettä, mutta josta osa potilaista saattaa parantua myös ilman hoitoa. Lääkkeen tehon selvittämiseksi voidaan järjestää kontrolloitu koe esimerkiksi seuraavalla tavalla: (1) Jaetaan riittävän suuri joukko potilaita satunnaisesti kahteen ryhmään. (2) Annetaan toiselle ryhmälle uutta lääkettä ja toiselle ryhmälle plaseboa eli lumelääkettä. (3) Vertaillaan parantuneiden suhteellisia osuuksia. Pohdi seuraavia kysymyksiä: Miksi potilaita pitää olla riittävästi? Miksi potilaat jaetaan ryhmiin satunnaisesti? Miksi toiselle ryhmälle annetaan plaseboa? TKK (c) Ilkka Mellin (2007) 11

Kontrolloidut kokeet: Kommentteja 1/3 Jos koe on kontrolloitu eli kokeessa on käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistamista ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin on mahdollista. Jos koe on kontrolloitu, koetuloksiin liittyvät systemaattiset ja satunnaiset tekijät voidaan erottaa ja kuvata ja kuvauksen luotettavuus voidaan arvioida. Jos koe on kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin voidaan tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2007) 12

Kontrolloidut kokeet: Kommentteja 2/3 Jos koe ei ole kontrolloitu eli kokeessa ei ole käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistamista ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin ei ole mahdollista. Jos koe ei ole kontrolloitu, koetuloksiin liittyviä systemaattisia ja satunnaisia tekijöitä ei voida erottaa ja kuvata ja kuvauksen luotettavuutta ei voida arvioida. Jos koe ei ole kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2007) 13

Kontrolloidut kokeet: Kommentteja 3/3 Jos koe ei ole kontrolloitu, koeasetelma saattaa systemaattisesti suosia joitakin tulosvaihtoehtoja. Jos koeasetelma suosii systemaattisesti joitakin tulosvaihtoehtoja, asetelmaa sanotaan harhaiseksi. Harhaisten koeasetelmien perusteella ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2007) 14

Kontrolloidut kokeet ja satunnaistaminen 1/2 Kokeen satunnaistaminen tarkoittaa sitä, että käsittelyiden kohdistamisessa käytetään arvontaa. Arvonta on ainoa puolueeton tapa kohdistaa käsittelyitä, koska arpominen ei suosi mitään perusjoukon osaa. Satunnaistettujen kokeiden tulosten analysointiin voidaan soveltaa tilastollisia menetelmiä, koska arvonta noudattaa todennäköisyyslaskennan lakeja. TKK (c) Ilkka Mellin (2007) 15

Kontrolloidut kokeet ja satunnaistaminen 2/2 Satunnaistaminen takaa suurella todennäköisyydellä sen, että kokeessa erilaisten käsittelyiden kohteiksi joutuvat perusjoukon osajoukot ovat ennen käsittelyiden soveltamista ominaisuuksiltaan keskimäärin samankaltaisia. Satunnaistaminen takaa suurella todennäköisyydellä sen, että kokeen tuloksista voidaan tehdä kausaalipäätelmiä: Jos koe on satunnaistettu, kokeen tuloksissa havaitut systemaattisten erojen on johduttava erilaisista käsittelyistä. TKK (c) Ilkka Mellin (2007) 16

Suorien havaintojen kerääminen Suoriin havaintoihin perustuvassa tutkimuksessa tavoitteena on saada selville tutkimuksen kohteiden olosuhteisiin puuttumatta, mitä vaikutuksia kohteiden olosuhteilla ja niissä tapahtuvilla muutoksilla on kohteisiin. Tiukasti ottaen suoriin havaintoihin perustuvien tutkimusten perusteella ei voida tehdä kausaalisia eli syy-yhteyksiä koskevia johtopäätöksiä. Huomautus: Tutkimus on koe, jos kohteiden olosuhteita muutetaan tutkimuksessa aktiivisesti. TKK (c) Ilkka Mellin (2007) 17

Suorien havaintojen kerääminen ja satunnaisotanta Suoria havaintoja tehtäessä havaintojen tulokset saattavat olla harhaisia. Havaintojen tulokset ovat harhaisia, jos havaintoja tehtäessä suositaan systemaattisesti joitakin tulosvaihtoehtoja. Harhaisten havaintotulosten perusteella ei voida tehdä luotettavia johtopäätöksiä. Harhan syntymistä pyritään välttämään valitsemalla havaintojen kohteet perusjoukosta satunnaisesti (ellei tavoitteena ole tutkia kaikkia perusjoukon alkioita). Tämä merkitsee satunnaisotannan soveltamista havaintojen kohteiden valintaan. TKK (c) Ilkka Mellin (2007) 18

Kokonaistutkimus Tutkimus on kokonaistutkimus, jos se kohdistuu kaikkiin (kohde-) perusjoukon alkioihin. Huomautuksia: Kokonaistutkimuksen tekeminen on vain harvoin mahdollista. Jos perusjoukko on ääretön, kokonaistutkimuksen tekeminen on jopa periaatteessa mahdotonta. Äärelliseen perusjoukkoon kohdistuvat kokonaistutkimukset voidaan aina tulkita otantatutkimuksiksi: Tällöin tutkimuksen kohteena oleva perusjoukko tulkitaan otokseksi hypoteettisesta äärettömästä perusjoukosta. TKK (c) Ilkka Mellin (2007) 19

Otantatutkimus Tutkimus on otantatutkimus, jos se kohdistuu johonkin perusjoukon osajoukkoon. Otantatutkimuksessa perusjoukon osajoukosta tehdyt johtopäätökset pyritään yleistämään koko perusjoukkoon. Tutkimuksen kohteeksi valittua perusjoukon osajoukkoa kutsutaan otokseksi. Otoksen valitsemista eli poimimista kutsutaan otannaksi. Otoksen poiminnassa käytettyjä menetelmiä kutsutaan otantamenetelmiksi. TKK (c) Ilkka Mellin (2007) 20

Satunnaisotanta Perusjoukosta voidaan tehdä luotettavia johtopäätöksiä otoksen perusteella vain, jos otos muodostaa edustavan pienoiskuvan perusjoukosta. Otoksen poimiminen perusjoukosta satunnaisesti takaa suurella todennäköisyydellä sen, että otos muodostaa perusjoukon edustavan pienoiskuvan. Otoksen poiminta satunnaisesti merkitsee tutkimuksen kohteiden arpomista perusjoukon alkioiden joukosta. Arvonta on ainoa puolueeton tapa poimia otos, koska arpominen ei suosi mitään perusjoukon osaa. Arvonta noudattaa todennäköisyyslaskennan lakeja. TKK (c) Ilkka Mellin (2007) 21

Otantamenetelmät Tilastollisessa tutkimuksessa sovelletaan tutkimusasetelmasta riippuen erilaisia otantamenetelmiä. Otannan perusmuoto: Yksinkertainen satunnaisotanta Muita otantamenetelmiä: Systemaattinen otanta Ositettu otanta Ryväsotanta Moniasteinen otanta TKK (c) Ilkka Mellin (2007) 22

Otantamenetelmät: Yksinkertainen satunnaisotanta 1/2 Yksinkertainen satunnaisotanta on otannan perusmuoto, jossa jokaisella perusjoukon alkiolla on yhtä suuri todennäköisyys tulla valituksi otokseen. Jos otos poimitaan yksinkertaisella satunnaisotannalla, myös jokaisella perusjoukon samankokoisella osajoukolla on sama todennäköisyys tulla valituksi otokseksi. Yksinkertainen satunnaisotanta voidaan aina tulkita arvonnaksi. TKK (c) Ilkka Mellin (2007) 23

Otantamenetelmät: Yksinkertainen satunnaisotanta 2/2 Arvonnan toteutus yksinkertaisessa satunnaisotannassa: (i) Alkiot arvotaan perusjoukosta otokseen yksi alkio kerrallaan. (ii) Perusjoukkoon kuuluvilla alkioilla on jokaisessa arvonnassa yhtä suuri todennäköisyys tulla valituksi otokseen. TKK (c) Ilkka Mellin (2007) 24

Otantamenetelmät: Kommentteja yksinkertaiseen satunnaisotantaan 1/2 Yksinkertaisen satunnaisotannan perusmuodossa alkiot poimitaan perusjoukosta otokseen palauttaen: Poimittu alkio palautetaan aina ennen uuden alkion arpomista takaisin perusjoukkoon, jolloin alkio voi tulla poimituksi otokseen useita kertoja. Otannassa palauttaen arvonnat ovat riippumattomia: Alkion todennäköisyys tulla poimituksi otokseen ei riipu siitä mitä alkiota otokseen on jo poimittu. Otantaan palauttaen liittyviä todennäköisyyksiä hallitaan binomijakauman avulla; ks. monisteen Todennäköisyyslaskenta lukua Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 25

Otantamenetelmät: Kommentteja yksinkertaiseen satunnaisotantaan 2/2 Yksinkertaiseksi satunnaisotannaksi kutsutaan myös menetelmää, jossa alkiot poimitaan perusjoukosta otokseen palauttamatta: Poimittua alkiota ei palauteta ennen uuden alkion arpomista takaisin perusjoukkoon, jolloin alkio voi tulla poimituksi otokseen vain kerran. Otannassa palauttamatta arvonnat eivät ole riippumattomia: Alkion todennäköisyys tulla poimituksi otokseen muuttuu arvonnan edistyessä. Otantaan palauttamatta liittyviä todennäköisyyksiä hallitaan hypergeometrisen jakauman avulla; ks. monisteen Todennäköisyys-laskenta lukua Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 26

Otantamenetelmät: Systemaattinen otanta Systemaattisessa otannassa otos muodostetaan poimimalla otokseen joka k. alkio perusjoukon alkioiden järjestetystä jonosta. Systemaattista otantaa sovelletaan tavallisesti yksinkertaisen satunnaisotannan sijasta silloin, kun perusjoukon alkioista on käytettävissä tietorekisteri tai luettelo tai havaintoja kerätään ajassa tai tilassa. Huomautus: Systemaattinen otanta ei oikeastaan kuulu satunnaisotannan menetelmiin, koska siinä ei sovelleta arvontaa. Systemaattinen otanta tuottaa kuitenkin samat tulokset kuin yksinkertainen satunnaisotanta, jos perusjoukon alkioiden järjestys on tutkittavan ilmiön kannalta satunnainen. TKK (c) Ilkka Mellin (2007) 27

Otantamenetelmät: Ositettu otanta Ositettua otantaa voidaan soveltaa tilanteissa, joissa perusjoukko koostuu jonkin perusjoukon alkioiden ominaisuuden suhteen homogeenisista ryhmistä. Tällöin otos kerätään siten, että jokaisesta ryhmästä eli ositteesta poimitaan osaotos ja yhdistetään osaotokset yhdeksi otokseksi. Esimerkki: Oletetaan, että maassa on useita erikokoisia kieliryhmiä ja tavoitteena on vertailla eri kieliryhmiin kuuluvien taloudellista asemaa. Kaikista ryhmistä saadaan riittävä edustus poimimalla jokaisesta ryhmästä samankokoinen osaotos. TKK (c) Ilkka Mellin (2007) 28

Otantamenetelmät: Ryväsotanta Ryväsotantaa voidaan soveltaa tilanteissa, joissa perusjoukko voidaan jakaa ryppäisiin eli ryhmiin. Tällöin otos kerätään kahdessa vaiheessa: (1) Poimitaan ensin joukko ryppäitä kaikkien ryppäiden joukosta. (2) Poimitaan jokaisesta vaiheessa (1) poimitusta ryppäästä osaotos ja yhdistetään osaotokset yhdeksi otokseksi. Huomautus: Vaiheissa (1) ja (2) voidaan soveltaa yksinkertaista satunnaisotantaa tai systemaattista otantaa. TKK (c) Ilkka Mellin (2007) 29

Otantamenetelmät: Moniasteinen otanta Moniasteista otantaa voidaan soveltaa tilanteissa, joissa perusjoukko voidaan jakaa ryppäisiin eli ryhmiin hierarkkisesti eli perusjoukko voidaan jakaa ryppäisiin, jotka puolestaan voidaan jakaa aliryppäisiin jne. Esimerkki: Läänit, Kunnat, Koulupiirit, Koulut, Luokat Otos kerätään vaiheittain poimimalla 1. asteen ryppäiden joukosta joukko ryppäitä, joista jokaisesta poimitaan joukko aliryppäitä jne. kunnes päästään poimimaan perusjoukon alkioita. Huomautus: Poiminnan eri vaiheissa voidaan soveltaa yksinkertaista satunnaisotantaa tai systemaattista otantaa. TKK (c) Ilkka Mellin (2007) 30

Satunnaistamisen merkitys tilastollisten aineistojen keräämisessä 1/2 Edellä on kuvattu kahta tilastollisten aineistojen keräämisen perusmenetelmää: (i) Kontrolloidut kokeet (ii) Satunnaisotanta Kummassakin tapauksessa aineiston keräämisessä sovelletaan arvontaa. TKK (c) Ilkka Mellin (2007) 31

Satunnaistamisen merkitys tilastollisten aineistojen keräämisessä 2/2 Arvonnan soveltaminen merkitsee seuraavaa: Kaikki tutkimuksen kohteita kuvaavat (numeeriset tai kvantitatiiviset) tiedot ja myös niistä johdetut suureet ovat satunnaisia siinä mielessä, että ne vaihtelevat otoksesta toiseen. Tilastollisten todennäköisyyslaskentaan perustuvien mallien soveltaminen tilastollisten aineistojen analyysiin perustuu juuri tähän tosiasiaan. TKK (c) Ilkka Mellin (2007) 32

Tilastollisten aineistojen kerääminen >> Mittaaminen ja mitta-asteikot TKK (c) Ilkka Mellin (2007) 33

Mittaaminen ja mitta-asteikot Mittaaminen ja mittari 1/2 Tilastollisen tutkimuksen kohteiden ominaisuuksia ja olosuhteita sekä niiden muutoksia kuvaavat numeeriset tai kvantitatiiviset tiedot saadaan selville mittaamalla. Tarkoitamme mittaamisella numeeristen arvojen liittämistä tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Mittari on funktio, joka liittää numeeriset arvot tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Ominaisuus Mittari Numeerinen arvo TKK (c) Ilkka Mellin (2007) 34

Mittaaminen ja mitta-asteikot Mittaaminen ja mittari 2/2 Mittauksen tulos voidaan aina ilmaista jonkin tutkimuksen kohteen ominaisuutta tai olosuhdetta kuvaavan muuttujan numeerisena arvona. Ominaisuus Muuttuja Mittaustapahtumassa tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin liitetään numeeriset muuttujat. TKK (c) Ilkka Mellin (2007) 35

Mittaaminen ja mitta-asteikot Mittareiden validiteetti ja tarkkuus Mittari on validi eli oikea, jos se esittää mittauksen kohteena olevaa ominaisuutta oikein, merkityksellisesti ja tarkoituksenmukaisesti. Mittari on tarkka, jos se on harhaton ja reliaabeli: (i) Mittari on harhaton, jos se ei systemaattisesti ali- tai yliarvioi mitattavan ominaisuuden määrää. (ii) Mittari on reliaabeli eli luotettava, jos mittaustulos ei muutu, kun mittausta toistetaan. TKK (c) Ilkka Mellin (2007) 36

Mittaaminen ja mitta-asteikot Mitta-asteikot Mittaamisessa voidaan käyttää seuraavia mitta-asteikoita: (i) Nominaali- eli laatueroasteikko (ii) Ordinaali- eli järjestysasteikko (iii) Intervalli- eli välimatka-asteikko (iv) Suhdeasteikko Huomautus: Jos ominaisuutta voidaan mitata kaikilla neljällä mittaasteikoilla, mittaustuloksen informatiivisuus, mutta samalla myös mittauksen vaativuus kasvaa seuraavassa järjestyksessä: (i) (ii) (iii) (iv) TKK (c) Ilkka Mellin (2007) 37

Mittaaminen ja mitta-asteikot Nominaaliasteikko ja ordinaaliasteikko Mittaus on tehty nominaali-eli laatueroasteikolla, jos mittaus kertoo mihin luokkaan mittauksen kohde kuuluu. Esimerkkejä: Sukupuoli, Asuinpaikka, Väri, Viallisuus Mittaus on tehty ordinaali-eli järjestysasteikolla, jos mittaus kertoo onko mittauksen kohteella mitattavaa ominaisuutta enemmän tai vähemmän kuin jollakin toisella kohteella. Esimerkkejä: Kouluarvosanat, Aineen kovuus TKK (c) Ilkka Mellin (2007) 38

Mittaaminen ja mitta-asteikot Intervalliasteikko ja suhdeasteikko Mittaus on tehty intervalli- eli välimatka-asteikolla, jos mittaus kertoo kuinka paljon kahden mitattavan kohteen ominaisuudet eroavat toisistaan. Esimerkkejä: Lämpötila Celsius-asteissa Mittaus on tehty suhdeasteikolla, jos mittaus kertoo kuinka monta kertaa enemmän tai vähemmän mittauksen kohteella on mitattavaa ominaisuutta kuin jollakin toisella kohteella. Esimerkkejä: Lukumäärä, Pituus, Pinta-ala, Tilavuus, Paino, Aika, Nopeus, Paine, Rahamäärä, Korko TKK (c) Ilkka Mellin (2007) 39

Mittaaminen ja mitta-asteikot Intervalliasteikko ja suhdeasteikko: Kommentteja Tilastotieteessä ei yleensä ole tarpeen erottaa intervalli- ja suhdeasteikollisia muuttujia. Intervalli- ja suhdeasteikollisten muuttujien mittaasteikoilla on kuitenkin seuraava ero: (i) Intervalliasteikollisten muuttujien mitta-asteikossa ei ole luonnollista nollapistettä. (ii) Suhdeasteikollisten muuttujien mitta-asteikossa on luonnollinen nollapiste, jota pienempiä arvoja muuttuja ei voi saada. TKK (c) Ilkka Mellin (2007) 40

Mittaaminen ja mitta-asteikot Kvalitatiiviset ja kvantitatiiviset muuttujat Ominaisuutta ja sitä kuvaavaa muuttujaa kutsutaan kvalitatiiviseksi, jos mittauksen kohteet voidaan luokitella mittauksen perusteella toisistaan eroaviin kategorioihin tai luokkiin. Kvalitatiivisia ominaisuuksia kuvataan laatueroasteikollisilla muuttujilla. Ominaisuutta ja sitä kuvaavaa muuttujaa kutsutaan kvantitatiiviseksi, jos mittaus tuottaa ominaisuuden määrällisen arvon. Kvantitatiivisia ominaisuuksia kuvataan välimatka-tai suhdeasteikollisilla muuttujilla. TKK (c) Ilkka Mellin (2007) 41

Mittaaminen ja mitta-asteikot Diskreetit ja jatkuvat muuttujat Mitattavaa ominaisuutta vastaava muuttuja on diskreetti, jos se voi saada vain erillisiä arvoja. Esimerkkejä: Laatueroasteikolliset muuttujat, Järjestysasteikolliset muuttujat, Lukumäärämuuttujat Mitattavaa ominaisuutta vastaava muuttuja on jatkuva, jos se voi saada kaikki arvot joltakin väliltä. Esimerkkejä: Pituus, Pinta-ala, Tilavuus, Paino, Aika, Nopeus, Paine, Rahamäärä, Korko TKK (c) Ilkka Mellin (2007) 42

Mittaaminen ja mitta-asteikot Mitta-asteikot ja tilastolliset menetelmät Tilastolliset menetelmät voidaan luokitella tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mittaasteikollisten ominaisuuksien mukaan. Tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mitta-asteikolliset ominaisuudet määräävät sen, mitä tilastollisia menetelmiä tutkimuksessa saa soveltaa ja/tai mitkä menetelmät ovat suositeltavia. Tässä esityksessä tilastolliset tunnusluvut ja tilastolliset testit on ryhmitelty tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mitta-asteikon mukaan. TKK (c) Ilkka Mellin (2007) 43