Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1



Samankaltaiset tiedostot
Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Otannasta ja mittaamisesta

Salkin poliorokotekoe Ryhmän koko Sairastuvuus (per ) Hoitoryhmä Vertailuryhmä Ei saanut rokottaa

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Testit järjestysasteikollisille muuttujille

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

Testit laatueroasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille

Osa 2: Otokset, otosjakaumat ja estimointi

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

MONISTE 2 Kirjoittanut Elina Katainen

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

B. Siten A B, jos ja vain jos x A x

Poimi yrityksistä i) neljän, ii) kymmenen suuruinen otos. a) yksinkertaisella satunnaisotannalla palauttaen, b) systemaattisella otannalla

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Ohjeita kvantitatiiviseen tutkimukseen

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Harjoitus 2: Matlab - Statistical Toolbox

Teema 8: Parametrien estimointi ja luottamusvälit

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

(x, y) 2. heiton tulos y

Väliestimointi (jatkoa) Heliövaara 1

Harjoitus 7: NCSS - Tilastollinen analyysi

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

D ( ) Var( ) ( ) E( ) [E( )]

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

pitkittäisaineistoissa

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

30A02000 Tilastotieteen perusteet

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Tutkimusasetelma, mittaaminen ja otanta

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

TUTKIMUSAINEISTON ANALYYSI LTKY012. Timo Törmäkangas

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

pitkittäisaineistoissa

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Ilkka Mellin Aikasarja-analyysi Aikasarjat

Lohkoasetelmat. Kuusinen/Heliövaara 1

Kvantitatiivisen aineiston analyysi

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

Mat Tilastollisen analyysin perusteet, kevät 2007

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Ohjeita kvantitatiiviseen tutkimukseen

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Sovellettu todennäköisyyslaskenta B

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Sovellettu todennäköisyyslaskenta B

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Ohjeita kvantitatiiviseen tutkimukseen

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

7. laskuharjoituskierros, vko 10, ratkaisut

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012

Sovellettu todennäköisyyslaskenta B

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

7. Tutkimuksen teko. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina

Sovellettu todennäköisyyslaskenta B

Tilastollinen aineisto Luottamusväli

Monitasomallit koulututkimuksessa

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Mat Tilastollisen analyysin perusteet, kevät 2007

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Lohkoasetelmat. Heliövaara 1

Til.yks. x y z

Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1

Transkriptio:

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2005) 1

ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c) Ilkka Mellin (2005) 2

ja mittaaminen: Mitä opimme? 1/3 Tilastollisen tutkimuksen kaikki mahdolliset kohteet muodostavat tutkimuksen perusjoukon. Tilastollinen tutkimusaineisto muodostuu perusjoukon alkioita koskevista numeerisista tiedoista. Tutkimusta kutsutaan kokeeksi, jos tavoitteena on selvittää, miten kohteiden olosuhteiden aktiivinen muuttaminen vaikuttaa kohteisiin. Tutkimus perustuu suoriin havaintoihin, jos tutkimuksessa seurataan kohteiden olosuhteisiin puuttumatta, miten kohteiden olosuhteet ja niiden muuttuminen vaikuttavat kohteisiin. Vain kontrolloidut kokeet mahdollistavat kausaalipäätelmien teon. Jos kaikki perusjoukon alkiot tutkitaan, tutkimusta sanotaan kokonaistutkimukseksi. Jos vain osa perusjoukon alkioista tutkitaan, tutkimusta sanotaan otantatutkimukseksi. TKK (c) Ilkka Mellin (2005) 3

ja mittaaminen: Mitä opimme? 2/3 Tiedot tutkimuksen kohteista saadaan mittaamalla kohteiden ominaisuudet ja olosuhteet, joissa kohteet ovat. Mittaaminen tarkoittaa numeeristen arvojen liittämistä tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Hyvä mittari on validi ja reliaabeli. Mittaamisessa käytettävä mitta-asteikko kuvaa mittaamisen tarkkuutta. Mitta-asteikot ovat nominaali- eli laatueroasteikko, ordinaali- eli järjestysasteikko, intervalli- eli välimatka-asteikko ja suhdeasteikko. Tutkimuksen kohteiden ominaisuudet ja niitä vastaavat tilastolliset muuttujat voidaan jakaa kvalitatiivisiin ja kvantitatiivisiin. Tutkimuksen kohteita kuvaavat tilastolliset muuttujat voidaan jakaa diskreetteihin ja jatkuviin. TKK (c) Ilkka Mellin (2005) 4

ja mittaaminen: Mitä opimme? 3/3 Tilastolliset menetelmät voidaan luokitella tutkimuksen kohteena olevien muuttujien mitta-asteikollisten ominaisuuksien suhteen. TKK (c) Ilkka Mellin (2005) 5

ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c) Ilkka Mellin (2005) 6

Avainsanat Binomijakauma Havainto Havaintoarvo Havaintoyksikkö Hypergeometrinen jakauma Koe Kokonaistutkimus Kontrolloitu koe Otanta Otantamenetelmät Moniasteinen otanta Ositettu otanta Ryväsotanta Yksinkertainen satunnaisotanta Otanta palauttaen Otanta palauttamatta Otantatutkimus Perusjoukko Satunnaisotanta Satunnaistus Suorat havainnot Tilastollinen aineisto Tilastollisten aineistojen kerääminen Tilastollinen koe TKK (c) Ilkka Mellin (2005) 7

Perusjoukko, tilastollinen aineisto, havainto Tilastollisen tutkimuksen kaikki mahdolliset kohteet muodostavat tutkimuksen (kohde-) perusjoukon. Tutkimuksen kohteita tarkastellaan aina jonkin perusjoukon muodostamassa kehikossa. Tutkimuksen kohteiksi valittuja perusjoukon alkioita kutsutaan havaintoyksiköiksi. Tilastollinen aineisto koostuu havaintoyksiköiden ominaisuuksia ja olosuhteita kuvaavista numeerisista tai kvantitatiivisista tiedoista. Havaintoyksiköitä koskevia numeerisia tai kvantitatiivisia tietoja kutsutaan havaintoarvoiksi tai havainnoiksi. TKK (c) Ilkka Mellin (2005) 8

Miten tilastollisia aineistoja kerätään? 1/2 Muutetaanko tutkimuksessa tutkimuksen kohteiden olosuhteita aktiivisesti? (i) Tutkimus on koe, jos tutkimuksen tavoitteena on selvittää, miten kohteiden olosuhteiden aktiivinen muuttaminen vaikuttaa tutkimuksen kohteisiin. (ii) Tutkimus perustuu suoriin havaintoihin, jos tutkimuksen tavoitteena on ainoastaan seurata, miten kohteiden olosuhteet ja niissä tapahtuvat muutokset vaikuttavat tutkimuksen kohteisiin. TKK (c) Ilkka Mellin (2005) 9

Miten tilastollisia aineistoja kerätään? 2/2 Kohdistuuko tutkimus kaikkiin perusjoukon alkioihin vai vain johonkin perusjoukon osaan? (i) Tutkimusta kutsutaan kokonaistutkimukseksi, jos kaikki perusjoukon alkiot tutkitaan. (ii) Tutkimusta kutsutaan otantatutkimukseksi, jos tutkimus kohdistuu johonkin perusjoukon osajoukkoon. TKK (c) Ilkka Mellin (2005) 10

Koe Kokeellisen tutkimuksen tavoitteena on selvittää, millaisia vaikutuksia tutkimuksen kohteisiin kohdistetuilla käsittelyillä on kohteisiin. Käsittelyllä tarkoitetaan tutkimuksen kohteiden olosuhteiden aktiivista, suunnitelmallista ja järjestelmällistä muuttamista. Tiukasti ottaen vain kokeiden perusteella voidaan tehdä kausaalisia eli syy-yhteyksiä koskevia päätelmiä. Huomautus: Tutkimus perustuu suoriin havaintoihin, jos tutkimuksen kohteiden olosuhteita ei tutkimuksessa muuteta aktiivisesti. TKK (c) Ilkka Mellin (2005) 11

Koeasetelmat Koeasetelmalla tarkoitetaan kokeen tekemiseen liittyviä periaatteita ja sääntöjä: (i) Mitä käsittelyitä kokeen kohteisiin sovelletaan? (ii) Miten kokeen kohteet valitaan? (iii) Mikä on tehtävien koetoistojen lukumäärä? TKK (c) Ilkka Mellin (2005) 12

Kontrolloidut kokeet 1/2 Kokeesta voidaan tehdä luotettavia johtopäätöksiä vain, jos koe on kontrolloitu: (i) Koetuloksiin vaikuttavien ulkopuolisten sekoittavien tekijöiden kontrolloimiseksi kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. (ii) Erilaisten käsittelyiden kohteiksi valittavien perusjoukon alkioiden välisten systemaattisten erojen kontrolloimiseksi käsittelyiden kohdistamisessa on käytettävä satunnaistamista. (iii) Koetuloksiin liittyvän satunnaisvaihtelun kontrolloimiseksi kokeessa on tehtävä riittävästi koetoistoja. TKK (c) Ilkka Mellin (2005) 13

Kontrolloidut kokeet 2/2 Kutsumme kontrolloituja kokeita tavallisesti tilastollisiksi kokeiksi. Huomautus: Tilastollisten kokeiden suunnittelua ja analysointia käsitellään kurssilla Koesuunnittelu ja tilastolliset mallit. TKK (c) Ilkka Mellin (2005) 14

Yksinkertainen kontrolloitu koe Alla oleva kaavio kuvaa yksinkertaista kontrolloitua koetta: (1) Jaetaan kokeen kohteet satunnaisesti kahteen ryhmään. (2) Kohdistetaan ryhmiin erilaiset käsittelyt. (3) Vertaillaan käsittelyiden vaikutuksia. Ryhmä 1 Käsittely 1 Satunnaistaminen Vertailu Ryhmä 2 Käsittely 2 TKK (c) Ilkka Mellin (2005) 15

Yksinkertainen kontrolloitu koe: Esimerkki Oletetaan, että haluamme tutkia vastakehitetyn lääkkeen tehoa tautiin, johon aikaisemmin ei ole ollut lääkettä, mutta josta osa potilaista saattaa parantua myös ilman hoitoa. Tällöin lääkkeen tehon selvittämiseksi voidaan järjestää kontrolloitu koe esimerkiksi seuraavalla tavalla: (1) Jaetaan riittävän suuri joukko potilaita satunnaisesti kahteen ryhmään. (2) Annetaan toiselle ryhmälle uutta lääkettä ja toiselle ryhmälle plaseboa eli lumelääkettä. (3) Vertaillaan parantuneiden suhteellisia osuuksia. Pohdi seuraavia kysymyksiä: Miksi potilaita pitää olla riittävästi? Miksi potilaat jaetaan ryhmiin satunnaisesti? Miksi toiselle ryhmälle annetaan plaseboa? TKK (c) Ilkka Mellin (2005) 16

Kontrolloidut kokeet: Kommentteja 1/3 Jos koe on kontrolloitu eli kokeessa on käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistamista ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin on mahdollista. Jos koe on kontrolloitu, koetuloksiin liittyvät systemaattiset ja satunnaiset tekijät voidaan erottaa ja kuvata ja kuvauksen luotettavuus voidaan arvioida. Jos koe on kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin voidaan tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2005) 17

Kontrolloidut kokeet: Kommentteja 2/3 Jos koe ei ole kontrolloitu eli kokeessa ei ole käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistamista ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin ei ole mahdollista. Jos koe ei ole kontrolloitu, koetuloksiin liittyviä systemaattisia ja satunnaisia tekijöitä ei voida erottaa ja kuvata ja kuvauksen luotettavuutta ei voida arvioida. Jos koe ei ole kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2005) 18

Kontrolloidut kokeet: Kommentteja 3/3 Jos koe ei ole kontrolloitu, koeasetelma saattaa systemaattisesti suosia joitakin tulosvaihtoehtoja. Jos koeasetelma suosii systemaattisesti joitakin tulosvaihtoehtoja, asetelmaa sanotaan harhaiseksi. Harhaisten koeasetelmien perusteella ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2005) 19

Kontrolloidut kokeet ja satunnaistaminen 1/2 Kokeen satunnaistaminen tarkoittaa sitä, että käsittelyiden kohdistamisessa käytetään arvontaa. Arvonta on ainoa puolueeton tapa kohdistaa käsittelyitä, koska arpominen ei suosi mitään perusjoukon osaa. Satunnaistettujen kokeiden tulosten analysointiin voidaan soveltaa tilastollisia menetelmiä, koska arvonta noudattaa todennäköisyyslaskennan lakeja. TKK (c) Ilkka Mellin (2005) 20

Kontrolloidut kokeet ja satunnaistaminen 2/2 Satunnaistaminen takaa suurella todennäköisyydellä sen, että kokeessa erilaisten käsittelyiden kohteiksi joutuvat perusjoukon osajoukot ovat ennen käsittelyiden soveltamista ominaisuuksiltaan keskimäärin samankaltaisia. Satunnaistaminen takaa suurella todennäköisyydellä sen, että kokeen tuloksista voidaan tehdä kausaalipäätelmiä: Jos koe on satunnaistettu, kokeen tuloksissa havaitut systemaattisten erojen on johduttava erilaisista käsittelyistä. TKK (c) Ilkka Mellin (2005) 21

Suorien havaintojen kerääminen Suoriin havaintoihin perustuvassa tutkimuksessa tavoitteena on saada selville tutkimuksen kohteiden olosuhteisiin puuttumatta, mitä vaikutuksia kohteiden olosuhteilla ja niissä tapahtuvilla muutoksilla on kohteisiin. Tiukasti ottaen suoriin havaintoihin perustuvien tutkimusten perusteella ei voida tehdä kausaalisia eli syy-yhteyksiä koskevia johtopäätöksiä. Huomautus: Tutkimus on koe, jos kohteiden olosuhteita muutetaan tutkimuksessa aktiivisesti. TKK (c) Ilkka Mellin (2005) 22

Suorien havaintojen kerääminen ja satunnaisotanta Suoria havaintoja tehtäessä havaintojen tulokset saattavat olla harhaisia. Havaintojen tulokset ovat harhaisia, jos havaintoja tehtäessä suositaan systemaattisesti joitakin tulosvaihtoehtoja. Harhaisten havaintotulosten perusteella ei voida tehdä luotettavia johtopäätöksiä. Harhan syntyminen saatetaan pystyä välttämään, jos havaintojen kohteet valitaan perusjoukosta satunnaisesti (ellei tavoitteena ole tutkia kaikkia perusjoukon alkioita). Tämä merkitsee satunnaisotannan soveltamista havaintojen kohteiden valintaan. TKK (c) Ilkka Mellin (2005) 23

Kokonaistutkimus Tutkimus on kokonaistutkimus, jos se kohdistuu kaikkiin (kohde-) perusjoukon alkioihin. Huomautuksia: Kokonaistutkimuksen tekeminen on vain harvoin mahdollista. Jos perusjoukko on ääretön, kokonaistutkimuksen tekeminen on jopa periaatteessa mahdotonta. Äärelliseen perusjoukkoon kohdistuvat kokonaistutkimukset voidaan aina tulkita otantatutkimuksiksi: Tällöin tutkimuksen kohteena oleva perusjoukko tulkitaan otokseksi hypoteettisesta äärettömästä perusjoukosta. TKK (c) Ilkka Mellin (2005) 24

Otantatutkimus Tutkimus on otantatutkimus, jos se kohdistuu johonkin perusjoukon osajoukkoon. Otantatutkimuksessa perusjoukon osajoukosta tehdyt johtopäätökset pyritään yleistämään koko perusjoukkoon. Tutkimuksen kohteeksi valittua perusjoukon osajoukkoa kutsutaan otokseksi. Otoksen valitsemista eli poimimista kutsutaan otannaksi. Otoksen poiminnassa käytettyjä menetelmiä kutsutaan otantamenetelmiksi. TKK (c) Ilkka Mellin (2005) 25

Satunnaisotanta Perusjoukosta voidaan tehdä luotettavia johtopäätöksiä otoksen perustella vain, jos otos muodostaa perusjoukon edustavan pienoiskuvan. Otoksen poimiminen perusjoukosta satunnaisesti takaa suurella todennäköisyydellä sen, että otos muodostaa perusjoukon edustavan pienoiskuvan. Otoksen poiminta satunnaisesti merkitsee otokseen poimittavien havaintoyksiköiden arpomista perusjoukon alkioiden joukosta. Arvonta on ainoa puolueeton tapa poimia otos, koska arpominen ei suosi mitään perusjoukon osaa. Arvonta noudattaa todennäköisyyslaskennan lakeja. TKK (c) Ilkka Mellin (2005) 26

Otantamenetelmät Tilastollisessa tutkimuksessa sovelletaan tutkimusasetelmasta riippuen erilaisia otantamenetelmiä. Otannan perusmuoto: Yksinkertainen satunnaisotanta Muita otantamenetelmiä: Systemaattinen otanta Ositettu otanta Ryväsotanta Moniasteinen otanta TKK (c) Ilkka Mellin (2005) 27

Otantamenetelmät: Yksinkertainen satunnaisotanta 1/2 Yksinkertainen satunnaisotanta on otannan perusmuoto, jossa jokaisella perusjoukon alkiolla on yhtä suuri todennäköisyys tulla valituksi otokseen. Jos otos poimitaan yksinkertaisella satunnaisotannalla, myös jokaisella perusjoukon samankokoisella osajoukolla on sama todennäköisyys tulla valituksi otokseksi. Yksinkertainen satunnaisotanta voidaan aina tulkita arvonnaksi. TKK (c) Ilkka Mellin (2005) 28

Otantamenetelmät: Yksinkertainen satunnaisotanta 2/2 Arvonnan toteutus yksinkertaisessa satunnaisotannassa: (i) Alkiot arvotaan perusjoukosta otokseen yksi alkio kerrallaan. (ii) Perusjoukkoon kuuluvilla alkioilla on jokaisessa arvonnassa yhtä suuri todennäköisyys tulla valituksi otokseen. TKK (c) Ilkka Mellin (2005) 29

Otantamenetelmät: Kommentteja yksinkertaiseen satunnaisotantaan 1/2 Yksinkertaisen satunnaisotannan perusmuodossa alkiot poimitaan perusjoukosta otokseen palauttaen: Poimittu alkio palautetaan aina ennen uuden alkion arpomista takaisin perusjoukkoon, jolloin alkio voi tulla poimituksi otokseen useita kertoja. Otannassa palauttaen arvonnat ovat riippumattomia: Alkion todennäköisyys tulla poimituksi otokseen ei riipu siitä mitä alkiota otokseen on jo poimittu. Otantaan palauttaen liittyviä todennäköisyyksiä hallitaan binomijakauman avulla; ks. kalvokokoelman Johdatus todennäköisyyslaskentaan lukua Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 30

Otantamenetelmät: Kommentteja yksinkertaiseen satunnaisotantaan 2/2 Yksinkertaiseksi satunnaisotannaksi kutsutaan tavallisesti myös menetelmää, jossa alkiot poimitaan perusjoukosta otokseen palauttamatta: Poimittua alkiota ei palauteta ennen uuden alkion arpomista takaisin perusjoukkoon, jolloin alkio voi tulla poimituksi otokseen vain kerran. Otannassa palauttamatta arvonnat eivät ole riippumattomia: Alkion todennäköisyys tulla poimituksi otokseen muuttuu arvonnan edistyessä. Otantaan palauttamatta liittyviä todennäköisyyksiä hallitaan hypergeometrisen jakauman avulla; ks. kalvokokoelman Johdatus todennäköisyyslaskentaan lukua Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 31

Otantamenetelmät: Systemaattinen otanta Systemaattisessa otannassa otokseen poimitaan joka k. alkio perusjoukon alkioiden järjestetystä jonosta. Systemaattista otantaa sovelletaan usein yksinkertaisen satunnaisotannan sijasta, jos perusjoukon alkioista on käytettävissä tietorekisteri tai luettelo tai havaintoja kerätään ajassa tai tilassa. Huomautus: Systemaattinen otanta ei oikeastaan kuulu satunnaisotannan menetelmiin, koska siinä ei sovelleta arvontaa. Systemaattinen otanta tuottaa kuitenkin täysin samat tulokset kuin yksinkertainen satunnaisotanta, jos perusjoukon alkioiden järjestys on tutkittavan ilmiön kannalta satunnainen. TKK (c) Ilkka Mellin (2005) 32

Otantamenetelmät: Ositettu otanta Ositettua otantaa voidaan soveltaa tilanteissa, joissa perusjoukko koostuu jonkin perusjoukon alkioiden ominaisuuden suhteen homogeenisista ryhmistä. Tällöin otos kerätään siten, että jokaisesta ryhmästä eli ositteesta poimitaan osaotos, jotka yhdistetään yhdeksi otokseksi. Esimerkki: Oletetaan, että maassa on useita erikokoisia kieliryhmiä ja tavoitteena on vertailla eri kieliryhmiin kuuluvien taloudellista asemaa. Jokaisesta ryhmästä saadaan otokseen riittävä edustus poimimalla jokaisesta ryhmästä samankokoinen osaotos. TKK (c) Ilkka Mellin (2005) 33

Otantamenetelmät: Ryväsotanta Ryväsotantaa voidaan soveltaa tilanteissa, joissa perusjoukko voidaan jakaa ryppäisiin eli ryhmiin. Tällöin otos kerätään kahdessa vaiheessa: (1) Poimitaan ensin joukko ryppäitä kaikkien ryppäiden joukosta. (2) Poimitaan jokaisesta vaiheessa (1) poimitusta ryppäästä joukko perusjoukon alkioita ja yhdistetään alkiot yhdeksi otokseksi. Huomautus: Vaiheissa (1) ja (2) voidaan soveltaa yksinkertaista satunnaisotantaa tai systemaattista otantaa. TKK (c) Ilkka Mellin (2005) 34

Otantamenetelmät: Moniasteinen otanta Moniasteista otantaa voidaan soveltaa tilanteissa, joissa perusjoukko voidaan jakaa ryppäisiin eli ryhmiin hierarkkisesti eli perusjoukko voidaan jakaa ryppäisiin, jotka puolestaan voidaan jakaa aliryppäisiin jne. Esimerkki: Läänit, Kunnat, Koulupiirit, Koulut, Luokat Otos kerätään vaiheittain poimimalla 1. asteen ryppäiden joukosta joukko ryppäitä, joista jokaisesta poimitaan joukko aliryppäitä jne. kunnes päästään poimimaan perusjoukon alkioita. Huomautus: Poiminnan eri vaiheissa voidaan soveltaa yksinkertaista satunnaisotantaa tai systemaattista otantaa. TKK (c) Ilkka Mellin (2005) 35

Satunnaistamisen merkitys tilastollisten aineistojen keräämisessä 1/2 Edellä on kuvattu seuraavia tilastollisten aineistojen keräämisen menetelmiä: (i) Kontrolloidut kokeet (ii) Satunnaisotanta Kummassakin tapauksessa aineiston keräämisessä sovelletaan arvontaa. TKK (c) Ilkka Mellin (2005) 36

Satunnaistamisen merkitys tilastollisten aineistojen keräämisessä 2/2 Arvonnan soveltaminen merkitsee seuraavaa: Kaikki tutkimuksen kohteita kuvaavat (numeeriset tai kvantitatiiviset) tiedot ja myös niistä johdetut suureet ovat satunnaisia. Tilastollisten todennäköisyyslaskentaan perustuvien mallien soveltaminen tilastollisten aineistojen analyysiin perustuu juuri tähän tosiasiaan. TKK (c) Ilkka Mellin (2005) 37

Tilastollisten aineistojen kerääminen >> Mittaaminen ja mitta-asteikot TKK (c) Ilkka Mellin (2005) 38

Mittaaminen ja mitta-asteikot Avainsanat Diskreetit muuttujat Jatkuvat muuttujat Kvalitatiiviset muuttujat Kvantitatiiviset muuttujat Mittaaminen Mitta-asteikot Intervalli- eli välimatka-asteikko Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Suhdeasteikko Mitta-asteikot ja tilastolliset menetelmät Mittarin tarkkuus Mittarin validiteetti Mittarit TKK (c) Ilkka Mellin (2005) 39

Mittaaminen ja mitta-asteikot Mittaaminen ja mittari 1/2 Tilastollisen tutkimuksen kohteiden ominaisuuksia ja olosuhteita sekä niiden muutoksia kuvaavat numeeriset tai kvantitatiiviset tiedot saadaan selville mittaamalla. Mittaaminen tarkoittaa numeeristen arvojen liittämistä tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Mittaria voidaan pitää funktiona, joka liittää numeeriset arvot tutkimuksen kohteiden ominaisuuksiin ja olosuhteisiin. Ominaisuus Mittari Numeerinen arvo TKK (c) Ilkka Mellin (2005) 40

Mittaaminen ja mitta-asteikot Mittaaminen ja mittari 2/2 Mittauksen tulos voidaan aina ilmaista jonkin tutkimuksen kohteen ominaisuutta tai olosuhdetta kuvaavan muuttujan numeerisena arvona. Ominaisuus Muuttuja Siten tutkimuksen kohteiden ominaisuuksia ja olosuhteita kuvataan mittaustapahtumassa numeerisilla muuttujilla. TKK (c) Ilkka Mellin (2005) 41

Mittaaminen ja mitta-asteikot Mittareiden validiteetti ja tarkkuus Mittari on validi eli oikea, jos se esittää mittauksen kohteena olevaa ominaisuutta oikein, merkityksellisesti ja tarkoituksenmukaisesti. Mittari on tarkka, jos se on harhaton ja reliaabeli: (i) Mittari on harhaton, jos se ei systemaattisesti ali- tai yliarvioi mitattavan ominaisuuden määrää. (ii) Mittari on reliaabeli eli luotettava, jos mittaustulos ei muutu, kun mittausta toistetaan. TKK (c) Ilkka Mellin (2005) 42

Mittaaminen ja mitta-asteikot Mitta-asteikot Mittaamisessa voidaan käyttää seuraavia mitta-asteikoita: (i) Nominaali- eli laatueroasteikko (ii) Ordinaali- eli järjestysasteikko (iii) Intervalli- eli välimatka-asteikko (iv) Suhdeasteikko Huomautus: Jos ominaisuutta voidaan mitata kaikilla neljällä mittaasteikoilla, mittaustuloksen informatiivisuus, mutta samalla myös mittauksen vaativuus kasvaa seuraavassa järjestyksessä: (i) (ii) (iii) (iv) TKK (c) Ilkka Mellin (2005) 43

Mittaaminen ja mitta-asteikot Nominaaliasteikko ja ordinaaliasteikko Mittaus on tehty nominaali- eli laatueroasteikolla, jos mittaus kertoo mihin luokkaan mittauksen kohde kuuluu. Esimerkkejä: Sukupuoli, Asuinpaikka, Väri, Viallisuus Mittaus on tehty ordinaali- eli järjestysasteikolla, jos mittaus kertoo onko mittauksen kohteella mitattavaa ominaisuutta enemmän tai vähemmän kuin jollakin toisella kohteella. Esimerkkejä: Kouluarvosanat, Aineen kovuus TKK (c) Ilkka Mellin (2005) 44

Mittaaminen ja mitta-asteikot Intervalliasteikko ja suhdeasteikko Mittaus on tehty intervalli- eli välimatka-asteikolla, jos mittaus kertoo kuinka paljon kahden mitattavan kohteen ominaisuudet eroavat toisistaan. Esimerkkejä: Lämpötila Celsius-asteissa Mittaus on tehty suhdeasteikolla, jos mittaus kertoo kuinka monta kertaa enemmän tai vähemmän mittauksen kohteella on mitattavaa ominaisuutta kuin jollakin toisella kohteella. Esimerkkejä: Lukumäärä, Pituus, Pinta-ala, Tilavuus, Paino, Aika, Nopeus, Paine, Rahamäärä, Korko TKK (c) Ilkka Mellin (2005) 45

Mittaaminen ja mitta-asteikot Intervalliasteikko ja suhdeasteikko: Kommentteja Tilastotieteessä ei yleensä ole tarpeen erottaa intervalli- ja suhdeasteikollisia muuttujia. Intervalli- ja suhdeasteikollisten muuttujien mittaasteikoilla on kuitenkin seuraava ero: (i) Intervalliasteikollisten muuttujien mitta-asteikossa ei ole luonnollista nollapistettä. (ii) Suhdeasteikollisten muuttujien mitta-asteikossa on luonnollinen nollapiste, jota pienempiä arvoja muuttuja ei voi saada. TKK (c) Ilkka Mellin (2005) 46

Mittaaminen ja mitta-asteikot Kvalitatiiviset ja kvantitatiiviset muuttujat Ominaisuutta ja sitä kuvaavaa muuttujaa kutsutaan kvalitatiiviseksi, jos mittauksen kohteet voidaan luokitella mittauksen perusteella toisistaan eroaviin kategorioihin tai luokkiin. Kvalitatiivisia ominaisuuksia kuvataan laatueroasteikollisilla muuttujilla. Ominaisuutta ja sitä kuvaavaa muuttujaa kutsutaan kvantitatiiviseksi, jos mittaus tuottaa ominaisuuden määrällisen arvon. Kvantitatiivisia ominaisuuksia kuvataan välimatka- tai suhdeasteikollisilla muuttujilla. TKK (c) Ilkka Mellin (2005) 47

Mittaaminen ja mitta-asteikot Diskreetit ja jatkuvat muuttujat Mitattavaa ominaisuutta vastaava muuttuja on diskreetti, jos se voi saada vain erillisiä arvoja. Esimerkkejä: Laatueroasteikolliset muuttujat, Järjestysasteikolliset muuttujat, Lukumäärämuuttujat Mitattavaa ominaisuutta vastaava muuttuja on jatkuva, jos se voi saada kaikki arvot joltakin väliltä. Esimerkkejä: Pituus, Pinta-ala, Tilavuus, Paino, Aika, Nopeus, Paine, Rahamäärä, Korko TKK (c) Ilkka Mellin (2005) 48

Mittaaminen ja mitta-asteikot Mitta-asteikot ja tilastolliset menetelmät Tilastolliset menetelmät voidaan ryhmitellä tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mittaasteikon mukaan. Tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mitta-asteikot määräävät sen, mitä tilastollisia menetelmiä tutkimuksessa saa soveltaa ja/tai mitkä menetelmät ovat suositeltavia. Tässä esityksessä tilastolliset tunnusluvut ja tilastolliset testit on ryhmitelty tutkimuksen kohteiden ominaisuuksia kuvaavien muuttujien mitta-asteikon mukaan. TKK (c) Ilkka Mellin (2005) 49