Koesuunnittelu ja tilastolliset mallit Johdanto TKK (c) Ilkka Mellin (2005) 1
Koesuunnittelu: Johdanto Johdattelevia esimerkkejä Tilastolliset kokeet TKK (c) Ilkka Mellin (2005) 2
Koesuunnittelu: Johdanto >> Esimerkkejä Tilastolliset kokeet TKK (c) Ilkka Mellin (2005) 3
Johdattelevia esimerkkejä Avainsanat Harha Hoitoryhmä Kaksoissokkokoe Koe Kokeen kohteet Satunnaistaminen Vertailu Vertailuryhmä TKK (c) Ilkka Mellin (2005) 4
Johdattelevia esimerkkejä: Poliorokotuskokeet USA:ssa Salkin koe 1/3 Tri Salkin johdolla tehtiin USA:ssa 1954 hänen kehittämälleen poliorokotteelle kenttäkoe. Kokeen kohteet: Peruskoulujen 1., 2. ja 3. luokkien lapset. Kokeen suoritus: Lapset jaettiin arpomalla kahteen ryhmään. (i) Hoitoryhmälle annettiin rokotetta. (ii) Vertailuryhmälle annettiin plaseboa (lumetta). (iii) Sairastavuuksia (per 100000) hoito- ja vertailuryhmissä verrattiin toisiinsa. TKK (c) Ilkka Mellin (2005) 5
Johdattelevia esimerkkejä: Poliorokotuskokeet USA:ssa Salkin koe 2/3 Tulokset kokeesta: Salkin poliorokotekoe Ryhmän koko Sairastuvuus (per 100000) Hoitoryhmä 200000 28 Vertailuryhmä 200000 71 Ei saanut rokottaa 350000 46 Huomautus: Osaa lapsista ei saanut rokottaa. TKK (c) Ilkka Mellin (2005) 6
Johdattelevia esimerkkejä: Poliorokotuskokeet USA:ssa Salkin koe 3/3 Salkin koe oli satunnaistettu vertaileva kaksoissokkokoe: (i) Satunnaistus: Lapset jaettiin hoito- ja vertailuryhmään arpomalla. (ii) Vertailu: Kokeen vasteena ollutta sairastavuutta (per 100000) hoito- ja vertailuryhmissä verrattiin toisiinsa. (iii) Kaksoisokkokoe: Kokeen tekijät ja kohteet eivät tienneet ennen seuranta-ajan päättymistä oliko kohde kuulunut hoito- vai vertailuryhmään. TKK (c) Ilkka Mellin (2005) 7
Johdattelevia esimerkkejä: Poliorokotuskokeet USA:ssa NFIP-koe 1/3 Tri Salkin kehittämälle poliorokotteelle tehtiin myös USA:n kansallisen lapsihalvaussäätiön (NFIP) järjestämä koe. Kokeen kohteet: Peruskoulujen 1., 2. ja 3. luokkien lapset. Kokeen suoritus: 2. luokan lapset pyrittiin rokottamaan, 1. ja 3. luokkien lapset muodostivat vertailuryhmän. (i) Hoitoryhmälle annettiin rokotetta. (ii) Sairastuvuuksia (per 100000) hoito- ja vertailuryhmissä verrattiin toisiinsa. TKK (c) Ilkka Mellin (2005) 8
Johdattelevia esimerkkejä: Poliorokotuskokeet USA:ssa NFIP-koe 2/3 Tulokset kokeesta: NFIP:n poliorokotekoe Ryhmän koko Sairastuvuus (per 100000) Hoitoryhmä 225000 25 Vertailuryhmä 725000 54 Ei saanut rokottaa 125000 44 Huomautus: Osaa 2. luokan lapsista ei saanut rokottaa. TKK (c) Ilkka Mellin (2005) 9
Johdattelevia esimerkkejä: Poliorokotuskokeet USA:ssa NFIP-koe 3/3 Koska NFIP-kokeessa ei oltu käytetty satunnaistusta, tulokset olivat harhaisia. Tämä nähdään vertaamalla vertailuryhmien sairastuvuuksia Salkin kokeessa (71 per 100000) ja NFIP-kokeessa (54 per 100000). Syynä NFIP-kokeen harhaisuuteen oli se, että koe- ja vertailuryhmät eivät NFIP-kokeessa olleet samanlaisia: NFIP-kokeen vertailuryhmässä olivat mukana myös ne, joita ei olisi saanut rokottaa ja sairastuvuus polioon oli niiden 2. ja 3. luokkien lasten joukossa, jotka olisi saanut rokottaa suurempaa kuin niiden joukossa, joita ei olisi saanut rokottaa. Tämä johtui siitä, että lastensa rokotuksen kielsivät tavallisemmin alempien sosiaaliryhmien vanhemmat, joiden lapsissa oli varhaislapsuudessa kehittänyt immuniteetti poliota vastaan useammin kuin ylempien sosiaaliryhmien lapsissa. TKK (c) Ilkka Mellin (2005) 10
Johdattelevia esimerkkejä: Lujuuskoe Vetolujuuskoe 1/4 Tavoitteena on tutkia uudesta synteettisestä kuidusta tehdyn langan vetolujuutta (lb/in 2 ). Lankaan sekoitetaan aina puuvillaa ja jo ennestään tiedetään, että puuvillan määrä vaikuttaa langan vetolujuuteen. Tarkoituksena on selvittää vetolujuuden kannalta optimaalinen puuvillan määrä. Asian selvittämiseksi järjestetään koe, jossa puuvillan määrää langoissa vaihdellaan (5 painoprosenttia) ja vetolujuudet mitataan useasta eri lankanäytteestä (5 näytettä kutakin lankaa). TKK (c) Ilkka Mellin (2005) 11
Johdattelevia esimerkkejä: Lujuuskoe Vetolujuuskoe 2/4 Tulokset kokeesta: Tensile strenght (lb/in 2 ) Obs Cotton weight % 1 2 3 4 5 Mean 15 7 7 15 11 9 9.8 25 12 17 12 18 18 15.4 25 14 18 18 19 19 17.6 30 19 25 22 19 23 21.6 35 7 10 11 15 11 10.8 Total 15.04 TKK (c) Ilkka Mellin (2005) 12
Johdattelevia esimerkkejä: Lujuuskoe Vetolujuuskoe 3/4 Keskiarvoprofiili: 30.00 Means of TnslStrngth 23.75 TnslStrngth 17.50 11.25 5.00 15 20 25 30 35 CttnWghtPrctg TKK (c) Ilkka Mellin (2005) 13
Johdattelevia esimerkkejä: Lujuuskoe Vetolujuuskoe 4/4 Kysymys 1: Eroavatko keskiarvoprofiililla kuvatut ryhmäkohtaiset (vetolujuuksien) keskiarvot tilastollisesti merkitsevästi toisistaan? Kysymys 2: Jos ryhmäkohtaiset (vetolujuuksien) keskiarvot eroavat toisistaan, mikä puuvillan määrä tuottaa optimaalisen vetolujuuden langalle? Kysymyksiin voidaan vastata soveltamalla aineistoon yksisuuntaista varianssianalyysia. TKK (c) Ilkka Mellin (2005) 14
Johdattelevia esimerkkejä: Akkukoe Akun kesto 1/4 Tavoitteena on tutkia eri materiaaleista valmistettujen akkujen kestoa (tunteina) eri lämpötiloissa. Tarkoituksena on selvittää lämpötilan suhteen optimaalinen materiaali. Asian selvittämiseksi järjestetään koe, jossa eri materiaaleista (3 materiaalia) valmistettujen akkujen kesto mitataan useassa eri lämpötilassa (3 lämpötilaa; F). TKK (c) Ilkka Mellin (2005) 15
Johdattelevia esimerkkejä: Akkukoe Akun kesto 2/4 Tulokset kokeesta: Life (h) Temp ( F) Material 15 70 125 1 130 155 34 40 20 70 74 180 80 75 82 58 2 150 188 136 122 25 70 159 126 106 115 58 45 3 138 110 174 120 96 104 168 160 150 139 82 60 TKK (c) Ilkka Mellin (2005) 16
Johdattelevia esimerkkejä: Akkukoe Akun kesto 3/4 Keskiarvoprofiili: Means of BatteryLife 200.00 150.00 Material 1 2 3 BatteryLife 100.00 50.00 0.00 15 70 125 Temp TKK (c) Ilkka Mellin (2005) 17
Johdattelevia esimerkkejä: Akkukoe Akun kesto 4/4 Kysymys 1: Eroavatko keskiarvoprofiililla kuvatut ryhmäkohtaiset (kestoajan) keskiarvot tilastollisesti merkitsevästi toisistaan? Kysymys 2: Jos ryhmäkohtaiset (kestoaikojen) keskiarvot eroavat toisistaan, mikä materiaali toimii eri lämpötilat huomioiden optimaalisen keston akulle? Kysymyksiin voidaan vastata soveltamalla aineistoon kaksisuuntaista varianssianalyysia. TKK (c) Ilkka Mellin (2005) 18
Koesuunnittelu: Johdanto Esimerkkejä >> Tilastolliset kokeet TKK (c) Ilkka Mellin (2005) 19
Tilastolliset kokeet Avainsanat Harha Hoitoryhmä Kaksoissokkokoe Kausaliteetti Koe Koeasetelma Koetoisto Kokeen kohteet Kontrolli Käsittely Satunnaistaminen Satunnaisvaihtelu Sekoittava tekijä Systemaattiset erot Syy-yhteys Vertailu Vertailuryhmä TKK (c) Ilkka Mellin (2005) 20
Tilastolliset kokeet Koe Kokeellisessa tutkimuksessa tavoitteena on selvittää, millaisia vaikutuksia tutkimuksen kohteisiin kohdistetuilla erilaisilla käsittelyillä on kohteisiin. Käsittelyllä tarkoitetaan tutkimuksen kohteiden olosuhteiden aktiivista, suunnitelmallista ja järjestelmällistä muuttamista. Tiukasti ottaen vain kokeiden perusteella voidaan tehdä kausaalisia eli syy-yhteyksiä koskevia päätelmiä. Huomautus: Tutkimus perustuu suorien havaintojen tekemiseen, jos havaintojen kohteiden olosuhteisiin ei tutkimuksessa puututa. TKK (c) Ilkka Mellin (2005) 21
Tilastolliset kokeet Koeasetelmat Koeasetelmalla tarkoitetaan kokeen tekemiseen liittyviä periaatteita ja sääntöjä: (i) Mitä käsittelyitä kokeen kohteisiin sovelletaan? (ii) Miten kokeen kohteet valitaan? (iii) Mikä on tehtävien koetoistojen lukumäärä? TKK (c) Ilkka Mellin (2005) 22
Tilastolliset kokeet Kontrolloidut kokeet Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: (i) Koetuloksiin vaikuttavien ulkopuolisten sekoittavien tekijöiden kontrolloimiseksi kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. (ii) Erilaisten käsittelyiden kohteiksi valittavien perusjoukon alkioiden välisten systemaattisten erojen kontrolloimiseksi käsittelyiden kohdistamisessa on käytettävä satunnaistusta. (iii) Koetuloksiin liittyvän satunnaisvaihtelun kontrolloimiseksi kokeessa on tehtävä riittävästi koetoistoja. TKK (c) Ilkka Mellin (2005) 23
Tilastolliset kokeet Yksinkertainen kontrolloitu koe Alla oleva kaavio kuvaa yksinkertaista kontrolloitua koetta: (1) Jaetaan kokeen kohteet satunnaisesti kahteen ryhmään. (2) Kohdistetaan ryhmiin erilaiset käsittelyt. (3) Vertaillaan käsittelyiden vaikutuksia. Ryhmä 1 Käsittely 1 Satunnaistus Vertailu Ryhmä 2 Käsittely 2 TKK (c) Ilkka Mellin (2005) 24
Tilastolliset kokeet Yksinkertainen kontrolloitu koe: Esimerkki Oletetaan, että haluamme tutkia vastakehitetyn lääkkeen tehoa tautiin, johon aikaisemmin ei ole ollut lääkettä, mutta josta osa potilaista saattaa parantua myös ilman hoitoa (vrt. rokotuskokeet edellä). Tällöin lääkkeen tehon selvittämiseksi voidaan järjestää kontrolloitu koe esimerkiksi seuraavalla tavalla: (1) Jaetaan riittävän suuri joukko potilaita satunnaisesti kahteen ryhmään. (2) Annetaan toiselle ryhmälle uutta lääkettä ja toiselle ryhmälle plaseboa eli lumelääkettä. (3) Vertaillaan parantuneiden suhteellisia osuuksia. Pohdi seuraavia kysymyksiä: Miksi potilaita pitää olla riittävästi? Miksi potilaat jaetaan ryhmiin satunnaisesti? Miksi toiselle ryhmälle annetaan plaseboa? TKK (c) Ilkka Mellin (2005) 25
Tilastolliset kokeet Kontrolloidut kokeet: Kommentteja 1/3 Jos koe on kontrolloitu eli kokeessa on käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistusta ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin on mahdollista. Jos koe on kontrolloitu, koetuloksiin liittyvät systemaattiset ja satunnaiset tekijät voidaan erottaa ja kuvata ja kuvauksen luotettavuus voidaan arvioida. Jos koe on kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin voidaan tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2005) 26
Tilastolliset kokeet Kontrolloidut kokeet: Kommentteja 2/3 Jos koe ei ole kontrolloitu eli kokeessa ei ole käytetty suunnitelmallisesti ja järjestelmällisesti vertailua, satunnaistusta ja koetoistoja niin koetuloksien analysointi tilastotieteen keinoin ei ole mahdollista. Jos koe ei ole kontrolloitu, koetuloksiin liittyviä systemaattisia ja satunnaisia tekijöitä ei voida erottaa ja kuvata ja kuvauksen luotettavuutta ei voida arvioida. Jos koe ei ole kontrolloitu, käsittelyiden vaikutuksista kokeen kohteisiin ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2005) 27
Tilastolliset kokeet Kontrolloidut kokeet: Kommentteja 3/3 Jos koe ei ole kontrolloitu, koeasetelma saattaa systemaattisesti suosia joitakin tulosvaihtoehtoja. Jos koeasetelma suosii systemaattisesti joitakin tulosvaihtoehtoja, asetelmaa sanotaan harhaiseksi. Harhaisten koeasetelmien perusteella ei voida tehdä luotettavia johtopäätöksiä. TKK (c) Ilkka Mellin (2005) 28
Tilastolliset kokeet Kontrolloidut kokeet ja satunnaistus 1/2 Kokeen satunnaistus tarkoittaa sitä, että käsittelyiden kohdistamisessa käytetään arvontaa. Arvonta on ainoa puolueeton tapa kohdistaa käsittelyitä, koska arpominen ei suosi mitään perusjoukon osaa. Satunnaistettujen kokeiden tulosten analysointiin voidaan soveltaa tilastollisia menetelmiä, koska arvonta noudattaa todennäköisyyslaskennan lakeja. TKK (c) Ilkka Mellin (2005) 29
Tilastolliset kokeet Kontrolloidut kokeet ja satunnaistus 2/2 Satunnaistus takaa suurella todennäköisyydellä sen, että kokeessa erilaisten käsittelyiden kohteiksi joutuvat perusjoukon osajoukot ovat ennen käsittelyiden soveltamista ominaisuuksiltaan keskimäärin samankaltaisia. Satunnaistus takaa suurella todennäköisyydellä sen, että kokeen tuloksista voidaan tehdä kausaalipäätelmiä: Jos koe on satunnaistettu, kokeen tuloksissa havaitut systemaattisten erojen on johduttava erilaisista käsittelyistä. TKK (c) Ilkka Mellin (2005) 30