MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017
Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi) Harjoitukset: Ryhmä 1: ti 8-10 ja to 10-12 luokassa U257, Ilkka Särkiö (ilkka.sarkio@ayy.fi) Ryhmä 2: to 10-12 ja pe 10-12 luokassa U344, Marko Voutilainen (marko.voutilainen@aalto.fi) Ryhmä 3: ke 8-10 ja pe 12-14 luokassa U344, Ilkka Särkiö (ilkka.sarkio@ayy.fi) Huom: loppiaisen laskuharjoitukset pidetään jo torstaina
Kurssin suorittaminen Kurssi suoritetaan tentillä Lisäpisteistä voi saada laskuharjoitustehtävistä ja pareittain tehtävästä harjoitustyöstä Kotitehtävät ovat ns. pistelaskareita, eli pisteiden saamiseksi läsnäolo laskuharjoituksissa on pakollinen Kurssin pisteytys: 4 tenttitehtävää, max 6 pistettä/tehtävä laskareista max 3 pistettä harjoitustyöstä max 3 pistettä
R-ohjelmointi Ilmainen avoimen lähdekoodin ohjelmisto tilastoanalyysiin. Ohjeita: https://math.aalto.fi/opetus/mattie/ MattieO/r.html Suosio vahvassa kasvussa sekä akateemisessa tutkimuksessa että yrityksissä.
R-ohjelmointi
Kurssin sisältö Todennäköisyyslaskun ja tilastollisen analyysin kertaus Regressioanalyysi Varianssianalyysi Erilaisia koeasetelmia
Oppimistavoitteet Kurssin aikana opiskelija oppii Ymmärtämään kokeellisen tutkimuksen ja kausaliteettipäätelmien suhteen Valitsemaan oikean koeasetelman haluttujen oletusten testaamiseen Suorittamaan testit Tekemään testien perusteella oikeat johtopäätökset testattavien oletusten paikkansapitävyydestä
Koesuunnittelu Kokeellisessa tutkimuksessa on tavoitteena selvittää, miten erilaiset käsittelyt vaikuttavat tutkimuksen kohteisiin. Käsittelyllä tarkoitetaan tutkimuksen kohteiden olosuhteiden aktiivista, suunnitelmallista ja järjestelmällistä muuttamista. Jos havaintojen kohteiden olosuhteisiin ei tutkimuksessa puututa, tutkimus perustuu suorien havaintojen tekemiseen. Tiukasti ottaen vain kokeiden perusteella voidaan tehdä kausaalisuutta koskevia päätelmiä.
Kontrolloidut kokeet Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: (i) Kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia: saadaan selville kiinnostuksen kohteena olevan tekijän vaikutus (ii) Käsittelyiden kohdistamisessa on käytettävä satunnaistusta: poistetaan tutkimuksen kohteiden välillä mahdollisesti esiintyvien systemaattisten erojen vaikutus tällöin tuloksissa mahdollisesti havaittavien systemaattisen erojen on johduttava erilaisista käsittelyistä (iii) Kokeessa on tehtävä riittävästi koetoistoja: vähennetään satunnaisen vaihtelun vaikutusta
Esimerkki - suora havainnointi ja kausaliteettipäätelmät Kengät jalassa nukkuminen korreloi aamupäänsäryn kanssa = kengät jalassa nukkuminen aiheuttaa päänsärkyä Jäätelömyynnin kasvaessa hukkumiskuolemien määrä kasvaa voimakkaasti = Jäätelön syönti aiheuttaa hukkumisia. Sekä ilmakehän CO2-pitoisuus että ylipainoisuus ovat kasvaneet voimakkaasti 1950-luvulta lähtien = Ilmakehän hiilidioksidi aiheuttaa ylipainoisuutta Hattujen käyttö on vähentynyt samaan aikaan ilmaston lämpenemisen kanssa = Hattujen hylkääminen on aiheuttanut ilmaston lämpenemisen.
Esimerkki - kontrolloitu koe ja kausaliteettipäätelmät Halutaan testata lääkkeen tehoa tautiin, josta osa potilaista saattaa parantua myös ilman hoitoa. Lääkkeen tehon selvittämiseksi voidaan järjestää seuraava kontrolloitu koe: (1) Jaetaan riittävän suuri joukko potilaita satunnaisesti kahteen ryhmään. (2) Annetaan toiselle ryhmälle lääkettä ja toiselle ryhmälle plaseboa eli lumelääkettä. (3) Vertaillaan parantuneiden suhteellisia osuuksia.
Luentoaikataulu
Todennäköisyyslaskennan kertaus Satunnaismuuttujat ja tn-jakaumat Tunnusluvut χ 2 -, F- ja t-jakauma Riippumattomuus
Tilastotieteen kertaus Kuvailun ja päättelyn menetelmiä Aineiston kerääminen ja kuvaaminen Kontrolloidut kokeet Otosjakaumat Tilastollinen malli Yksinkertainen satunnaisotos Tunnusluvut
Estimointi Estimaatti ja estimaattori Piste- ja väliestimointi Luottamusväli Otoskoon määrääminen
Tilastollinen testaus Hypoteesit Testisuure Virheet testauksessa Testin voimakkuus p-arvo Tilastollisia testejä Keskeinen raja-arvolause
Regressioanalyysi Yhden selittäjän lineaarinen regressio Pienimmän neliösumman menetelmä Regression merkitsevyyden testaaminen Yleinen lineaarinen malli
Johdatus varianssianalyysiin Yksisuuntainen varianssianalyysi Varianssianalyysihajotelma Bartlettin testi
Odotusarvoparien vertailu Luottamusvälin käyttö Testaus Simultaaniset testit Kontrastit
Kaksisuuntainen varianssianalyysi Pää- ja yhdysvaikutusten testaaminen
2 k -faktorikokeet 2 2 -faktorikokeet 2 k -faktorikokeet Osafaktorikokeet Aliakset ja resoluutio
Lohkoasetelmat Kiusatekijä Satunnaistettu täydellinen lohkoasetelma Latinalaiset neliöt
Kertaus Keskeisten asioiden kertaus Vinkkejä tenttiin