MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016
Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12 sali C Luennoitsija: (heikki.seppala@aalto.fi) Harjoitukset: Ryhmä 1: 7.1.-11.2. ti 8-10 luokka U351 ja to 10-12 luokka Y344, Jarno Ruokokoski (jarno.ruokokoski@gmail.com) Ryhmä 2: 8.1.-11.2. ti 10-12 luokka U344 ja to 12-14 luokka Y344, Markku Malmivuori (markku.malmivuori@aalto.fi) Ryhmä 3: 8.1.-12.2. ti 8-10 luokka U344 ja pe 8-10 luokka Y344, Markku Malmivuori (markku.malmivuori@aalto.fi)
Kurssin suorittaminen Kurssi suoritetaan tentillä Lisäpisteistä voi saada laskuharjoitustehtävistä ja pareittain tehtävästä harjoitustyöstä Kotitehtävät ovat ns. pistelaskareita, eli pisteiden saamiseksi läsnäolo laskuharjoituksissa on pakollinen Kurssin pisteytys: 4 tenttitehtävää, max 6 pistettä/tehtävä laskareista max 4 pistettä, jolla voi korvata tentin 4. tehtävän a)-kohdan harjoitustyöstä max 5 pistettä, jolla voi korvata tehtävän 4 b)-kohdan
R-ohjelmointi Ilmainen avoimen lähdekoodin ohjelmisto tilastoanalyysiin. Ohjeita: https://math.aalto.fi/opetus/mattie/ MattieO/r.html Suosio vahvassa kasvussa sekä akateemisessa tutkimuksessa että yrityksissä.
R-ohjelmointi
Kurssin sisältö Todennäköisyyslaskun ja tilastollisen analyysin kertaus Regressioanalyysi Varianssianalyysi Erilaisia koeasetelmia
Oppimistavoitteet Kurssin aikana opiskelija oppii Ymmärtämään kokeellisen tutkimuksen ja kausaliteettipäätelmien suhteen Valitsemaan oikean koeasetelman haluttujen oletusten testaamiseen Suorittamaan testit Tekemään testien perusteella oikeat johtopäätökset testattavien oletusten paikkansapitävyydestä
Koesuunnittelu Kokeellisessa tutkimuksessa on tavoitteena selvittää, miten erilaiset käsittelyt vaikuttavat tutkimuksen kohteisiin. Käsittelyllä tarkoitetaan tutkimuksen kohteiden olosuhteiden aktiivista, suunnitelmallista ja järjestelmällistä muuttamista. Jos havaintojen kohteiden olosuhteisiin ei tutkimuksessa puututa, tutkimus perustuu suorien havaintojen tekemiseen. Tiukasti ottaen vain kokeiden perusteella voidaan tehdä kausaalisuutta koskevia päätelmiä.
Kontrolloidut kokeet Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: (i) Kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia: saadaan selville kiinnostuksen kohteena olevan tekijän vaikutus (ii) Käsittelyiden kohdistamisessa on käytettävä satunnaistusta: poistetaan tutkimuksen kohteiden välillä mahdollisesti esiintyvien systemaattisten erojen vaikutus tällöin tuloksissa mahdollisesti havaittavien systemaattisen erojen on johduttava erilaisista käsittelyistä (iii) Kokeessa on tehtävä riittävästi koetoistoja: vähennetään satunnaisen vaihtelun vaikutusta
Esimerkki - suora havainnointi ja kausaliteettipäätelmät Kengät jalassa nukkuminen korreloi aamupäänsäryn kanssa = kengät jalassa nukkuminen aiheuttaa päänsärkyä Jäätelömyynnin kasvaessa hukkumiskuolemien määrä kasvaa voimakkaasti = Jäätelön syönti aiheuttaa hukkumisia. Sekä ilmakehän CO2-pitoisuus että ylipainoisuus ovat kasvaneet voimakkaasti 1950-luvulta lähtien = Ilmakehän hiilidioksidi aiheuttaa ylipainoisuutta Hattujen käyttö on vähentynyt samaan aikaan ilmaston lämpenemisen kanssa = Hattujen hylkääminen on aiheuttanut ilmaston lämpenemisen.
Esimerkki - kontrolloitu koe ja kausaliteettipäätelmät Halutaan testata lääkkeen tehoa tautiin, josta osa potilaista saattaa parantua myös ilman hoitoa. Lääkkeen tehon selvittämiseksi voidaan järjestää seuraava kontrolloitu koe: (1) Jaetaan riittävän suuri joukko potilaita satunnaisesti kahteen ryhmään. (2) Annetaan toiselle ryhmälle lääkettä ja toiselle ryhmälle plaseboa eli lumelääkettä. (3) Vertaillaan parantuneiden suhteellisia osuuksia.
Luento 2: Todennäköisyyslaskennan kertaus Satunnaismuuttujat ja tn-jakaumat Tunnusluvut χ 2 -, F- ja t-jakauma Riippumattomuus
Luento 3: Tilastotieteen kertaus Kuvailun ja päättelyn menetelmiä Aineiston kerääminen ja kuvaaminen Kontrolloidut kokeet Otosjakaumat Tilastollinen malli Yksinkertainen satunnaisotos Tunnusluvut
Luento 4: Estimointi Estimaatti ja estimaattori Piste- ja väliestimointi Luottamusväli Otoskoon määrääminen
Luento 5: Tilastollinen testaus Hypoteesit Testisuure Virheet testauksessa Testin voimakkuus p-arvo Tilastollisia testejä Keskeinen raja-arvolause
Luento 6: Regressioanalyysi Yhden selittäjän lineaarinen regressio Pienimmän neliösumman menetelmä Regression merkitsevyyden testaaminen Yleinen lineaarinen malli
Luento 7: Johdatus varianssianalyysiin Yksisuuntainen varianssianalyysi Varianssianalyysihajotelma Bartlettin testi
Luento 8: Odotusarvoparien vertailu Luottamusvälin käyttö Testaus Simultaaniset testit Kontrastit
Luento 9: Kaksisuuntainen varianssianalyysi Pää- ja yhdysvaikutusten testaaminen
Luento 10: 2 k -faktorikokeet 2 2 -faktorikokeet 2 k -faktorikokeet Osafaktorikokeet Aliakset ja resoluutio
Luento 11: Vastepintamenetelmä Luonnolliset ja koodatut muuttujat 1. asteen vastepintamalli Gradienttimenetelmä Harjoitustyö
Luento 12: Lohkoasetelmat Kiusatekijä Satunnaistettu täydellinen lohkoasetelma Latinalaiset neliöt