MTTTS2 Pro gradu -tutkielma ja seminaari Kevät 2014, 40op Jaakko Peltonen
Osaamistavoitteet Opiskelija osaa tehdä itsenäisesti tilastollista tutkimustyötä ja osaa raportoida sekä käyttämiensä menetelmien taustateorian että tutkimustulokset ymmärrettävästi. Opiskelija pystyy hallitsemaan tieteellisiä kokonaisuuksia sekä seuraamaan alansa kehitystä. Opiskelija osaa esitellä tutkielmansa aihetta ja tuottamiaan analyysituloksia ymmärrettävästi muille opiskelijoille seminaarin yhteydessä.
Tutkielman vaiheita Aiheen alustava valinta aineisto, tavoite, menetelmät? Taustatutkimus / kirjallisuuskatsaus Aiheen rajaus taustatutkimuksen perusteella Aineiston hankkiminen ja alustava perehtyminen siihen Harjoitusaineen kirjoittaminen Menetelmien tarkempi pohdinta ja toteutus Kokeiden/testien suunnittelu Kokeiden toteutus Tulosten analysointi ja summarisointi, päätelmien vetäminen Kypsyysnäytteen kirjoittaminen Tutkielman kirjoittaminen
Aihe Tilastotieteen perusidea: tutkitaan jotain kiinnostavaa aineistoja, selitetään hypoteesien/mallinnuksen avulla sen säännönmukaisuuksia Aineistolähtöinen: löydetään kiinnostava aineisto ja asia, jota siitä voisi tutkia, valitaan menetelmät ym. tätä varten Menetelmälähtöinen: tutkitaan esim. hiljattain esitellyn uuden tilastollisen menetelmän kykyjä, valitaan aineistot ym. tätä varten Teorialähtöinen: tutkitaan menetelmän/mallin/tilastollisen käsitteen ominaisuuksia todistelemalla ja/tai kokeellisesti
Aineistoja? Kun aineiston perusluonne (esim. lämpötila-aikasarjat ) on keksitty, verkosta voi hakea vapaasti saatavia aineistoja (esim. haulla temperature time series data set ) Yleisiä aineistopankkeja ovat esim. UCI Machine Learning Repository http://archive.ics.uci.edu/ml/ MLData.org http://mldata.org/ Tietyille aineistotyypeille on omia aineistopankkeja, esim. bioinformatiikassa ArrayExpress https://www.ebi.ac.uk/arrayexpress/ Tietyissä ennustustehtävissä järjestetään säännöllisiä kilpailuja, joiden aineistot tulevat saataville Useat valtiolliset tai muut julkiset toimijat julkaisevat avoimia aineistoja, esim. vaalikone ym. kyselyjen aineistot. Tietyt yritykset julkaisevat joitain avoimia aineistoja, esim. NetFlix -ennustuskilpailu
Menetelmiä? Kun tehtävän perusluonne (esim. ennustetaan näytteiden luokkia tai ennustetaan aikasarjan tulevia arvoja ) on keksitty, kirjallisuudesta voi hakea siihen soveltuvia menetelmiä Uusimmat menetelmät eivät vielä ole kirjoissa Seuraa alan tärkeitä lehtiä ja konferensseja Vanhoille menetelmille voi olla valmiita julkisia toteutuksia eri ohjelmointikielillä, uusille usein ei
Raportointi Kuin kirjoittaisi tieteellistä artikkelia Motivoi tutkittavan aiheen tärkeys Kerro, mitä aiheessa on aiemmin tehty Kerro, miten nyt tehty työ eroaa aiemmista töistä Motivoi uutuuksien kiinnostavuus Perustele tehdyt valinnat Aseta kysymykset, joita työ tutkii Kerro, miten tehdyt kokeet vastaavat kysymyksiin Kerro, miten vastaukset näkyvät tuloksista Vedä vastauksista loppupäätelmät Kuvaile, mitä jatkokysymyksiä voisi tutkia
Arvosteluperiaatteet http://www.uta.fi/sis/mtt/kaytannot/opinnaytteet/mtt-pro_gradututkielman_arvosteluperiaatteet.pdf
Aiemmin tehtyjä graduja http://tampub.uta.fi/
Harjoitusaineen kirjoitusohjeet http://www15.uta.fi/kielikeskus/kielet/suomi/harjoitusaineohje.pdf
Edellisvuoden materiaali http://www.uta.fi/sis/mtt/mttts2.html (mm. LaTeX-ohjeita, kirjaston ohjeet työn tallentamisesta...)
Seuraavat tapaamiset Tapaamiset joka toinen maanantai, parittomat viikot 27.1., 10.2., 24.2., 10.3., 24.3., 7.4., Tapaamiset joka toinen maanantai, parilliset viikot 14.4., 28.4.,... Viimeistään 6 päivää ennen tapaamista: lähetä sähköpostilla (jaakko [dot] peltonen [at] uta [dot] fi) kuvaus työsi nykytilasta ja haasteista. Pari-kolme tekstikappaletta sähköpostissa riittää, ei tarvitse erillisiä dokumentteja. Tapaamiselle tehdään agenda lähetettyjen kuvausten perusteella. Kussakin tapaamisessa: - kukin esittelee muille työnsä ja sen tilanteen ja haasteet (noin 10min/henkilö). - käsitellään yhdessä jotain haasteita yhdistävää tekijää