Kokeiden arvioinnista TIES542 Ohjelmointikielten periaatteet, kevät 2016

Koko: px
Aloita esitys sivulta:

Download "Kokeiden arvioinnista TIES542 Ohjelmointikielten periaatteet, kevät 2016"

Transkriptio

1 Kokeiden arvioinnista TIES542 Ohjelmointikielten periaatteet, kevät 2016 Antti-Juhani Kaijanaho 19. tammikuuta 2016 Kokeella (engl. experiment) tarkoitan tässä monisteessa tutkimusta, jossa tutkijat pyrkivät todellista koetilannetta manipuloimalla tuottamaan mitattavia muutoksia tai eroja koetilanteessa. 1 Koeasetelma Tyypillinen (joskaan ei ainoa mahdollinen) koeasetelma on seuraavanlainen. Tutkijat pyrkivät osoittamaan, että ohjelmointikieli A on parempi kuin ohjelmointikieli B. He rekrytoivat jostakin 2n koehenkilöä (engl. experimental subject, participant), jotka eivät osaa kumpaakaan kieltä, ja jakavat heidät arvalla kahteen n ihmisen ryhmään. Toiselle ryhmälle he opettavat kielen A ja toiselle kielen B. Sen jälkeen he laittavat kummankin ryhmän toteuttamaan jonkin tietyn ohjelmointitehtävän sillä kielellä, joka heille opetettiin. Kunkin koehenkilön käyttämä aika hyväksyttävään lopputulokseen kirjataan ylös. Ryhmien keskimääräisillä suoriutumisajoilla huomataan olevan eroa kielen A hyväksi; tilastollisella testillä todetaan p = Tutkijat raportoivat kielen A olevan keskimäärin parempi kuin kieli B. 1 Tässä kuvitteellisessa esimerkissä manipulointi ilmenee siten, että osalle koehenkilöistä opetetaan yksi kieli ja osalle toinen kieli, ja kukin laitetaan laatimaan oppimallaan kielellä tietty ohjelma. Tällä manipuloinnilla saadaan aikaan mitattava ero ryhmien välille keskimääräisessä suoriutumisajassa. Kokeiden analyysissä koemanipulaatio mallitetaan mahdollisimman yksinkertaisena matemaattisena muuttujana, jota kutsutaan riippumattomaksi muuttujaksi (engl. independent variable). Riippumattoman muuttujan arvoja kutsutaan toisinaan käsittelyiksi (engl. treatment). Kokeen tulos johdetaan puolestaan mittauksista, jotka mallitetaan riippuvana muuttujana (engl. dependent variable). Ylläolevassa esimerkissä riippumattomaksi muuttujaksi 1 Tämä ei ole esimerkki hyvästä kokeesta. Koeasetelmaan liittyy ongelmia. 1

2 kelpaa ohjelmointikieli sillä on kaksi arvoa, A ja B, jotka ovat siten käsittelyjä ja riippuvaksi muuttujaksi aika hyväksyttyyn suoritukseen se on positiivinen reaaliluku. 2 Ylläoleva esimerkkikoe on koehenkilöiden välinen (engl. between subjects): kullekin koehenkilölle määrätään yksi riippumattoman muuttujan arvo ja kokeen tulos luetaan vertailemalla koehenkilöiden tuloksia toisiinsa. Jotkut kokeet ovat koehenkilöiden sisäisiä (engl. within subjects): jokainen koehenkilö testataan riippumattoman muuttujan kaikilla arvoilla ja kokeen tulos luetaan vertailemalla kunkin koehenkilön omia tuloksia toisiinsa; jos esimerkkikokeessa jokainen koehenkilö opettelisi molemmat kielet ja ohjelmoisi testiohjelman kummallakin kielellä, koe olisi koehenkilöiden sisäinen. Yksi tärkeimmistä kokeen luotettavuuteen vaikuttavista kysymyksistä on, onko se kontrolloitu. Kontrolloidussa kokeessa on aina kyse kahden tai useamman eri käsittelyn vertailusta. Tavallisesti yksi tai useampi vertailtavista käsittelyistä on kontrolli, jolloin muita kutsutaan interventioiksi, ja tällöin tarkoitus on, että mikäli kontrolli pärjää paremmin kuin jokin interventioista, kyseinen interventio on kokeen perusteella hylättävä. Kontrollina käytetään yleensä jotain yleisesti hyväksyttyä ja laajasti käytettyä käsittelyä. Esimerkiksi, jos kokeen tarkoituksena on osoittaa uuden ohjelmointikielen ylivertaisuus, voidaan kontrolliksi ottaa jokin vertailukohdaksi sopiva laajasti käytössä oleva kieli. Kokeen kontrolliin kuuluu olennaisena seikkana se, että kaikki muut tekijät kuin riippumattomat muuttujat pyritään pitämään muuttumattomina. Lisäksi joskus ennakoitavissa olevat häiriötekijät pyritään sulkemaan pois tilastollisin keinoin käyttämällä niitä kovariaatteina. Esimerkkikokeessa ongelmana on esimerkiksi se, kuinka nämä kaksi kieltä voidaan opettaa tasavertaisesti niin, että opetuksesta ei johdu kokeen luotettavuutta sekoittavia eroja. Koehenkilöiden sisäisissä kokeissa on lisäksi kontrolloitava myös järjestys, jolla käsittelyitä testataan. Jos esimerkiksi vertaillaan Javaa ja C#:aa, tulee joillakin koehenkilöillä ensin testata Javaa ja sitten C#:aa ja toisilla ensin C#:aa ja sitten Javaa. Tätä kutsutaan koeasetelman tasapainottamikseksi (engl. counterbalancing). Jos kaikki mahdolliset järjestykset testataan, koeasetelma on täysin tasapainotettu (engl. fully counterbalanced). Jos tasapainotus jätetään tekemättä tai se tehdään vaillinaisesti, voi olla, että osa havaitusta tuloksesta selittyy valitulla järjestyksellä. 2 Joskus kokeissa mitataan riippuvien muuttujien lisäksi kovariaatteja (engl. covariant). Näitä muuttujia ei koeasetelmassa manipuloida eikä niistä lueta kokeen tulosta, mutta niiden arvellaan vaikuttavan jollakin tavalla kokeen lopputulokseen ja niitä siksi käytetään tulosten tilastollisessa analyysissä apuna. Ylläolevassa esimerkissä ei ole kovariaatteja mitattu, mutta esimerkiksi koehenkilön opiskelumenestystä olisi voitu käyttää kovariaattina. 2

3 Koehenkilöiden jako ryhmiin tapahtuu tavallisesti arpomalla. Tällöin puhutaan satunnaistetusta kokeesta (engl. randomized controlled trial (RCT)). Arpomisen etu on, että tällöin kukaan ihminen ei voi vahingossa tai tahallaan vaikuttaa ryhmien muodostumiseen eikä siten voi antaa jollekin käsittelylle etulyöntiasemaa. Arpomisen haittana on, että se on todella vaikea tehdä oikein, ja se voi joskus aiheuttaa eettisiä ongelmia. 3 Joskus koeraportti väittää kokeen olevan satunnaistettu vaikka se oikeasti sitä ei ole: esimerkiksi ryhmiin jako koehenkilöiden nimien MD5-tarkistussummien perusteella ei ole satunnainen vaan systemaattinen. Samassa kokeessa voidaan testata useiden riippumattomien muuttujien vaikutusta riippuviin muuttujiin samanaikaisesti. Tällöin puhutaan faktorikoeasetelmasta (engl. factorial design) ja riippumattomia muuttujia kutsutaan tässä yhteydessä usein faktoreiksi (engl. factor). Esimerkiksi Fischer ja Hanenberg 4 käyttivät riippumattomina muuttujina eli faktoreina ohjelmointikieltä (JavaScript vai TypeScript) ja koodintäydennystä (päällä vai pois). Tällöin asianmukainen kokeen kontrolli vaatii, että kaikkia riippumattomien muuttujien arvojen yhdistelmiä testataan. Kahden riippumattoman muuttujan tapauksessa piirretään usein taulukko, jossa muttujien yhdistelmien jakaminen koehenkilöryhmille ilmoitetaan. Esimerkiksi: 5 code completion no code completion JavaScript Group 1 Group 2 TypeScript Group 3 Group 4 Se, onko koe koehenkilöiden välinen vai koehenkilöiden sisäinen, voi olla kullekin riippumattomalle muuttujalle eri. Esimerkiksi edellä mainitussa Fischerin ja Hanenbergin kokeessa koodintäydennys on koehenkilöiden välinen ja kieli koehenkilöiden sisäinen (osittain tasapainotettu) faktori. Niinpä heidän todellinen koeasetelmansa vaatii kaksiosaisen taulukon (suora lainaus kuten edellä, ilman poistoja): 3 Joskus väitetään, että satunnaistaminen poistaa kaikki häiritsevät tekijät kokeesta. Tämä on varsin uskomaton väite, enkä ole sille koskaan nähnyt hyvää perustelua. 4 Lars Fischer, Stefan Hanenberg: An Empirical Investigation of the Effects of Type Systems and Code Completion on API Usability using TypeScript and JavaScript in MS Visual Studio. In Proceedings of the 11th Symposium on Dynamic Languages (DLS 15), , doi: / Taulukko on suora lainaus edellämainitusta Fischerin ja Hanenbergin tutkimuksesta, heidän kuvansa 2 sivulta 157, round 1, kierroksen nimi poistettu. 3

4 Round 1 code completion no code completion JavaScript Group 1 Group 2 TypeScript Group 3 Group 4 Round 2 code completion no code completion TypeScript Group 1 Group 2 JavaScript Group 3 Group 4 2 Kokeen tulosten analyysi Miten tahansa koe onkaan järjestetty, tuloksena on tavallisesti joukko riippuvan muuttujan mittauksia, joista jokaiseen liittyy mm. tieto, millä riippumattoman muuttujan arvolla se on mitattu. Tästä tilastoaineistosta voidaan sitten laskea havaittu efekti. Ylläolevan kuvitteellisen kokeen tapauksessa lasketaan hyväksyttyyn suoritukseen käytetyn ajan keskiarvo kummallekin kielelle erikseen; havaittu efekti on näiden erotus. Edellä mainitun Fischerin ja Hanenbergin kokeen havaittu efekti on myös hyväksyttyyn suoritukseen vaaditun ajan keskiarvojen erotus. Havaitun efektin pistearvo ei sinänsä kerro mitään. Siksi usein koeraportissa ilmoitetaan myös sen luottamusväli (engl. confidence interval). Luottamusvälin kanssa tulee aina ilmoittaa myös luottamustaso (yleensä, mutta ei aina, 95 %). Tämä usein ilmoitetaan esimerkiksi näin: The observed difference in mean time to successful completion was 15 minutes (95 % CI 10 to 20 minutes). Luottamusvälin käsite on varsin hankala ymmärtää, ja se usein selitetään väärin. Edellä esitetty raportti ei tarkoita, että todellinen efekti olisi 95 %:n todennäköisyydellä 10 ja 20 minuutin välillä. Sen sijaan se tarkoittaa, että jos käyttäydymme ikään kuin todellinen efekti olisi 10 ja 20 minuutin välillä, teemme virheen 5 %:n todennäköisyydellä. Luottamusvälin asemesta tai sen lisäksi usein raportoidaan tilastollinen hypoteesitesti. Tavanomaisesti testattava hypoteesi 6 on, että todellinen efekti on nolla (eli eroa ei todellisuudessa ole), ja vaihtoehtoinen hypoteesi on, että todellinen efekti on jotain muuta kuin nolla (eli eroa on, joskin sen suuruusluokasta ei ole tietoa). Lisäksi kiinnitetään käytettävä testi sekä α-taso eli todennäköisyys, jolla testi virheellisesti kertoo testattavan hypoteesin olevan väärä. Tämän jälkeen voidaan koedata ajaa tilastollisen analyysiohjelmiston läpi ja katsoa, millaisen p-arvon ohjelma antaa valitulla testillä. Jos p < α, testattava hypoteesi hylätään. Tavallisesti tutkimusraportissa ilmoitetaan valittu testi, valittu α-taso sekä aineistosta laskettu p-arvo. 6 Testattavaa hypoteesia kutsutaan joskus myös nollahypoteesiksi (engl. null hypothesis). 4

5 On tavallista, että tutkimusraportissa käytetään ilmaisua tilastollisesti merkitsevä (engl. statistically significant). Tämä tarkoittaa vain, että hypoteesitestissä testattava hypoteesi hylättiin. Raportissa pitäisi aina myös ilmoittaa, mitä α-tasoa eli merkitsevyystasoa (engl. significance level) käytettiin. Hypoteesitesti on yhtä vaikea tulkittava kuin luottamusvälikin. Yleinen virhe on tulkita raportoitu p-arvo testattavan hypoteesin todennäköisyydeksi; sitä se ei ole. Oikea tulkinta on: mikäli aina, kun testattava hypoteeesi hylätään, käyttäydymme ikään kuin se olisi epätosi, teemme virheen todennäköisyydellä α. Hypoteesitesteihin liittyy merkittävä ongelma, jota kutsutaan p-arvon nikkaroimiseksi (engl. p-value hacking). Luottamustaso ja merkitsevyystaso ilmaisevat todennäköisyyden kertatestauksen virheelle. Jos testejä tehdään runsaasti, todennäköisyys sille, että ainakin yksi antaa tilastollisesti merkitsevän tuloksen, kasvaa. Esimerkiksi jos tehdään sata testiä merkitsevyystasolla α = 0.05, on todennäköisyys, että ainakin yksi niistä tuottaa tilastollisesti merkitsevän tuloksen vaikka mitään todellista ilmiötä ei havaittu, 1 (1 0.05) Asiaa kuvaa hyvin kuvan 1 sarjakuva. 7 Hypoteesitesti ja luottamusväli kertovat olennaisesti saman informaation: jos nolla ei sisälly (1 p) 100 %:n luottamusväliin, vastaava hypoteesin tulos on nolla testi α-tasolla p on tilastollisesti merkisevä. Myös p-arvon nikkarointi on luottamusvälienkin ongelma. Kokeen analyysineen voi tulkita induktiiviseksi argumentiksi: teimme näin, havaitsimme noin, sen vuoksi on niin. Aiemmassa monisteessa mainitsemani subjektiiviseen todennäköisyyteen perustava argumentin analyysi voi käyttää tällaisia tilastollisia analyysejä apunaan. Valitettavasti sen tekeminen täsmällisesti numeroiden kanssa on työlästä: tavallisesti raportoitujen tietojen lisäksi tarvitaan käytetyn testin voimafunktio. 8 3 Validiteettiuhat Kokeiden arvioinnissä käytetään tavallisesti validiteettiuhkien (engl. threats to validity) käsitettä. Tässä validiteetilla ei valitettavasti tarkoiteta deduktiivisen argumentin validiteettia. Validiteettiuhka tarkoittaa potentiaalisia 7 Ks. esim. Joseph P. Simmons, Leif D. Nelson, Uri Simonsohn: False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant. Psychological Science 22 (11), , doi: / Asiaa on käsitelty tarkemmin väitöskirjani luvussa 4.5. Antti-Juhani Kaijanaho: Evidence-Based Programming Language Design: A Philosophical and Methodological Exploration. University of Jyväskylä, Jyväskylä Studies in Computing 222,

6 Kuva 1: Randall Munroe. XKCD: Significant CC BY-NC. 6

7 syytä, jonka vuoksi kokeen tulos voi olla virheellinen. Hyvä koeraportti sisältää jo itse validiteettiuhkien tarkastelua, mutta kriittisen lukijan tulee aina pohtia asiaa myös itse. Tässä yhteydessä puhutaan usein seuraavista validiteettityypeistä: Konstruktiovaliditeetti (engl. construct validity) Usein kokeella halutaan selvittää vastaus johonkin hankalasti mitattavaan kysymykseen. Koetta varten kysymystä muokataan niin, että siitä tulee mitattava. Tähän muokkaamiseen liittyy vakava uhka siitä, että koe ei enää mittaa sitä, mitä sen on tarkoitus mitata. Esimerkiksi koe, joka haluaa verrata staattista ja dynaamista tyypitystä, saattaa testata asiaa vertaamalla TypeScriptiä ja JavaScriptiä; kysymys on, katoaako tässä yksinkertaistuksessa jotain oleellista? Sisäinen validiteetti (engl. internal validity) Kokeen sisäisen logiikan pätevyys. Ulkoinen validiteetti (engl. external validity) Kokeen tulosten yleistettävyys muihin kuin itse koetilanteeseen ja muihin ihmisiin kuin koehenkilöihin. 4 Koeraportin arviointi Aivan ensimmäinen kysymys koeraportin arvioinnissa on, onko kyseessä oikeasti koe. Moni tutkimusraportti kuvailee itseään sanalla experiment olematta oikeasti koe. Älä luota pelkästään siihen, että raportissa esiintyy kyseinen sana! Koeraportin arvioinnissa tulee selvittää, mitä kokeessa oikeasti testattiin. Mitkä olivat riippumattomat ja riippuvat muuttujat? Tässä ei kannata luottaa koeraportin omiin luonnehdintoihin, sillä ne ovat usein ylioptimistisia tai muuten epätarkkoja; esimerkiksi, jos kokeessa verrataan TypeScriptiä ja JavaScriptiä, koeraportissa saatetaan silti puhua koko ajan dynaamisen ja staattisen tyypityksen vertaamisesta vaikka näillä kielillä on muitakin eroja kuin pelkästään tyypitys. Tämän jälkeen kokeen arvioinnissa kannattaa noudattaa Paul Glaszioun urheilukilpailuanalogiaa 9 First, was there a fair start? [... ] Second, was the race fair? [... ] Third, was it a fair finish? 9 Sharon E. Straus, Paul Glasziou, W. Scott Richardson, R. Brian Haynes: Evidence- Based Medicine: How to practice and teach it. 4th Edition. Edinburgh: Churchill Livingstone, Lainaus sivulta 63. 7

8 Reilu lähtö: tarkista koeasetelman asianmukaisuus. Onko koe asianmukaisesti kontrolloitu? Tehtiinkö ryhmäjako arpomalla tai muulla tutkijoiden epäasiallista valtaa vähentävällä tavalla? Reilu kilpailu: Onko kokeen läpivienti tehty niin, että kaikilla käsittelyillä on yhtäläinen mahdollisuus pärjätä? Esimerkiksi kahta kieltä vertailevassa kokeessa koehenkilöillä voi olla huomattavasti enemmän aiempaa kokemusta toisesta kielestä tai kieliä ei opeteta tasavertaisesti. Reilu maaliintulo: Analysoitiinko tulokset asianmukaisesti? Tyypillinen ongelma tässä on tilastollisten hypoteesitestien liikakäyttö, joka johtaa siihen, että tilastollisesti merkitseviä tuloksia tulee lähes varmasti riippumatta siitä, onko todellista vaikutusta olemassa. Useiden yksittäisten testien asemesta on aina parempi käyttää kokeen kokonaisuuden kerta-analyysiä monimuuttujamenetelmillä (esim. ANOVA). Hankalaksi tämän arvioinnin tekee se, että moni raportoi vain tilastollisesti merkitsevät testit, eikä lukija siten voi tietää, kuinka paljon tehtiin muita testejä. Jos ongelmia löytyy, pitää arvioida, ovatko ongelmat niin vakavia, että ne vaarantavat tulosten luotettavuuden. 8

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1 Odotusarvoparien vertailu Vilkkumaa / Kuusinen 1 Motivointi Viime luennolta: yksisuuntaisella varianssianalyysilla testataan nollahypoteesia H 0 : μ 1 = μ 2 = = μ k = μ Jos H 0 hylätään, tiedetään, että

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1 T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään tiedetään, että ainakin kaksi

Lisätiedot

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA

Tekijä(t) Vuosi Nro. Arviointikriteeri K E? NA JBI: Arviointikriteerit kvasikokeelliselle tutkimukselle 29.11.2018 Tätä tarkistuslistaa käytetään kvasikokeellisen tutkimuksen metodologisen laadun arviointiin ja tutkimuksen tuloksiin vaikuttavan harhan

Lisätiedot

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto

Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja. Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Pienet ännät tutkimuksessa Tilastollisen analyysin työpaja Jari Westerholm Niilo Mäki instituutti Jyväskylän yliopisto Luennon sisältö Pienten otoskokojen haasteista Pieni otoskoko Suositeltuja metodeja

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1 Odotusarvoparien vertailu Jos yksisuuntaisen varianssianalyysin nollahypoteesi H 0 : µ 1 = µ 2 = = µ k = µ hylätään, tiedetään, että ainakin

Lisätiedot

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:

Lisätiedot

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto Tutkimusaineistomme otantoja Hyödyt Ei tarvitse tutkia kaikkia Oikein tehty otanta mahdollistaa yleistämisen

Lisätiedot

Argumenteista ja niiden arvioinnista TIES542 Ohjelmointikielten periaatteet, kevät 2016

Argumenteista ja niiden arvioinnista TIES542 Ohjelmointikielten periaatteet, kevät 2016 Argumenteista ja niiden arvioinnista TIES542 Ohjelmointikielten periaatteet, kevät 2016 Antti-Juhani Kaijanaho 14. tammikuuta 2016 1 Argumentin käsite Tässä monisteessa argumentti on kielellinen viesti,

Lisätiedot

T Luonnollisten kielten tilastollinen käsittely

T Luonnollisten kielten tilastollinen käsittely T-61.281 Luonnollisten kielten tilastollinen käsittely Vastaukset 3, ti 11.2.2003, 16:15-18:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

Otoskoon arviointi. Tero Vahlberg

Otoskoon arviointi. Tero Vahlberg Otoskoon arviointi Tero Vahlberg Otoskoon arviointi Otoskoon arviointi (sample size calculation) ja tutkimuksen voima-analyysi (power analysis) ovat tilastollisen tutkimuksen suunnittelussa keskeisiä kysymyksiä

Lisätiedot

Kliininen arviointi ja kliininen tieto mikä riittää?

Kliininen arviointi ja kliininen tieto mikä riittää? Kliininen arviointi ja kliininen tieto mikä riittää? Riittävä tutkimuksen otoskoko ja tulos Timo Partonen LT, psykiatrian dosentti, Helsingin yliopisto Ylilääkäri, Terveyden ja hyvinvoinnin laitos Tutkimuksen

Lisätiedot

2. TILASTOLLINEN TESTAAMINEN...

2. TILASTOLLINEN TESTAAMINEN... !" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

Kokeellinen yhteiskuntatiede

Kokeellinen yhteiskuntatiede Kokeellinen yhteiskuntatiede Metodifestivaali 2019 Syistä selityksiin Samuli Reijula samuli.reijula@helsinki.fi Kokeita yhteiskuntatieteessä? EI Yhteiskuntatieteen tutkimuskohde erityinen Vapaa tahto

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003

Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Nimi Opiskelijanumero Tilastotieteen jatkokurssi syksy 2003 Välikoe 2 11.12.2003 Normaalisti jakautuneiden yhdistyksessä on useita tuhansia jäseniä. Yhdistyksen sääntöjen mukaan sääntöihin tehtävää muutosta

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 5.10.2017/1 MTTTP1, luento 5.10.2017 KERTAUSTA Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla todennäköisyydellä,

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 11 (vko 48/003) (Aihe: Tilastollisia testejä, Laininen luvut 4.9, 15.1-15.4, 15.7) Nordlund 1. Kemiallisen prosessin

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1 ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen

Lisätiedot

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2016/1 MTTTP1, luento 6.10.2016 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa

Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Sanajärjestyksen ja intensiteetin vaikutus suomen intonaation havaitsemisessa ja tuotossa Martti Vainio, Juhani Järvikivi & Stefan Werner Helsinki/Turku/Joensuu Fonetiikan päivät 2004, Oulu 27.-28.8.2004

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

Kokeellinen interventiotutkimus

Kokeellinen interventiotutkimus Kokeellinen interventiotutkimus Raija Sipilä LT, toimituspäällikkö Suomalainen Lääkäriseura Duodecim Kriittisen arvioinnin kurssi 2.10.2017 Kiitos Käypä hoito -tiimille Interventio Interventio tarkoittaa

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Mitä eri tutkimusmetodeilla tuotetusta tiedosta voidaan päätellä? Juha Pekkanen, prof Hjelt Instituutti, HY Terveyden ja Hyvinvoinnin laitos

Mitä eri tutkimusmetodeilla tuotetusta tiedosta voidaan päätellä? Juha Pekkanen, prof Hjelt Instituutti, HY Terveyden ja Hyvinvoinnin laitos Mitä eri tutkimusmetodeilla tuotetusta tiedosta voidaan päätellä? Juha Pekkanen, prof Hjelt Instituutti, HY Terveyden ja Hyvinvoinnin laitos Päätöksentekoa tukevien tutkimusten tavoitteita kullakin oma

Lisätiedot

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet

Lisätiedot

Tutkimusasetelmat. - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla

Tutkimusasetelmat. - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla Tutkimusasetelmat - Oikea asetelma oikeaan paikkaan - Vaikeakin tutkimusongelma voi olla ratkaistavissa oikealla tutkimusasetelmalla Jotta kokonaisuus ei unohdu Tulisi osata Tutkimusasetelmat Otoskoko,

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu ja tilastolliset mallit Johdanto TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu: Johdanto Johdattelevia esimerkkejä Tilastolliset kokeet TKK (c) Ilkka Mellin (2005) 2 Koesuunnittelu: Johdanto

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

Kandidaatintutkielman aineistonkeruu ja analyysi

Kandidaatintutkielman aineistonkeruu ja analyysi Kandidaatintutkielman aineistonkeruu ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 Kirjallisuutta mm. Vehkalahti,

Lisätiedot

Aineistokoko ja voima-analyysi

Aineistokoko ja voima-analyysi TUTKIMUSOPAS Aineistokoko ja voima-analyysi Johdanto Aineisto- eli otoskoon arviointi ja tutkimuksen voima-analyysi ovat tilastollisen tutkimuksen suunnittelussa keskeisimpiä asioita. Otoskoon arvioinnilla

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2005) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.14 Tilastollisen analyysin perusteet, kevät 7 7. luento: Tarina yhden selittään lineaarisesta regressiomallista atkuu Kai Virtanen 1 Luennolla 6 opittua Kuvataan havainnot (y, x ) yhden selittään

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012 Puheentutkimuksen tilastoanalyysin perusteet 8. luento Pertti Palo 20.1.2012 Käytännön asioita Viimeisen seminaarin siirto: 2.3. 10-12 -> 2.3. 14-16. Miten seminaarin luentokuulustelun voi korvata? Harjoitustöiden

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %? [TILTP1] TILASTOTIETEEN JOHDANTOKURSSI, Syksy 2011 http://www.uta.fi/~strale/tiltp1/index.html 30.9.2011 klo 13:07:54 HARJOITUS 5 viikko 41 Ryhmät ke 08.30 10.00 ls. C8 Leppälä to 12.15 13.45 ls. A2a Laine

Lisätiedot

10. laskuharjoituskierros, vko 14, ratkaisut

10. laskuharjoituskierros, vko 14, ratkaisut 10. laskuharjoituskierros, vko 14, ratkaisut D1. Eräässä kokeessa verrattiin kahta sademäärän mittaukseen käytettävää laitetta. Kummallakin laitteella mitattiin sademäärät 10 sadepäivän aikana. Mittaustulokset

Lisätiedot

Aki Taanila VARIANSSIANALYYSI

Aki Taanila VARIANSSIANALYYSI Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen

Lisätiedot

Mitä IHMEttä on MIXTURE -mallintaminen?

Mitä IHMEttä on MIXTURE -mallintaminen? JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Esko Leskinen 28.5.2009 Mitä IHMEttä on MIXTURE -mallintaminen? A-L Lyyra 2009 2 1. Taustaa mixture sekoitus (mikstuura) sekoitetut jakaumat sekoitetut

Lisätiedot

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. 6.10.2015/1 MTTTP1, luento 6.10.2015 KERTAUSTA JA TÄYDENNYSTÄ Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria. Muodostetaan väli, joka peittää parametrin etukäteen valitulla

Lisätiedot

Prolog kielenä Periaatteet Yhteenveto. Prolog. Toni ja Laura Fadjukoff. 9. joulukuuta 2010

Prolog kielenä Periaatteet Yhteenveto. Prolog. Toni ja Laura Fadjukoff. 9. joulukuuta 2010 kielenä 9. joulukuuta 2010 Historia kielenä Historia Sovelluksia kehitettiin vuonna 1972 Kehittäjinä ranskalaiset Pääkehittäjä Alain Colmerauer Philippe Roussel programmation en logique Robert Kowalski

Lisätiedot

MTTTP5, luento Luottamusväli, määritelmä

MTTTP5, luento Luottamusväli, määritelmä 23.11.2017/1 MTTTP5, luento 23.11.2017 Luottamusväli, määritelmä Olkoot A ja B satunnaisotoksen perusteella määriteltyjä satunnaismuuttujia. Väli (A, B) on parametrin 100(1 - ) %:n luottamusväli, jos P(A

Lisätiedot

SELVITTÄJÄN KOMPETENSSISTA

SELVITTÄJÄN KOMPETENSSISTA OTM, KTM, Mikko Hakola, Vaasan yliopisto, Laskentatoimen ja rahoituksen laitos Helsinki 20.11.200, Helsingin kauppakorkeakoulu Projekti: Yrityksen maksukyky ja strateginen johtaminen SELVITTÄJÄN KOMPETENSSISTA

Lisätiedot

PÄIVI PORTAANKORVA-KOIVISTO

PÄIVI PORTAANKORVA-KOIVISTO 7.4.2013 PÄIVI PORTAANKORVA-KOIVISTO HARRY SILFVERBERG: Matematiikka kouluaineena yläkoulun oppilaiden tekemien oppiainevertailujen paljastamia matematiikkakäsityksiä Juho Oikarinen 7.4.2013 PÄIVI PORTAANKORVA-KOIVISTO

Lisätiedot

Move! laadun varmistus arvioinnissa. Marjo Rinne, TtT, erikoistutkija UKK instituutti, Tampere

Move! laadun varmistus arvioinnissa. Marjo Rinne, TtT, erikoistutkija UKK instituutti, Tampere Move! laadun varmistus arvioinnissa Marjo Rinne, TtT, erikoistutkija UKK instituutti, Tampere Fyysisen toimintakyvyn mittaaminen Tarkoituksena tuottaa luotettavaa tietoa mm. fyysisestä suorituskyvystä

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

TIEA255 Tietotekniikan teemaseminaari ohjelmointikielet ja kehitysalustat. Antti-Juhani Kaijanaho. 16. helmikuuta 2011

TIEA255 Tietotekniikan teemaseminaari ohjelmointikielet ja kehitysalustat. Antti-Juhani Kaijanaho. 16. helmikuuta 2011 TIEA255 Tietotekniikan teemaseminaari ohjelmointikielet ja kehitysalustat Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 16. helmikuuta 2011 Sisällys Sisällys Ohjelmointikieli? programming language n. a

Lisätiedot

Tietotekniikan valintakoe

Tietotekniikan valintakoe Jyväskylän yliopisto Tietotekniikan laitos Tietotekniikan valintakoe 2..22 Vastaa kahteen seuraavista kolmesta tehtävästä. Kukin tehtävä arvostellaan kokonaislukuasteikolla - 25. Jos vastaat useampaan

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari

Konsensusongelma hajautetuissa järjestelmissä. Niko Välimäki Hajautetut algoritmit -seminaari Konsensusongelma hajautetuissa järjestelmissä Niko Välimäki 30.11.2007 Hajautetut algoritmit -seminaari Konsensusongelma Päätöksen muodostaminen hajautetussa järjestelmässä Prosessien välinen viestintä

Lisätiedot

Johnson, A Theoretician's Guide to the Experimental Analysis of Algorithms.

Johnson, A Theoretician's Guide to the Experimental Analysis of Algorithms. Kokeellinen algoritmiikka (3 ov) syventäviä opintoja edeltävät opinnot: ainakin Tietorakenteet hyödyllisiä opintoja: ASA, Algoritmiohjelmointi suoritus harjoitustyöllä (ei tenttiä) Kirjallisuutta: Johnson,

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

1. Tutkitaan tavallista kahden selittäjän regressiomallia

1. Tutkitaan tavallista kahden selittäjän regressiomallia TA7, Ekonometrian johdantokurssi HARJOITUS 5 RATKAISUEHDOTUKSET 232215 1 Tutkitaan tavallista kahden selittäjän regressiomallia Y i = β + β 1 X 1,i + β 2 X 2,i + u i (a) Kirjoita regressiomalli muodossa

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Tietojenkäsittelyteorian alkeet, osa 2

Tietojenkäsittelyteorian alkeet, osa 2 TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 12. syyskuuta 2016 Sisällys vs Ovat eri asioita! Älä sekoita niitä. Funktiot Funktio f luokasta A luokkaan B, merkitään

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5 MS-A Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko Tilastollinen testaus Tilastollisten testaaminen Tilastollisen tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai

Lisätiedot

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo? MTTTP5, kevät 2016 15.2.2016/RL Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen 1. Valitaan 25 alkion satunnaisotos jakaumasta N(µ, 25). Olkoon H 0 : µ = 12. Hylätään H 0, jos otoskeskiarvo

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Algoritmit. Ohjelman tekemisen hahmottamisessa käytetään

Algoritmit. Ohjelman tekemisen hahmottamisessa käytetään Ohjelmointi Ohjelmoinnissa koneelle annetaan tarkkoja käskyjä siitä, mitä koneen tulisi tehdä. Ohjelmointikieliä on olemassa useita satoja. Ohjelmoinnissa on oleellista asioiden hyvä suunnittelu etukäteen.

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 15. marraskuuta 2007 Antti Rasila () TodB 15. marraskuuta 2007 1 / 19 1 Tilastollisia testejä (jatkoa) Yhden otoksen χ 2 -testi varianssille Kahden riippumattoman

Lisätiedot

Opetusmateriaali. Tutkimustehtävien tekeminen

Opetusmateriaali. Tutkimustehtävien tekeminen Opetusmateriaali Tämän opetusmateriaalin tarkoituksena on opettaa kiihtyvyyttä mallintamisen avulla. Toisena tarkoituksena on hyödyntää pikkuautoa ja lego-ukkoa fysiikkaan liittyvän ahdistuksen vähentämiseksi.

Lisätiedot

KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto

KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT. Vesa Kiviniemi (FL) Itä-Suomen yliopisto KLIINISTEN TUTKIMUSTEN SUUNNITTELU JA KOEASETELMAT Vesa Kiviniemi (FL) Itä-Suomen yliopisto 13.4.2010 SISÄLTÖ 1 Kokeellisen tutkimuksen tutkimustyypit 2 Kohdepopulaatio ja potilaiden valinta 3 Vertailuryhmän

Lisätiedot

Perimmäinen kysymys. Työllistämisen tukitoimien vaikuttavuuden arvioinnista. Mitkä ovat tukitoimen X vaikutukset Y:hyn? Kari Hämäläinen (VATT)

Perimmäinen kysymys. Työllistämisen tukitoimien vaikuttavuuden arvioinnista. Mitkä ovat tukitoimen X vaikutukset Y:hyn? Kari Hämäläinen (VATT) Työllistämisen tukitoimien vaikuttavuuden arvioinnista Kari Hämäläinen (VATT) VATES päivät, 5.5.2015 Perimmäinen kysymys Mitkä ovat tukitoimen X vaikutukset Y:hyn? 1 Kolme ehtoa kausaaliselle syy seuraussuhteelle

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Interventiotutkimuksen arviointi

Interventiotutkimuksen arviointi Interventiotutkimuksen arviointi Raija Sipilä LT, toimituspäällikkö Kriittisen arvioinnin kurssi, VKTK 28.9.2015 Kiitos Käypä hoito -tiimille Sidonnaisuudet Päätyö: Duodecim, Käypä hoito Työnanatajan edustajana

Lisätiedot

Tilastollisen tutkimuksen vaiheet

Tilastollisen tutkimuksen vaiheet Tilastollisen tutkimuksen vaiheet Jari Päkkilä Johdatus tilastotieteeseen Matemaattisten tieteiden laitos TILASTOLLISEN TUTKIMUKSEN TARKOITUS Muodostaa mahdollisimman hyvä mielikuva havaintoaineistosta,

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

12. Javan toistorakenteet 12.1

12. Javan toistorakenteet 12.1 12. Javan toistorakenteet 12.1 Sisällys Yleistä toistorakenteista. Laskurimuuttujat. While-, do-while- ja for-lauseet. Laskuri- ja lippumuuttujat. Tyypillisiä ohjelmointivirheitä. Silmukan rajat asetettu

Lisätiedot