Johdatus tilastotieteeseen Jari Päkkilä Kevätlukukausi 2017 Matemaattisten tieteiden laitos
Esimerkki mittauksen luotettavuudesta Viime viikon mittausharjoituksessa pelattiin mm. kunnat kartalle -peliä ja mittauslomakkeelle pyydettiin merkitsemään pelistä saatujen virhekilometrien määrä. Pelin virhekilometrien jakauma oli seuraava Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 2 / 17
Kunnat kartalle -pelin lopputulos KOKO AINEISTO (n=103) 0 1000 2000 3000 4000 virhekilometrit Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 3 / 17
Onko realistista odottaa, että tiistain ja torstain ryhmien tulokset poikkeavat toisistaan? to Päivä ti 0 1000 2000 3000 4000 virhekilometrit Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 4 / 17
Onko realistista odottaa, että tiistain ja torstain ryhmien tulokset poikkeavat toisistaan? to keskiarvo=1866 km Päivä ti keskiarvo=1732 km 0 1000 2000 3000 4000 virhekilometrit Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 5 / 17
Esimerkki mittauksen luotettavuudesta Viime viikon mittausharjoituksessa pyydettiin myös arvioimaan Moskovan ja New Yorkin välistä etäisyyttä kilometreissä. Etäisyysarvioiden jakauma oli seuraava Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 6 / 17
Etäisyysarvioiden jakauma KOKO AINEISTO 0 20000 40000 60000 80000 100000 Moskovan ja New Yorkin välinen etäisyys (km) Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 7 / 17
Onko nyt realistista odottaa, että tiistain ja torstain ryhmien tulokset poikkeavat toisistaan? KOKO AINEISTO to keskiarvo=12336 km Päivä ti keskiarvo=9240 km 0 20000 40000 60000 80000 100000 Moskovan ja New Yorkin välinen etäisyys (km) Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 8 / 17
Onko nyt realistista odottaa, että tiistain ja torstain ryhmien tulokset poikkeavat toisistaan? KOKO AINEISTO to keskiarvo=12336 km mediaani=10000 km Päivä ti keskiarvo=9240 km mediaani=8867 km 0 20000 40000 60000 80000 100000 Moskovan ja New Yorkin välinen etäisyys (km) Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 9 / 17
Vuonna 2015 vastaava etäisyydenarviointitehtävä tehtiin myös ja tuollakin kurssilla harjoitukset pidettiin kahtena eri päivänä. Mittaustulosten jakaumat olivat tuolloin Etäisyysarvioiden jakauma harjoitusryhmittäin KE TI 0 10000 20000 30000 40000 50000 60000 kilometriä Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 10 / 17
Miksi ryhmien välillä on selvä ero? Yksi luotettavien vastausten saamisen ehdottomista ehdoista on se, että sama kysymys kysytään kaikilta samalla neutraalilla tavalla......ja niinhän tässä tehtiin! Sekä tiistain että keskiviikon ryhmissä tarjolla oli täsmälleen sama kysymys samassa muodossa. Arviosi Moskovan ja New Yorkin välisestä etäisyydestä: kilometriä Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 11 / 17
Mutta... Juuri ennen etäisyyden arviointikysymystä tiistain ryhmäläisiltä kysyttiin Onko Moskovan ja New Yorkin välinen etäisyys yli vai alle 50 000 kilometriä?...ja keskiviikon ryhmäläisiltä kysyttiin Onko Moskovan ja New Yorkin välinen etäisyys yli vai alle 2 000 kilometriä? Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 12 / 17
Mittauksen luotettavuus Tämän kurssin viime viikon harjoituksissa tehtävänä oli arvioida astiassa olleiden hamahelmien lukumäärää. Onko nyt ryhmien välillä eroa? Juuri ennen arviointikysymystä tiistain ryhmäläisiltä kysyttiin Onko hamahelmien lukumäärä mielestäsi ylivai alle 200?...ja torstain ryhmäläisiltä kysyttiin Onko hamahelmien lukumäärä mielestäsi ylivai alle 20 000? Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 13 / 17
Mittauksen luotettavuus? to keskiarvo = 11 580 kpl Päivä ti keskiarvo = 870 kpl 0 10000 20000 30000 40000 50000 Hamahelmien lkm Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 14 / 17
100 irtokarkkia tavoitteena arvioida 100 irtokarkin kokonaispaino (g) apuna arvioinnissa neljän irtokarkin punnitustulos punnitut irtokarkit valittiin arpomalla päättely perustuu otantatutkimukseen Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 15 / 17
Malli havainnoille otostunnusluvun arvo = parametrin arvo + harha + satunnaisvirhe Millaisia havaintoja (arvioita) karkkipussin kokonaispainosta saatiin? Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 16 / 17
Havainnot ja parametrin todellinen arvo oikea paino = 447 g keskiarvo = 665 g mediaani = 595 g Arviointikisan voittajat: Meri Korva ja Otso Valkeeniemi (virhe 3 g) 0 500 1000 1500 2000 2500 Karkkien yhteispaino (g) Jari Päkkilä Johdatus tilastotieteeseen 24. tammikuuta 2017 17 / 17