Johdatus tilastotieteeseen Tilastotiede tieteenalana. TKK (c) Ilkka Mellin (2005) 1



Samankaltaiset tiedostot
Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Salkin poliorokotekoe Ryhmän koko Sairastuvuus (per ) Hoitoryhmä Vertailuryhmä Ei saanut rokottaa

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

TILASTOLLINEN LAADUNVALVONTA

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

MONISTE 2 Kirjoittanut Elina Katainen

Johdatus todennäköisyyslaskentaan Todennäköisyys ja sen määritteleminen. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastollisen tutkimuksen vaiheet

Ilkka Mellin Todennäköisyyslaskenta

Osa 2: Otokset, otosjakaumat ja estimointi

Kvantitatiiviset menetelmät

Numeeriset menetelmät

Tilastotieteen rooli uuden tieteellisen tiedon tuottamisessa Mitä tilastotiede on?

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

Kvantitatiivisen aineiston analyysi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

B. Siten A B, jos ja vain jos x A x

Koesuunnittelu Latinalaiset neliöt. TKK (c) Ilkka Mellin (2005) 1

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Matemaatikot ja tilastotieteilijät

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk

Yhteistyöaineiden edustajan puheenvuoro

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI. LTKY012 Timo Törmäkangas Gerontologian tutkimuskeskus

Testit laatueroasteikollisille muuttujille

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

tilastotieteen kertaus

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

T&K- HANKKEISIIN ja OPINNÄYTETÖIHIN SOVELTUVIA ANALYYSIMENETELMIÄ

Otannasta ja mittaamisesta

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

II- luento. Etiikan määritelmiä. Eettisen ajattelu ja käytänteet. 1 Etiikka on oikean ja väärän tutkimusta

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

OULUN SEUDUN AMMATTIKORKEAKOULU TEKNIIKAN YKSIKKÖ TIETOTEKNIIKAN OSASTO OHJELMISTOKEHITYKSEN SUUNTAUTUMISVAIHTOEHTO

OPETUSSUUNNITELMALOMAKE

Testit järjestysasteikollisille muuttujille

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

LUKUJÄRJESTYSPOHJA Tekniikan ja luonnontieteiden TkK-tutkinto-ohjelma, Ympäristö- ja energiatekniikan opintosuunta

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Teknillisen fysiikan ja matematiikan tutkintoohjelma, tekniikan kandidaatin tutkinnon pääaineet

Osa 2: Otokset, otosjakaumat ja estimointi

OPETUSSUUNNITELMALOMAKE

Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1

Lukuvuosi oppikirjat Huomioi, että muutokset ovat vielä mahdollisia. Lisätietoja kurssien opettajilta.

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Harjoitus 7: NCSS - Tilastollinen analyysi

Testejä suhdeasteikollisille muuttujille

Lukuvuosi oppikirjat LOPS 2016 Huomioi, että muutokset ovat vielä mahdollisia. Lisätietoja kurssien opettajilta.

Perusopetuksen aamu- ja iltapäivätoiminnan laadun arviointi 2016 Västankvarns skola/ Tukiyhdistys Almus ry.

Matkalla naapuruuteen -seminaari Eduskunnan terveiset. Kansanedustaja, TtT Merja Mäkisalo-Ropponen

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

UEF TOHTORIOHJELMAT laadukas, läpinäkyvä ja ennakoitava tohtorikoulutus OHJE JATKO-OPISKELIJOIDEN SIIRTYMISESTÄ UEF:N TOHTORIOHJELMIIN

Fysiikan laitos.

Päätöksentekomenetelmät

Teema 8: Parametrien estimointi ja luottamusvälit

(1) Pekan pakasta vetämät neljä korttia ovat hertta 5, hertta 6, hertta 7 ja pata 7. Mikä on todennäköisyys, että seuraava kortti

Laadullisen tutkimuksen luonne ja tehtävät. Pertti Alasuutari professori, Laitoksen johtaja Yhteiskuntatieteiden tutkimuslaitos

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Prosessit etyön kehittämisessä

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Osa 1: Todennäköisyys ja sen laskusäännöt. Klassinen todennäköisyys ja kombinatoriikka

Lukuvuosi oppikirjat Huomioi, että muutokset ovat vielä mahdollisia. Lisätietoja kurssien opettajilta.

Kuntosaliharjoittelun kesto tunteina Kokonaishyöty Rajahyöty

Case Hoviagents. Oppimisprojekti /TKI3 Kevät

Opetussuunnitelman perusteet esi- ja perusopetuksessa Osa ohjausjärjestelmää, jonka tarkoitus on varmistaa opetuksen tasa-arvo ja laatu sekä luoda

Mitä on laadullinen tutkimus? Pertti Alasuutari Tampereen yliopisto

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Tilastollinen aineisto Luottamusväli

Tieteen tila katsauksen tohtoreiden sijoittumista koskevien tarkastelujen tieteenalaryhmittelyt

ARVIOINTIPERIAATTEET

P A R T. Professional Assault Response Training Seppo Salminen Auroran koulu. Valtakunnalliset sairaalaopetuksen koulutuspäivät

Kyselytutkimusten. Erkki Pahkinen Kyselytutkimusten otantamenetelmät ja aineistoanalyysi. Erkki Pahkinen OTANTAMENETELMÄT JA AINEISTOANALYYSI

Johdatus diskreettiin matematiikkaan Harjoitus 7,

Ilkka Mellin Aikasarja-analyysi Aikasarjat

KOKEMUKSIA TOIMINTAKYKYÄ. Itsenäiseen elämään sopivin palveluin -hanke Merja Marjamäki

Mitä käytännön lääkärin tarvitsee tietää biostatistiikasta?

Ilomantsin lukion oppikirjaluettelo lukuvuosi , LOPS2016

AMMATTITAITOA TÄYDENTÄVÄT TUTKINNON OSAT

Opetussuunnitelma uudistui mikä muuttui? Tietoja Linnainmaan koulun huoltajille syksy 2016

TFM-tutkinto-ohjelma, tekniikan kandidaatin tutkinnon pääaineet lv Teknillinen fysiikka Matematiikka Mekaniikka Systeemitieteet

Ilomantsin lukion oppikirjaluettelo lukuvuosi Kurssit Oppikirja ISBN numero Kustantaja Äidinkieli ja kirjallisuus Englanti Ruotsi

Hakukohde Pisteraja Valintakokeen pisterajat hyväksyttävissä olemiseen

Ilomantsin lukion oppikirjaluettelo lukuvuosi , LOPS2016

Transkriptio:

Johdatus tilastotieteeseen Tilastotiede tieteenalana TKK (c) Ilkka Mellin (2005) 1

Tilastotiede tieteenalana Mitä tilastotiede on? Tilastotieteen sovellukset TKK (c) Ilkka Mellin (2005) 2

Tilastotiede tieteenalana: Mitä opimme? Pyrimme tässä luvussa vastaamaan seuraaviin kysymyksiin: Mitä tilastotiede on ja mitä se ei ole? Mihin tilastotiedettä käytetään? Saamme tietää, että tilastotiede on yleinen menetelmätiede, jota voidaan soveltaa aina, kun reaalimaailman ilmiöistä halutaan tehdä johtopäätöksiä ilmiöitä kuvaavien kvantitatiivisten tietojen perusteella sellaisissa tilanteissa, joissa tietoihin liittyy epävarmuutta. Näemme myös, että tilastotiede pyrkii muodostamaan matemaattisia, todennäköisyyslaskentaan perustuvia malleja niille prosesseille, jotka generoivat tiedot. TKK (c) Ilkka Mellin (2005) 3

Tilastotiede tieteenalana >> Mitä tilastotiede on? Tilastotieteen sovellukset TKK (c) Ilkka Mellin (2005) 4

Mitä tilastotiede on? Avainsanat Arvonta Epävarmuus Johtopäätösten tekeminen Kuvaileva tilastotiede Kvantitatiivinen tieto Matemaattinen malli Matematiikka Menetelmätiede Numeerinen tieto Reaalimaailman ilmiö Satunnaisilmiö Satunnaisuus Soveltava tilastotiede Teoreettinen tilastotiede Tieto Tilasto Tilastotiede Tilastollinen päättely Tilastollinen stabiliteetti Tilastollinen tutkimusasetelma Tilastollinen malli Tilastollinen menetelmä Todennäköisyyslaskenta Tulosvaihtoehto Tunnusluku TKK (c) Ilkka Mellin (2005) 5

Mitä tilastotiede on? Tilastotiede ei ole oppi tilastoista! Tilastotiede ei ole nimestään huolimatta oppi tilastoista tai tilastojen tuotannosta! Mikä sen sijaan on totta, on se, että tilastojen tuotannon, jalostuksen ja analysoinnin menetelmien kehittäminen muodostaa keskeisen osan tilastotiedettä. TKK (c) Ilkka Mellin (2005) 6

Mitä tilastotiede on? Tilastotiede ei ole matematiikkaa! Tilastotiede ei ole matematiikan osa-alue! Mikä sen sijaan on totta, on se, että tilastotieteen menetelmät ja mallit ovat matemaattisia ja perustuvat todennäköisyyslaskentaan: Matematiikalla on tilastotieteessä välineellinen rooli. Tilastotiede käyttää matematiikan kieltä. TKK (c) Ilkka Mellin (2005) 7

Mitä tilastotiede on? Tilastotiede on yleinen menetelmätiede Tilastotiede on yleinen menetelmätiede. Tilastotiede kehittää ja soveltaa menetelmiä ja malleja, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä ilmiöitä kuvaavien numeeristen tai kvantitatiivisten tietojen perusteella tilanteissa, joissa tietoihin liittyy epävarmuutta ja satunnaisuutta. TKK (c) Ilkka Mellin (2005) 8

Mitä tilastotiede on? Tilastolliset menetelmät ja mallit Tilastollisten menetelmien avulla reaalimaailman ilmiöitä kuvaavat numeeriset tai kvantitatiiviset tiedot jalostetaan sellaiseen muotoon, että ilmiöitä koskevat johtopäätökset tulevat mahdollisiksi. Tietojen jalostaminen merkitsee tietojen tiivistämistä graafisiksi esityksiksi ja tunnusluvuiksi sekä tilastollisten mallien rakentamista tiedot generoineille prosesseille tai mekanismeille. TKK (c) Ilkka Mellin (2005) 9

Mitä tilastotiede on? Tilastolliset tutkimusasetelmat Tilastollisissa tutkimusasetelmissa reaalimaailman ilmiöitä kuvaaviin numeerisiin tai kvantitatiivisiin tietoihin liittyy aina epävarmuutta ja satunnaisuutta. Reaalimaailman ilmiötä kuvaavien tietojen tilastollinen analyysi perustuu siihen, että tietoihin liittyvän epävarmuuden ja satunnaisuuden ajatellaan johtuvan tiedot generoineesta prosessista tai mekanismista. Epävarmuuden ja satunnaisuuden generoijana voi olla ilmiö itse tai ne voivat olla seurausta menetelmästä, jolla tutkimuksen kohteet valitaan. TKK (c) Ilkka Mellin (2005) 10

Mitä tilastotiede on? Satunnaisilmiöt Reaalimaailman ilmiö on satunnaisilmiö, jos seuraavat ehdot pätevät: (i) Ilmiöllä on useita erilaisia tulosvaihtoehtoja. (ii) Sattuma määrää mikä tulosvaihtoehdoista toteutuu. (iii) Vaikka ilmiön tulos vaihtelee ilmiön toistuessa satunnaisesti, ilmiön tulosvaihtoehtojen suhteellisten osuuksien jakauma käyttäytyy tilastollisesti stabiilisti, kun ilmiön toistokertojen lukumäärä kasvaa. Todennäköisyyslaskennan tehtävänä on tuottaa matemaattisia malleja satunnaisilmiöissä havaittavalle tilastolliselle stabiliteetille. TKK (c) Ilkka Mellin (2005) 11

Mitä tilastotiede on? Satunnaisilmiöt: Kommentteja Satunnaisilmiöihin liittyy aina ennustamattomuutta: Satunnaisilmiön yksittäistä tulosta ei voida tietää etukäteen. Satunnaisilmiöihin on kuitenkin liityttävä säännönmukaisuutta, jonka on tultava esille ilmiön toistuessa: Vaikka satunnaisilmiön tulos vaihtelee satunnaisesti ilmiön toistokerrasta toiseen, ilmiön tulosvaihtoehtojen suhteellisten osuuksien jakauman on käyttäydyttävä stabiilisti, kun toistokertojen lukumäärä kasvaa. TKK (c) Ilkka Mellin (2005) 12

Mitä tilastotiede on? Satunnaisilmiöt: Esimerkkejä Esimerkkejä satunnaisilmiöistä: Kvanttimekaniikan ilmiöt Hiukkasfysiikan ilmiöt Luonnontieteellisiin mittauksiin liittyvien mittausvirheiden syntymekanismit Uhkapelit: arpajaiset, lotto, ruletti, kortti- ja noppapelit Perinnöllisyys Eliöiden ja eliöpopulaatioiden käyttäytyminen Ihmisten, ihmisryhmien ja ihmisten muodostamien organisaatioiden sosiaalinen ja taloudellinen käyttäytyminen Teknisten prosessien tuloksien ominaisuudet TKK (c) Ilkka Mellin (2005) 13

Mitä tilastotiede on? Tietojen kerääminen satunnaisilmiönä 1/2 Voimme ajatella, että tilastollisissa tutkimusasetelmissa tutkimuksen kohteet valitaan arpomalla. Arvonta on satunnaisilmiö: (i) Arvontaan liittyy aina ennustamattomuutta, koska yksittäisen arvonnan tulosta ei voida tietää etukäteen. (ii) Arvonta noudattaa kuitenkin todennäköisyyden lakeja. TKK (c) Ilkka Mellin (2005) 14

Mitä tilastotiede on? Tietojen kerääminen satunnaisilmiönä 2/2 Koska arvonnan tulos vaihtelee satunnaisesti arvontakerrasta toiseen, myös tutkimuksen kohteita kuvaavat tiedot vaihtelevat satunnaisesti arvontakerrasta toiseen. Tutkimuksen kohteita kuvaavien tietojen käyttäytymisessä havaitaan kuitenkin arvontaa toistettaessa sitä säännönmukaisuutta, jota kutsutaan tilastolliseksi stabiliteetiksi. Juuri tämä säännönmukaisuus on tilastollisen tutkimuksen kohde. TKK (c) Ilkka Mellin (2005) 15

Mitä tilastotiede on? Tietojen kerääminen satunnaisilmiönä: Esimerkkejä Esimerkkejä tietojen keräämisen menetelmistä, jotka perustuvat arvontaan: Satunnaistetut kokeet Satunnaisotanta Huomautus: Koesuunnittelu ja otantateoria ovat keskeisiä tilastotieteen menetelmiä. TKK (c) Ilkka Mellin (2005) 16

Mitä tilastotiede on? Teoreettinen ja soveltava tilastotiede 1/2 Teoreettinen tilastotiede kehittää matemaattisia malleja prosesseille, jotka generoivat reaalimaailman ilmiöitä kuvaavia numeerisia tai kvantitatiivisia tietoja, joihin liittyy epävarmuutta ja satunnaisuutta. Teoreettisen tilastotieteen kehittämät mallit perustuvat todennäköisyyslaskentaan ja niitä kutsutaan tilastollisiksi malleiksi, stokastisiksi malleiksi tai todennäköisyysmalleiksi. Tilastollisten mallien avulla reaalimaailman ilmiöitä kuvaaviin tietoihin liittyvät systemaattiset ja satunnaiset piirteet voidaan erottaa ja kuvata. TKK (c) Ilkka Mellin (2005) 17

Mitä tilastotiede on? Teoreettinen ja soveltava tilastotiede 2/2 Soveltava tilastotiede soveltaa teoreettisen tilastotieteen kehittämiä matemaattisia malleja reaalimaailman ilmiöitä kuvaavien numeeristen tai kvantitatiivisten tietojen analysointiin. Teoreettinen ja soveltava tilastotiede kulkevat tilastollisessa tutkimuksessa käsi kädessä: Teoreettinen tilastotiede kehittää tilastomatemaattisia malleja soveltavan tilastotieteen empiiristen ongelmien ratkaisemiseksi. Soveltava tilastotiede käyttää hyväkseen teoreettisen tilastotieteen kehittämiä malleja. TKK (c) Ilkka Mellin (2005) 18

Mitä tilastotiede on? Kuvaileva tilastotiede ja tilastollinen päättely 1/2 Deskriptiivinen eli kuvaileva tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla tutkimuksen kohteena olevasta ilmiöstä kerättyjä numeerisia tai kvantitatiivisia tietoja voidaan kuvailla ja esitellä. Kuvailevan tilastotieteen työkaluja: Tilastografiikka Tilastolliset tunnusluvut Tilastolliset mallit TKK (c) Ilkka Mellin (2005) 19

Mitä tilastotiede on? Kuvaileva tilastotiede ja tilastollinen päättely 2/2 Tilastollinen inferenssi eli päättely kehittää ja soveltaa menetelmiä, joiden avulla tutkimuksen kohteena olevasta ilmiöstä voidaan tehdä johtopäätöksiä ilmiöstä kerättyjen numeeristen tai kvantitatiivisten tietojen perusteella. Tilastollisen päättelyn työkaluja: Tilastolliset mallit Tilastollinen testaus Kuvaileva tilastotiede ja tilastollinen päättely kulkevat tilastollisessa tutkimuksessa käsi kädessä. TKK (c) Ilkka Mellin (2005) 20

Tilastotiede tieteenalana Mitä tilastotiede on? >> Tilastotieteen sovellukset TKK (c) Ilkka Mellin (2005) 21

Avainsanat Empiirinen tutkimus Havaintoaineisto Laadunvalvonta Lääketieteellinen koe Koe Kyselytutkimus Menetelmätiede Otanta Päätöksenteko Tilasto Tilastoala Tilastollinen aineisto Tilastollinen tutkimus Tilastollinen tutkimusasetelma Tilastotiede Tilastotieteen osa-alueet Tilastotieteen reuna-alueet Tilastotoimi Tutkimus Tutkimusaineisto Yhteiskunta TKK (c) Ilkka Mellin (2005) 22

Missä tilastotiedettä voidaan soveltaa? Tilastotiedettä voidaan yleisenä menetelmätieteenä soveltaa ja myös pitäisi soveltaa kaikkialla, missä tuotetaan reaalimaailmaa ja sen ilmiöitä kuvaavaa numeerista tai kvantitatiivista tietoa. Tilastollisia menetelmiä voidaan soveltaa tietojen keruun, jalostuksen ja analysoinnin jokaisessa vaiheessa. Tilastollisia menetelmiä sovellettaessa päämääränä on jalostaa tiedot muotoon, joka mahdollistaa reaalimaailmaa ja sen ilmiöitä koskevien johtopäätösten tekemisen. TKK (c) Ilkka Mellin (2005) 23

Tilastotiede ja tieteellinen tutkimus Tilastotiedettä voidaan yleisenä menetelmätieteenä soveltaa kaikissa tieteissä, joiden tutkimusaineistot voidaan esittää numeerisessa tai kvantitatiivisessa muodossa. Jokainen tiede, jonka tutkimusaineistot voidaan esittää numeerisessa tai kvantitatiivisessa muodossa voi soveltaa / voisi soveltaa / pitäisi soveltaa tilastollisia menetelmiä sekä tutkimusaineistoja kerättäessä että niitä analysoitaessa. Jokainen empiirisen tutkimuksen havaintoaineisto on tilastollisen tutkimuksen mahdollinen kohde. TKK (c) Ilkka Mellin (2005) 24

Tilastotieteen käyttöalueita Biotieteet biokemia biologia ekologia eläinlääketiede eläintiede kasvitiede lääketiede perinnöllisyystiede Ihmistieteet arkeologia kielitiede psykologia Luonnontieteet fysiikka kemia tähtitiede Maatalous- ja metsätieteet kasvinviljelytiede kotieläinten jalostustiede metsänarviointitiede metsänviljelytiede Yhteiskuntatieteet sosiaalitieteet taloustiede TKK (c) Ilkka Mellin (2005) 25

Tilastotieteellä on monta nimeä Biometria tai Biostatistiikka = Bio- ja lääketieteiden tilastotiede Demometria = Väestötiede Ekonometria = Taloustieteen tilastotiede Epidemiologia = Tautien leviämismekanismeja koskeva lääketieteen osa-alue Kemometria = Kemian tilastotiede TKK (c) Ilkka Mellin (2005) 26

Tilastotieteen osa-alueita Aikasarja-analyysi Bayeslaiset menetelmät Biometria Demometria Ei-parametriset menetelmät Ekonometria Estimointiteoria Kemometria Koesuunnittelu Laadunvalvonta Lineaaristen mallien teoria Matemaattinen tilastotiede Monimuuttujamenetelmät Otantateoria Regressioanalyysi Robustit menetelmät Spatiaaliset menetelmät Testiteoria Tilastollinen päättely Tilastollinen tietojenkäsittely Varianssianalyysi TKK (c) Ilkka Mellin (2005) 27

Tilastotieteen reuna-alueita Finanssimatematiikka Hahmontunnistus Hermoverkot Kaaosteoria Katastrofiteoria Kuvankäsittely Kybernetiikka Operaatioanalyysi Peliteoria Päätösteoria Riskiteoria Signaalinkäsittely Stokastiset prosessit Todennäköisyyslaskenta Tulevaisuudentutkimus Vakuutusmatematiikka TKK (c) Ilkka Mellin (2005) 28

Tilastotieteen sovelluksia teknisissä tieteissä Hahmontunnistus Kalibrointi Koesuunnittelu Kuvankäsittely Laadunvalvonta Laskennallinen tekniikka Lääketieteellinen tekniikka Neuroverkot Päätöksentekomenetelmät Prosessinvalvonta Signaalinkäsittely Spektroskopia Tietoliikennetekniikka TKK (c) Ilkka Mellin (2005) 29

Tilastotieteen eksoottisia sovelluksia 1: Dendrokronologia Dendrokronologia Arkeologiassa puuesineiden ajoituksessa käytetään apuna mm. puiden vuosilustojen muodostamia (aika-) sarjoja. Historiallisessa meteorologiassa ilmastonmuutoksien tutkimuksessa käytetään apuna mm. puiden vuosilustojen muodostamia (aika-) sarjoja. Puiden vuosilustosarjojen analysoinnissa sovelletaan mm. tilastollista aikasarja-analyysia. TKK (c) Ilkka Mellin (2005) 30

Tilastotieteen eksoottisia sovelluksia 2: Tietokonetomografia Tietokonetomografia Lääketieteellisissä tutkimuksissa käytetään (esim. syöpäkasvaimia etsittäessä) apuna tietokonetomografiaa. Tietokonetomografia on menetelmä, jonka avulla ihmisen kudoksista tai elimistä tuotetaan tomografi-nimisellä laitteella ns. viipale- tai tasokuvia. Kuvat perustuvat sähkömagneettisen tai hiukkassäteilyn mittaamiseen säteilyn kulkiessa kudosten tai elinten läpi. Kuvaa muodostettaessa tomografiin ohjelmoitu algoritmi ratkaisee inversio-ongelmaksi kutsutun matemaattisen ongelman, joka voidaan luontevimmin tulkita bayeslaisten tilastollisten menetelmien muodostamassa kehikossa. TKK (c) Ilkka Mellin (2005) 31

Tilastot ja tilastolliset aineistot 1/2 Sana tilasto tuo useimmille ensimmäisenä mieleen yhteiskuntaa ja sen toimintaa kuvaavat numeeristen tietojen järjestelmälliset kokoelmat. Yhteiskuntaa ja sen toimintaa kuvaavien tilastojen tuotannossa ja analysoinnissa tarvittavien menetelmien kehittäminen on keskeinen osa tilastotiedettä, mutta tilastotieteen sovellusalue on paljon tätä laajempi. TKK (c) Ilkka Mellin (2005) 32

Tilastot ja tilastolliset aineistot 2/2 Tilastotieteen kannalta mikä tahansa reaalimaailman ilmiötä kuvaava numeeristen tai kvantitatiivisten tietojen järjestelmällinen kokoelma muodostaa tilastollisen aineiston ja tilastollisen tutkimuksen mahdollisen kohteen. Esimerkiksi kaikki empiirisen tai kvantitatiivisen tutkimuksen tutkimus- tai havaintoaineistot ovat tilastotieteen kannalta tilastollisia aineistoja. TKK (c) Ilkka Mellin (2005) 33

Tilastoala, tilastotiede, tilastotoimi Terminologiaa: Tilastoala = Tilastotiede + Tilastotoimi Tilastotiede = Teoreettinen tilastotiede + Soveltava tilastotiede Tilastotoimi = Tilastojen tuotanto + Tilastojen hyödyntäminen TKK (c) Ilkka Mellin (2005) 34

Tilastotiede, tilastot ja yhteiskunta 1/3 Ihminen ei voi toimia nykymaailmassa järkevästi, ellei hän pysty muodostamaan oikeata kuvaa maailmasta ja sen tilasta. Rakennusaineeksi oikeata kuvaa varten tarvitaan mm. maailmaa ja sen tilaa merkityksellisesti ja oikein kuvaavia, ajantasaisia (tilasto-) tietoja. Merkityksellisesti ja oikein todellisuutta kuvaavat, ajantasaiset (tilasto-) tiedot ovat välttämättömiä modernin yhteiskunnan toiminnalle ja niiden saatavuutta voidaan pitää toimivan demokratian edellytyksenä. TKK (c) Ilkka Mellin (2005) 35

Tilastotiede, tilastot ja yhteiskunta 2/3 Yhteiskunnan kaikilla sektoreilla toiminnan seuranta, päätöksenteko ja ennakointi perustuvat sekä yhteiskunnan eri sektoreita kuvaaviin (tilasto-) tietoihin että tilastollisiin menetelmiin. Päätöksenteko perustuu sekä julkisella että yksityisellä sektorilla (elinkeinoelämässä) yhteiskuntaa ja elinkeinoelämää kuvaaviin (tilasto-) tietoihin ja tilastollisiin menetelmiin. Esimerkiksi tuotantoprosessien ohjaus ja laadunvalvonta teollisuudessa sekä markkinatutkimus kaupan alalla perustuvat tilastollisiin menetelmiin. TKK (c) Ilkka Mellin (2005) 36

Tilastotiede, tilastot ja yhteiskunta 3/3 Koska todellisuutta kuvaaviin (tilasto-) tietoihin sisältyy (lähes) aina epävarmuutta ja satunnaisuutta, tilastotiede ja tilastolliset menetelmät luovat perustan tilastojen tuotannolle, jalostukselle ja analysoinnille. Tilastojen tuotannon, jalostuksen ja analysoinnin menetelmien kehittäminen on keskeinen osa tilastotieteen tehtäväkenttää. TKK (c) Ilkka Mellin (2005) 37

Esimerkki 1: Kyselytutkimukset 1/4 Päätöksentekijät ja tiedotusvälineet kartoittavat säännöllisien välein suomalaisten mielipiteet erilaisista yhteiskuntaa koskevista kysymyksistä. Esimerkkejä: Miten suomalaiset suhtautuvat mahdolliseen NATOjäsenyyteen? Miten suomalaiset suhtautuvat ydinvoiman lisärakentamiseen? Mitkä ovat poliittisten puolueiden kannatusosuudet? Mielipiteet selvitetään kyselytutkimuksilla, joiden kohteeksi poimitaan tyypillisesti 1000 2000 suomalaista. Kyselytutkimuksen tavoitteena on tehdä kyselyn tulosten perusteella johtopäätöksiä mielipiteiden jakautumisesta kaikkien suomalaisten joukossa. TKK (c) Ilkka Mellin (2005) 38

Esimerkki 1: Kyselytutkimukset 2/4 Miten 1000 2000 suomalaiseen kohdistetun kyselyn tulokset voidaan yleistää koskemaan kaikkia suomalaisia? Kyselyn tulokset voidaan yleistää, jos kyselyn kohteiksi poimittujen suomalaisten joukko muodostaa edustavan pienoiskuvan Suomen kansasta. Pienoiskuva on edustava, jos mielipiteet jakautuvat kyselyn kohteiksi poimittujen joukossa samalla tavalla kuin kaikkien suomalaisten muodostamassa perusjoukossa. Kyselyn kohteiden poiminta arpomalla on ainoa menetelmä, joka mahdollistaa edustavan pienoiskuvan saamisen. Kyselyn kohteiden poimintaa kaikkien suomalaisten muodostamasta perusjoukosta arpomalla kutsutaan tilastotieteessä (satunnais-) otannaksi ja tutkimuksen kohteeksi poimittua perusjoukon osaa kutsutaan (satunnais-) otokseksi. TKK (c) Ilkka Mellin (2005) 39

Esimerkki 1: Kyselytutkimukset 3/4 Arvonnan käyttö kyselyn kohteiden poiminnassa merkitsee sitä, että kyselyn tulokset ovat satunnaisia seuraavassa mielessä: Jos arvontaa toistettaisiin, kysely tuottaisi (suurella todennäköisyydellä) joka kerran (ainakin jonkin verran) erilaiset tulokset, koska eri arvonnoissa kyselyyn poimittaisiin (suurella todennäköisyydellä) eri henkilöt. Kysymyksiä: Miten yhdestä otoksesta saadut ja satunnaiset kyselytulokset voidaan yleistää koskemaan koko sitä perusjoukkoa, josta otos poimitaan? Miten luotettava tällainen yleistys on? TKK (c) Ilkka Mellin (2005) 40

Esimerkki 1: Kyselytutkimukset 4/4 Vastauksia: Jos kyselyn kohteiden poiminnassa on käytetty satunnaisotantaa, kyselyn tuloksiin sisältyvälle epävarmuudelle ja satunnaisuudelle voidaan muodostaa tilastollinen malli, joka mahdollistaa sekä kyselyn tulosten yleistämisen että yleistyksen luotettavuuden arvioinnin. Yleistyksen luotettavuutta ei pystytä arvioimaan, ellei otoksen poiminnassa ole käytetty satunnaisotantaa. Kyselytutkimusten suunnittelussa, toteutuksessa ja tulosten analysoinnissa sovelletaan mm. seuraavia tilastollisia menetelmiä: otanta estimointi testaus TKK (c) Ilkka Mellin (2005) 41

Esimerkki 2: Lääketieteelliset kokeet 1/4 Erään tappavan taudin hoitoon on kehitetty uusi lääke, jonka toivotaan parantavan enemmän potilaita kuin kauan käytössä ollut vanha lääke. Miten saadaan varmuus siitä, että uusi lääke on parempi kuin vanha lääke? Paranemistulosten vertailemiseksi järjestetään tilastollinen koe: (i) Jaetaan joukko potilaita arpomalla kahteen ryhmään: Ryhmälle 1 annetaan uutta lääkettä. Ryhmälle 2 annetaan vanhaa lääkettä. (ii) Verrataan parantuneiden suhteellisia osuuksia ryhmissä 1 ja 2. Kokeen tavoitteena on tehdä kokeen tulosten perusteella yleisiä johtopäätöksiä uuden lääkkeen tehokkuudesta. TKK (c) Ilkka Mellin (2005) 42

Esimerkki 2: Lääketieteelliset kokeet 2/4 Miten yhdestä kokeesta saadut tulokset voidaan yleistää koskemaan kaikkia tautia sairastavia potilaita? Kokeen tulokset voidaan yleistää, jos kokeessa uutta ja vanhaa lääkettä saavien potilaiden ryhmät ovat samankaltaisia kaikissa muissa suhteissa paitsi siinä, että niihin kohdistetaan kokeessa erilainen käsittely. Tällöin mahdolliset erot parantuneiden suhteellisissa osuuksissa ovat seurausta erilaisista käsittelyistä. Kokeen kohteiden jakaminen ryhmiin arpomalla on ainoa menetelmä, joka mahdollistaa samankaltaisten ryhmien saamisen. Kokeen kohteiden jakamista erilaisen käsittelyn kohteiksi joutuviin ryhmiin arpomalla kutsutaan tilastotieteessä satunnaistamiseksi. TKK (c) Ilkka Mellin (2005) 43

Esimerkki 2: Lääketieteelliset kokeet 3/4 Arvonnan käyttö ryhmiin jaossa merkitsee sitä, että koetulokset ovat satunnaisia seuraavassa mielessä: Jos arvontaa toistettaisiin, kokeesta saataisiin (suurella todennäköisyydellä) joka kerran (ainakin jonkin verran) erilaiset tulokset, koska eri arvonnoissa saataisiin (suurella todennäköisyydellä) erilaiset ryhmäjaot. Kysymyksiä: Miten yhdestä kokeesta saadut ja satunnaiset koetulokset voidaan yleistää koskemaan kaikkia ko. tautia sairastavia potilaita? Miten luotettava tällainen yleistys on? TKK (c) Ilkka Mellin (2005) 44

Esimerkki 2: Lääketieteelliset kokeet 4/4 Vastauksia: Jos potilaiden jaossa ryhmiin on käytetty satunnaistamista, kokeen tuloksiin sisältyvälle epävarmuudelle ja satunnaisuudelle voidaan muodostaa tilastollinen malli, joka mahdollistaa sekä koetulosten yleistämisen että yleistyksen luotettavuuden arvioinnin. Yleistyksen luotettavuutta ei pystytä arvioimaan, ellei ryhmiin jaossa ole käytetty satunnaistamista. Tilastollisen kokeen suunnittelussa, toteutuksessa ja tulosten analysoinnissa sovelletaan mm. seuraavia tilastollisia menetelmiä: koesuunnittelu estimointi testaus TKK (c) Ilkka Mellin (2005) 45

Esimerkki 3: Laadunvalvonta 1/4 Tehdas valmistaa korkealuokkaisia sulkimia kameroihin. Tehdas pyrkii siihen, että yli 90 % sulkimista kestää vähintään 100 000 laukaisua. Sulkimien laadun valvonta on toteutettu seuraavalla tavalla: (i) Tuotantolinjalta poimitaan arpomalla joukko sulkimia rasituskokeeseen. (ii) Rasituskokeessa määrätään vähintään 100 000 laukaisua kestävien sulkimien suhteellinen osuus. Kokeen tavoitteena on tehdä kokeen tulosten perusteella yleisiä johtopäätöksiä sulkimien kestävyydestä. TKK (c) Ilkka Mellin (2005) 46

Esimerkki 3: Laadunvalvonta 2/4 Miten vain osaan sulkimista kohdistetun rasituskokeen tulokset voidaan yleistää koskemaan kaikkia sulkimia? Kokeen tulokset voidaan yleistää, jos rasituskokeen kohteiksi poimittujen sulkimien joukko muodostaa edustavan pienoiskuvan kaikista valmistetuista sulkimista. Pienoiskuva on edustava, jos sulkimien kesto jakautuu rasituskokeeseen poimittujen sulkimien joukossa samalla tavalla kuin kaikkien valmistettujen sulkimien muodostamassa perusjoukossa. Rasituskokeen kohteiden poiminta arpomalla on ainoa menetelmä, joka mahdollistaa edustavan pienoiskuvan saamisen. Rasituskokeen kohteiden poimintaa kaikkien valmistettujen sulkimien muodostamasta perusjoukosta arpomalla kutsutaan tilastotieteessä (satunnais-) otannaksi ja tutkimuksen kohteeksi poimittua perusjoukon osaa kutsutaan (satunnais-) otokseksi. TKK (c) Ilkka Mellin (2005) 47

Esimerkki 3: Laadunvalvonta 3/4 Arvonnan käyttö rasituskokeen kohteiden poiminnassa merkitsee sitä, että koetulokset ovat satunnaisia seuraavassa mielessä: Jos arvontaa toistettaisiin, kokeesta saataisiin (suurella todennäköisyydellä) joka kerran (ainakin jonkin verran) erilaiset tulokset, koska eri arvonnoissa kokeeseen poimittaisiin (suurella todennäköisyydellä) eri sulkimet. Kysymyksiä: Miten yhdestä kokeesta saadut ja satunnaiset koetulokset voidaan yleistää koskemaan kaikkia sulkimia? Miten luotettava tällainen yleistys on? TKK (c) Ilkka Mellin (2005) 48

Esimerkki 3: Laadunvalvonta 4/4 Vastauksia: Jos rasituskokeen kohteiden poiminnassa on käytetty satunnaisotantaa, kokeen tuloksiin sisältyvälle epävarmuudelle ja satunnaisuudelle voidaan muodostaa tilastollinen malli, joka mahdollistaa sekä koetulosten yleistämisen että yleistyksen luotettavuuden arvioinnin. Yleistyksen luotettavuutta ei pystytä arvioimaan, ellei kokeen kohteiden poiminnassa ole käytetty satunnaisotantaa. Kokeen suunnittelussa, toteutuksessa ja tulosten analysoinnissa sovelletaan mm. seuraavia tilastollisia menetelmiä: koesuunnittelu ja otanta estimointi testaus TKK (c) Ilkka Mellin (2005) 49