Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?



Samankaltaiset tiedostot
Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

Johdatus tilastotieteeseen Tilastotiede tieteenalana. TKK (c) Ilkka Mellin (2005) 1

Tilastollisten aineistojen kerääminen ja mittaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Sovellettu todennäköisyyslaskenta B

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen rooli uuden tieteellisen tiedon tuottamisessa Mitä tilastotiede on?

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Johdatus todennäköisyyslaskentaan Todennäköisyys ja sen määritteleminen. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Yhteistyöaineiden edustajan puheenvuoro

Osa 2: Otokset, otosjakaumat ja estimointi

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen tutkimuksen vaiheet

Matemaatikot ja tilastotieteilijät

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI. LTKY012 Timo Törmäkangas Gerontologian tutkimuskeskus

OPETUSSUUNNITELMALOMAKE

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

MONISTE 2 Kirjoittanut Elina Katainen

tilastotieteen kertaus

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

OPETUSSUUNNITELMALOMAKE

Kvantitatiivisen aineiston analyysi

1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...

Mitä tarvitsee tietää biostatistiikasta ja miksi? Matti Uhari Lastentautien klinikka Oulun yliopisto

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Testit laatueroasteikollisille muuttujille

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyys (englanniksi probability)

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tieteen tila katsauksen tohtoreiden sijoittumista koskevien tarkastelujen tieteenalaryhmittelyt

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty

Tieteenaloittaiset tilastot: Lääke- ja terveystieteet

Tieteenaloittaiset tilastot: Luonnontieteet

Tieteenaloittaiset tilastot: Tekniikka

B. Siten A B, jos ja vain jos x A x

Teema 8: Parametrien estimointi ja luottamusvälit

Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Tieteenaloittaiset tilastot: Yhteiskuntatieteet

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Otannasta ja mittaamisesta

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Teknillisen fysiikan ja matematiikan tutkintoohjelma, tekniikan kandidaatin tutkinnon pääaineet

Kurssin puoliväli ja osan 2 teemat

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Tfy Teoreettinen mekaniikka (5 op) Tfy Fysiikka IV alkuosa A ja Tfy Teoreettinen mekaniikka

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

(x, y) 2. heiton tulos y

Moderni biolääketieteellinen optiikka X - Optinen mittaaminen sekä valmistusmenetelmät X X X

HOPS Henkilökohtainen opintosuunnitelma LuK -tutkintoon

Lukuvuosi oppikirjat Huomioi, että muutokset ovat vielä mahdollisia. Lisätietoja kurssien opettajilta.

TIETEEN TILA Tohtoreiden sijoittuminen työelämässä: tieteenalaluokitukset

Tieteenaloittaiset tilastot: Biotieteet, maantiede, ympäristötieteet sekä maatalous- ja metsätieteet

Tilastotiede ottaa aivoon

Tilastollinen aineisto Luottamusväli

7. Tutkimuksen teko. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina. Kevät 2005 Empiirinen ohjelmistotutkimus / Taina

Harjoitus 7: NCSS - Tilastollinen analyysi

Sovellettu todennäköisyyslaskenta B

Todennäköisyyslaskenta: Todennäköisyys ja sen laskusäännöt

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden aksioomat

Tilastot: Kaikki tieteenalat yhteensä ja t&k-toiminta päätieteenaloittain

Matematiikka tai tilastotiede sivuaineena

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Tieteen ja tutkimusalan opintoihin hyväksyttävät opintojaksot ovat (taulukossa A= aineopinnot, S=syventävät opinnot, J = jatko-opinnot):

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

TFM-tutkinto-ohjelma, tekniikan kandidaatin tutkinnon pääaineet lv Teknillinen fysiikka Matematiikka Mekaniikka Systeemitieteet

Tavoitekehitys, Varsinais-Suomi

Tilastollisia peruskäsitteitä ja Monte Carlo

Mitä on laadullinen tutkimus? Pertti Alasuutari Tampereen yliopisto

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Useiden top-viittausindeksien tarkastelu tieteenalaryhmittäin Suomessa ja valituissa verrokkimaissa

Vääksyn Yhteiskoulun lukion kirjalista lukuvuodelle Kirja ja ISBN-numero BIOLOGIA ENGLANTI FILOSOFIA FYSIIKKA HISTORIA KEMIA

Lukuvuosi oppikirjat Huomioi, että muutokset ovat vielä mahdollisia. Lisätietoja kurssien opettajilta.

Tilastotiede ottaa aivoon

Lukuvuosi oppikirjat LOPS 2016 Huomioi, että muutokset ovat vielä mahdollisia. Lisätietoja kurssien opettajilta.

RAUTJÄRVEN LUKION OPPIKIRJALISTA LUKUVUONNA L1-L3

Laadullisen tutkimuksen luonne ja tehtävät. Pertti Alasuutari professori, Laitoksen johtaja Yhteiskuntatieteiden tutkimuslaitos

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Helsingin yliopiston määrälliset tavoitteet kaudelle

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Luento-osuusosuus. tilasto-ohjelmistoaohjelmistoa

Ilomantsin lukion oppikirjaluettelo lukuvuosi Kurssit Oppikirja ISBN numero Kustantaja Äidinkieli ja kirjallisuus Englanti Ruotsi

Oulun yliopisto. Luonnontieteellinen koulutusala. Fysiikan tutkinto-ohjelma. Fysiikka, filosofian maisteri, 120 op. 1 of

Ilomantsin lukion oppikirjaluettelo lukuvuosi , LOPS2016

Lukuohje. Oulun yliopisto

Transkriptio:

TKK (c) Ilkka Mellin (2004) 1 Tilastotiede tieteenalana Johdatus todennäköisyyslaskentaan ja tilastotieteeseen Tilastotiede tieteenalana TKK (c) Ilkka Mellin (2004) 2 Tilastotiede tieteenalana: Mitä opimme? Pyrimme tässä luvussa vastaamaan seuraaviin kysymyksiin: Mitä tilastotiede on ja mitä se ei ole? Mihin tilastotiedettä käytetään? Saamme tietää, että tilastotiede on yleinen menetelmätiede, jota voidaan soveltaa aina, kun reaalimaailman ilmiöistä halutaan tehdä johtopäätöksiä ilmiöitä kuvaavien kvantitatiivisten tietojen perusteella sellaisissa tilanteissa, joissa tietoihin liittyy epävarmuutta. Näemme myös, että tilastotiede pyrkii muodostamaan matemaattisia, todennäköisyyslaskentaan perustuvia malleja niille prosesseille, jotka generoivat tiedot. Tilastotiede tieteenalana >> TKK (c) Ilkka Mellin (2004) 3 TKK (c) Ilkka Mellin (2004) 4 Tilastotiede ei ole oppi tilastoista! Avainsanat Arvonta Epävarmuus Johtopäätösten tekeminen Kuvaileva tilastotiede Kvantitatiivinen tieto Matemaattinen malli Matematiikka Menetelmätiede Numeerinen tieto Reaalimaailman ilmiö Satunnaisilmiö Satunnaisuus Soveltava tilastotiede Teoreettinen tilastotiede Tieto Tilasto Tilastotiede Tilastollinen päättely Tilastollinen stabiliteetti Tilastollinen tutkimusasetelma Tilastollinen malli Tilastollinen menetelmä Todennäköisyyslaskenta Tulosvaihtoehto Tunnusluku Tilastotiede ei ole nimestään huolimatta oppi tilastoista tai tilastojen tuotannosta! Mikä sen sijaan on totta, on se, että tilastojen tuotannon, jalostuksen ja analysoinnin menetelmien kehittäminen muodostaa keskeisen osan tilastotiedettä. TKK (c) Ilkka Mellin (2004) 5 TKK (c) Ilkka Mellin (2004) 6

TKK (c) Ilkka Mellin (2004) 7 Tilastotiede ei ole matematiikkaa! Tilastotiede on yleinen menetelmätiede Tilastotiede ei ole matematiikan osa-alue! Mikä sen sijaan on totta, on se, että tilastotieteen menetelmät ja mallit ovat matemaattisia ja perustuvat todennäköisyyslaskentaan: Matematiikalla on tilastotieteessä välineellinen rooli. Tilastotiede käyttää matematiikan kieltä. Tilastotiede on yleinen menetelmätiede. Tilastotiede kehittää ja soveltaa menetelmiä ja malleja, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä ilmiöitä kuvaavien numeeristen tai kvantitatiivisten tietojen perusteella tilanteissa, joissa tietoihin liittyy epävarmuutta ja satunnaisuutta. TKK (c) Ilkka Mellin (2004) 8 Tilastolliset menetelmät ja mallit Tilastolliset tutkimusasetelmat Tilastollisten menetelmien avulla reaalimaailman ilmiöitä kuvaavat numeeriset tai kvantitatiiviset tiedot jalostetaan sellaiseen muotoon, että ilmiöitä koskevat johtopäätökset tulevat mahdollisiksi. Tietojen jalostaminen merkitsee tietojen tiivistämistä graafisiksi esityksiksi ja tunnusluvuiksi sekä tilastollisten mallien rakentamista tiedot generoineille prosesseille tai mekanismeille. Tilastollisissa tutkimusasetelmissa reaalimaailman ilmiöitä kuvaaviin numeerisiin tai kvantitatiivisiin tietoihin liittyy aina epävarmuutta ja satunnaisuutta. Reaalimaailman ilmiötä kuvaavien tietojen tilastollinen analyysi perustuu siihen, että tietoihin liittyvän epävarmuuden ja satunnaisuuden ajatellaan johtuvan tiedot generoineesta prosessista tai mekanismista. Epävarmuuden ja satunnaisuuden generoijana voi olla ilmiö itse tai ne voivat olla seurausta menetelmästä, jolla tutkimuksen kohteet valitaan. TKK (c) Ilkka Mellin (2004) 9 TKK (c) Ilkka Mellin (2004) 10 Satunnaisilmiöt Reaalimaailman ilmiö on satunnaisilmiö, jos seuraavat ehdot pätevät: (i) Ilmiöllä on useita erilaisia tulosvaihtoehtoja. (ii) Sattuma määrää mikä tulosvaihtoehdoista toteutuu. (iii) Vaikka ilmiön tulos vaihtelee ilmiön toistuessa satunnaisesti, ilmiön tulosvaihtoehtojen suhteellisten osuuksien jakauma käyttäytyy tilastollisesti stabiilisti, kun toistokertojen lukumäärä kasvaa. Todennäköisyyslaskennan tehtävänä on tuottaa matemaattisia malleja satunnaisilmiöissä havaittavalle tilastolliselle stabiliteetille. TKK (c) Ilkka Mellin (2004) 11 Satunnaisilmiöt: Kommentteja Satunnaisilmiöihin liittyy aina ennustamattomuutta: Satunnaisilmiön yksittäistä tulosta ei voida tietää etukäteen. Satunnaisilmiöihin on kuitenkin liityttävä säännönmukaisuutta, jonka on tultava esille ilmiön toistuessa: Vaikka satunnaisilmiön tulos vaihtelee satunnaisesti ilmiön toistokerrasta toiseen, ilmiön tulosvaihtoehtojen suhteellisten osuuksien jakauman on käyttäydyttävä stabiilisti, kun toistokertojen lukumäärä kasvaa. TKK (c) Ilkka Mellin (2004) 12

TKK (c) Ilkka Mellin (2004) 13 Satunnaisilmiöt: Esimerkkejä Esimerkkejä satunnaisilmiöistä: Kvanttimekaniikan ilmiöt Hiukkasfysiikan ilmiöt Luonnontieteellisiin mittauksiin liittyvien mittausvirheiden syntymekanismit Uhkapelit: arpajaiset, lotto, ruletti, kortti- ja noppapelit Perinnöllisyys Eliöiden ja eliöpopulaatioiden käyttäytyminen Ihmisten, ihmisryhmien ja ihmisten muodostamien organisaatioiden sosiaalinen ja taloudellinen käyttäytyminen Teknisten prosessien tuloksien ominaisuudet Tietojen kerääminen satunnaisilmiönä 1/2 Voimme ajatella, että tilastollisissa tutkimusasetelmissa tutkimuksen kohteet valitaan arpomalla. Arvonta on satunnaisilmiö: (i) Arvontaan liittyy aina ennustamattomuutta, koska yksittäisen arvonnan tulosta ei voida tietää etukäteen. (ii) Arvonta noudattaa kuitenkin todennäköisyyden lakeja. TKK (c) Ilkka Mellin (2004) 14 Tietojen kerääminen satunnaisilmiönä 2/2 Koska arvonnan tulos vaihtelee satunnaisesti arvontakerrasta toiseen, myös tutkimuksen kohteita kuvaavat tiedot vaihtelevat satunnaisesti arvontakerrasta toiseen. Tutkimuksen kohteita kuvaavien tietojen käyttäytymisessä havaitaan kuitenkin arvontaa toistettaessa sitä säännönmukaisuutta, jota kutsutaan tilastolliseksi stabiliteetiksi. Juuri tämä säännönmukaisuus on tilastollisen tutkimuksen kohde. Tietojen kerääminen satunnaisilmiönä: Esimerkkejä Esimerkkejä tietojen keräämisen menetelmistä, jotka perustuvat arvontaan: Satunnaistetut kokeet Satunnaisotanta Huomautus: Koesuunnittelu ja otantateoria ovat keskeisiä tilastotieteen menetelmiä. TKK (c) Ilkka Mellin (2004) 15 TKK (c) Ilkka Mellin (2004) 16 Teoreettinen ja soveltava tilastotiede 1/2 Teoreettinen ja soveltava tilastotiede 2/2 Teoreettinen tilastotiede kehittää matemaattisia malleja prosesseille, jotka generoivat reaalimaailman ilmiöitä kuvaavia numeerisia tai kvantitatiivisia tietoja, joihin liittyy epävarmuutta ja satunnaisuutta. Teoreettisen tilastotieteen kehittämät mallit perustuvat todennäköisyyslaskentaan ja niitä kutsutaan tilastollisiksi malleiksi, stokastisiksi malleiksi tai todennäköisyysmalleiksi. Tilastollisten mallien avulla reaalimaailman ilmiöitä kuvaaviin tietoihin liittyvät systemaattiset ja satunnaiset piirteet voidaan erottaa ja kuvata. Soveltava tilastotiede soveltaa teoreettisen tilastotieteen kehittämiä matemaattisia malleja reaalimaailman ilmiöitä kuvaavien numeeristen tai kvantitatiivisten tietojen analysointiin. Teoreettinen ja soveltava tilastotiede kulkevat tilastollisessa tutkimuksessa käsi kädessä: Teoreettinen tilastotiede kehittää tilastomatemaattisia malleja soveltavan tilastotieteen empiiristen ongelmien ratkaisemiseksi. Soveltava tilastotiede käyttää hyväkseen teoreettisen tilastotieteen kehittämiä malleja. TKK (c) Ilkka Mellin (2004) 17 TKK (c) Ilkka Mellin (2004) 18

TKK (c) Ilkka Mellin (2004) 19 Kuvaileva tilastotiede ja tilastollinen päättely 1/2 Kuvaileva tilastotiede ja tilastollinen päättely 2/2 Deskriptiivinen eli kuvaileva tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla tutkimuksen kohteena olevasta ilmiöstä kerättyjä numeerisia tai kvantitatiivisia tietoja voidaan kuvailla ja esitellä. Kuvailevan tilastotieteen työkaluja: Tilastografiikka Tilastolliset tunnusluvut Tilastolliset mallit Tilastollinen inferenssi eli päättely kehittää ja soveltaa menetelmiä, joiden avulla tutkimuksen kohteena olevasta ilmiöstä voidaan tehdä johtopäätöksiä ilmiöstä kerättyjen numeeristen tai kvantitatiivisten tietojen perusteella. Tilastollisen päättelyn työkaluja: Tilastolliset mallit Tilastollinen testaus Kuvaileva tilastotiede ja tilastollinen päättely kulkevat tilastollisessa tutkimuksessa käsi kädessä. TKK (c) Ilkka Mellin (2004) 20 Tilastotiede tieteenalana >> Avainsanat Empiirinen tutkimus Havaintoaineisto Laadunvalvonta Lääketieteellinen koe Koe Kyselytutkimus Menetelmätiede Otanta Päätöksenteko Tilasto Tilastoala Tilastollinen aineisto Tilastollinen tutkimus Tilastollinen tutkimusasetelma Tilastotiede Tilastotieteen osa-alueet Tilastotieteen reuna-alueet Tilastotoimi Tutkimus Tutkimusaineisto Yhteiskunta TKK (c) Ilkka Mellin (2004) 21 TKK (c) Ilkka Mellin (2004) 22 Missä tilastotiedettä voidaan soveltaa? Tilastotiede ja tieteellinen tutkimus Tilastotiedettä voidaan yleisenä menetelmätieteenä soveltaa kaikkialla, missä tuotetaan reaalimaailmaa ja sen ilmiöitä kuvaavaa numeerista tai kvantitatiivista tietoa. Tilastollisia menetelmiä voidaan soveltaa tietojen keruun, jalostuksen ja analysoinnin jokaisessa vaiheessa. Tilastollisia menetelmiä sovellettaessa päämääränä on jalostaa tiedot muotoon, joka mahdollistaa reaalimaailmaa ja sen ilmiöitä koskevien johtopäätösten tekemisen. Tilastotiedettä voidaan yleisenä menetelmätieteenä soveltaa kaikissa tieteissä, joiden tutkimusaineistot voidaan esittää numeerisessa tai kvantitatiivisessa muodossa. Jokainen tiede, jonka tutkimusaineistot voidaan esittää numeerisessa tai kvantitatiivisessa muodossa voi soveltaa / voisi soveltaa / pitäisi soveltaa tilastollisia menetelmiä sekä tutkimusaineistoja kerättäessä että niitä analysoitaessa. Jokainen empiirisen tutkimuksen havaintoaineisto on tilastollisen tutkimuksen mahdollinen kohde. TKK (c) Ilkka Mellin (2004) 23 TKK (c) Ilkka Mellin (2004) 24

TKK (c) Ilkka Mellin (2004) 25 Tilastotieteen käyttöalueita Tilastotieteellä on monta nimeä Biotieteet biokemia biologia ekologia eläinlääketiede eläintiede kasvitiede lääketiede perinnöllisyystiede Ihmistieteet arkeologia kielitiede psykologia Luonnontieteet fysiikka kemia tähtitiede Maatalous- ja metsätieteet kasvinviljelytiede kotieläinten jalostustiede metsänarviointitiede metsänviljelytiede Yhteiskuntatieteet sosiaalitieteet taloustiede Biometria tai Biostatistiikka = Bio- ja lääketieteiden tilastotiede Demometria = Väestötiede Ekonometria = Taloustieteen tilastotiede Epidemiologia = Tautien leviämismekanismeja koskeva lääketieteen osa-alue Kemometria = Kemian tilastotiede TKK (c) Ilkka Mellin (2004) 26 Tilastotieteen osa-alueita Tilastotieteen reuna-alueita Aikasarja-analyysi Bayeslaiset menetelmät Biometria Demometria Ei-parametriset menetelmät Ekonometria Estimointiteoria Kemometria Koesuunnittelu Laadunvalvonta Lineaaristen mallien teoria Matemaattinen tilastotiede Monimuuttujamenetelmät Otantateoria Regressioanalyysi Robustit menetelmät Spatiaaliset menetelmät Testiteoria Tilastollinen päättely Tilastollinen tietojenkäsittely Varianssianalyysi Finanssimatematiikka Hahmontunnistus Hermoverkot Kaaosteoria Katastrofiteoria Kuvankäsittely Kybernetiikka Operaatioanalyysi Peliteoria Päätösteoria Riskiteoria Signaalinkäsittely Stokastiset prosessit Todennäköisyyslaskenta Tulevaisuudentutkimus Vakuutusmatematiikka TKK (c) Ilkka Mellin (2004) 27 TKK (c) Ilkka Mellin (2004) 28 Tilastotieteen sovelluksia teknisissä tieteissä Tilastotieteen eksoottisia sovelluksia 1: Dendrokronologia Hahmontunnistus Kalibrointi Koesuunnittelu Kuvankäsittely Laadunvalvonta Laskennallinen tekniikka Lääketieteellinen tekniikka Neuroverkot Päätöksentekomenetelmät Prosessinvalvonta Signaalinkäsittely Spektroskopia Tietoliikennetekniikka Dendrokronologia Arkeologiassa puuesineiden iän määrityksessä käytetään apuna puiden vuosilustojen muodostamia (aika-) sarjoja. Historiallisessa meteorologiassa ilmastonmuutoksia tutkittaessa käytetään apuna mm. puiden vuosilustojen muodostamia (aika-) sarjoja. Puiden vuosilustosarjojen analysoinnissa sovelletaan mm. tilastollista aikasarja-analyysia. TKK (c) Ilkka Mellin (2004) 29 TKK (c) Ilkka Mellin (2004) 30

TKK (c) Ilkka Mellin (2004) 31 Tilastotieteen eksoottisia sovelluksia 2: Tietokonetomografia Tietokonetomografia Lääketieteellisissä tutkimuksissa käytetään (esim. syöpäkasvaimia etsittäessä) apuna tietokonetomografiaa. Tietokonetomografia on menetelmä, jonka avulla ihmisen kudoksista tai elimistä tuotetaan tomografi-nimisellä laitteella ns. viipale- tai tasokuvia. Kuvat perustuvat sähkömagneettisen tai hiukkassäteilyn mittaamiseen säteilyn kulkiessa kudosten tai elinten läpi. Kuvaa muodostettaessa tomografiin ohjelmoitu algoritmi ratkaisee inversio-ongelmaksi kutsutun matemaattisen ongelman, joka voidaan luontevimmin tulkita bayeslaisten tilastollisten menetelmien muodostamassa kehikossa. Tilastot ja tilastolliset aineistot 1/2 Sana tilasto tuo useimmille ensimmäisenä mieleen yhteiskuntaa ja sen toimintaa kuvaavat numeeristen tietojen järjestelmälliset kokoelmat. Yhteiskuntaa ja sen toimintaa kuvaavien tilastojen tuotannossa ja analysoinnissa tarvittavien menetelmien kehittäminen on keskeinen osa tilastotiedettä, mutta tilastotieteen sovellusalue on paljon tätä laajempi. TKK (c) Ilkka Mellin (2004) 32 Tilastot ja tilastolliset aineistot 2/2 Tilastoala, tilastotiede, tilastotoimi Tilastotieteen kannalta mikä tahansa reaalimaailman ilmiötä kuvaava numeeristen tai kvantitatiivisten tietojen järjestelmällinen kokoelma muodostaa tilastollisen aineiston ja tilastollisen tutkimuksen mahdollisen kohteen. Esimerkiksi kaikki empiirisen tai kvantitatiivisen tutkimuksen tutkimus- tai havaintoaineistot ovat tilastotieteen kannalta tilastollisia aineistoja. Terminologiaa: Tilastoala = Tilastotiede + Tilastotoimi Tilastotiede = Teoreettinen tilastotiede + Soveltava tilastotiede Tilastotoimi = Tilastojen tuotanto + Tilastojen hyödyntäminen TKK (c) Ilkka Mellin (2004) 33 TKK (c) Ilkka Mellin (2004) 34 Tilastotiede, tilastot ja yhteiskunta 1/3 Tilastotiede, tilastot ja yhteiskunta 2/3 Ihminen ei voi toimia nykymaailmassa järkevästi, ellei hän pysty muodostamaan oikeata kuvaa maailmasta ja sen tilasta. Rakennusaineeksi oikeata kuvaa varten tarvitaan mm. maailmaa ja sen tilaa merkityksellisesti ja oikein kuvaavia, ajantasaisia (tilasto-) tietoja. Merkityksellisesti ja oikein todellisuutta kuvaavat, ajantasaiset (tilasto-) tiedot ovat välttämättömiä modernin yhteiskunnan toiminnalle ja niiden saatavuutta voidaan pitää toimivan demokratian edellytyksenä. Yhteiskunnan kaikilla sektoreilla toiminnan seuranta, päätöksenteko ja ennakointi perustuvat sekä yhteiskunnan eri sektoreita kuvaaviin (tilasto-) tietoihin että tilastollisiin menetelmiin. Päätöksenteko perustuu sekä julkisella että yksityisellä sektorilla (elinkeinoelämässä) yhteiskuntaa ja elinkeinoelämää kuvaaviin (tilasto-) tietoihin ja tilastollisiin menetelmiin. Esimerkiksi tuotantoprosessien ohjaus ja laadunvalvonta teollisuudessa sekä markkinatutkimus kaupan alalla perustuvat tilastollisiin menetelmiin. TKK (c) Ilkka Mellin (2004) 35 TKK (c) Ilkka Mellin (2004) 36

TKK (c) Ilkka Mellin (2004) 37 Tilastotiede, tilastot ja yhteiskunta 3/3 Koska todellisuutta kuvaaviin (tilasto-) tietoihin sisältyy (lähes) aina epävarmuutta ja satunnaisuutta, tilastotiede ja tilastolliset menetelmät luovat perustan tilastojen tuotannolle, jalostukselle ja analysoinnille. Tilastojen tuotannon, jalostuksen ja analysoinnin menetelmien kehittäminen on keskeinen osa tilastotieteen tehtäväkenttää. Esimerkki 1: Kyselytutkimukset 1/4 Päätöksentekijät ja tiedotusvälineet kartoittavat säännöllisien välein suomalaisten mielipiteet erilaisista yhteiskuntaa koskevista kysymyksistä. Esimerkkejä: Miten suomalaiset suhtautuvat mahdolliseen NATOjäsenyyteen? Miten suomalaiset suhtautuvat ydinvoiman lisärakentamiseen? Mitkä ovat poliittisten puolueiden kannatusosuudet? Mielipiteet selvitetään kyselytutkimuksilla, joiden kohteeksi poimitaan tyypillisesti 1000 2000 suomalaista. Kyselytutkimuksen tavoitteena on tehdä kyselyn tulosten perusteella johtopäätöksiä mielipiteiden jakautumisesta kaikkien suomalaisten joukossa. TKK (c) Ilkka Mellin (2004) 38 Esimerkki 1: Kyselytutkimukset 2/4 Miten 1000 2000 suomalaiseen kohdistetun kyselyn tulokset voidaan yleistää koskemaan kaikkia suomalaisia? Kyselyn tulokset voidaan yleistää, jos kyselyn kohteiksi poimittujen suomalaisten joukko muodostaa edustavan pienoiskuvan Suomen kansasta. Pienoiskuva on edustava, jos mielipiteet jakautuvat kyselyn kohteiksi poimittujen joukossa samalla tavalla kuin kaikkien suomalaisten muodostamassa perusjoukossa. Kyselyn kohteiden poiminta arpomalla on ainoa menetelmä, joka mahdollistaa edustavan pienoiskuvan saamisen. Kyselyn kohteiden poimintaa kaikkien suomalaisten muodostamasta perusjoukosta arpomalla kutsutaan tilastotieteessä (satunnais-) otannaksi ja tutkimuksen kohteeksi poimittua perusjoukon osaa kutsutaan (satunnais-) otokseksi. Esimerkki 1: Kyselytutkimukset 3/4 Arvonnan käyttö kyselyn kohteiden poiminnassa merkitsee sitä, että kyselyn tulokset ovat satunnaisia seuraavassa mielessä: Jos arvontaa toistettaisiin, kysely tuottaisi (suurella todennäköisyydellä) joka kerran erilaiset tulokset, koska eri arvonnoissa kyselyyn poimittaisiin (suurella todennäköisyydellä) eri henkilöt. Kysymyksiä: Miten yhdestä otoksesta saadut ja satunnaiset kyselytulokset voidaan yleistää koskemaan koko sitä perusjoukkoa, josta otos poimitaan? Miten luotettava tällainen yleistys on? TKK (c) Ilkka Mellin (2004) 39 TKK (c) Ilkka Mellin (2004) 40 Esimerkki 1: Kyselytutkimukset 4/4 Vastauksia: Jos kyselyn kohteiden poiminnassa on käytetty satunnaisotantaa, kyselyn tuloksiin sisältyvälle epävarmuudelle ja satunnaisuudelle voidaan muodostaa tilastollinen malli, joka mahdollistaa sekä kyselyn tulosten yleistämisen että yleistyksen luotettavuuden arvioinnin. Yleistyksen luotettavuutta ei pystytä arvioimaan, ellei otoksen poiminnassa ole käytetty satunnaisotantaa. Kyselytutkimusten suunnittelussa, toteutuksessa ja tulosten analysoinnissa sovelletaan mm. seuraavia tilastollisia menetelmiä: otanta estimointi testaus Esimerkki 2: Lääketieteelliset kokeet 1/4 Erään tappavan taudin hoitoon on kehitetty uusi lääke, jonka toivotaan parantavan enemmän potilaita kuin kauan käytössä ollut vanha lääke. Miten saadaan varmuus siitä, että uusi lääke on parempi kuin vanha lääke? Paranemistulosten vertailemiseksi järjestetään tilastollinen koe: (i) Jaetaan joukko potilaita arpomalla kahteen ryhmään: Ryhmälle 1 annetaan uutta lääkettä. Ryhmälle 2 annetaan vanhaa lääkettä. (ii) Verrataan parantuneiden suhteellisia osuuksia ryhmissä 1 ja 2. Kokeen tavoitteena on tehdä kokeen tulosten perusteella yleisiä johtopäätöksiä uuden lääkkeen tehokkuudesta. TKK (c) Ilkka Mellin (2004) 41 TKK (c) Ilkka Mellin (2004) 42

TKK (c) Ilkka Mellin (2004) 43 Esimerkki 2: Lääketieteelliset kokeet 2/4 Miten yhdestä kokeesta saadut tulokset voidaan yleistää koskemaan kaikkia tautia sairastavia potilaita? Kokeen tulokset voidaan yleistää, jos kokeessa uutta ja vanhaa lääkettä saavien potilaiden ryhmät ovat samankaltaisia kaikissa muissa suhteissa paitsi siinä, että niihin kohdistetaan kokeessa erilainen käsittely. Tällöin mahdolliset erot parantuneiden suhteellisissa osuuksissa ovat seurausta erilaisista käsittelyistä. Kokeen kohteiden jakaminen ryhmiin arpomalla on ainoa menetelmä, joka mahdollistaa samankaltaisten ryhmien saamisen. Kokeen kohteiden jakamista erilaisen käsittelyn kohteiksi joutuviin ryhmiin arpomalla kutsutaan tilastotieteessä satunnaistamiseksi. Esimerkki 2: Lääketieteelliset kokeet 3/4 Arvonnan käyttö ryhmiin jaossa merkitsee sitä, että koetulokset ovat satunnaisia seuraavassa mielessä: Jos arvontaa toistettaisiin, kokeesta saataisiin (suurella todennäköisyydellä) joka kerran erilaiset tulokset, koska eri arvonnoissa saataisiin (suurella todennäköisyydellä) erilaiset ryhmäjaot. Kysymyksiä: Miten yhdestä kokeesta saadut ja satunnaiset koetulokset voidaan yleistää koskemaan kaikkia ko. tautia sairastavia potilaita? Miten luotettava tällainen yleistys on? TKK (c) Ilkka Mellin (2004) 44 Esimerkki 2: Lääketieteelliset kokeet 4/4 Vastauksia: Jos potilaiden jaossa ryhmiin on käytetty satunnaistamista, kokeen tuloksiin sisältyvälle epävarmuudelle ja satunnaisuudelle voidaan muodostaa tilastollinen malli, joka mahdollistaa sekä koetulosten yleistämisen että yleistyksen luotettavuuden arvioinnin. Yleistyksen luotettavuutta ei pystytä arvioimaan, ellei ryhmiin jaossa ole käytetty satunnaistamista. Tilastollisen kokeen suunnittelussa, toteutuksessa ja tulosten analysoinnissa sovelletaan mm. seuraavia tilastollisia menetelmiä: koesuunnittelu estimointi testaus Esimerkki 3: Laadunvalvonta 1/4 Tehdas valmistaa korkealuokkaisia sulkimia kameroihin. Tehdas pyrkii siihen, että yli 90 % sulkimista kestää vähintään 100 000 laukaisua. Sulkimien laadun valvonta on toteutettu seuraavalla tavalla: (i) Tuotantolinjalta poimitaan arpomalla joukko sulkimia rasituskokeeseen. (ii) Rasituskokeessa määrätään vähintään 100 000 laukaisua kestävien sulkimien suhteellinen osuus. Kokeen tavoitteena on tehdä kokeen tulosten perusteella yleisiä johtopäätöksiä sulkimien kestävyydestä. TKK (c) Ilkka Mellin (2004) 45 TKK (c) Ilkka Mellin (2004) 46 Esimerkki 3: Laadunvalvonta 2/4 Miten vain osaan sulkimista kohdistetun rasituskokeen tulokset voidaan yleistää koskemaan kaikkia sulkimia? Kokeen tulokset voidaan yleistää, jos kokeen kohteiksi poimittujen sulkimien joukko muodostaa edustavan pienoiskuvan kaikista valmistetuista sulkimista. Pienoiskuva on edustava, jos sulkimien kesto jakautuu rasituskokeeseen poimittujen sulkimien joukossa samalla tavalla kuin kaikkien valmistettujen sulkimien muodostamassa perusjoukossa. Rasituskokeen kohteiden poiminta arpomalla on ainoa menetelmä, joka mahdollistaa edustavan pienoiskuvan saamisen. Rasituskokeen kohteiden poimintaa kaikkien valmistettujen sulkimien muodostamasta perusjoukosta arpomalla kutsutaan tilastotieteessä (satunnais-) otannaksi ja tutkimuksen kohteeksi poimittua perusjoukon osaa kutsutaan (satunnais-) otokseksi. Esimerkki 3: Laadunvalvonta 3/4 Arvonnan käyttö rasituskokeen kohteiden poiminnassa merkitsee sitä, että koetulokset ovat satunnaisia seuraavassa mielessä: Jos arvontaa toistettaisiin, kokeesta saataisiin (suurella todennäköisyydellä) joka kerran erilaiset tulokset, koska eri arvonnoissa kokeeseen poimittaisiin (suurella todennäköisyydellä) eri sulkimet. Kysymyksiä: Miten yhdestä kokeesta saadut ja satunnaiset koetulokset voidaan yleistää koskemaan kaikkia sulkimia? Miten luotettava tällainen yleistys on? TKK (c) Ilkka Mellin (2004) 47 TKK (c) Ilkka Mellin (2004) 48

TKK (c) Ilkka Mellin (2004) 49 Esimerkki 3: Laadunvalvonta 4/4 Vastauksia: Jos rasituskokeen kohteiden poiminnassa on käytetty satunnaisotantaa, kokeen tuloksiin sisältyvälle epävarmuudelle ja satunnaisuudelle voidaan muodostaa tilastollinen malli, joka mahdollistaa sekä koetulosten yleistämisen että yleistyksen luotettavuuden arvioinnin. Yleistyksen luotettavuutta ei pystytä arvioimaan, ellei kokeen kohteiden poiminnassa ole käytetty satunnaisotantaa. Kokeen suunnittelussa, toteutuksessa ja tulosten analysoinnissa sovelletaan mm. seuraavia tilastollisia menetelmiä: koesuunnittelu ja otanta estimointi testaus