Tilastolliset menetelmät: Johdanto

Koko: px
Aloita esitys sivulta:

Download "Tilastolliset menetelmät: Johdanto"

Transkriptio

1 Tilastolliset meetelmät Johdato Tilastolliset meetelmät: Johdato. Tilastotiede tieteealaa. Tilastolliste aieistoje keräämie ja mittaamie 3. Tilastolliste aieistoje kuvaamie Ilkka Melli (006)

2 Tilastolliset meetelmät Johdato Ilkka Melli (006)

3 Tilastolliset meetelmät Johdato Sisällys. TILASTOTIEDE TIETEENALANA 5.. MITÄ TILASTOTIEDE ON? 6 MITÄ TILASTOTIEDE EI OLE? 6 MITÄ TILASTOTIEDE ON? 6 SATUNNAISILMIÖT JA TODENNÄKÖISYYSLASKENTA 6 TILASTOLLISEN TUTKIMUSAINEISTON KERÄÄMINEN SATUNNAISILMIÖNÄ 7 TEOREETTINEN JA SOVELTAVA TILASTOTIEDE 8 KUVAILEVA TILASTOTIEDE JA TILASTOLLINEN PÄÄTTELY 8 TILASTOTIETEEN OSA ALUEITA 8 TILASTOTIETEEN REUNA ALUEITA 9.. TILASTOTIETEEN SOVELLUSKOHTEET 9 TILASTOTIETEELLÄ ON MONTA NIMEÄ 0 TILASTOTIEDE JA TILASTOT 0 TILASTOTIEDE, TILASTOT JA YHTEISKUNTA ESIMERKKEJÄ TILASTOLLISISTA TUTKIMUSASETELMISTA. TILASTOLLISET AINEISTOT, NIIDEN KERÄÄMINEN JA MITTAAMINEN 5.. TILASTOLLISET AINEISTOT JA NIIDEN TODENNÄKÖISYYSMALLIT 6 TILASTOLLISET AINEISTOT 6 TILASTOLLISET TUTKIMUSASETELMAT 6 TILASTOLLISET MALLIT 6 TILASTOLLISTEN AINEISTOJEN KERÄÄMINEN 6.. TILASTOLLISET KOKEET 7 KOEASETELMAT 7 KONTROLLOIDUT KOKEET 7 KONTROLLOIDUT KOKEET: KOMMENTTEJA 8 SATUNNAISTAMINEN 8.3. SUORAT HAVAINNOT 9 SUORAT HAVAINNOT: KOMMENTTEJA 9.4. KOKONAISTUTKIMUS 9.5. OTANTATUTKIMUS 9 OTANTAMENETELMIÄ 0 YKSINKERTAINEN SATUNNAISOTANTA 0 SYSTEMAATTINEN OTANTA 0 OSITETTU OTANTA RYVÄSOTANTA MONIASTEINEN OTANTA.6. SATUNNAISTAMISEN MERKITYS TILASTOLLISTEN AINEISTOJEN KERÄÄMISESSÄ.7. MITTAAMINEN, MITTA ASTEIKOT JA TILASTOLLISET MUUTTUJAT MITTARIN VALIDITEETTI JA TARKKUUS MITTA ASTEIKOT KVALITATIIVISET JA KVANTITATIIVISET MUUTTUJAT 3 DISKREETIT JA JATKUVAT MUUTTUJAT 3 TILASTOLLISTEN MUUTTUJIEN MITTA ASTEIKOT JA TILASTOLLISET MENETELMÄT 3 3. TILASTOLLISTEN AINEISTOJEN KUVAAMINEN 4 Ilkka Melli (006) 3

4 Tilastolliset meetelmät Johdato 3.. TILASTOLLISET AINEISTOT HAVAINTOARVOJEN JAKAUMA 5 FREKVENSSIT JA FREKVENSSIEN JAKAUMA 6 PYLVÄSDIAGRAMMI 6 PYLVÄSDIAGRAMMIN PIIRTÄMINEN 6 LUOKKAFREKVENSSIT JA LUOKKAFREKVENSSIEN JAKAUMA 7 HISTOGRAMMI 8 HISTOGRAMMIN PIIRTÄMINEN 8 MITTA ASTEIKOT JA HAVAINTOARVOJEN JAKAUMAN KUVAAMINEN TUNNUSLUVUT 30 TUNNUSLUVUT JA MITTA ASTEIKOT SUHDEASTEIKOLLISTEN MUUTTUJIEN TUNNUSLUVUT 3 ARITMEETTINEN KESKIARVO 3 LUOKITELLUN AINEISTON ARITMEETTINEN KESKIARVO 3 ARITMEETTINEN KESKIARVO HAVAINTOARVOJEN JAKAUMAN KUVAAJANA 3 VARIANSSI 33 ARITMEETTISEN KESKIARVON JA VARIANSSI LASKEMINEN 34 KESKIHAJONTA 35 VARIANSSI JA KESKIHAJONTA HAVAINTOARVOJEN JAKAUMAN KUVAAJANA 36 STANDARDOINTI 36 TILASTOLLINEN ETÄISYYS 36 ORIGOMOMENTIT 36 KESKUSMOMENTIT 37 VINOUS 37 HUIPUKKUUS 38 HARMONINEN KESKIARVO 39 GEOMETRINEN KESKIARVO 40 ARITMEETTINEN, HARMONINEN JA GEOMETRINEN KESKIARVO JÄRJESTYSASTEIKOLLISTEN MUUTTUJIEN TUNNUSLUVUT 4 JÄRJESTYSTUNNUSLUVUT 4 MINIMI, MAKSIMI, VAIHTELUVÄLI 4 PROSENTTIPISTEET 4 MEDIAANI 4 MEDIAANI HAVAINTOARVOJEN JAKAUMAN KUVAAJANA 43 MEDIAANI, ARITMEETTINEN KESKIARVO JA VINOUS 43 LUOKITELLUN AINEISTON MEDIAANI 44 KVARTIILIT 45 KVARTIILIT, KVARTIILIVÄLI, KVARTIILIPOIKKEAMA 45 BOX WHISKER KUVIO LAATUEROASTEIKOLLISTEN MUUTTUJIEN TUNNUSLUVUT 47 FREKVENSSI 47 MOODI 47 LUOKITELLUN AINEISTON MOODI 47 MOODI HAVAINTOARVOJEN JAKAUMAN KUVAAJANA 48 MOODI, MEDIAANI, ARITMEETTINEN KESKIARVO JA VINOUS 48 Ilkka Melli (006) 4

5 Tilastolliset meetelmät.tilastotiede tieteealaa. Tilastotiede tieteealaa.. Mitä tilastotiede o?.. Tilastotietee sovelluskohteet Tässä luvussa yritämme vastata seuraavii kysymyksii: Mitä tilastotiede o ja mitä se ei ole? Mihi tilastotiedettä käytetää? Tilastotiede o yleie meetelmätiede, jota sovelletaa, jos reaalimaailma ilmiöstä halutaa tehdä johtopäätöksiä ilmiötä kuvaavie kvatitatiiviste tai umeeriste tietoje perusteella sellaisissa tilateissa, joissa tietoihi liittyy epävarmuutta tai satuaisuutta. Tilastototiede ei ole oppi tilastoista, vaikka iide meetelmie kostruoiti, joilla tilastoja tuotetaa, jalostetaa ja aalysoidaa oki keskeie osa tilastotiedettä. Tilastotiede ei ole myöskää matematiika osa alue, vaikka tilastotietee meetelmät ja mallit ovatki matemaattisia. Tilastotiede kehtitää matemaattisia malleja satuaisilmiöitä kuvaavia kvatitatiivisia tietoja geeroiville prosesseille. Koska tietoihi liittyy epävarmuutta tai satuaisuutta, tilastolliset mallit perustuvat todeäköisyyslasketaa. Tarkastelemme tässä luvussa myös tilastotietee sovelluskohteita sekä selveämme käsitteitä tilastotiede ja tilastot. Avaisaat: Arvota, Empiirie tutkimus, Epävarmuus, Havaitoaieisto, Johtopäätöste tekemie, Koe, Kuvaileva tilastotiede, Kvatitatiivie tieto, Kyselytutkimus, Laaduvalvota, Lääketieteellie koe, Matemaattie malli, Matematiikka, Meetelmätiede, Numeerie tieto, Otata, Päätökseteko, Reaalimaailma ilmiö, Satuaisilmiö, Satuaisuus, Soveltava tilastotiede, Teoreettie tilastotiede, Tieto, Tilasto, Tilastoala, Tilastollie aieisto, Tilastollie päättely, Tilastollie tutkimus, Tilastollie tutkimusasetelma, Tilastollie malli, Tilastollie meetelmä, Tilastotiede, Tilastotietee osaalue,tilastotietee reua alue, Tilastotoimi, Todeäköisyyslasketa, Tulosvaihtoehto, Tuusluku, Tutkimus, Tutkimusaieisto, Yhteiskuta Ilkka Melli (006) 5

6 Tilastolliset meetelmät.tilastotiede tieteealaa.. Mitä tilastotiede o? Mitä tilastotiede ei ole? Tieteeala määrittelemie o aia vaikeata. Esitämme kaike uhallaki esi pari egatiivista luoehditaa tilastotieteelle. Tilastotiede ei ole imestää huolimatta oppi tilastoista tai tilastoje tuotaosta! Mutta se sijaa o totta, että tilastoje tuotao, jalostukse ja aalysoii meetelmie kehittämie muodostaa keskeise osa tilastotiedettä. Tilastotiede ei ole myöskää matematiika osa alue! Mutta se sijaa o totta, että tilastotietee meetelmät ja mallit ovat matemaattisia ja perustuvat todeäköisyyslasketaa: Matematiikalla o tilastotieteessä välieellie rooli. Tilastotiede käyttää matematiika kieltä. Mitä tilastotiede o? Tehdää sitte muutama positiivie määrittely yritys: Tilastotiede o yleie meetelmätiede. Tilastotiede kehittää ja soveltaa meetelmiä ja malleja, joide avulla reaalimaailma ilmiöistä voidaa tehdä johtopäätöksiä ilmiöitä kuvaavie umeeriste tai kvatitatiiviste tietoje perusteella tilateissa, joissa tietoihi liittyy epävarmuutta ja satuaisuutta. Tilastolliste meetelmie avulla reaalimaailma ilmiöitä kuvaavat umeeriset tai kvatitatiiviset tiedot jalostetaa sellaisee muotoo, että ilmiöitä koskevat johtopäätökset tulevat mahdollisiksi. Tietoje jalostamie merkitsee tietoje tiivistämistä graafisiksi esityksiksi ja tuusluvuiksi sekä tilastolliste mallie raketamista tiedot geeroieille prosesseille tai mekaismeille. Tilastollisissa tutkimusasetelmissa reaalimaailma ilmiöitä kuvaavii umeerisii tai kvatitatiivisii tietoihi liittyy aia epävarmuutta ja satuaisuutta. Reaalimaailma ilmiötä kuvaavie tietoje tilastollie aalyysi perustuu siihe, että tietoihi liittyvä epävarmuude ja satuaisuude ajatellaa johtuva tiedot geeroieesta prosessista tai mekaismista. Epävarmuude ja satuaisuude geeroijaa voi olla ilmiö itse tai e voivat olla seurausta meetelmästä, jolla tutkimukse kohteet valitaa. Satuaisilmiöt ja todeäköisyyslasketa Reaalimaailma ilmiö o satuaisilmiö, jos seuraavat ehdot pätevät: Ilmiöllä o useita erilaisia tulosvaihtoehtoja. Sattuma määrää mikä tulosvaihtoehdoista toteutuu. (iii) Vaikka ilmiö tulos vaihtelee ilmiö toistuessa satuaisesti, ilmiö tulosvaihtoehtoje suhteelliste osuuksie jakauma käyttäytyy tilastollisesti stabiilisti, ku ilmiö toistokertoje lukumäärä kasvaa. Todeäköisyyslaskea tehtävää o tuottaa matemaattisia malleja satuaisilmiöissä havaittavalle tilastolliselle stabiliteetille. Todeäköisyyslasketaa käsitellää moisteessa Todeäköisyyslasketa. Ilkka Melli (006) 6

7 Tilastolliset meetelmät.tilastotiede tieteealaa Satuaisilmiöihi liittyy aia eustamattomuutta. Satuaisilmiö yksittäistä tulosta ei voida tietää etukätee. Satuaisilmiöihi o kuiteki liityttävä sääömukaisuutta, joka o tultava esille ilmiö toistuessa: Vaikka satuaisilmiö tulos vaihtelee satuaisesti ilmiö toistokerrasta toisee, ilmiö tulosvaihtoehtoje suhteelliste osuuksie jakauma o käyttäydyttävä stabiilisti, ku toistokertoje lukumäärä kasvaa. Esimerkki : Satuaisilmiöitä. Satuaisilmiöistä kohdataa esimerkkejä mitä moiaisimmilla alueilla: Kvattimekaiika ja hiukkasfysiika ilmiöt ovat perusluoteeltaa satuaisia. Luootieteellisii mittauksii liittyvie mittausvirheide sytymekaismit ovat (aiaki osittai) satuaisprosesseja. Uhkapeleissä kute arpajaisissa, lotossa, ruletissa, korttipeleissä ja oppapeleissä sattumalla o keskeie rooli. Periöllisyys oudattaa sattuma lakeja. Eliöide omiaisuuksie jakautumie populaatiossa o satuaista. Ihmiste, ihmisryhmie ja ihmiste muodostamie orgaisaatioide sosiaalisessa ja taloudellisessa käyttäytymisessä o moia satuaisia elemettejä. Tekiste prosessie tuloksie omiaisuudet jakautuvat satuaisesti. Tilastollise tutkimusaieisto keräämie satuaisilmiöä Voimme ajatella, että tilastollise tutkimukse kohteet o aia valittu arpomalla. Arvota o satuaisilmiö: Arvotaa liittyy aia eustamattomuutta, koska yksittäise arvoa tulosta ei voida tietää etukätee. Arvota oudattaa kuiteki todeäköisyyde lakeja. Koska arvoa tulos vaihtelee satuaisesti arvotakerrasta toisee, myös tutkimukse kohteita kuvaavat tiedot vaihtelevat satuaisesti arvotakerrasta toisee. Tutkimukse kohteita kuvaavie tietoje käyttäytymisessä havaitaa kuiteki arvotaa toistettaessa juuri sitä sääömukaisuutta, jota kutsutaa tilastolliseksi stabiliteetiksi. Tämä sääömukaisuus o tilastollise tutkimukse kohde. Esimerkki : Tilastolliste aieistoje keräämie arvotaa. Esimerkkejä tilastolliste aieistoje keräämise meetelmistä, jotka perustuvat arvotaa: Satuaistetut kokeet Satuaisotata Kokeellisessa tutkimuksessa tavoitteea o vertailla erilaiste käsittelyide vaikutuksia kokee kohteisii. Erilaiste virhelähteide kotrolloimiseksi käsittelyt o syytä arpoa kohteille. Otaalla tarkoitetaa laveasti tutkimusaieistoje keräämise meetelmiä. Erilaiste virhelähteide kotrolloimiseksi tutkimukse kohteet o syytä valita arpomalla. Ilkka Melli (006) 7

8 Tilastolliset meetelmät.tilastotiede tieteealaa Teoreettie ja soveltava tilastotiede Teoreettie tilastotiede kehittää matemaattisia malleja prosesseille, jotka geeroivat reaalimaailma ilmiöitä kuvaavia umeerisia tai kvatitatiivisia tietoja, joihi liittyy epävarmuutta ja satuaisuutta. Teoreettise tilastotietee kehittämät mallit perustuvat todeäköisyyslasketaa ja iitä kutsutaa tilastollisiksi malleiksi, stokastisiksi malleiksi tai todeäköisyysmalleiksi. Tilastolliste mallie avulla reaalimaailma ilmiöitä kuvaavii tietoihi liittyvät systemaattiset ja satuaiset piirteet voidaa erottaa ja kuvata. Soveltava tilastotiede soveltaa teoreettise tilastotietee kehittämiä matemaattisia malleja reaalimaailma ilmiöitä kuvaavie umeeriste tai kvatitatiiviste tietoje aalysoitii. Teoreettie ja soveltava tilastotiede kulkevat tilastollisessa tutkimuksessa käsi kädessä: Teoreettie tilastotiede kehittää tilastomatemaattisia malleja soveltava tilastotietee empiiriste ogelmie ratkaisemiseksi. Soveltava tilastotiede käyttää hyväksee teoreettise tilastotietee kehittämiä malleja. Kuvaileva tilastotiede ja tilastollie päättely Deskriptiivie eli kuvaileva tilastotiede kehittää ja soveltaa meetelmiä, joide avulla tutkimukse kohteea olevasta ilmiöstä kerättyjä umeerisia tai kvatitatiivisia tietoja voidaa kuvailla ja esitellä. Kuvaileva tilastotietee työkaluja: Tilastografiikka Tilastolliset tuusluvut Tilastolliset mallit Tilastollie iferessi eli päättely kehittää ja soveltaa meetelmiä, joide avulla tutkimukse kohteea olevasta ilmiöstä voidaa tehdä johtopäätöksiä ilmiöstä kerättyje umeeriste tai kvatitatiiviste tietoje perusteella. Tilastollise päättely työkaluja: Tilastolliset mallit Tilastollie testaus Kuvaileva tilastotiede ja tilastollie päättely kulkevat tilastollisessa tutkimuksessa käsi kädessä. Tilastotietee osa alueita Tilastotiede jakautuu moii osa alueisii. Osa alueita o ii paljo, että ammattitilastotieteilijäkää ei voi hallita iitä kaikkia. Esimerkki 3: Tilastotietee osa alueita. Aikasarja aalyysi, Bayeslaiset meetelmät, Biometria, Demometria, Ei parametriset meetelmät (), Ekoometria, Estimoiti (), Kemometria, Koesuuittelu, Kuvaileva tilastotiede (), Laaduvalvota, Lieaariset mallit (), Matemaattie tilastotiede, Moimuuttujameetelmät, Otatateoria, Regressioaalyysi (), Robustit meetelmät, Spatiaaliset meetelmät, Testaus (), Tilastografiikka (), Tilastollie päättely (), Tilastollie tietojekäsittely, Variassiaalyysi () Ilkka Melli (006) 8

9 Tilastolliset meetelmät.tilastotiede tieteealaa () Tässä moisteessa käsiteltäviä aiheita. Tilastotietee reua alueita Moet tieteealat ovat rikastaeet tilastotiedettä ja/tai iissä sovelletaa rutiiiomaisesti tilastollisia meetelmiä. Esimerkki 4: Tilastotietee reua alueita. Fiassimatematiikka, Hahmotuistus, Hermoverkot, Kaaosteoria, Katastrofiteoria, Kuvakäsittely, Kyberetiikka, Operaatioaalyysi, Peliteoria, Päätösteoria, Riskiteoria, Sigaalikäsittely, Stokastiset prosessit, Todeäköisyyslasketa, Tulevaisuudetutkimus, Vakuutusmatematiikka.. Tilastotietee sovelluskohteet Tilastotiedettä voidaa yleiseä meetelmätieteeä soveltaa ja myös pitäisi soveltaa kaikkialla, missä tuotetaa reaalimaailmaa ja se ilmiöitä kuvaavaa umeerista tai kvatitatiivista tietoa. Tilastollisia meetelmiä voidaa soveltaa tietoje keruu, jalostukse ja aalysoii jokaisessa vaiheessa. Tilastollisia meetelmiä sovellettaessa päämäärää o jalostaa tiedot muotoo, joka mahdollistaa reaalimaailmaa ja se ilmiöitä koskevie johtopäätöste tekemise. Tilastotiedettä voidaa yleiseä meetelmätieteeä soveltaa kaikissa tieteissä, joide tutkimusaieistot voidaa esittää umeerisessa tai kvatitatiivisessa muodossa. Jokaie tiede, joka tutkimusaieistot voidaa esittää umeerisessa tai kvatitatiivisessa muodossa voi soveltaa / voisi soveltaa / pitäisi soveltaa tilastollisia meetelmiä sekä tutkimusaieistoja kerättäessä että iitä aalysoitaessa. Site jokaie empiirise tutkimukse havaitoaieisto o tilastollise tutkimukse mahdollie kohde. Esimerkki : Tilastotietee sovelluskohteita eri tieteealoilla. Biotieteet: Biokemia, Biologia, Ekologia, Eläilääketiede, Eläitiede, Farmakologia, Kasvitiede, Lääketiede, Periöllisyystiede Ihmistieteet: Arkeologia, Kielitiede, Psykologia Luootieteet: Fysiikka, Kemia, Tähtitiede Maatalous ja metsätieteet: Kasviviljelytiede, Kotieläite jalostustiede, Metsäarvioititiede, Metsäviljelytiede Tekiset tieteet: Hahmotuistus, Kalibroiti, Koesuuittelu, Kuvakäsittely, Laaduvalvota, Laskeallie tekiikka, Lääketieteellie tekiikka, Neuroverkot, Päätöksetekomeetelmät, Prosessivalvota, Sigaalikäsittely, Spektroskopia, Tietoliikeetekiikka Yhteiskutatieteet: Sosiaalitieteet, Taloustiede Ilkka Melli (006) 9

10 Tilastolliset meetelmät.tilastotiede tieteealaa Esimerkki : Tilastotietee eksoottisia sovelluksia: Dedrokroologia. Arkeologiassa puuesieide ajoituksessa voidaa käyttää apua mm. puide vuosilustoje muodostamia aikasarjoja. Myös ilmastomuutoksie tutkimuksessa voidaa käyttää apua puide vuosilustoje muodostamia aikasarjoja. Kummassaki esimerkissä puide vuosilustosarjoje aalysoiissa voidaa soveltaa dedrokroologiaksi kutsuttua tilastolliste meetelmie kokoaisuutta. Dedrokroologia meetelmät ovat läheistä sukua tilastollise aikasarja aalyysi meetelmille. Esimerkki 3: Tilastotietee eksoottisia sovelluksia: Tietokoetomografia. Lääketieteellisissä tutkimuksissa käytetää (esim. syöpäkasvaimia etsittäessä) apua tietokoetomografiaa eli viipalekuvausta. Siiä ihmise kudoksista tai elimistä tuotetaa s. viipalekuvia laitteella, joka mittaa sähkömageettise tai hiukkassäteily muuttumista säteily kulkiessa kudoste tai elite läpi. Kuvaa muodostavaa laitteesee o ohjelmoitu algoritmi, joka ratkaisee iversioogelmaksi kutsutu matemaattise ogelma. Iversio ogelma ratkaisumeetelmät voidaa luotevimmi tulkita bayeslaiste tilastolliste meetelmie muodostamassa kehikossa. Tilastotieteellä o mota imeä Tilastotieteestä käytetää moessa tieteessä omaa erityistä imeä. Esimerkki 4: Tilastotietee imiä eri tieteealoilla. Biometria tai Biostatistiikka = Bio ja lääketieteide tilastotiede Demometria Ekoometria Epidemiologia Kemometria Tilastotiede ja tilastot = Väestötiede = Taloustietee tilastotiede = Tautie leviämismekaismeja koskeva lääketietee osa alue = Kemia tilastotiede Saa tilasto tuo useimmille esimmäiseä mielee yhteiskutaa ja se toimitaa kuvaavat umeeriste tietoje järjestelmälliset kokoelmat. Yhteiskutaa ja se toimitaa kuvaavie tilastoje tuotaossa ja aalysoiissa tarvittavie meetelmie kehittämie o keskeie osa tilastotiedettä, mutta o syytä huomata, että tilastotietee sovellusalue o paljo tätä laajempi. Tilastotietee kaalta mikä tahasa reaalimaailma ilmiötä kuvaava umeeriste tai kvatitatiiviste tietoje järjestelmällie kokoelma muodostaa tilastollise aieisto ja site tilastollise tutkimukse mahdollise kohtee. Esimerkiksi kaikki empiirise tai kvatitatiivise tutkimukse tutkimus tai havaitoaieistot ovat tilastotietee kaalta tilastollisia aieistoja. Termiologiaa: Tilastoala = Tilastotiede + Tilastotoimi Tilastotiede = Teoreettie tilastotiede + Soveltava tilastotiede Tilastotoimi = Tilastoje tuotato + Tilastoje hyödytämie Ilkka Melli (006) 0

11 Tilastolliset meetelmät.tilastotiede tieteealaa Tilastotiede, tilastot ja yhteiskuta Ihmie ei voi toimia maailmassa järkevästi, ellei hä pysty muodostamaa oikeata kuvaa maailmasta ja se tilasta. Nykyaikaa oikeata kuvaa varte tarvitaa maailmaa ja se tilaa merkityksellisesti ja oikei kuvaavia, ajatasaisia (tilasto ) tietoja. Merkityksellisesti ja oikei todellisuutta kuvaavat, ajatasaiset (tilasto ) tiedot ovat välttämättömiä moderi yhteiskua toimialle ja iide saatavuutta voidaa pitää jopa toimiva demokratia edellytykseä. Yhteiskua kaikilla sektoreilla toimia seurata, päätökseteko ja eakoiti perustuvat sekä yhteiskua eri sektoreita kuvaavii (tilasto ) tietoihi että tilastollisii meetelmii. Päätökseteko sekä julkisella että yksityisellä sektorilla (elikeioelämässä) perustuu hyvi pitkälti yhteiskutaa ja elikeioelämää kuvaavii (tilasto ) tietoihi ja tilastollisii meetelmii. Esimerkiksi tuotatoprosessie ohjaus ja laaduvalvota teollisuudessa sekä markkiatutkimus kaupa alalla perustuvat tilastollisii meetelmii. Koska todellisuutta kuvaavii (tilasto ) tietoihi sisältyy (lähes) aia epävarmuutta ja satuaisuutta, tilastotiede ja tilastolliset meetelmät luovat perusta tilastoje tuotaolle, jalostukselle ja aalysoiille. Niipä tilastoje tuotao, jalostukse ja aalysoii meetelmie kehittämie o keskeie osa tilastotietee tehtäväkettää. Esimerkkejä tilastollisista tutkimusasetelmista Esimerkki 5: Kyselytutkimukset. Päätöksetekijät ja tiedotusvälieet kartoittavat sääöllisie välei suomalaiste mielipiteet erilaisista yhteiskutaa koskevista kysymyksistä. Esimerkkejä: Mite suomalaiset suhtautuvat mahdollisee NATO jäseyytee? Mite suomalaiset suhtautuvat ydivoima lisäraketamisee? Mitkä ovat poliittiste puolueide kaatusosuudet? Mielipiteet selvitetää kyselytutkimuksilla, joide kohteeksi poimitaa tyypillisesti suomalaista. Kyselytutkimukse tavoitteea o tehdä kysely tuloste perusteella johtopäätöksiä mielipiteide jakautumisesta kaikkie suomalaiste joukossa. Mite suomalaisee kohdistetu kysely tulokset voidaa yleistää koskemaa kaikkia suomalaisia? Kysely tulokset voidaa yleistää, jos kysely kohteiksi poimittuje suomalaiste joukko muodostaa edustava pieoiskuva Suome kasasta. Pieoiskuva o edustava, jos mielipiteet jakautuvat kysely kohteiksi poimittuje joukossa samalla tavalla kui kaikkie suomalaiste muodostamassa perusjoukossa. Kysely kohteide poimita arpomalla o aioa meetelmä, joka mahdollistaa edustava pieoiskuva saamise. Kysely kohteide poimitaa kaikkie suomalaiste muodostamasta perusjoukosta arpomalla kutsutaa tilastotieteessä (satuais ) otaaksi ja tutkimukse kohteeksi poimittua perusjouko osaa kutsutaa (satuais ) otokseksi. Arvoa käyttö kysely kohteide poimiassa merkitsee sitä, että kysely tulokset ovat satuaisia seuraavassa mielessä: Jos arvotaa toistettaisii, kysely tuottaisi (suurella tode Ilkka Melli (006)

12 Tilastolliset meetelmät.tilastotiede tieteealaa äköisyydellä) joka kerra (aiaki joki verra) erilaiset tulokset, koska eri arvooissa kyselyy poimittaisii (suurella todeäköisyydellä) eri hekilöt. Kysymyksiä: Mite yhdestä otoksesta saadut ja satuaiset kyselytulokset voidaa yleistää koskemaa koko sitä perusjoukkoa, josta otos poimitaa? Mite luotettava tällaie yleistys o? Vastauksia: Jos kysely kohteide poimiassa o käytetty satuaisotataa, kysely tuloksii sisältyvälle epävarmuudelle ja satuaisuudelle voidaa muodostaa tilastollie malli, joka mahdollistaa sekä kysely tuloste yleistämise että yleistykse luotettavuude arvioimise. Yleistykse luotettavuutta ei pystytä arvioimaa, ellei otokse poimiassa ole käytetty satuaisotataa. Kyselytutkimuste suuittelussa, toteutuksessa ja tuloste aalysoiissa sovelletaa mm. seuraavia tilastollisia meetelmiä: otata, estimoiti ja testaus. Esimerkki 6: Lääketieteelliset kokeet. Erää tappava taudi hoitoo o kehitetty uusi lääke, joka toivotaa paratava eemmä potilaita kui kaua käytössä ollut vaha lääke. Mite saadaa varmuus siitä, että uusi lääke o parempi kui vaha lääke? Paraemistuloste vertailemiseksi järjestetää tilastollie koe: Jaetaa joukko potilaita arpomalla kahtee ryhmää: Ryhmälle aetaa uutta lääkettä. Ryhmälle aetaa vahaa lääkettä. Verrataa paratueide suhteellisia osuuksia ryhmissä ja. Kokee tavoitteea o tehdä kokee tuloste perusteella yleisiä johtopäätöksiä uude lääkkee tehokkuudesta. Mite yhdestä kokeesta saadut tulokset voidaa yleistää koskemaa kaikkia tautia sairastavia potilaita? Kokee tulokset voidaa yleistää, jos kokeessa uutta ja vahaa lääkettä saavie potilaide ryhmät ovat samakaltaisia kaikissa muissa suhteissa paitsi siiä, että iihi kohdistetaa kokeessa erilaie käsittely. Tällöi mahdolliset erot paratueide suhteellisissa osuuksissa o oltava seurausta erilaisista käsittelyistä. Kokee kohteide jakamie ryhmii arpomalla o aioa meetelmä, joka mahdollistaa samakaltaiste ryhmie saamise. Kokee kohteide jakamista erilaise käsittely kohteiksi joutuvii ryhmii arpomalla kutsutaa tilastotieteessä satuaistamiseksi. Arvoa käyttö ryhmii jaossa merkitsee sitä, että koetulokset ovat satuaisia seuraavassa mielessä: Jos arvotaa toistettaisii, kokeesta saataisii (suurella todeäköisyydellä) joka Ilkka Melli (006)

13 Tilastolliset meetelmät.tilastotiede tieteealaa kerra (aiaki joki verra) erilaiset tulokset, koska eri arvooissa saataisii (suurella todeäköisyydellä) erilaiset ryhmäjaot. Kysymyksiä: Mite yhdestä kokeesta saadut ja satuaiset koetulokset voidaa yleistää koskemaa kaikkia ko. tautia sairastavia potilaita? Mite luotettava tällaie yleistys o? Vastauksia: Jos potilaide jaossa ryhmii o käytetty satuaistamista, kokee tuloksii sisältyvälle epävarmuudelle ja satuaisuudelle voidaa muodostaa tilastollie malli, joka mahdollistaa sekä koetuloste yleistämise että yleistykse luotettavuude arvioimise. Yleistykse luotettavuutta ei pystytä arvioimaa, ellei ryhmii jaossa ole käytetty satuaistamista. Tilastollise kokee suuittelussa, toteutuksessa ja tuloste aalysoiissa sovelletaa mm. seuraavia tilastollisia meetelmiä: koesuuittelu, estimoiti ja testaus. Esimerkki 7: Laaduvalvota. Tehdas valmistaa korkealuokkaisia sulkimia kameroihi. Tehdas pyrkii siihe, että yli 90 % sulkimista kestää vähitää kamera laukaisua. Sulkimie laadu valvota o toteutettu seuraavalla tavalla: Tuotatolijalta poimitaa arpomalla joukko sulkimia rasituskokeesee. Rasituskokeessa määrätää vähitää laukaisua kestävie sulkimie suhteellie osuus. Kokee tavoitteea o tehdä kokee tuloste perusteella yleisiä johtopäätöksiä sulkimie kestävyydestä. Mite vai osaa sulkimista kohdistetu rasituskokee tulokset voidaa yleistää koskemaa kaikkia sulkimia? Kokee tulokset voidaa yleistää, jos rasituskokee kohteiksi poimittuje sulkimie joukko muodostaa edustava pieoiskuva kaikista valmistetuista sulkimista. Pieoiskuva o edustava, jos sulkimie kesto jakautuu rasituskokeesee poimittuje sulkimie joukossa samalla tavalla kui kaikkie valmistettuje sulkimie muodostamassa perusjoukossa. Rasituskokee kohteide poimita arpomalla o aioa meetelmä, joka mahdollistaa edustava pieoiskuva saamise. Rasituskokee kohteide poimitaa kaikkie valmistettuje sulkimie muodostamasta perusjoukosta arpomalla kutsutaa tilastotieteessä (satuais ) otaaksi ja tutkimukse kohteeksi poimittua perusjouko osaa kutsutaa (satuais ) otokseksi. Arvoa käyttö rasituskokee kohteide poimiassa merkitsee sitä, että koetulokset ovat satuaisia seuraavassa mielessä: Jos arvotaa toistettaisii, kokeesta saataisii (suurella todeäköisyydellä) joka kerra (aiaki joki verra) erilaiset tulokset, koska eri arvooissa kokeesee poimittaisii (suurella todeäköisyydellä) eri sulkimet. Ilkka Melli (006) 3

14 Tilastolliset meetelmät.tilastotiede tieteealaa Kysymyksiä: Mite yhdestä kokeesta saadut ja satuaiset koetulokset voidaa yleistää koskemaa kaikkia sulkimia? Mite luotettava tällaie yleistys o? Vastauksia: Jos rasituskokee kohteide poimiassa o käytetty satuaisotataa, kokee tuloksii sisältyvälle epävarmuudelle ja satuaisuudelle voidaa muodostaa tilastollie malli, joka mahdollistaa sekä koetuloste yleistämise että yleistykse luotettavuude arvioimise. Yleistykse luotettavuutta ei pystytä arvioimaa, ellei kokee kohteide poimiassa ole käytetty satuaisotataa. Kokee suuittelussa, toteutuksessa ja tuloste aalysoiissa sovelletaa mm. seuraavia tilastollisia meetelmiä: koesuuittelu, otata, estimoiti ja testaus. Ilkka Melli (006) 4

15 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie. Tilastolliset aieistot, iide keräämie ja mittaamie.. Tilastolliset aieistot ja iide todeäköisyysmallit.. Tilastolliset kokeet.3. Suorat havaiot.4. Kokoaistutkimus.5. Otatatutkimus.6. Satuaistamise merkitys.7. Mittaamie, mitta asteikot ja tilastolliset muuttujat Tarkastelemme tässä luvussa tilastollisia aieistoja sekä iide keräämistä. Tilastollie aieisto koostuu tutkimukse kohteita ja iide olosuhteita kuvaavie muuttujie havaituista arvoista. Tilastollie aieisto voi sytyä tilastollise kokee tuloksea tai se voi olla peräisi suorista havaioista. Tutkimusta kutsutaa kokoaistutkimukseksi, jos tutkimukse kohteeksi otetaa kaikki tutkimukse mahdolliset kohteet. Otatatutkimuksessa tutkimukse kohteiksi poimitaa mahdollisimma edustava osa tutkimukse mahdolliste kohteide joukosta. Tilastolliste aieistoja kerättäessä tutkimukse kohteet pitää poimia satuaisesti eli kohteet o arvottava kaikkie mahdolliste kohteide joukosta. Se, että tutkimukse kohteet arvotaa, mahdollistaa tilastolliste, so. todeäköisyyslasketaa perustuvie matemaattiste mallie soveltamise tilastollisii aieistoihi. Tilastollie aieisto kerätää mittaamalla tutkimukse kohteide omiaisuudet. Mittaustapahtumassa kohteide omiaisuuksia vastaaville tilastollisille muuttujille aetaa iide arvot. Tilastolliste muuttujie mitta asteikollisilla omiaisuuksilla o syvällie vaikutus tutkimusogelma ratkaisemisee valittavaa tekiikkaa. Avaisaat: Biomijakauma, Diskreetti muuttuja, Havaito, Havaitoarvo, Havaitoyksikkö, Hypergeometrie jakauma, Itervalliasteikko, Jatkuva muuttuja, Järjestysasteikko, Koe, Kokoaistutkimus, Kotrolloitu koe, Kvalitatiivie muuttuja, Kvatitatiivie muuttuja, Laatueroasteikko, Mittaamie, Mittaasteikko, Mittari, Moiasteie otata, Nomiaaliasteikko, Ordiaaliasteikko, Ositettu otata, Otata, Otatameetelmä, Otata palauttae, Otata palauttamatta, Otatatutkimus, Perusjoukko, Reliabiliteetti, Ryväsotata, Satuaisotata, Satuaistamie, Suhdeasteikko, Suora havaito, Tarkkuus, Tilastollie aieisto, Tilastollie koe, Tilastollie meetelmä, Tilastollise aieisto keräämie, Validiteetti, Välimatka asteikko, Yksikertaie satuaisotata Ilkka Melli (006) 5

16 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie.. Tilastolliset aieistot ja iide todeäköisyysmallit Tilastolliset aieistot Tilastollise tutkimukse kaikki mahdolliset kohteet muodostavat tutkimukse (kohde ) perusjouko. Tutkimukse kohteita tarkastellaa aia joki perusjouko muodostamassa kehikossa. Tutkimukse kohteiksi valittuja perusjouko alkioita kutsutaa havaitoyksiköiksi. Tilastollie aieisto koostuu havaitoyksiköide omiaisuuksia ja olosuhteita kuvaavista umeerisista tai kvatitatiivisista tiedoista. Havaitoyksiköitä koskevia umeerisia tai kvatitatiivisia tietoja kutsutaa havaitoarvoiksi tai havaioiksi. Tilastolliset tutkimusasetelmat Tilastollisissa tutkimusasetelmissa havaitoarvoihi liittyy aia epävarmuutta ja satuaisuutta. Seurauksia: Tilastollisissa tutkimusasetelmissa ajatellaa, että havaitoarvot o geeroiut ilmiö, joka o luoteeltaa satuaie. Tilastollise tutkimukse kohteita kuvaavat muuttujat tulkitaa tilastollisissa tutkimusasetelmissa satuaismuuttujiksi ja havaitoarvot tulkitaa äide satuaismuuttujie realisoitueiksi arvoiksi. Tilastolliset mallit Tilastollisella mallilla tarkoitetaa tutkimukse kohteita kuvaavie satuaismuuttujie todeäköisyysjakaumaa, joka ajatellaa geeroiee ko. satuaismuuttujie havaitut arvot. Voimme myös ajatella, että havaitoarvot ovat sytyeet arpomalla tilastollisea mallia käytetystä todeäköisyysjakaumasta saatavi todeäköisyyksi. Huomautus: Todeäköisyysjakaumat riippuvat tavallisesti parametreista eli vakioista, joide arvoja ei yleesä tueta. Ku tilastollista mallia sovelletaa jotaki reaalimaailma ilmiötä kuvaava havaitoaieisto aalysoitii, kohdataa tavallisesti seuraavat malli parametreja koskevat ogelmat: Parametrie arvoja ei tueta ja e o estimoitava eli arvioitava havaitoaieistosta. Estimoitia käsitellää luvuissa Estimoiti, Estimoitimeetelmät ja Väliestimoiti. Parametrie arvoista o esitetty oletuksia tai väitteitä, joita halutaa testata eli asettaa koetteelle havaitoaieistosta saatua iformaatiota vastaa. Testausta käsitellää luvuissa Tilastollie testaus, Testit suhdeasteikollisille muuttujille, Testit järjestysasteikollisille muuttujille, Testit laatueroasteikollisille muuttujille, Yhteesopivuude, homogeeisuude ja riippuvuude testaamie. Tilastolliste mallie parametrie estimoiti ja testaus muodostavat keskeise osa tilastollista päättelyä. Tilastolliste aieistoje keräämie Muutetaako tutkimuksessa tutkimukse kohteide olosuhteita aktiivisesti? Ilkka Melli (006) 6

17 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie Tutkimus o koe, jos tutkimukse tavoitteea o selvittää, mite kohteide olosuhteide aktiivie muuttamie vaikuttaa tutkimukse kohteisii. Tutkimus perustuu suorii havaitoihi, jos tutkimukse tavoitteea o vai seurata, mite kohteide olosuhteet ja iissä tapahtuvat muutokset vaikuttavat kohteisii. Kohdistuuko tutkimus kaikkii perusjouko alkioihi vai johoki perusjouko osaa? Tutkimusta kutsutaa kokoaistutkimukseksi, jos kaikki perusjouko alkiot tutkitaa. Tutkimusta kutsutaa otatatutkimukseksi, jos tutkimus kohdistuu johoki perusjouko osajoukkoo... Tilastolliset kokeet Kokeellise tutkimukse tavoitteea o selvittää, millaisia vaikutuksia erilaisilla käsittelyillä o kohteisii. Käsittelyllä tarkoitetaa tutkimukse kohteide olosuhteide aktiivista, suuitelmallista ja järjestelmällistä muuttamista. Tiukasti ottae vai kokeide perusteella voidaa tehdä kausaalisia eli syy yhteyksiä koskevia päätelmiä. Huomautus: Tutkimus perustuu suorii havaitoihi, jos tutkimukse kohteide olosuhteita ei muuteta aktiivisesti; ks. kappaletta Suorat havaiot. Koeasetelmat Koeasetelmalla tarkoitetaa kokee tekemisee liittyviä periaatteita ja säätöjä: (iii) Mitä käsittelyitä kokee kohteisii sovelletaa? Mite kokee kohteet valitaa? Mikä o tehtävie koetoistoje lukumäärä? Kotrolloidut kokeet Kokeesta voidaa tehdä luotettavia johtopäätöksiä vai, jos koe o kotrolloitu: Koetuloksii vaikuttavie ulkopuoliste sekoittavie tekijöide kotrolloimiseksi kokeessa o vertailtava vähitää kahde erilaise käsittely vaikutuksia. Erilaiste käsittelyide kohteiksi valittavie perusjouko alkioide väliste systemaattiste eroje kotrolloimiseksi käsittelyide kohdistamisessa o käytettävä satuaistusta. (iii) Koetuloksii liittyvä satuaisvaihtelu kotrolloimiseksi kokeessa o tehtävä riittävästi koetoistoja. Kutsumme kotrolloituja kokeita tavallisesti tilastollisiksi kokeiksi. Huomautus: Tilastolliste kokeide suuittelua ja aalysoitia käsitellää moisteessa Koesuuittelu ja tilastolliset mallit. Esimerkki : Yksikertaie kotrolloitu koe. Ehkä yksikertaisi mahdollie kotrolloidu kokee asetelma o seuraava: () Jaetaa kokee kohteet satuaisesti kahtee ryhmää. Ilkka Melli (006) 7

18 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie () Kohdistetaa ryhmii erilaiset käsittelyt. (3) Vertaillaa käsittelyide vaikutuksia. Ryhmä Käsittely Satuaistus Vertailu Ryhmä Käsittely Kotrolloidut kokeet: Kommetteja Oletetaa, että koe o kotrolloitu eli kokeessa o sovellettu suuitelmallisesti ja järjestelmällisesti vertailua, satuaistusta ja koetoistoja. Tällöi: Koetuloksie aalysoiti tilastotietee keioi o mahdollista. Koetuloksii liittyvät systemaattiset ja satuaiset tekijät voidaa erottaa ja kuvata ja kuvaukse luotettavuus voidaa arvioida. (iii) Käsittelyide vaikutuksista kokee kohteisii voidaa tehdä luotettavia johtopäätöksiä. Oletetaa, että koe ei ole kotrolloitu eli kokeessa ei ole käytetty suuitelmallisesti ja järjestelmällisesti vertailua, satuaistusta ja koetoistoja. Tällöi: Koetuloksie aalysoiti tilastotietee keioi ei ole mahdollista. Koetuloksii liittyviä systemaattisia ja satuaisia tekijöitä ei voida erottaa ja kuvata ja kuvaukse luotettavuutta ei voida arvioida. (iii) Käsittelyide vaikutuksista kokee kohteisii ei voida tehdä luotettavia johtopäätöksiä. Jos koe ei ole kotrolloitu, koeasetelma saattaa systemaattisesti suosia joitaki tulosvaihtoehtoja. Jos koeasetelma suosii systemaattisesti joitaki tulosvaihtoehtoja, asetelmaa saotaa harhaiseksi. Harhaiste koeasetelmie perusteella ei voida tehdä luotettavia johtopäätöksiä. Satuaistamie Kokee satuaistamise tarkoittaa sitä, että käsittelyide kohdistamisessa käytetää arvotaa. Arvota o aioa puolueeto tapa kohdistaa käsittelyitä, koska arpomie ei suosi mitää perusjouko osaa. Se, että satuaistettuje kokeide tuloste aalysoitii voidaa soveltaa tilastollisia meetelmiä perustuu siihe, että arvoassa oudatetaa todeäköisyyslaskea lakeja. Satuaistus takaa suurella varmuudella se, että kokeessa erilaiste käsittelyide kohteiksi joutuvat perusjouko osajoukot ovat ee käsittelyide soveltamista omiaisuuksiltaa samakaltaisia. Juuri se takia kokee tuloksista voidaa tehdä kausaalipäätelmiä: Jos koe o satuaistettu, kokee tuloksissa havaitut systemaattiste eroje o johduttava erilaisista käsittelyistä. Ilkka Melli (006) 8

19 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie.3. Suorat havaiot Suorii havaitoihi perustuvassa tutkimuksessa tavoitteea o saada selville tutkimukse kohteide olosuhteisii puuttumatta, mitä vaikutuksia kohteide olosuhteilla ja iissä tapahtuvilla muutoksilla o kohteisii. O syytä huomata, että tiukasti ottae suorii havaitoihi perustuvie tutkimuste perusteella ei voida tehdä kausaalisia eli syy yhteyksiä koskevia johtopäätöksiä. Huomautus: Tutkimus o koe, jos kohteide olosuhteita muutetaa tutkimuksessa aktiivisesti; ks. kappaletta Tilastolliset kokeet. Suorat havaiot: Kommetteja Suoria havaitoja tehtäessä havaitoje tulokset saattavat olla harhaisia. Havaitoje tulokset ovat harhaisia, jos havaitoja tehtäessä suositaa systemaattisesti joitaki tulosvaihtoehtoja. Harhaiste havaitotuloste perusteella ei voida tehdä luotettavia johtopäätöksiä. Harha sytymie saatetaa pystyä välttämää havaitoja tehtäessä, jos havaitoje kohteet valitaa perusjoukosta satuaisesti (ellei tavoitteea ole tutkia kaikkia perusjouko alkioita). Tämä merkitsee satuaisotaa soveltamista havaitoje kohteide valitaa; ks. kappaletta Satuaisotata..4. Kokoaistutkimus Tutkimus o kokoaistutkimus, jos se kohdistuu kaikkii (kohde ) perusjouko alkioihi. Huomautuksia: Kokoaistutkimukse tekemie o vai harvoi mahdollista. Jos perusjoukko o ääretö, kokoaistutkimukse tekemie o jopa periaatteessa mahdotota. Äärellisee perusjoukkoo kohdistuvat kokoaistutkimukset voidaa tulkita otatatutkimuksiksi: Tällöi tutkimukse kohteea oleva äärellie perusjoukko tulkitaa otokseksi hypoteettisesta äärettömästä perusjoukosta..5. Otatatutkimus Tutkimus o otatatutkimus, jos se kohdistuu johoki perusjouko osajoukkoo. Otatatutkimuksessa perusjouko osajoukosta tehdyt johtopäätökset pyritää yleistämää koko perusjoukkoo. Tutkimukse kohteeksi valittua perusjouko osajoukkoa kutsutaa otokseksi. Otokse valitsemista eli poimimista kutsutaa otaaksi. Otokse poimiassa käytettyjä meetelmiä kutsutaa otatameetelmiksi. Perusjoukosta voidaa tehdä luotettavia johtopäätöksiä otokse perustella vai, jos otos muodostaa perusjouko edustava pieoiskuva. Otokse poimimie perusjoukosta satuaisesti takaa suurella todeäköisyydellä se, että otos muodostaa perusjouko edustava pieoiskuva. Otokse poimita satuaisesti merkitsee otoksee poimittavie havaitoyksiköide arpomista perusjouko alkioide joukosta. Arvota o aioa puolueeto tapa poimia otos, koska arpomie ei suosi mitää perusjouko osaa. Arvoassa oudatetaa todeäköisyyslaskea lakeja. Ilkka Melli (006) 9

20 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie Otatameetelmiä Tilastollisessa tutkimuksessa sovelletaa tutkimusasetelmasta riippue erilaisia otatameetelmiä. Otaa perusmuoto: Yksikertaie satuaisotata Muita otatameetelmiä: Systemaattie otata Ositettu otata Ryväsotata Moiasteie otata Yksikertaie satuaisotata Yksikertaie satuaisotata o otaa perusmuoto, jossa jokaisella perusjouko alkiolla o yhtä suuri todeäköisyys tulla valituksi otoksee. Jos otos poimitaa yksikertaisella satuaisotaalla, myös jokaisella perusjouko samakokoisella osajoukolla o sama todeäköisyys tulla valituksi otokseksi. Yksikertaie satuaisotata voidaa aia tulkita arvoaksi, joka o toteutettu seuraavalla tavalla: Alkiot arvotaa perusjoukosta otoksee yksi alkio kerrallaa. Perusjoukkoo kuuluvilla alkioilla o jokaisessa arvoassa yhtä suuri todeäköisyys tulla valituksi otoksee. Yksikertaise satuaisotaa perusmuodossa alkiot poimitaa perusjoukosta otoksee palauttae: Poimittu alkio palautetaa aia ee uude alkio arpomista takaisi perusjoukkoo, jolloi sama alkio voi tulla poimituksi otoksee useita kertoja. Otaassa palauttae arvoat ovat riippumattomia: Alkio todeäköisyys tulla poimituksi otoksee ei riipu siitä mitä alkiota otoksee o jo poimittu. Otataa palauttae liittyviä todeäköisyyksiä hallitaa biomijakauma avulla; ks. moistee Todeäköisyyslasketa lukua Diskreettejä jakaumia. Yksikertaiseksi satuaisotaaksi kutsutaa tavallisesti myös meetelmää, jossa alkiot poimitaa perusjoukosta otoksee palauttamatta: Poimittua alkiota ei palauteta ee uude alkio arpomista takaisi perusjoukkoo, jolloi smam alkio ei voi tulla poimituksi otoksee kui kerra. Otaassa palauttamatta arvoat eivät ole riippumattomia: Alkio todeäköisyys tulla poimituksi otoksee muuttuu arvoa edistyessä. Otataa palauttamatta liittyviä todeäköisyyksiä hallitaa hypergeometrise jakauma avulla; ks. moistee Todeäköisyyslasketa lukua Diskreettejä jakaumia. Systemaattie otata Systemaattisessa otaassa otoksee poimitaa joka k. alkio perusjouko alkioide järjestetystä joosta. Systemaattista otataa sovelletaa usei yksikertaise satuaisotaa sijasta, jos perusjouko alkioista o käytettävissä tietorekisteri tai luettelo tai havaitoja kerätää ajassa tai tilassa. Huomautuksia: Systemaattie otata ei tiukasti ottae kuulu satuaisotaa meetelmii, koska siiä ei sovelleta arvotaa. Ilkka Melli (006) 0

21 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie Systemaattie otata tuottaa kuiteki täysi samat tulokset kui yksikertaie satuaisotata, jos perusjouko alkioide järjestys o tutkittava ilmiö kaalta satuaie. Ositettu otata Ositettua otataa voidaa soveltaa tilateissa, joissa perusjoukko koostuu joki perusjouko alkioide omiaisuude suhtee homogeeisista ryhmistä. Tällöi otos kerätää site, että jokaisesta ryhmästä eli ositteesta poimitaa osaotos, jotka yhdistetää yhdeksi otokseksi. Esimerkki : Edustavuude takaamie ositetulla otaalla. Oletetaa, että maassa o useita erikokoisia kieliryhmiä ja tavoitteea o vertailla eri kieliryhmii kuuluvie taloudellista asemaa. Jokaisesta ryhmästä saadaa otoksee riittävä edustus poimimalla jokaisesta ryhmästä samakokoie osaotos. Ryväsotata Ryväsotataa voidaa soveltaa tilateissa, joissa perusjoukko voidaa jakaa ryppäisii eli ryhmii. Tällöi otos kerätää kahdessa vaiheessa: () Poimitaa esi joukko ryppäitä kaikkie ryppäide joukosta. () Poimitaa jokaisesta vaiheessa () poimitusta ryppäästä joukko perusjouko alkioita ja yhdistetää alkiot yhdeksi otokseksi. Huomautus: Vaiheissa () ja () voidaa soveltaa yksikertaista satuaisotataa tai systemaattista otataa. Moiasteie otata Moiasteista otataa voidaa soveltaa tilateissa, joissa perusjoukko voidaa jakaa ryppäisii eli ryhmii hierarkkisesti eli perusjoukko voidaa jakaa ryppäisii, jotka puolestaa voidaa jakaa aliryppäisii je. Otos kerätää vaiheittai poimimalla. astee ryppäide joukosta joukko ryppäitä, joista jokaisesta poimitaa joukko aliryppäitä je. kues päästää poimimaa perusjouko alkioita. Huomautus: Poimia eri vaiheissa voidaa soveltaa yksikertaista satuaisotataa tai systemaattista otataa..6. Satuaistamise merkitys tilastolliste aieistoje keräämisessä Edellä o kuvattu seuraavia tilastolliste aieistoje keräämise meetelmiä: Kotrolloidut kokeet Satuaisotata Kummassaki tapauksessa aieisto keräämisessä sovelletaa arvotaa. Arvoa soveltamie merkitsee seuraavaa: Kaikki tutkimukse kohteita kuvaavat (umeeriset tai kvatitatiiviset) tiedot ja myös iistä johdetut suureet ovat satuaisia. Tilastolliste todeäköisyyslasketaa perustuvie mallie soveltamie tilastolliste aieistoje aalyysii perustuu juuri tähä tosiseikkaa. Ilkka Melli (006)

22 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie.7. Mittaamie, mitta asteikot ja tilastolliset muuttujat Tilastollise tutkimukse kohteide omiaisuuksia ja olosuhteita sekä iide muutoksia kuvaavat umeeriset tai kvatitatiiviset tiedot saadaa selville mittaamalla. Mittaamie tarkoittaa umeeriste arvoje liittämistä tutkimukse kohteide omiaisuuksii ja olosuhteisii. Mittaria voidaa pitää fuktioa, joka liittää umeeriset arvot tutkimukse kohteide omiaisuuksii ja olosuhteisii. Mittari Omiaisuus Numeerie arvo Mittaukse tulos voidaa aia ilmaista joki tutkimukse kohtee omiaisuutta tai olosuhdetta kuvaava muuttuja arvoa. Omiaisuus Muuttuja Tilastollisessa tutkimuksessa tutkimukse kohteide omiaisuuksia ja olosuhteita kuvataa mittaustapahtumassa aia umeerisilla muuttujilla. Mittari validiteetti ja tarkkuus Mittari o validi eli oikea, jos se esittää mittaukse kohteea olevaa omiaisuutta oikei, merkityksellisesti ja tarkoituksemukaisesti. Mittari o tarkka, jos se o harhato ja reliaabeli: Mittari o harhato, jos se ei systemaattisesti ali tai yliarvioi mitattava omiaisuude määrää. Mittari o reliaabeli eli luotettava, jos mittaustulos ei muutu, ku mittausta toistetaa. Mitta asteikot Mittaus o tehty omiaali eli laatueroasteikolla, jos mittaus kertoo mihi luokkaa mittaukse kohde kuuluu. Esimerkkejä: Sukupuoli, Asuipaikka, Väri, Viallisuus. Mittaus o tehty ordiaali eli järjestysasteikolla, jos mittaus kertoo oko mittaukse kohteella mitattavaa omiaisuutta eemmä tai vähemmä kui jollaki toisella kohteella. Esimerkkejä: Kouluarvosaat, Aiee kovuus. (iii) Mittaus o tehty itervalli eli välimatka asteikolla, jos mittaus kertoo kuika paljo kahde mitattava kohtee omiaisuudet eroavat toisistaa. Esimerkkejä: Lämpötila Celsius asteissa. (iv) Mittaus o tehty suhdeasteikolla, jos mittaus kertoo kuika mota kertaa eemmä tai vähemmä mittaukse kohteella o mitattavaa omiaisuutta kui jollaki toisella kohteella. Esimerkkejä: Lukumäärä, Pituus, Pita ala, Tilavuus, Paio, Aika, Nopeus, Paie, Rahamäärä, Korko Ilkka Melli (006)

23 Tilastolliset meetelmät.tilastolliste aieistoje keräämie ja mittaamie Huomautus: Jos omiaisuutta voidaa mitata kaikilla eljällä mitta asteikoilla, mittaustulokse iformatiivisuus, mutta samalla myös mittaukse vaativuus kasvaa seuraavassa järjestyksessä: Nomiaaliasteikko Ordiaaliasteikko Itervalliasteikko Suhdeasteikko Kvalitatiiviset ja kvatitatiiviset muuttujat Omiaisuutta ja sitä kuvaavaa muuttujaa kutsutaa kvalitatiiviseksi, jos mittaukse kohteet voidaa luokitella mittaukse perusteella toisistaa eroavii kategorioihi tai luokkii. Kvalitatiivisia omiaisuuksia kuvataa laatueroasteikollisilla muuttujilla. Omiaisuutta ja sitä kuvaavaa muuttujaa kutsutaa kvatitatiiviseksi, jos mittaus tuottaa omiaisuude määrällise arvo. Kvatitatiivisia omiaisuuksia kuvataa välimatka tai suhde asteikollisilla muuttujilla. Diskreetit ja jatkuvat muuttujat Mitattavaa omiaisuutta vastaava muuttuja o diskreetti, jos se voi saada vai erillisiä arvoja. Diskreettejä muuttujia ovat esimerkiksi kaikki laatueroasteikolliste ja järjestysasteikolliste muuttujie lisäksi myös sellaiset kvatitatiiviset muuttujat kute lukumäärämuuttujat. Mitattavaa omiaisuutta vastaava muuttuja o jatkuva, jos se voi saada kaikki arvot joltaki väliltä. Jatkuvia muuttujia ovat esimerkiksi useimmat fysikaaliset suureet kute pituus, pitaala, tilavuus, paio, aika, opeus ja paie sekä myös moet talouselämää kuvaavat suureet kute rahamäärä ja korko. Tilastolliste muuttujie mitta asteikot ja tilastolliset meetelmät Tilastolliste muuttujie mitta asteikollisilla omiaisuuksilla tai kvalitatiivisuudella/ kvatitatiivisuudella tai diskreettiydellä/jatkuvuudella o syvällie vaikutus tutkimusogelma ratkaisemisessa käytettävie tilastolliste meetelmie valitaa. Esimerkiksi aieistoje kuvaamise meetelmät ja tilastolliset testit o tässä esityksessä luokiteltu muuttujie mitta asteiko mukaa. Ilkka Melli (006) 3

24 Tilastolliset meetelmät 3. Tilastolliste aieistoje kuvaamie 3. Tilastolliste aieistoje kuvaamie 3.. Tilastolliset aieistot 3.. Havaitoarvoje jakauma 3.3. Tuusluvut 3.4. Suhdeasteikolliste muuttujie tuusluvut 3.5. Järjestysasteikolliste muuttujie tuusluvut 3.6. Laatueroasteikolliste muuttujie tuusluvut. Tilastollie aieisto koostuu tutkimukse kohteita ja iide olosuhteita kuvaavie muuttujie havaituista arvoista. Käsittelemme tässä luvussa tilastolliste aieistoje kuvaamista. Luvussa esitellää sekä graafiste meetelmie että tuuslukuje käyttöä yksiulotteiste tilastolliste aieistoje kuvaamisessa. Käsittely o jaettu osii tarkasteltava muuttuja tyypi tai mitta asteikolliste omiaisuuksie mukaa. Kaksiulotteiste tilastolliste aieistoje kuvaamista käsitellää moistee Regressio ja variassi aalyysi luvussa Tilastollie riippuvuus ja korrelaatio. Tilastollisia aiiestoja kuvattaessa o tärkeitä ataa kuva havaitoarvoje jakaumasta. Tämä tapahtuu parhaite piirtämällä jakaumasta kuva. Diskreeti muuttuja tapauksessa havaitoarvoje jakaumaa kuvataa umeerisesti frekvessijakaumalla, jota vastaavaa graafista esitystä kutsutaa pylväsdiagrammiksi. Jatkuva muuttuja tapauksessa havaitoarvoje jakaumaa kuvataa umerisesti luokitellulla frekvessijakaumalla, jota vastaavaa graafista esitystä kutsutaa histogrammiksi. Tuusluvuista tärkeimmät ovat havaitoje keskimääräisiä, tyypillisiä tai yleisiä arvoja kuvaavat keskiluvut ja havaitoarvoje hajaatueisuutta kuvaavat hajotaluvut. Avaisaat: Aritmeettie keskiarvo, Box ad Whisker kuvio, Frekvessi, Frekvessijakauma, Geometrie keskiarvo, Graafie esitys, Hajotaluku, Harmoie keskiarvo, Havaitoarvo, Havaitoarvoje jakauma, Histogrammi, Huipukkuus, Järjestystuusluku, Keskihajota, Keskiluku, Keskusmometti, Kvartiili, Kvartiilipoikkeama, Kvartiiliväli ja kvartiiliväli pituus, Luokiteltu frekvessijakauma, Luokkafrekvessi, Maksimi, Mediaai, Mimimi, Mitta asteikko, Moodi, Origomometti, Prosettipiste, Pylväsdiagrammi, Robustisuus, Stadardoiti, Suhteellie frekvessi, Tilastollie aieisto, Tilastollie etäisyys, Tuusluku, Variassi, Vious, Vaihteluväli ja vaihteluväli pituus Ilkka Melli (006) 4

25 Tilastolliset meetelmät 3. Tilastolliste aieistoje kuvaamie 3.. Tilastolliset aieistot Kutsumme tilastollise tutkimukse kaikkie mahdolliste kohteide muodostamaa joukkoa tutkimukse (kohde ) perusjoukoksi ja kutsumme tutkimukse kohteiksi valittuja perusjouko alkioita havaitoyksiköiksi. Tilastollie aieisto koostuu havaitoyksiköitä kuvaavie muuttujie havaituista arvoista. Olkoo tutkimukse kohteiksi valittuje havaitoyksiköide lukumäärä ja olkoo x i, i =,,, kohdeperusjouko alkioide omiaisuutta kuvaava muuttuja x havaittu arvo havaitoyksikössä i. Kutsumme muuttuja x havaittuja arvoja x, x,, x havaitoarvoiksi tai havaioiksi. Havaitoarvo x i saadaa mittaamalla muuttuja x arvo havaitoyksikölle i. Huomautuksia: Tilastollie aieisto voi sytyä tilastollise kokee tuloksea tai tekemällä suoria havaitoja. Jos tutkimukse kohteea o koko perusjoukko, tutkimusta kutsutaa kokoaistutkimukseksi, jos vai satuaisesti valittu osa perusjoukosta tutkitaa, kutsutaa tutkimusta otatatutkimukseksi. Lisätietoja: Ks. lukua Tilastolliset aieistot, iide keräämie ja mittaamie. 3.. Havaitoarvoje jakauma Perusjouko alkioide omiaisuutta kuvaava muuttuja x havaittuje arvoje x, x,, x vaihtelua havaitoyksiköide joukossa kuvaa parhaite havaitoarvoje jakauma. Perusjouko alkioide omiaisuutta kuvaava muuttuja x havaittuje arvoje jakaumaa voidaa kuvailla ja esitellä tiivistämällä havaitoarvoihi sisältyvä iformaatio sopivaa muotoo: Havaitoarvoje jakaumaa kokoaisuutea voidaa kuvata sopivasti valitulla graafisella esityksellä. Jakauma karakteristisia omiaisuuksia voidaa kuvata sopivasti valituilla tuusluvuilla. Perusjouko alkioide omiaisuutta kuvaava muuttuja x (mitta asteikolliset) omiaisuudet (ks. lukua Tilastolliste aieistot, iide keräämie ja mittaamie) määräävät muuttuja x havaittuje arvoje jakaumalle parhaite sopiva kuvaustava: Jos muuttuja x o diskreetti, se havaittuje arvoje jakaumaa voidaa kuvata frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä pylväsdiagrammilla. Jos muuttuja x o jatkuva, se havaittuje arvoje jakaumaa voidaa kuvata luokitellulla frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä histogrammilla. Ilkka Melli (006) 5

26 Tilastolliset meetelmät 3. Tilastolliste aieistoje kuvaamie Frekvessit ja frekvessie jakauma Olkoo muuttuja x diskreetti ja oletetaa, että se mahdolliset arvot ovat Olkoot y, y,, y m x, x,, x muuttuja x havaitut arvot. Muuttuja x mahdollise arvo y k, k =,,, m frekvessi f k kertoo kuika mota kertaa y k esiityy havaitoarvoje x, x,, x joukossa. Muuttuja x mahdolliset arvot y, y,, y m yhdessä iide frekvessie f, f,, f m kassa muodostavat muuttuja x havaittuje arvoje x, x,, x frekvessijakauma. Huomaa, että f + f + + f m = jossa o havaitoje kokoaislukumäärä. Pylväsdiagrammi Frekvessijakaumaa (y k, f k ), k =,,, m voidaa kuvata graafisesti pylväsdiagrammilla, jossa muuttuja x mahdollise arvo y k havaitoarvoje x, x,, x joukossa esittää pylväs, joka korkeus vastaa frekvessiä f k. Huomautus: Pylväsdiagrammi tulkita o aalogie diskreeti todeäköisyysjakauma pistetodeäköisyysfuktio tulkia kassa. Pylväsdiagrammi piirtämie Olkoot y, y,, y m muuttuja x mahdolliset arvot ja olkoo (y k, f k ), k =,,, m muuttuja x havaittuje arvoje f f k x, x,, x frekvessijakauma. Frekvessi f k kertoo kuika mota kertaa y k esiityy muuttuja x havaittuje arvoje joukossa. Tarkastellaa muuttuja x mahdollista arvoa y k vastaava pylvää piirtämistä pylväsdiagrammii. f k f k+ y k y k y k+ x Ilkka Melli (006) 6

Tilastolliset menetelmät: Johdanto

Tilastolliset menetelmät: Johdanto Johdato Tilastolliset meetelmät: Johdato. Tilastotiede tieteealaa. Tilastolliste aieistoje keräämie ja mittaamie 3. Tilastolliste aieistoje kuvaamie Ilkka Melli Johdato Ilkka Melli Johdato Sisällys. TILASTOTIEDE

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1 ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen

Lisätiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (004) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo otosjakauma Otosvariassi otosjakauma

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Johdatus tilastotieteeseen ja mittaaminen TKK (c) Ilkka Mellin (2004) 2 ja mittaaminen: Mitä opimme? 1/3 Tilastollisen tutkimuksen kaikki mahdolliset kohteet

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2005) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mitä tilastotiede o? Mat-.04 Tilastollise aalyysi perusteet, kevät 007. lueto: Johdato Tilastotiede kehittää ja soveltaa meetelmiä: reaalimaailma ilmiöistä johtopäätökset ilmiöitä kuvaavie tietoje perusteella

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Melli Tilastolliset meetelmät Osa : Otokset, otosjakaumat ja estimoiti Otokset ja otosjakaumat TKK (c) Ilkka Melli (007) 1 Otokset ja otosjakaumat >> Satuaisotata ja satuaisotokset Otostuusluvut

Lisätiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (005) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo ja otosvariassi otosjakaumat

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana TKK (c) Ilkka Mellin (2006) 1 Tilastotiede tieteenalana >> Mitä tilastotiede on? Tilastotieteen sovellukset TKK (c) Ilkka

Lisätiedot

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on? TKK (c) Ilkka Mellin (2004) 1 Tilastotiede tieteenalana Johdatus todennäköisyyslaskentaan ja tilastotieteeseen Tilastotiede tieteenalana TKK (c) Ilkka Mellin (2004) 2 Tilastotiede tieteenalana: Mitä opimme?

Lisätiedot

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme? TKK (c) Ilkka Melli (004) Tilastolliste aieistoje kuvaamie Tuusluvut Laatueroasteikolliste muuttujie tuusluvut Johdatus tilastotieteesee Tilastolliste aieistoje kuvaamie TKK (c) Ilkka Melli (004) Tilastolliste

Lisätiedot

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot TKK (c Ilkka Melli (004 Johdatus tilastotieteesee TKK (c Ilkka Melli (004 : Mitä opimme? Tarkastelemme tässä luvussa seuraavia järjestysasteikolliste muuttujie testejä: ja merkkitesti parivertailuille

Lisätiedot

TILASTOT: johdantoa ja käsitteitä

TILASTOT: johdantoa ja käsitteitä TILASTOT: johdatoa ja käsitteitä TOD.NÄK JA TILASTOT, MAA10 Tilastotietee tehtävää o esittää ja tulkita tutkimuskohteesee liittyvää havaitoaieistoa eli tilastoaieistoa. Tutkitaa valittua joukkoa ja se

Lisätiedot

Tilastolliset menetelmät: Tilastolliset testit

Tilastolliset menetelmät: Tilastolliset testit Tilastolliset meetelmät Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille.

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Estimoitimeetelmät TKK (c) Ilkka Melli (2005) 1 Estimoitimeetelmät Todeäköisyysjakaumie parametrie estimoiti Momettimeetelmä Normaalijakauma parametrie estimoiti Ekspoettijakauma

Lisätiedot

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme? TKK (c) Ilkka Melli (4) Johdato Johdatus todeäköisyyslasketaa TKK (c) Ilkka Melli (4) : Mitä opimme? / Tutustumme tässä luvussa seuraavii ormaalijakaumasta (ks. lukua Jatkuvia jakaumia) johdettuihi jakaumii:

Lisätiedot

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu ja tilastolliset mallit Johdanto TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu: Johdanto Johdattelevia esimerkkejä Tilastolliset kokeet TKK (c) Ilkka Mellin (2005) 2 Koesuunnittelu: Johdanto

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2005) 1 Tilastollisten aineistojen kuvaaminen Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten muuttujien tunnusluvut

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut Mat-2.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Kaksiulotteie ormaalijakauma Mitta-asteikot Havaitoaieisto kuvaamie ja otostuusluvut Avaisaat: Ehdollie jakauma, Ehdollie odotusarvo, Ehdollie variassi,

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Melli Tilastolliset meetelmät Osa 2: Otokset, otosjakaumat ja estimoiti Estimoitimeetelmät TKK (c) Ilkka Melli (2007) Estimoitimeetelmät >> Todeäköisyysjakaumie parametrie estimoiti Suurimma uskottavuude

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todeäköisyyslaskea ja tilastotietee peruskurssi 4A Satuaisotata ja parametrie estimoiti Lasse Leskelä Matematiika ja systeemiaalyysi laitos Perustieteide korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Tunnuslukuja 27 III TUNNUSLUKUJA

Tunnuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 28 Tuuslukuja käytetää, ku tilastoaieistoa havaiollistetaa tiivistetysti yksittäisillä luvuilla. Tuusluvut lasketaa muuttujie arvoje perusteella ja e kuvaavat

Lisätiedot

Tilastollisten aineistojen kuvaaminen

Tilastollisten aineistojen kuvaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2007) 1 Tilastollisten aineistojen kuvaaminen >> Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten

Lisätiedot

Mat-2.090 Sovellettu todennäköisyyslasku A

Mat-2.090 Sovellettu todennäköisyyslasku A Mat-.090 Sovellettu todeäköiyylaku A Mat-.090 Sovellettu todeäköiyylaku A / Ratkaiut Aiheet: Avaiaat: Tilatollite aieito keräämie ja mittaamie Tilatollite aieitoje kuvaamie Oto ja otojakaumat Aritmeettie

Lisätiedot

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä Otatajakauma kuvaa tarkasteltava parametri jakauma eri otoksista laskettua parametria o joki yleesä tuusluku, esim. keskiarvo, suhteellie osuus, riskisuhde, korrelaatiokerroi, regressiokerroi, je. parametria

Lisätiedot

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489 Perusjoukko ja otos Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Havaitoyksikkö o empiirise mittaukse kohde Perusjoukko o kaikkie havaitoyksiköide muodostama kokoaisuus Otos o perusjoukkoa

Lisätiedot

8. laskuharjoituskierros, vko 11, ratkaisut

8. laskuharjoituskierros, vko 11, ratkaisut Mat-2.091 Sovellettu todeäköisyyslasku, kevät -05 Heliövaara, Palo, Melli 8. laskuharjoituskierros, vko 11, ratkaisut D1. Oletetaa, että havaiot X i, i = 1, 2,..., 100 muodostavat yksikertaise satuaisotokse

Lisätiedot

Todennäköisyyslaskennan peruskäsitteet. Todennäköisyyslaskennan peruskäsitteet. Todennäköisyyslaskennan peruskäsitteet: Mitä opimme?

Todennäköisyyslaskennan peruskäsitteet. Todennäköisyyslaskennan peruskäsitteet. Todennäköisyyslaskennan peruskäsitteet: Mitä opimme? TKK (c) Ilkka Melli (2004) 1 Todeäköisyyslaskea peruskäsitteet Johdatus todeäköisyyslasketaa Todeäköisyyslaskea peruskäsitteet TKK (c) Ilkka Melli (2004) 2 Todeäköisyyslaskea peruskäsitteet: Mitä opimme?

Lisätiedot

Tilastollinen todennäköisyys

Tilastollinen todennäköisyys Tilastollie todeäköisyys TOD.NÄK JA TILASTOT, MAA10 Klassisessa todeäköisyydessä oli ehdot: äärellisyys ja symmetrisyys. Tämä tilae o usei mahdoto ts. alkeistapauksia o usei ääretö määrä tai e eivät ole

Lisätiedot

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla. Kvatitatiivie metodologia verkossa Moitasomallius Pekka Ratae Helsigi yliopisto isältö Moitasomallit Matemaattisia peruskäsitteitä Esimerkki kovariassista Otatavirhe Esimerkki elittävie muuttujie lisäämie

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Otantajakauman käyttö päättelyssä

Otantajakauman käyttö päättelyssä Keskiarvo otatajakauma Toisistaa tietämättä kaksi tutkijaa tutkii samaa ilmiötä, jossa perusjoukko koostuu kuudesta tutkittavasta ja tarkoituksea o laskea keskiarvo A: Kokoaistutkimus B: Otatatutkimus

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla. Kombiatoriikka, kesä 2010 Harjoitus 2 Ratkaisuehdotuksia (RT) (5 sivua) Käytä tehtävissä 1-3 kombiatorista päättelyä. 1. Osoita, että kaikilla 0 b a pätee ( ) a a ( ) k 1 b b 1 kb Biomikertoime määritelmä

Lisätiedot

Otannasta ja mittaamisesta

Otannasta ja mittaamisesta Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollise aalyysi perusteet, kevät 007 6. lueto: Johdatus regressioaalyysii S ysteemiaalyysi Tekillie korkeakoulu Kai Virtae 1 Regressioaalyysi idea Tavoitteea selittää selitettävä tekiä/muuttua

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ). HY / Matematiika ja tilastotietee laitos Tilastollie päättely II, kevät 018 Harjoitus 5B Ratkaisuehdotuksia Tehtäväsarja I 1. (Jatkoa Harjoitus 5A tehtävää ). Moistee esimerki 3.3.3. mukaa momettimeetelmä

Lisätiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot TKK (c) Ilkka Melli (4) Testit suhdeasteikollisille muuttujille Johdatus tilastotieteesee Testit suhdeasteikollisille muuttujille Testit ormaalikauma parametreille Yhde otokse t-testi Kahde otokse t-testi

Lisätiedot

4.3 Signaalin autokorrelaatio

4.3 Signaalin autokorrelaatio 5 4.3 Sigaali autokorrelaatio Sigaali autokorrelaatio kertoo kuika paljo sigaali eri illä korreloi itsesä kassa (josta imiki). Se o Fourier-muuokse ohella yksi käyttökelpoisimmista sigaalie aalysoitimeetelmistä.

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet Ilkka Melli Todeäköisyyslasketa Osa 2: Satuaismuuttujat ja todeäköisyysjakaumat Kovergessikäsitteet ja raja arvolauseet TKK (c) Ilkka Melli (2006) 1 Kovergessikäsitteet ja raja arvolauseet >> Kovergessikäsitteitä

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa. Testimuuttuja kriittie arvo 5 %: merkitsevyystasolla katsotaa taulukosta. Kriittie arvo o 9,488. Koska laskettu arvo 4,35 o pieempi kui taulukosta saatu kriittie arvo 9,488, ii ollahypoteesi jää voimaa.

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat: Mat-.090 Sovellettu todeäköisyyslasku A Mat-.090 Sovellettu todeäköisyyslasku A / Ratkaisut Aiheet: Avaisaat: Otos- ja otosjakaumat Estimoiti Estimoitimeetelmät Väliestimoiti Aritmeettie keskiarvo, Beroulli-jakauma,

Lisätiedot

Tilastolliset menetelmät: Tilastolliset testit

Tilastolliset menetelmät: Tilastolliset testit Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille 0. Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille

Lisätiedot

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1 Johdatus todeäköisyyslasketaa Kovergessikäsitteet ja raja-arvolauseet TKK (c) Ilkka Melli (2004) 1 Kovergessikäsitteet ja raja-arvolauseet Kovergessikäsitteitä Suurte lukuje lait Keskeie raja-arvolause

Lisätiedot

Todennäköisyyslaskenta: Todennäköisyys ja sen laskusäännöt

Todennäköisyyslaskenta: Todennäköisyys ja sen laskusäännöt Todeäköisyys ja se laskusääöt Todeäköisyyslasketa: Todeäköisyys ja se laskusääöt 1. Johdato 2. Joukko opi peruskäsitteet 3. Todeäköisyyslaskea peruskäsitteet 4. Todeäköisyyslaskea peruslaskusääöt 5. Klassie

Lisätiedot

Tilastotieteen johdantokurssi

Tilastotieteen johdantokurssi VAASAN YLIOPISTO Tilastotietee johdatokurssi Luetoruko Christia Gustafsso 1 SISÄLLYSLUETTELO 1. JOHDANTO... 1.1. Mitä tilastotiede o?... 1.. Tilastotietee historiaa... 3. HAVAINTOAINEISTON HANKINNASTA

Lisätiedot

****************************************************************** ****************************************************************** 7 Esim.

****************************************************************** ****************************************************************** 7 Esim. 8.3. Kombiaatiot MÄÄRITELMÄ 6 Merkitä k, joka luetaa yli k:, tarkoittaa lause- ketta k = k! ( k)! 6 3 2 1 6 Esim. 1 3 3! = = = = 3! ( 3)! 3 2 1 3 2 1 3 2 1 Laskimesta löydät äppäime, jolla kertomia voi

Lisätiedot

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit Mat-.09 Sovellettu todeäköisyyslasku Mat-.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Estimoiti Luottamusvälit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Estimaattori, Estimoiti, Frekvessi,

Lisätiedot

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli TKK (c) Ilkka Melli (2005) Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää

Lisätiedot

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1 35 Naiivi Bayes Luokkamuuttua C o Bayes-verko uuri a attribuutit X i ovat se lehtiä Naiivi oletus o, että attribuutit ovat ehdollisesti riippumattomia toisistaa aettua luokka Ku käytössä o Boole muuttuat,

Lisätiedot

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko Moimuuttujameetelmät Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Mikko Mattila 009 1 Yhde muuttuja meetelmät (uivariate statistics): keskiluvut ja hajotaluvut Moimuuttujameetelmät:

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II Otokset MS-A050 Todeäköisyyslaskea ja tilastotietee peruskurssi Lueot, osa II Kaksi hyödyllista jakaumaa 3 Estimoiti G. Gripeberg 4 Luottamusvälit Aalto-yliopisto. helmikuuta 05 5 Hypoteesie testaus 6

Lisätiedot

Todennäköisyyslaskenta: Todennäköisyysjakaumia

Todennäköisyyslaskenta: Todennäköisyysjakaumia Todeäköisyysjakaumia Todeäköisyyslasketa: Todeäköisyysjakaumia 6. Diskreettejä jakaumia 7. Jatkuvia jakaumia 8. Normaalijakaumasta johdettuja jakaumia 9. Moiulotteisia jakaumia Ilkka Melli 35 Todeäköisyysjakaumia

Lisätiedot

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot TKK (c) Ilkk Melli (24) Johdtus tilstotieteesee TKK (c) Ilkk Melli (24) 2 : Mitä opimme? Trkstelemme tässä luvuss seurvi ltuerosteikolliste muuttujie testejä: Testukse kohtee testeissä o Beroulli-jkum

Lisätiedot

2-suuntainen vaihtoehtoinen hypoteesi

2-suuntainen vaihtoehtoinen hypoteesi Mat-.6 Sovellettu todeäköisyyslasketa. harjoitukset Mat-.6 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Tilastolliset testit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, F-jakauma,

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

Tilastotieteen perusteet

Tilastotieteen perusteet VAASAN YLIOPISTO Tilastotieteeperusteet Luetoruko Christia Gustafsso SISÄLLYSLUETTELO 1. JOHDANTO... 3 1.1. Mitä tilastotiede o?... 3 1.. Tilastotietee historiaa... 4. HAVAINTOAINEISTO JA MITTAAMINEN...

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen.

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen. 10 Kertolaskusäätö Kahta tapahtumaa tai satuaisilmiötä saotaa riippumattomiksi, jos toise tulos ei millää tavalla vaikuta toisee. Esim. 1 A = (Heitetää oppaa kerra) ja B = (vedetää yksi kortti pakasta).

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12

Lisätiedot

Kvantitatiivisen aineiston analyysi

Kvantitatiivisen aineiston analyysi Kvantitatiivisen aineiston analyysi Liiketalouden tutkimusmenetelmät SL 2014 Kvantitatiivinen vs. kvalitatiivinen? tutkimuksen lähtökohtana ovat joko tiedostetut tai tiedostamattomat taustaoletukset (tieteenfilosofiset

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

Sormenjälkimenetelmät

Sormenjälkimenetelmät Sormejälkimeetelmät Matti Risteli mristeli@iksula.hut.fi Semiaariesitelmä 23.4.2008 T-106.5800 Satuaisalgoritmit Tietotekiika laitos Tekillie korkeakoulu Tiivistelmä Sormejälkimeetelmät ovat satuaisuutta

Lisätiedot

Tilastolliset luottamusvälit

Tilastolliset luottamusvälit Luku 8 Tilastolliset luottamusvälit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 8.1 Piste-estimaatti ja väliestimaatti Edellisessä luvussa opittii määrittämää parametreille estimaatteja suurimma uskottavuude

Lisätiedot

2. Mittaus ja data 2.1. Johdanto. 2.2. Mittaustyypit

2. Mittaus ja data 2.1. Johdanto. 2.2. Mittaustyypit 2. Mittaus ja data 2.. Johdato Voidaksemme keksiä tosimaailma relaatioita tarkastelemme sitä kuvaavaa dataa, jote esiksi selvitämme, mitä data perimmiltää o. Data kerätää kuvaamalla mielekiitoaluee oliot

Lisätiedot

Tilastotieteen perusteet

Tilastotieteen perusteet VAASANYLIOPISTO Tilastotieteeperusteet Luetoruko Christia Gustafsso SISÄLLYSLUETTELO. JOHDANTO... 3.. Mitä tilastotiede o?... 3.. Tilastotietee historiaa... 4. HAVAINTOAINEISTO JA MITTAAMINEN... 6.. Peruskäsitteitä...

Lisätiedot

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus:

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus: 1. Tietyllä koeella valmistettavie tiivisterekaide halkaisija keskihajoa tiedetää oleva 0.04 tuumaa. Kyseisellä koeella valmistettuje 100 rekaa halkaisijoide keskiarvo oli 0.60 tuumaa. Määrää 95%: ja 99%:

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat: Mat-.60 Sovellettu todeäköisyyslasketa B Mat-.60 Sovellettu todeäköisyyslasketa B / Ratkaisut Aiheet: Estimoiti Estimoitimeetelmät Väliestimoiti Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Beroulli-koe,

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteesee Tilastollie riippuvuus ja korrelaatio TKK (c) Ilkka Melli (2004) 1 Tilastollie riippuvuus ja korrelaatio Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto

Lisätiedot

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N 11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation

Lisätiedot

χ 2 -yhteensopivuustesti

χ 2 -yhteensopivuustesti Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Tilastollie

Lisätiedot

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164 86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Parametrien oppiminen

Parametrien oppiminen 38 Parametrie oppimie Tilastollise malli (Bayes-verkko rakee o kiiitetty, se umeeriste parametrie (ehdolliste todeäköisyyksie arvot pyritää määräämää Oletamme havaitoe oleva täydellisiä; s.o., okaise datapistee

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

S Laskennallinen systeemibiologia

S Laskennallinen systeemibiologia S-4250 Laskeallie systeemibiologia Harjoitus Mittaustuloksea o saatu havaitoparia (x, y ),, (x, y ) Muuttuja y käyttäytymistä voidaa selittää muuttuja x avulla esimerkiksi yksikertaise lieaarise riippuvuude

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot