Tilastolliset menetelmät: Johdanto

Koko: px
Aloita esitys sivulta:

Download "Tilastolliset menetelmät: Johdanto"

Transkriptio

1 Johdato Tilastolliset meetelmät: Johdato. Tilastotiede tieteealaa. Tilastolliste aieistoje keräämie ja mittaamie 3. Tilastolliste aieistoje kuvaamie Ilkka Melli

2 Johdato Ilkka Melli

3 Johdato Sisällys. TILASTOTIEDE TIETEENALANA 5.. MITÄ TILASTOTIEDE ON? 6 MITÄ TILASTOTIEDE EI OLE? 6 MITÄ TILASTOTIEDE ON? 6 SATUNNAISILMIÖT JA TODENNÄKÖISYYSLASKENTA 6 TILASTOLLISEN TUTKIMUSAINEISTON KERÄÄMINEN SATUNNAISILMIÖNÄ 7 TEOREETTINEN JA SOVELTAVA TILASTOTIEDE 8 KUVAILEVA TILASTOTIEDE JA TILASTOLLINEN PÄÄTTELY 8 TILASTOTIETEEN OSA-ALUEITA 8 TILASTOTIETEEN REUNA-ALUEITA 9.. TILASTOTIETEEN SOVELLUSKOHTEET 9 TILASTOTIETEELLÄ ON MONTA NIMEÄ 0 TILASTOTIEDE JA TILASTOT 0 TILASTOTIEDE, TILASTOT JA YHTEISKUNTA ESIMERKKEJÄ TILASTOLLISISTA TUTKIMUSASETELMISTA. TILASTOLLISET AINEISTOT, NIIDEN KERÄÄMINEN JA MITTAAMINEN 5.. TILASTOLLISET AINEISTOT JA NIIDEN TODENNÄKÖISYYSMALLIT 6 TILASTOLLISET AINEISTOT 6 TILASTOLLISET TUTKIMUSASETELMAT 6 TILASTOLLISET MALLIT 6 TILASTOLLISTEN AINEISTOJEN KERÄÄMINEN 6.. TILASTOLLISET KOKEET 7 KOEASETELMAT 7 KONTROLLOIDUT KOKEET 7 KONTROLLOIDUT KOKEET: KOMMENTTEJA 8 SATUNNAISTAMINEN 8.3. SUORAT HAVAINNOT 9 SUORAT HAVAINNOT: KOMMENTTEJA 9.4. KOKONAISTUTKIMUS 9.5. OTANTATUTKIMUS 9 OTANTAMENETELMIÄ 0 YKSINKERTAINEN SATUNNAISOTANTA 0 SYSTEMAATTINEN OTANTA 0 OSITETTU OTANTA RYVÄSOTANTA MONIASTEINEN OTANTA.6. SATUNNAISTAMISEN SEURAUKSET.7. MITTAAMINEN, MITTA-ASTEIKOT JA TILASTOLLISET MUUTTUJAT MITTARIN VALIDITEETTI JA TARKKUUS MITTA-ASTEIKOT KVALITATIIVISET JA KVANTITATIIVISET MUUTTUJAT 3 DISKREETIT JA JATKUVAT MUUTTUJAT 3 TILASTOLLISTEN MUUTTUJIEN MITTA-ASTEIKOT JA TILASTOLLISET MENETELMÄT 3 Ilkka Melli 3

4 Johdato 3. TILASTOLLISTEN AINEISTOJEN KUVAAMINEN TILASTOLLISET AINEISTOT HAVAINTOARVOJEN JAKAUMA 5 FREKVENSSIT JA FREKVENSSIEN JAKAUMA 6 PYLVÄSDIAGRAMMI 6 PYLVÄSDIAGRAMMIN KONSTRUOINTI 6 LUOKKAFREKVENSSIT JA LUOKKAFREKVENSSIEN JAKAUMA 7 HISTOGRAMMI 8 HISTOGRAMMIN KONSTRUOINTI 8 MITTA-ASTEIKOT JA HAVAINTOARVOJEN JAKAUMAN KUVAAMINEN TUNNUSLUVUT 30 TUNNUSLUVUT JA MITTA-ASTEIKOT SUHDEASTEIKOLLISTEN MUUTTUJIEN TUNNUSLUVUT 3 ARITMEETTINEN KESKIARVO 3 LUOKITELLUN AINEISTON ARITMEETTINEN KESKIARVO 3 ARITMEETTINEN KESKIARVO HAVAINTOARVOJEN JAKAUMAN KUVAAJANA 3 VARIANSSI 33 ARITMEETTISEN KESKIARVON JA VARIANSSI LASKEMINEN 34 KESKIHAJONTA 35 VARIANSSI JA KESKIHAJONTA HAVAINTOARVOJEN JAKAUMAN KUVAAJANA 36 STANDARDOINTI 36 TILASTOLLINEN ETÄISYYS 36 ORIGOMOMENTIT 37 KESKUSMOMENTIT 37 VINOUS 38 HUIPUKKUUS 38 HARMONINEN KESKIARVO 39 GEOMETRINEN KESKIARVO 40 ARITMEETTINEN, HARMONINEN JA GEOMETRINEN KESKIARVO JÄRJESTYSASTEIKOLLISTEN MUUTTUJIEN TUNNUSLUVUT 4 JÄRJESTYSTUNNUSLUVUT 4 MINIMI, MAKSIMI, VAIHTELUVÄLI 4 PROSENTTIPISTEET 4 MEDIAANI 4 MEDIAANI HAVAINTOARVOJEN JAKAUMAN KUVAAJANA 43 MEDIAANI, ARITMEETTINEN KESKIARVO JA VINOUS 44 LUOKITELLUN AINEISTON MEDIAANI 45 KVARTIILIT 45 KVARTIILIT, KVARTIILIVÄLI, KVARTIILIPOIKKEAMA 46 BOX-WHISKER-KUVIO LAATUEROASTEIKOLLISTEN MUUTTUJIEN TUNNUSLUVUT 48 FREKVENSSI 48 MOODI 48 LUOKITELLUN AINEISTON MOODI 48 MOODI HAVAINTOARVOJEN JAKAUMAN KUVAAJANA 49 MOODI, MEDIAANI, ARITMEETTINEN KESKIARVO JA VINOUS 49 Ilkka Melli 4

5 .Tilastotiede tieteealaa. Tilastotiede tieteealaa.. Mitä tilastotiede o?.. Tilastotietee sovelluskohteet Yritämme tässä luvussa vastata seuraavii kysymyksii: Mitä tilastotiede o ja mitä se ei ole? Missä tilastotiedettä käytetää? Mitä tilastotiede ei ole? Tilastotiede ei ole oppia tilastoista, vaikka meetelmie kehittämie tilastoje tuotatoa, jalostusta ja aalyysia varte muodostaa keskeise osa tilastotiedettä. Tilastotiede ei myöskää ole matematiika osa-alue, vaikka tilastotietee meetelmät ja mallit ovatki matemaattisia. Mitä tilastotiede o? Tilastotiede o yleie meetelmätiede, jota voidaa soveltaa, jos reaalimaailma ilmiöstä halutaa tehdä johtopäätöksiä ilmiötä kuvaavie kvatitatiiviste tai umeeriste tietoje perusteella sellaisissa tilateissa, joissa tietoihi liittyy epävarmuutta tai satuaisuutta. Tilastotiede kehittää matemaattisia malleja tiedot geeroieille prosesseille. Koska tietoihi liittyy epävarmuutta tai satuaisuutta, tilastolliset meetelmät ja mallit perustuvat todeäköisyyslasketaa. Se lisäksi, että yritämme kuvata tilastotiedettä tieteealaa tarkastelemme myös tilastotietee sovelluskohteita sekä yritämme selvetää käsitteide tilastotiede ja tilastot eroa. Avaisaat: Arvota, Empiirie tutkimus, Epävarmuus, Havaitoaieisto, Johtopäätöste tekemie, Koe, Kuvaileva tilastotiede, Kvatitatiivie tieto, Kyselytutkimus, Laaduvalvota, Lääketieteellie koe, Matemaattie malli, Matematiikka, Meetelmätiede, Numeerie tieto, Otata, Päätökseteko, Reaalimaailma ilmiö, Satuaisilmiö, Satuaisuus, Soveltava tilastotiede, Teoreettie tilastotiede, Tieto, Tilasto, Tilastoala, Tilastollie aieisto, Tilastollie päättely, Tilastollie tutkimus, Tilastollie tutkimusasetelma, Tilastollie malli, Tilastollie meetelmä, Tilastotiede, Tilastotietee osa-alue, Tilastotietee reua-alue, Tilastotoimi, Todeäköisyyslasketa, Tulosvaihtoehto, Tuusluku, Tutkimus, Tutkimusaieisto, Yhteiskuta Ilkka Melli 5

6 .Tilastotiede tieteealaa.. Mitä tilastotiede o? Mitä tilastotiede ei ole? Hyvä määritelmä atamie jolleki tieteealalle o vaikeata. Esitä esi kaike uhallaki pari egatiivista luoehditaa tilastotieteelle. Tilastotiede ei ole imestää huolimatta oppi tilastoista tai tilastoje tuotaosta! Mutta o kyllä totta, että tilastoje tuotao, jalostukse ja aalysoii meetelmie kehittämie muodostaa keskeise osa tilastotiedettä. Tilastotiede ei mielestäi myöskää ole (puhtaa) matematiika osa-alue! Mutta o kyllä totta, että tilastotietee meetelmät ja mallit ovat matemaattisia ja perustuvat todeäköisyyslasketaa: Tilastotiede käyttää matematiika kieltä. Matematiikalla o tilastotieteessä välieellie rooli. Mitä tilastotiede o? Tehdää sitte muutamia positiivisia määrittely-yrityksiä. Tilastotiede o yleie meetelmätiede. Tilastotiede kehittää ja soveltaa meetelmiä ja malleja, joide avulla reaalimaailma ilmiöistä voidaa tehdä johtopäätöksiä ilmiöitä kuvaavie umeeriste tai kvatitatiiviste tietoje perusteella tilateissa, joissa tietoihi liittyy epävarmuutta ja satuaisuutta. Tilastolliste meetelmie avulla reaalimaailma ilmiöitä kuvaavat umeeriset tai kvatitatiiviset tiedot jalostetaa sellaisee muotoo, että ilmiöitä koskevat johtopäätökset tulevat mahdollisiksi. Tietoje jalostamie merkitsee tietoje tiivistämistä graafisiksi esityksiksi ja tuusluvuiksi sekä tilastolliste mallie raketamista tiedot geeroieille prosesseille tai mekaismeille. Tilastollisissa tutkimusasetelmissa reaalimaailma ilmiöitä kuvaavii umeerisii tai kvatitatiivisii tietoihi liittyy siis aia epävarmuutta ja satuaisuutta. Reaalimaailma ilmiötä kuvaavie tietoje tilastollie aalyysi perustuu siihe, että tietoihi liittyvä epävarmuude ja satuaisuude ajatellaa johtuva tiedot geeroieesta prosessista tai mekaismista. Epävarmuude ja satuaisuude geeroijaa voi olla ilmiö itse tai e voivat olla seurausta meetelmästä, jolla tiedot kerätää. Satuaisilmiöt ja todeäköisyyslasketa Reaalimaailma ilmiö o satuaisilmiö, jos seuraavat ehdot pätevät: (i) Ilmiöllä o useita erilaisia tulosvaihtoehtoja. (ii) Sattuma määrää mikä tulosvaihtoehdoista toteutuu. (iii) Vaikka ilmiö tulos vaihtelee ilmiö toistuessa satuaisesti, ilmiö tulosvaihtoehtoje suhteelliste osuuksie jakauma käyttäytyy tilastollisesti stabiilisti, ku ilmiö toistokertoje lukumäärä kasvaa. Todeäköisyyslaskea tehtävää o tuottaa matemaattisia malleja satuaisilmiöissä tuloste vaihtelussa havaittavalle tilastolliselle stabiliteetille. Todeäköisyyslasketaa käsitellää käsillä oleva moistee riakkaismoisteessa Todeäköisyyslasketa. Ilkka Melli 6

7 .Tilastotiede tieteealaa Satuaisilmiöihi liittyy aia eustamattomuutta. Satuaisilmiö yksittäistä tulosta ei voida tietää etukätee. Satuaisilmiö tuloste vaihteluu o liityttävä sääömukaisuutta, joka o tultava esille ilmiö toistuessa: Vaikka satuaisilmiö tulos vaihtelee satuaisesti ilmiö esiitymiskerrasta toisee, ilmiö tulosvaihtoehtoje suhteelliste osuuksie jakauma o käyttäydyttävä stabiilisti, ku esiitymiskertoje lukumäärä kasvaa. Esimerkki : Satuaisilmiöitä. Satuaisilmiöistä kohdataa esimerkkejä mitä moiaisimmilla alueilla: Kvattimekaiika ja hiukkasfysiika ilmiöt ovat perusluoteeltaa satuaisia. Luootieteellisii mittauksii liittyvie mittausvirheet käyttäytyvät (aiaki osittai) satuaisesti. Useimmissa uhkapeleissä kute arpajaisissa, lotossa, ruletissa, kortti- ja oppapeleissä sattumalla o keskeie rooli. Periöllisyys oudattaa sattuma lakeja. Eliöide omiaisuuksie jakautumie eliöpopulaatioissa o satuaista. Ihmiste, ihmisryhmie ja ihmiste muodostamie orgaisaatioide sosiaalisessa ja taloudellisessa käyttäytymisessä o moia satuaisia elemettejä. Tekiste prosessie tuloksie omiaisuudet jakautuvat satuaisesti. Tilastollise tutkimusaieisto keräämie satuaisilmiöä Voimme ajatella, että tilastollise tutkimukse kohteet valitaa arpomalla. Arvota o satuaisilmiö: (i) Arvotaa liittyy eustamattomuutta, koska yksittäise arvoa tulosta ei voida tietää etukätee. (ii) Arvota oudattaa kuiteki todeäköisyyslaskea lakeja. Koska arvoa tulos vaihtelee satuaisesti arvotakerrasta toisee, myös tutkimukse kohteita kuvaavat tiedot vaihtelevat satuaisesti arvotakerrasta toisee. Tutkimukse kohteita kuvaavie tietoje käyttäytymisessä havaitaa kuiteki arvotaa toistettaessa sääömukaisuutta, jota olemme edellä kutsueet tilastolliseksi stabiliteetiksi. Juuri tämä sääömukaisuus o tilastollise tutkimukse kohde. Esimerkki : Tilastolliste aieistoje keräämie arvotaa. Esimerkkejä tilastolliste aieistoje keräämise meetelmistä, jotka perustuvat arvotaa: (i) Satuaistetut kokeet: Tilastollisissa kokeissa tutkimuksessa tavoitteea o vertailla erilaiste käsittelyide vaikutuksia kokee kohteisii. Erilaiste virhelähteide kotrolloimiseksi käsittelyt pitää arpoa kohteille, jolloi puhutaa satuaistetuista kokeesta. (ii) Satuaisotata: Otaalla tarkoitetaa erilaisia meetelmiä, joilla tutkimukse kohteet poimitaa kaikkie mahdolliste kohteide joukosta. Erilaiste virhelähteide kotrolloimiseksi tutkimukse kohteet pitää poimia arpomalla, jolloi puhutaa satuaisotaasta. Ilkka Melli 7

8 .Tilastotiede tieteealaa Teoreettie ja soveltava tilastotiede Teoreettie tilastotiede kehittää matemaattisia malleja prosesseille, jotka geeroivat sellaisia reaalimaailma ilmiöitä kuvaavia umeerisia tai kvatitatiivisia tietoja, joihi liittyy epävarmuutta ja satuaisuutta. Teoreettise tilastotietee mallit perustuvat todeäköisyyslasketaa ja iitä kutsutaa tilastollisiksi malleiksi, stokastisiksi malleiksi tai todeäköisyysmalleiksi. Mallie avulla pyritää reaalimaailma ilmiöitä kuvaavii tietoihi liittyvät systemaattiset ja satuaiset piirteet erottamaa ja kuvaamaa. Soveltava tilastotiede soveltaa teoreettise tilastotietee kehittämiä matemaattisia malleja reaalimaailma ilmiöitä kuvaavie umeeriste tai kvatitatiiviste tietoje aalysoitii. Teoreettie ja soveltava tilastotiede kulkevat tilastollisessa tutkimuksessa käsi kädessä: Teoreettie tilastotiede kehittää tilastollisia malleja soveltava tilastotietee empiiriste ogelmie ratkaisemiseksi. Soveltava tilastotiede käyttää hyväksee teoreettise tilastotietee kehittämiä malleja ja toisaalta sovelluste tarpeet ohjaavat tilastotietee teoria kehitystä. Kuvaileva tilastotiede ja tilastollie päättely Deskriptiivie eli kuvaileva tilastotiede kehittää ja soveltaa meetelmiä, joide avulla tutkimukse kohteea olevasta ilmiöstä kerättyjä umeerisia tai kvatitatiivisia tietoja pyritää kuvaamaa. Kuvaileva tilastotietee työkaluja: Tilastografiikka Tilastolliset tuusluvut Tilastolliset mallit Tilastolliste mallie estimoiti Tilastollie iferessi eli päättely kehittää ja soveltaa meetelmiä, joide avulla tutkimukse kohteea olevasta ilmiöstä pyritää tekemää johtopäätöksiä ilmiöstä kerättyje umeeriste tai kvatitatiiviste tietoje perusteella. Tilastollise päättely työkaluja: Tilastolliset mallit Tilastolliste mallie estimoiti Tilastollie testaus Kuvaileva tilastotiede ja tilastollie päättely kulkevat tilastollisessa tutkimuksessa käsi kädessä. Tilastotietee osa-alueita Tilastotiede jakautuu moii osa-alueisii. Osa-alueita o ii paljo, että ammattitilastotieteilijäkää ei voi hallita iitä kaikkia. Esimerkki 3: Tilastotietee osa-alueita. Aikasarja-aalyysi, Bayeslaiset meetelmät, Biometria, Demometria, Ei-parametriset meetelmät (), Ekoometria, Estimoititeoria (), Kemometria, Koesuuittelu, Kuvaileva tilastotiede (), Laaduvalvota, Lieaariset mallit (), Matemaattie tilastotiede, Moi- Ilkka Melli 8

9 .Tilastotiede tieteealaa muuttujameetelmät, Otatateoria, Regressioaalyysi (), Robustit meetelmät, Spatiaaliset meetelmät, Testiteoria (), Tilastografiikka (), Tilastollie päättely (), Tilastollie tietojekäsittely, Variassiaalyysi () () Tässä moisteessa käsiteltäviä aiheita. Tilastotietee reua-alueita Moet tieteealat ovat rikastaeet tilastotiedettä ja/tai iissä sovelletaa rutiiiomaisesti tilastollisia meetelmiä. Esimerkki 4: Tilastotietee reua-alueita. Fiassimatematiikka, Hahmotuistus, Hermoverkkoje teoria, Kaaosteoria, Katastrofiteoria, Kuvakäsittely, Kyberetiikka, Operaatioaalyysi, Peliteoria, Päätösteoria, Riskiteoria, Sigaalikäsittely, Stokastiset prosessit, Todeäköisyyslasketa, Tulevaisuudetutkimus, Vakuutusmatematiikka.. Tilastotietee sovelluskohteet Tilastotiedettä voidaa yleiseä meetelmätieteeä soveltaa ja myös pitäisi soveltaa kaikkialla, missä tuotetaa reaalimaailmaa ja se ilmiöitä kuvaavaa umeerista tai kvatitatiivista tietoa. Tilastollisia meetelmiä voidaa soveltaa tietoje keruu, jalostukse ja aalysoii jokaisessa vaiheessa. Tavoitteea o jalostaa tiedot muotoo, joka mahdollistaa reaalimaailmaa ja se ilmiöitä koskevie johtopäätöste tekemise. Tilastotiedettä voidaa yleiseä meetelmätieteeä soveltaa kaikissa tieteissä, joide tutkimusaieistot voidaa esittää umeerisessa tai kvatitatiivisessa muodossa. Jokaie tiede, joka tutkimusaieistot voidaa esittää umeerisessa tai kvatitatiivisessa muodossa voi soveltaa / voisi soveltaa / pitäisi soveltaa tilastollisia meetelmiä sekä tutkimusaieistoja kerättäessä että iitä aalysoitaessa. Site jokaie empiirise tutkimukse havaitoaieisto o tilastollise tutkimukse mahdollie kohde. Esimerkki : Tilastotietee sovelluskohteita eri tieteealoilla. Biotieteet: Biokemia, Biologia, Ekologia, Eläilääketiede, Eläitiede, Farmakologia, Kasvitiede, Lääketiede, Periöllisyystiede Ihmistieteet: Arkeologia, Kielitiede, Psykologia Luootieteet: Fysiikka, Kemia, Tähtitiede Maatalous- ja metsätieteet: Kasviviljelytiede, Kotieläite jalostustiede, Metsäarvioititiede, Metsäviljelytiede Tekiset tieteet: Hahmotuistus, Kalibroiti, Koesuuittelu, Kuvakäsittely, Laaduvalvota, Laskeallie tekiikka, Lääketieteellie tekiikka, Neuroverkot, Päätökseteko- Ilkka Melli 9

10 .Tilastotiede tieteealaa meetelmät, Prosessivalvota, Sigaalikäsittely, Spektroskopia, Tietoliikeetekiikka Yhteiskutatieteet: Sosiaalitieteet, Taloustiede Esimerkki : Tilastotietee eksoottisia sovelluksia: Dedrokroologia. Arkeologiassa puuesieide ajoituksessa voidaa käyttää apua mm. puide vuosilustoje muodostamia aikasarjoja. Myös ilmastomuutoksie tutkimuksessa voidaa käyttää apua puide vuosilustoje muodostamia aikasarjoja. Kummassaki esimerkissä puide vuosilustosarjoje aalysoiissa voidaa soveltaa dedrokroologiaksi kutsuttua tilastolliste meetelmie kokoaisuutta. Dedrokroologiassa sovelletaa mm. tilastollise aikasarja-aalyysi meetelmiä. Esimerkki 3: Tilastotietee eksoottisia sovelluksia: Tietokoetomografia. Lääketieteellisissä tutkimuksissa käytetää (esim. syöpäkasvaimia etsittäessä) apua tietokoetomografiaa eli viipalekuvausta. Siiä ihmise kudoksista tai elimistä tuotetaa s. viipalekuvia laitteella, joka mittaa sähkömageettise tai hiukkassäteily muuttumista säteily kulkiessa kudoste tai elite läpi. Kuvaa muodostavaa laitteesee o ohjelmoitu algoritmi, joka ratkaisee iversioogelmaksi kutsutu matemaattise ogelma. Moet iversio-ogelma ratkaisumeetelmät voidaa luotevimmi tulkita bayeslaiste tilastolliste meetelmie muodostamassa kehikossa. Tilastotieteellä o mota imeä Tilastotieteestä käytetää moella tieteealalla omaa erityistä imeää: Biometria tai Biostatistiikka = Bio- ja lääketieteide tilastotiede Demometria Ekoometria Epidemiologia Kemometria = Väestötiede = Taloustietee tilastotiede = Tautie leviämismekaismeja koskeva lääketietee osa-alue = Kemia tilastotiede Tilastotiede ja tilastot Saa tilasto tuo useimmille ihmisille esimmäiseä mielee yhteiskutaa ja se toimitaa kuvaavat umeeriste tietoje järjestelmälliset kokoelmat. Tilastoje tuotaossa ja aalysoiissa tarvittavie meetelmie kehittämie o keskeie osa tilastotiedettä, mutta o syytä huomata, että tilastotietee sovellusalue o paljo tätä laajempi. Tilastotietee kaalta mikä tahasa reaalimaailma ilmiötä kuvaava umeeriste tai kvatitatiiviste tietoje järjestelmällie kokoelma muodostaa tilastollise aieisto ja site tilastollise tutkimukse mahdollise kohtee. Esimerkiksi kaikki empiirise tai kvatitatiivise tutkimukse tutkimus- tai havaitoaieistot ovat tilastotietee kaalta tilastollisia aieistoja. Ilkka Melli 0

11 .Tilastotiede tieteealaa Termiologiaa: Tilastoala = Tilastotiede + Tilastotoimi Tilastotiede = Teoreettie tilastotiede + Soveltava tilastotiede Tilastotoimi = Tilastoje tuotato + Tilastoje hyödytämie Tilastotiede, tilastot ja yhteiskuta Ihmie ei voi toimia ykymaailmassa järkevästi, ellei hä pysty muodostamaa oikeata kuvaa maailmasta ja se tilasta. Oikeata kuvaa varte tarvitaa maailmaa ja se tilaa merkityksellisesti ja oikei kuvaavia, ajatasaisia (tilasto-) tietoja. Merkityksellisesti ja oikei todellisuutta kuvaavat, ajatasaiset (tilasto-) tiedot ovat välttämättömiä moderi yhteiskua toimialle ja iide saatavuutta voidaa pitää jopa toimiva demokratia edellytykseä. Yhteiskua kaikilla sektoreilla toimia seurata, päätökseteko ja eakoiti perustuvat huomattavilta osiltaa sekä yhteiskua eri sektoreita ja iide toimitaa kuvaavii (tilasto-) tietoihi että tilastolliste meetelmie hyväksikäyttöö. Yhteiskutaa ja elikeioelämää kuvaavat (tilasto-) tiedot muodostavat tietopohja päätökseteolle sekä julkisella että yksityisellä sektorilla. ja päätöksetekoprosessissa hyödyetää moella tavalla tilastollisia meetelmiä. Myös teollisuude tuotatoprosessie ohjaus ja laaduvalvota sekä kaupa ala markkiatutkimus perustuvat tilastolliste meetelmie hyväksikäyttöö. Koska todellisuutta kuvaavii (tilasto-) tietoihi sisältyy (lähes) aia epävarmuutta ja satuaisuutta, tilastotiede ja tilastolliset meetelmät luovat perusta tilastoje tuotaolle, jalostukselle ja aalysoiille. Niipä tilastoje tuotao, jalostukse ja aalysoii meetelmie kehittämie o keskeie osa tilastotietee tehtäväkettää. Esimerkkejä tilastollisista tutkimusasetelmista Esimerkki 4: Kyselytutkimukset. Päätöksetekijät ja tiedotusvälieet kartoittavat sääöllisie välei suomalaiste mielipiteet erilaisista yhteiskutaa koskevista kysymyksistä. Esimerkkejä: Mite suomalaiset suhtautuvat mahdollisee NATO-jäseyytee? Mite suomalaiset suhtautuvat ydivoima lisäraketamisee? Mitkä ovat poliittiste puolueide kaatusosuudet? Mielipiteet selvitetää kyselytutkimuksilla, joide kohteeksi poimitaa tyypillisesti suomalaista. Kyselytutkimukse tavoitteea o tehdä kysely tuloste perusteella johtopäätöksiä mielipiteide jakautumisesta kaikkie suomalaiste joukossa. Mite suomalaisee kohdistetu kysely tulokset voidaa yleistää koskemaa kaikkia suomalaisia? Kysely tulokset voidaa yleistää, jos kysely kohteiksi poimittuje suomalaiste joukko muodostaa edustava pieoiskuva Suome kasasta. Pieoiskuva o edustava, jos mielipiteet jakautuvat kysely kohteiksi poimittuje joukossa samalla tavalla kui kaikkie suomalaiste muodostamassa perusjoukossa. Ilkka Melli

12 .Tilastotiede tieteealaa Kysely kohteide poimita arpomalla o aioa meetelmä, joka mahdollistaa edustava pieoiskuva saamise. Kysely kohteide poimitaa kaikkie suomalaiste muodostamasta perusjoukosta arpomalla kutsutaa tilastotieteessä (satuais-) otaaksi ja tutkimukse kohteeksi poimittua perusjouko osaa kutsutaa (satuais-) otokseksi. Arvoa käyttö kysely kohteide poimiassa merkitsee sitä, että kysely tulokset ovat satuaisia seuraavassa mielessä: Jos arvotaa toistetaa, kysely tuottaa (suurella todeäköisyydellä) joka kerra (aiaki joki verra) erilaiset tulokset, koska eri arvotakerroilla kysely kohteiksi tulee poimituksi (suurella todeäköisyydellä) eri hekilöt. Kysymyksiä: Mite yhdestä otoksesta saadut ja satuaiset kyselytulokset yleistetää koskemaa koko sitä perusjoukkoa, josta otos poimitaa? Mite luotettava tällaie yleistys o? Vastauksia: Jos kysely kohteide poimiassa o käytetty satuaisotataa, kysely tuloksii sisältyvälle epävarmuudelle ja satuaisuudelle voidaa muodostaa tilastollie malli, joka mahdollistaa sekä kysely tuloste yleistämise että yleistykse luotettavuude arvioimise. Yleistykse luotettavuutta ei pystytä arvioimaa, ellei otokse poimiassa ole käytetty satuaisotataa. Kyselytutkimuste suuittelussa, toteutuksessa ja tuloste aalysoiissa sovelletaa mm. seuraavia tilastollisia meetelmiä: otata, estimoiti ja testaus. Esimerkki 5: Lääketieteelliset kokeet. Erää tappava taudi hoitoo o kehitetty uusi lääke, joka toivotaa paratava eemmä potilaita kui kaua käytössä ollut vaha lääke. Mite saadaa varmuus siitä, että uusi lääke o parempi kui vaha lääke? Paraemistuloste vertailemiseksi järjestetää tilastollie koe: (i) Jaetaa joukko potilaita arpomalla kahtee ryhmää: Ryhmälle aetaa uutta lääkettä. Ryhmälle aetaa vahaa lääkettä. (ii) Verrataa paratueide suhteellisia osuuksia ryhmissä ja. Kokee tavoitteea o tehdä kokee tuloste perusteella yleisiä johtopäätöksiä uude lääkkee tehokkuudesta. Mite yhdestä kokeesta saadut tulokset voidaa yleistää koskemaa kaikkie ko. tautii sairastuvie potilaide joukkoo? Kokee tulokset voidaa yleistää, jos kokeessa uutta ja vahaa lääkettä saavie potilaide ryhmät ovat samakaltaisia kaikissa muissa suhteissa paitsi siiä, että iihi kohdistetaa kokeessa erilaie käsittely. Tällöi mahdolliset erot paratueide suhteellisissa osuuksissa o oltava seurausta erilaisista käsittelyistä. Ilkka Melli

13 .Tilastotiede tieteealaa Kokee kohteide jakamie ryhmii arpomalla o aioa meetelmä, joka mahdollistaa samakaltaiste ryhmie saamise. Kokee kohteide jakamista erilaise käsittely kohteiksi joutuvii ryhmii arpomalla kutsutaa tilastotieteessä satuaistamiseksi. Arvoa käyttö ryhmii jaossa merkitsee sitä, että koetulokset ovat satuaisia seuraavassa mielessä: Jos arvotaa toistetaa, kokeesta saadaa (suurella todeäköisyydellä) joka kerra (aiaki joki verra) erilaiset tulokset, koska eri arvotakerroilla saadaa (suurella todeäköisyydellä) erilaiset ryhmäjaot. Kysymyksiä: Mite yhdestä kokeesta saadut ja satuaiset koetulokset yleistetää koskemaa kaikkia ko. tautia sairastavia potilaita? Mite luotettava tällaie yleistys o? Vastauksia: Jos potilaide jaossa ryhmii o käytetty satuaistamista, kokee tuloksii sisältyvälle epävarmuudelle ja satuaisuudelle voidaa muodostaa tilastollie malli, joka mahdollistaa sekä koetuloste yleistämise että yleistykse luotettavuude arvioimise. Yleistykse luotettavuutta ei pystytä arvioimaa, ellei ryhmii jaossa ole käytetty satuaistamista. Tilastollise kokee suuittelussa, toteutuksessa ja tuloste aalysoiissa sovelletaa mm. seuraavia tilastollisia meetelmiä: koesuuittelu, estimoiti ja testaus. Esimerkki 6: Laaduvalvota. Tehdas valmistaa korkealuokkaisia sulkimia kameroihi. Tehdas pyrkii siihe, että yli 90 % sulkimista kestää vähitää kamera laukaisua. Sulkimie laaduvalvota o toteutettu seuraavalla tavalla: (i) Tuotatolijalta poimitaa arpomalla joukko sulkimia rasituskokeesee. (ii) Rasituskokeessa määrätää vähitää laukaisua kestävie sulkimie suhteellie osuus. Kokee tavoitteea o tehdä kokee tuloste perusteella yleisiä johtopäätöksiä sulkimie kestävyydestä. Mite vai osaa sulkimista kohdistetu rasituskokee tulokset voidaa yleistää koskemaa kaikkia sulkimia? Kokee tulokset voidaa yleistää, jos rasituskokee kohteiksi poimittuje sulkimie joukko muodostaa edustava pieoiskuva kaikista valmistetuista sulkimista. Pieoiskuva o edustava, jos sulkimie kesto jakautuu rasituskokeesee poimittuje sulkimie joukossa samalla tavalla kui kaikkie valmistettuje sulkimie muodostamassa perusjoukossa. Rasituskokee kohteide poimita arpomalla o aioa meetelmä, joka mahdollistaa edustava pieoiskuva saamise. Ilkka Melli 3

14 .Tilastotiede tieteealaa Rasituskokee kohteide poimitaa kaikkie valmistettuje sulkimie muodostamasta perusjoukosta arpomalla kutsutaa tilastotieteessä (satuais-) otaaksi ja tutkimukse kohteeksi poimittua perusjouko osaa kutsutaa (satuais-) otokseksi. Arvoa käyttö rasituskokee kohteide poimiassa merkitsee sitä, että koetulokset ovat satuaisia seuraavassa mielessä: Jos arvotaa toistetaa, kokeesta saadaa (suurella todeäköisyydellä) joka kerra (aiaki joki verra) erilaiset tulokset, koska eri arvooissa kokeesee poimitaa (suurella todeäköisyydellä) eri sulkimet. Kysymyksiä: Mite yhdestä kokeesta saadut ja satuaiset koetulokset yleistetää koskemaa kaikkia sulkimia? Mite luotettava tällaie yleistys o? Vastauksia: Jos rasituskokee kohteide poimiassa o käytetty satuaisotataa, kokee tuloksii sisältyvälle epävarmuudelle ja satuaisuudelle voidaa muodostaa tilastollie malli, joka mahdollistaa sekä koetuloste yleistämise että yleistykse luotettavuude arvioimise. Yleistykse luotettavuutta ei pystytä arvioimaa, ellei kokee kohteide poimiassa ole käytetty satuaisotataa. Kokee suuittelussa, toteutuksessa ja tuloste aalysoiissa sovelletaa mm. seuraavia tilastollisia meetelmiä: koesuuittelu, otata, estimoiti ja testaus. Ilkka Melli 4

15 .Tilastolliste aieistoje keräämie ja mittaamie. Tilastolliset aieistot, iide keräämie ja mittaamie.. Tilastolliset aieistot ja iide todeäköisyysmallit.. Tilastolliset kokeet.3. Suorat havaiot.4. Kokoaistutkimus.5. Otatatutkimus.6. Satuaistamise merkitys.7. Mittaamie, mitta-asteikot ja tilastolliset muuttujat Tarkastelemme tässä luvussa tilastollisia aieistoja ja iide keräämistä. Tilastollie aieisto koostuu tutkimukse kohteita ja iide olosuhteita kuvaavie muuttujie havaituista arvoista. Tilastollie aieisto voi sytyä tilastollise kokee tuloksea tai se voi olla peräisi suorista havaioista. Kokoaistutkimuksessa, jos tutkimukse kohteiksi otetaa kaikki mahdolliset kohteet. Otatatutkimuksessa tutkimukse kohteiksi poimitaa mahdollisimma edustava osa mahdolliste kohteide joukosta. Tilastolliste aieistoja kerättäessä tutkimukse kohteet poimitaa satuaisesti eli kohteet arvotaa kaikkie mahdolliste kohteide joukosta. Se, että tutkimukse kohteet arvotaa, mahdollistaa tilastolliste, so. todeäköisyyslasketaa perustuvie matemaattiste mallie soveltamise tilastollisii aieistoihi. Tilastollie aieisto kerätää mittaamalla tutkimukse kohteide omiaisuudet. Tarkoitamme mittauksella meettelyä, jolla kohteide omiaisuuksia vastaaville tilastollisille muuttujille aetaa iide arvot. Tilastolliste muuttujie mitta-asteikollisilla omiaisuuksilla o syvällie vaikutus tutkimus-ogelma ratkaisemisee valittavaa tekiikkaa. Avaisaat: Biomijakauma, Diskreetti muuttuja, Havaito, Havaitoarvo, Havaitoyksikkö, Hypergeometrie jakauma, Itervalliasteikko, Jatkuva muuttuja, Järjestysasteikko, Koe, Kokoaistutkimus, Kotrolloitu koe, Kvalitatiivie muuttuja, Kvatitatiivie muuttuja, Laatueroasteikko, Mittaamie, Mitta-asteikko, Mittari, Moiasteie otata, Nomiaaliasteikko, Ordiaaliasteikko, Ositettu otata, Otata, Otatameetelmä, Otata palauttae, Otata palauttamatta, Otatatutkimus, Perusjoukko, Reliabiliteetti, Ryväsotata, Satuaisotata, Satuaistamie, Suhdeasteikko, Suora havaito, Tarkkuus, Tilastollie aieisto, Tilastollie koe, Tilastollie meetelmä, Tilastollise aieisto keräämie, Validiteetti, Välimatka-asteikko, Yksikertaie satuaisotata Ilkka Melli 5

16 .Tilastolliste aieistoje keräämie ja mittaamie.. Tilastolliset aieistot ja iide todeäköisyysmallit Tilastolliset aieistot Tilastollise tutkimukse kaikki mahdolliset kohteet muodostavat tutkimukse (kohde-) perusjouko. Tutkimukse kohteita o aia tarkasteltava hyvi määritelly perusjouko muodostamassa kehikossa. Tutkimukse kohteiksi poimittuja perusjouko alkioita kutsutaa havaitoyksiköiksi. Tilastollie aieisto koostuu havaitoyksiköide olosuhteita ja omiaisuuksia kuvaavista umeerisista tai kvatitatiivisista tiedoista. Havaitoyksiköitä koskevia umeerisia tai kvatitatiivisia tietoja kutsutaa havaitoarvoiksi tai havaioiksi. Tilastolliset tutkimusasetelmat Tilastollisissa tutkimusasetelmissa havaitoarvoihi liittyy aia epävarmuutta ja satuaisuutta: (i) Tilastollisissa tutkimusasetelmissa ajatellaa, että havaitoarvot geeroiut ilmiö o luoteeltaa satuaie. (ii) Tilastollise tutkimukse kohteita kuvaavat muuttujat tulkitaa tilastollisissa tutkimusasetelmissa satuaismuuttujiksi ja havaitoarvot tulkitaa äide satuaismuuttujie realisoitueiksi arvoiksi. Tilastolliset mallit Tilastollisella mallilla tarkoitetaa tutkimukse kohteide olosuhteita ja omiaisuuksia kuvaavie satuaismuuttujie todeäköisyysjakaumaa, joka ajatellaa geeroiee ko. satuaismuuttujie havaitut arvot. Voimme ajatella, että havaitoarvot o saatu arpomalla tilastollisea mallia käytetystä todeäköisyysjakaumasta saatavi todeäköisyyksi. Ku tilastollista mallia sovelletaa reaalimaailma ilmiöitä kuvaavie havaitoaieistoje aalysoitii, kohdataa tavallisesti seuraavat mallia käytettävä todeäköisyysjakauma parametreja koskevat ogelmat: (i) Parametrie todellisia arvoja ei tueta ja e o estimoitava eli arvioitava havaitoaieistosta. Estimoitia käsitellää tämä moistee luvuissa Estimoiti, Estimoitimeetelmät ja Väliestimoiti. (ii) Parametrie arvoista o esitetty oletuksia tai väitteitä, joita halutaa testata eli asettaa koetteelle havaitoaieistosta saatua iformaatiota vastaa. Testausta käsitellää tämä moistee luvuissa Tilastollie testaus, Testit suhdeasteikollisille muuttujille, Testit järjestysasteikollisille muuttujille, Testit laatueroasteikollisille muuttujille, Yhteesopivuude, homogeeisuude ja riippuvuude testaamie. Tilastolliste mallie parametrie estimoiti ja testaus muodostavat keskeise osa tilastollista päättelyä. Tilastolliste aieistoje keräämie Muutetaako tutkimuksessa tutkimukse kohteide olosuhteita aktiivisesti? Ilkka Melli 6

17 .Tilastolliste aieistoje keräämie ja mittaamie (i) Tutkimus o koe, jos tutkimukse tavoitteea o selvittää, mite kohteide olosuhteide aktiivie muuttamie vaikuttaa tutkimukse kohteisii. (ii) Tutkimus perustuu suorii havaitoihi, jos tutkimukse tavoitteea o vai seurata, mite kohteide olosuhteet ja iissä tapahtuvat muutokset vaikuttavat kohteisii. Kohdistuuko tutkimus kaikkii perusjouko alkioihi vai johoki perusjouko osaa? (i) Tutkimusta kutsutaa kokoaistutkimukseksi, jos kaikki perusjouko alkiot tutkitaa. (ii) Tutkimusta kutsutaa otatatutkimukseksi, jos tutkimus kohdistuu johoki perusjouko osajoukkoo... Tilastolliset kokeet Kokeellise tutkimukse tavoitteea o selvittää, millaisia vaikutuksia erilaisilla käsittelyillä o kohteisii. Käsittelyllä tarkoitetaa tutkimukse kohteide olosuhteide aktiivista, suuitelmallista ja järjestelmällistä muuttamista. Tiukasti ottae vai kokeide perusteella voidaa tehdä kausaalisia eli syy-yhteyksiä koskevia päätelmiä. Huomautus: Tutkimus perustuu suorii havaitoihi, jos tutkimukse kohteide olosuhteita ei muuteta aktiivisesti; ks. kappaletta Suorat havaiot. Koeasetelmat Koeasetelmalla tarkoitetaa kokee tekemisee liittyviä periaatteita ja säätöjä: (i) Millaisia käsittelyitä kokee kohteisii sovelletaa? (ii) Mite kohteet erilaisille käsittelyille valitaa? (iii) Mikä o tehtävie koetoistoje lukumäärä? Kotrolloidut kokeet Kokeesta voidaa tehdä luotettavia johtopäätöksiä vai, jos koe o kotrolloitu: (i) Koetuloksii vaikuttavie ulkopuoliste sekoittavie tekijöide kotrolloimiseksi kokeessa o vertailtava vähitää kahde erilaise käsittely vaikutuksia. (ii) Erilaiste käsittelyide kohteiksi valittavie perusjouko alkioide väliste systemaattiste eroje kotrolloimiseksi käsittelyide kohdistamisessa o käytettävä satuaistamista. (iii) Koetuloksii liittyvä satuaisvaihtelu kotrolloimiseksi kokeessa o tehtävä riittävästi koetoistoja. Kutsumme kotrolloituja kokeita tavallisesti tilastollisiksi kokeiksi. Huomautus: Tilastolliste kokeide suuittelua ja aalysoitia käsitellää moisteessa Koesuuittelu ja tilastolliset mallit. Esimerkki : Yksikertaie kotrolloitu koe. Yksikertaisi kotrolloitu koe o seuraava: Ilkka Melli 7

18 .Tilastolliste aieistoje keräämie ja mittaamie () Jaetaa kokee kohteet satuaisesti kahtee ryhmää. () Kohdistetaa ryhmii erilaiset käsittelyt. (3) Vertaillaa käsittelyide vaikutuksia. Ryhmä Käsittely Satuaistus Vertailu Ryhmä Käsittely Kotrolloidut kokeet: Kommetteja Oletetaa, että koe o kotrolloitu eli kokeessa o sovellettu suuitelmallisesti ja järjestelmällisesti vertailua, satuaistusta ja koetoistoja. Tällöi: (i) Koetuloksie aalysoiti tilastotietee keioi o mahdollista. (ii) Koetuloksii liittyvät systemaattiset ja satuaiset tekijät voidaa erottaa ja kuvata ja kuvaukse luotettavuus voidaa arvioida. (iii) Käsittelyide vaikutuksista kokee kohteisii voidaa tehdä luotettavia johtopäätöksiä. Oletetaa, että koe ei ole kotrolloitu eli kokeessa ei ole käytetty suuitelmallisesti ja järjestelmällisesti vertailua, satuaistusta ja koetoistoja. Tällöi: (i) Koetuloksie aalysoiti tilastotietee keioi ei ole mahdollista. (ii) Koetuloksii liittyviä systemaattisia ja satuaisia tekijöitä ei voida erottaa ja kuvata ja kuvaukse luotettavuutta ei voida arvioida. (iii) Käsittelyide vaikutuksista kokee kohteisii ei voida tehdä luotettavia johtopäätöksiä. Jos koe ei ole kotrolloitu, koeasetelma saattaa systemaattisesti suosia joitaki tulosvaihtoehtoja. Jos koeasetelma suosii systemaattisesti joitaki tulosvaihtoehtoja, asetelmaa saotaa harhaiseksi. Harhaiste koeasetelmie perusteella ei voida tehdä luotettavia johtopäätöksiä. Satuaistamie Kokee satuaistamie tarkoittaa sitä, että käsittelyide kohdistamisessa käytetää arvotaa. Arvota o aioa puolueeto tapa kohdistaa käsittelyitä, koska arpomie ei suosi mitää perusjouko osaa. Se, että satuaistettuje kokeide tuloste aalysoitii voidaa soveltaa tilastollisia meetelmiä perustuu siihe, että arvota oudattaa (oikei suoritettua) todeäköisyyslaskea lakeja. Satuaistus takaa suurella varmuudella se, että kokeessa erilaiste käsittelyide kohteiksi joutuvat perusjouko osajoukot ovat ee käsittelyide soveltamista omiaisuuksiltaa samakaltaisia. Ilkka Melli 8

19 .Tilastolliste aieistoje keräämie ja mittaamie Juuri se takia satuaistetu kokee tuloksista voidaa tehdä kausaalipäätelmiä: Jos koe o satuaistettu, kokee tuloksissa havaittuje systemaattiste eroje o johduttava erilaisista käsittelyistä..3. Suorat havaiot Suorii havaitoihi perustuvassa tutkimuksessa tavoitteea o saada selville tutkimukse kohteide olosuhteisii puuttumatta, mitä vaikutuksia kohteide olosuhteilla ja iissä tapahtuvilla muutoksilla o kohteisii. O syytä huomata, että tiukasti ottae suorii havaitoihi perustuvie tutkimuste perusteella ei voida tehdä kausaalisia eli syy-yhteyksiä koskevia johtopäätöksiä. Huomautus: Tutkimus o koe, jos kohteide olosuhteita muutetaa tutkimuksessa aktiivisesti; ks. kappaletta Tilastolliset kokeet. Suorat havaiot: Kommetteja Suoria havaitoja tehtäessä havaitoje tulokset saattavat olla harhaisia. Havaitoje tulokset ovat harhaisia, jos havaitoja tehtäessä suositaa systemaattisesti joitaki tulosvaihtoehtoja. Harhaiste havaitotuloste perusteella ei voida tehdä luotettavia johtopäätöksiä. Harha sytymistä vastaa pyritää suojautumaa valitsemalla havaitoje kohteet perusjoukosta satuaisesti (ellei tavoitteea ole tutkia kaikkia perusjouko alkioita). Tämä merkitsee satuaisotaa soveltamista havaitoje kohteide valitaa; ks. kappaletta Satuaisotata..4. Kokoaistutkimus Tutkimus o kokoaistutkimus, jos se kohdistuu kaikkii (kohde-) perusjouko alkioihi. Huomautuksia: Kokoaistutkimukse tekemie o vai harvoi mahdollista. Jos perusjoukko o ääretö, kokoaistutkimukse tekemie o jopa periaatteessa mahdotota. Äärellisee perusjoukkoo kohdistuvat kokoaistutkimukset voidaa tavallisesti tulkita otatatutkimuksiksi: Tällöi tutkimukse kohteea oleva äärellie perusjoukko tulkitaa otokseksi hypoteettisesta äärettömästä perusjoukosta..5. Otatatutkimus Tutkimus o otatatutkimus, jos se kohdistuu johoki perusjouko osajoukkoo. Otatatutkimuksessa perusjouko osajoukosta tehdyt johtopäätökset pyritää yleistämää koko perusjoukkoo. Tutkimukse kohteeksi valittua perusjouko osajoukkoa kutsutaa otokseksi. Otokse poimimista perusjoukosta kutsutaa otaaksi. Otokse poimiassa käytettyjä meetelmiä kutsutaa otatameetelmiksi. Perusjoukosta voidaa tehdä luotettavia johtopäätöksiä otokse perustella vai, jos otos muodostaa perusjouko edustava pieoiskuva. Otokse poimimie perusjoukosta satuaisesti takaa (suurella todeäköisyydellä) se, että otos muodostaa perusjouko edustava pieoiskuva. Ilkka Melli 9

20 .Tilastolliste aieistoje keräämie ja mittaamie Otokse poimita satuaisesti merkitsee otoksee poimittavie havaitoyksiköide arpomista perusjouko alkioide joukosta. Arvota o aioa puolueeto tapa poimia otos, koska arpomie ei suosi mitää perusjouko osaa. Arvota oudattaa (oikei suoritettua) todeäköisyyslaskea lakeja. Otatameetelmiä Tilastollisessa tutkimuksessa sovelletaa tutkimusasetelmasta riippue erilaisia otatameetelmiä. Otaa perusmuoto: Yksikertaie satuaisotata Muita otatameetelmiä: Systemaattie otata Ositettu otata Ryväsotata Moiasteie otata Yksikertaie satuaisotata Yksikertaie satuaisotata o otaa perusmuoto, jossa jokaisella perusjouko alkiolla o yhtä suuri todeäköisyys tulla valituksi otoksee. Jos otos poimitaa yksikertaisella satuaisotaalla, myös jokaisella perusjouko samakokoisella osajoukolla o sama todeäköisyys tulla valituksi otokseksi. Yksikertaie satuaisotata voidaa tulkita arvoaksi, joka o toteutettu seuraavalla tavalla: (i) Arvotaa alkiot perusjoukosta otoksee yksi kerrallaa. (ii) Jokaisella alkioilla o jokaisessa arvoassa yhtä suuri todeäköisyys tulla poimituksi otoksee. Yksikertaise satuaisotaa perusmuodossa alkiot poimitaa perusjoukosta otoksee palauttae: Poimittu alkio palautetaa aia ee uude alkio arpomista takaisi perusjoukkoo, jolloi sama alkio voi tulla poimituksi otoksee useita kertoja. Otaassa palauttae arvoat ovat riippumattomia: Alkio todeäköisyys tulla poimituksi otoksee ei riipu siitä mitä alkiota otoksee o jo poimittu. Otaassa palauttae poimitatodeäköisyyksiä hallitaa biomijakauma avulla; ks. moistee Todeäköisyyslasketa lukua Diskreettejä jakaumia. Yksikertaiseksi satuaisotaaksi kutsutaa tavallisesti myös meetelmää, jossa alkiot poimitaa perusjoukosta otoksee palauttamatta: Poimittua alkiota ei palauteta ee uude alkio arpomista takaisi perusjoukkoo, jolloi sama alkio ei voi tulla poimituksi otoksee kui kerra. Otaassa palauttamatta arvoat eivät ole riippumattomia: Alkio todeäköisyys tulla poimituksi otoksee muuttuu arvoa edistyessä. Otaassa palauttamatta poimitatodeäköisyyksiä hallitaa hyper-geometrise jakauma avulla; ks. moistee Todeäköisyyslasketa lukua Diskreettejä jakaumia. Systemaattie otata Systemaattisessa otaassa otoksee poimitaa joka k. alkio perusjouko alkioide järjestetystä joosta. Systemaattista otataa sovelletaa usei yksikertaise satuaisotaa sijasta, jos perus- Ilkka Melli 0

21 .Tilastolliste aieistoje keräämie ja mittaamie jouko alkioista o käytettävissä joki tietorekisteri tai luettelo tai havaitoja poimitaa ajassa tai tilassa. Huomautuksia: Systemaattie otata ei tiukasti ottae kuulu satuaisotaa meetelmii, koska siiä ei sovelleta arvotaa. Systemaattie otata tuottaa kuiteki sama tulokse kui yksikertaie satuaisotata, jos perusjouko alkioide järjestys o tutkittava ilmiö kaalta satuaie. Ositettu otata Ositetulla otaalla tarkoitetaa meettelyä, jossa perusjoukko koostuu joki perusjouko alkioide omiaisuude suhtee homogeeisista ryhmistä ja otos poimitaa site, että jokaisesta ryhmästä eli ositteesta poimitaa osaotos, jotka yhdessä muodostavat tutkimusaieisto. Esimerkki : Edustavuude takaamie ositetulla otaalla. Oletetaa, että maassa o useita hyvi erikokoisia kieliryhmiä ja tavoitteea o vertailla eri kieliryhmii kuuluvie taloudellista asemaa. Jokaisesta ryhmästä saadaa otoksee riittävä edustus poimimalla jokaisesta ryhmästä samakokoie osaotos. Ryväsotata Ryväsotaalla tarkoitetaa meettelyä, jossa perusjoukko voidaa jakaa ryppäisii eli ryhmii ja otos poimitaa kahdessa vaiheessa: () Poimitaa esi joukko ryppäitä kaikkie ryppäide joukosta. () Poimitaa jokaisesta vaiheessa () poimitusta ryppäästä joukko perusjouko alkioita ja yhdistetää alkiot yhdeksi tutkimusaieistoksi. Huomautus: Vaiheissa () ja () voidaa soveltaa yksikertaista satuaisotataa tai systemaattista otataa. Moiasteie otata Moiasteisella otaalla tarkoitetaa meettelyä, jossa perusjoukko voidaa jakaa ryppäisii eli ryhmii hierarkkisesti eli perusjoukko voidaa jakaa ryppäisii, jotka puolestaa voidaa jakaa aliryppäisii je. ja otos kerätää vaiheittai poimimalla. astee ryppäide joukosta joukko ryppäitä, joista jokaisesta poimitaa joukko aliryppäitä je. kues päästää poimimaa perusjouko alkioita. Huomautus: Poimia eri vaiheissa voidaa soveltaa yksikertaista satuaisotataa tai systemaattista otataa..6. Satuaistamise seuraukset Edellä o kuvattu seuraavia tilastolliste aieistoje keräämise meetelmiä: (i) Kotrolloidut kokeet (ii) Satuaisotata Ilkka Melli

22 .Tilastolliste aieistoje keräämie ja mittaamie Kummassaki tapauksessa aieisto keräämisessä sovelletaa arvotaa. Arvoa soveltamie merkitsee seuraavaa: Kaikki tutkimukse kohteita kuvaavat (umeeriset tai kvatitatiiviset) tiedot ja myös iistä johdetut suureet ovat satuaisia. Juuri tähä perustuu se, että tilastolliste aieistoje aalyysissa sovelletaa tilastollisia todeäköisyyslasketaa perustuvia malleja..7. Mittaamie, mitta-asteikot ja tilastolliset muuttujat Tilastollise tutkimukse kohteide omiaisuuksia ja olosuhteita sekä iide muutoksia kuvaavat umeeriset tai kvatitatiiviset tiedot saadaa selville mittaamalla. Mittaamisella tarkoitetaa tässä umeeriste arvoje liittämistä tutkimukse kohteide omiaisuuksii ja olosuhteisii. Site mittaria voidaa pitää fuktioa, joka liittää umeeriset arvot tutkimukse kohteide omiaisuuksii ja olosuhteisii. Mittari Omiaisuus Numeerie arvo Mittaukse tulos voidaa aia ilmaista joki tutkimukse kohtee omiaisuutta tai olosuhdetta kuvaava muuttuja arvoa. Omiaisuus Muuttuja Tilastollisessa tutkimuksessa tutkimukse kohteide omiaisuuksia ja olosuhteita kuvataa aia umeerisilla muuttujilla. Mittari validiteetti ja tarkkuus Mittari o validi eli oikea, jos se esittää mittaukse kohteea olevaa omiaisuutta oikei, merkityksellisesti ja tarkoituksemukaisesti. Mittari o tarkka, jos se o harhato ja reliaabeli: (i) Mittari o harhato, jos se ei systemaattisesti ali- tai yliarvioi mitattava omiaisuude määrää. (ii) Mittari o reliaabeli eli luotettava, jos mittaustulos ei muutu, ku mittausta toistetaa. Mitta-asteikot (i) Mittaus o tehty omiaali- eli laatueroasteikolla, jos mittaus kertoo mihi luokkaa mittaukse kohde kuuluu. Esimerkkejä: Sukupuoli, Asuipaikka, Väri, Viallisuus. (ii) Mittaus o tehty ordiaali- eli järjestysasteikolla, jos mittaus kertoo oko mittaukse kohteella mitattavaa omiaisuutta eemmä tai vähemmä kui jollaki toisella kohteella. Esimerkkejä: Kouluarvosaat, Aiee kovuus. (iii) Mittaus o tehty itervalli- eli välimatka-asteikolla, jos mittaus kertoo kuika paljo kahde mitattava kohtee omiaisuudet eroavat toisistaa. Ilkka Melli

23 .Tilastolliste aieistoje keräämie ja mittaamie Esimerkki: Lämpötila Celsius-asteissa. (iv) Mittaus o tehty suhdeasteikolla, jos mittaus kertoo kuika mota kertaa eemmä tai vähemmä mittaukse kohteella o mitattavaa omiaisuutta kui jollaki toisella kohteella. Esimerkkejä: Lukumäärä, Pituus, Pita-ala, Tilavuus, Paio, Aika, Nopeus, Paie, Rahamäärä, Korko Huomautus: Jos omiaisuutta voidaa mitata kaikilla eljällä mitta-asteikoilla, mittaustulokse iformatiivisuus, mutta samalla myös mittaukse vaativuus kasvaa seuraavassa järjestyksessä: Nomiaaliasteikko < Ordiaaliasteikko < Itervalliasteikko < Suhdeasteikko Kvalitatiiviset ja kvatitatiiviset muuttujat (i) Omiaisuutta ja sitä kuvaavaa muuttujaa kutsutaa kvalitatiiviseksi, jos mittaukse kohteet voidaa luokitella mittaukse perusteella toisistaa eroavii kategorioihi tai luokkii. Kvalitatiivisia omiaisuuksia kuvataa laatueroasteikollisilla muuttujilla. (ii) Omiaisuutta ja sitä kuvaavaa muuttujaa kutsutaa kvatitatiiviseksi, jos mittaus tuottaa omiaisuude määrällise arvo. Kvatitatiivisia omiaisuuksia kuvataa välimatka- tai suhdeasteikollisilla muuttujilla. Järjestysasteikolliset muuttujat ovat kvalitatiiviste ja kvatitatiiviste muuttujie välimaastossa ii, että tilateesta riippue iitä voidaa käsitellä kvalitatiivisia tai kvatitatiivisia. Diskreetit ja jatkuvat muuttujat (i) Muuttuja o diskreetti, jos se voi saada vai erillisiä arvoja. Diskreettejä muuttujia ovat esimerkiksi kaikki laatueroasteikolliste ja järjestysasteikolliste muuttujie lisäksi myös sellaiset kvatitatiiviset muuttujat kute lukumäärämuuttujat. (ii) Muuttuja o jatkuva, jos se voi saada kaikki arvot joltaki väliltä. Jatkuvia muuttujia ovat esimerkiksi useimmat fysikaaliset suureet kute pituus, pita-ala, tilavuus, paio, aika, opeus ja paie sekä myös moet talouselämää kuvaavat suureet kute rahamäärä ja korko. Tilastolliste muuttujie mitta-asteikot ja tilastolliset meetelmät Tilastolliste muuttujie mitta-asteikollisilla omiaisuuksilla tai kvalitatiivisuudella/ kvatitatiivisuudella tai diskreettiydellä/jatkuvuudella o syvällie vaikutus tutkimusogelma ratkaisemisessa käytettävie tilastolliste meetelmie valitaa. Esimerkiksi aieistoje kuvaamise meetelmät ja tilastolliset testit o tässä esityksessä luokiteltu muuttujie mitta-asteiko mukaa. Ilkka Melli 3

24 3. Tilastolliste aieistoje kuvaamie 3. Tilastolliste aieistoje kuvaamie 3.. Tilastolliset aieistot 3.. Havaitoarvoje jakauma 3.3. Tuusluvut 3.4. Suhdeasteikolliste muuttujie tuusluvut 3.5. Järjestysasteikolliste muuttujie tuusluvut 3.6. Laatueroasteikolliste muuttujie tuusluvut. Tilastollie aieisto koostuu tutkimukse kohteita ja iide olosuhteita kuvaavie muuttujie havaituista arvoista. Käsittelemme tässä luvussa tilastolliste aieistoje kuvaamista. Esittelemme sekä graafiste meetelmie että tuuslukuje käyttöä yksiulotteiste tilastolliste aieistoje kuvaamisessa. Käsittely o jaettu osii tarkasteltava muuttuja tyypi tai mitta-asteikolliste omiaisuuksie mukaa. Kaksiulotteiste tilastolliste aieistoje kuvaamista käsitellää vasta moistee Regressio- ja variassiaalyysi luvussa Tilastollie riippuvuus ja korrelaatio. Tilastollisia aieistoja kuvattaessa o tärkeitä ataa kuva havaitoarvoje jakaumasta. Tämä tapahtuu parhaite piirtämällä jakaumasta kuva. Diskreettie muuttujie tapauksessa havaitoarvoje jakaumaa kuvataa umeerisesti frekvessijakaumalla, jota vastaavaa graafista esitystä kutsutaa pylväsdiagrammiksi. Jatkuvie muuttujie tapauksessa havaitoarvoje jakaumaa kuvataa umeerisesti luokitellulla frekvessijakaumalla, jota vastaavaa graafista esitystä kutsutaa histogrammiksi. Tuusluvuista tärkeimmät ovat havaitoje keskimääräisiä, tyypillisiä tai yleisiä arvoja kuvaavat keskiluvut ja havaitoarvoje hajaatueisuutta kuvaavat hajotaluvut. Avaisaat: Aritmeettie keskiarvo, Box ad Whisker -kuvio, Frekvessi, Frekvessijakauma, Geometrie keskiarvo, Graafie esitys, Hajotaluku, Harmoie keskiarvo, Havaitoarvo, Havaitoarvoje jakauma, Histogrammi, Huipukkuus, Järjestystuusluku, Keskihajota, Keskiluku, Keskusmometti, Kvartiili, Kvartiilipoikkeama, Kvartiiliväli ja kvartiiliväli pituus, Luokiteltu frekvessijakauma, Luokkafrekvessi, Maksimi, Mediaai, Miimi, Mitta-asteikko, Moodi, Origomometti, Prosettipiste, Pylväsdiagrammi, Robustisuus, Stadardoiti, Suhteellie frekvessi, Tilastollie aieisto, Tilastollie etäisyys, Tuusluku, Variassi, Vious, Vaihteluväli ja vaihteluväli pituus Ilkka Melli 4

25 3. Tilastolliste aieistoje kuvaamie 3.. Tilastolliset aieistot Kutsumme tilastollise tutkimukse kaikkie mahdolliste kohteide muodostamaa joukkoa tutkimukse (kohde-) perusjoukoksi ja tutkimukse kohteiksi valittuja perusjouko alkioita havaitoyksiköiksi. Tilastollie aieisto koostuu havaitoyksiköitä kuvaavie muuttujie havaituista arvoista. Olkoo tutkimukse kohteiksi valittuje havaitoyksiköide lukumäärä ja olkoo x i, i =,,, kohdeperusjouko alkioide omiaisuutta kuvaava muuttuja x havaittu arvo havaitoyksikössä i. Kutsumme muuttuja x havaittuja arvoja x, x,, x havaitoarvoiksi tai havaioiksi. Havaitoarvo x i saadaa mittaamalla muuttuja x arvo havaitoyksikölle i. Huomautuksia: Tilastollie aieisto voi sytyä tilastollise kokee tuloksea tai tekemällä suoria havaitoja. Jos tutkimukse kohteea o koko perusjoukko, tutkimusta kutsutaa kokoaistutkimukseksi, jos vai satuaisesti valittu osa perusjoukosta tutkitaa, kutsutaa tutkimusta otatatutkimukseksi. Lisätietoja: Ks. lukua Tilastolliset aieistot, iide keräämie ja mittaamie. 3.. Havaitoarvoje jakauma Perusjouko alkioide omiaisuutta kuvaava muuttuja x havaittuje arvoje x, x,, x vaihtelua havaitoyksiköide joukossa kuvaa parhaite havaitoarvoje jakauma. Perusjouko alkioide omiaisuutta kuvaava muuttuja x havaittuje arvoje jakaumaa voidaa kuvailla ja esitellä tiivistämällä havaitoarvoihi sisältyvä iformaatio sopivaa muotoo: Havaitoarvoje jakaumaa kokoaisuutea voidaa kuvata sopivasti valitulla graafisella esityksellä. Jakauma karakteristisia omiaisuuksia voidaa kuvata sopivasti valituilla tuusluvuilla. Perusjouko alkioide omiaisuutta kuvaava muuttuja x (mitta-asteikolliset) omiaisuudet (ks. lukua Tilastolliste aieistot, iide keräämie ja mittaamie) määräävät muuttuja x havaittuje arvoje jakaumalle parhaite sopiva kuvaustava: Jos muuttuja x o diskreetti, se havaittuje arvoje jakaumaa voidaa kuvata frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä pylväsdiagrammilla. Jos muuttuja x o jatkuva, se havaittuje arvoje jakaumaa voidaa kuvata luokitellulla frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä histogrammilla. Ilkka Melli 5

26 3. Tilastolliste aieistoje kuvaamie Frekvessit ja frekvessie jakauma Olkoo muuttuja x diskreetti ja oletetaa, että se mahdolliset arvot ovat Olkoot y, y,, y m x, x,, x muuttuja x havaitut arvot. Muuttuja x mahdollise arvo y k frekvessi f k kertoo kuika mota kertaa y k esiityy havaitoarvoje x, x,, x joukossa. Muuttuja x mahdolliset arvot y, y,, y m yhdessä iide frekvessie f, f,, f m kassa muodostavat muuttuja x havaittuje arvoje x, x,, x frekvessijakauma. Huomaa, että f + f + + f m = jossa o havaitoje kokoaislukumäärä. Pylväsdiagrammi Frekvessijakaumaa (y k, f k ), k =,,, m voidaa kuvata graafisesti pylväsdiagrammilla, jossa muuttuja x mahdollise arvo y k frekvessiä f k havaitoarvoje x, x,, x joukossa esittää pylväs, joka korkeus vastaa frekvessiä f k. Huomautus: Pylväsdiagrammi tulkita o aalogie diskreeti todeäköisyysjakauma pistetodeäköisyysfuktio tulkia kassa. Pylväsdiagrammi kostruoiti Olkoot f y, y,, y m muuttuja x mahdolliset arvot ja olkoo (y k, f k ), k =,,, m muuttuja x havaittuje arvoje f k x, x,, x f k f k+ frekvessijakauma. Frekvessi f k kertoo kuika x mota kertaa muuttuja x mahdollie arvo y k esiityy havaittuje arvoje joukossa. y k y k y k+ Frekvessijakaumaa vastaava pylväsdiagrammi kostruoidaa seuraavalla tavalla (ks. kuvaa yllä): (i) Muuttuja x mahdolliset arvot y k määräävät pylväide paikat. (ii) Pylväide korkeudet valitaa ii, että e suhteessa frekvesseihi f k. Ilkka Melli 6

Tilastolliset menetelmät: Johdanto

Tilastolliset menetelmät: Johdanto Tilastolliset meetelmät Johdato Tilastolliset meetelmät: Johdato. Tilastotiede tieteealaa. Tilastolliste aieistoje keräämie ja mittaamie 3. Tilastolliste aieistoje kuvaamie TKK @ Ilkka Melli (006) Tilastolliset

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2007) 1 ja mittaaminen >> Tilastollisten aineistojen kerääminen Mittaaminen

Lisätiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (004) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo otosjakauma Otosvariassi otosjakauma

Lisätiedot

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2004) 1 ja mittaaminen Johdatus tilastotieteeseen ja mittaaminen TKK (c) Ilkka Mellin (2004) 2 ja mittaaminen: Mitä opimme? 1/3 Tilastollisen tutkimuksen kaikki mahdolliset kohteet

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen TKK (c) Ilkka Mellin (2005) 1 ja mittaaminen Tilastollisten aineistojen kerääminen Mittaaminen ja mitta-asteikot TKK (c)

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mitä tilastotiede o? Mat-.04 Tilastollise aalyysi perusteet, kevät 007. lueto: Johdato Tilastotiede kehittää ja soveltaa meetelmiä: reaalimaailma ilmiöistä johtopäätökset ilmiöitä kuvaavie tietoje perusteella

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Melli Tilastolliset meetelmät Osa : Otokset, otosjakaumat ja estimoiti Otokset ja otosjakaumat TKK (c) Ilkka Melli (007) 1 Otokset ja otosjakaumat >> Satuaisotata ja satuaisotokset Otostuusluvut

Lisätiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (005) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo ja otosvariassi otosjakaumat

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana

Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastotiede tieteenalana TKK (c) Ilkka Mellin (2006) 1 Tilastotiede tieteenalana >> Mitä tilastotiede on? Tilastotieteen sovellukset TKK (c) Ilkka

Lisätiedot

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on?

Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana. Tilastotiede tieteenalana: Mitä opimme? Mitä tilastotiede on? TKK (c) Ilkka Mellin (2004) 1 Tilastotiede tieteenalana Johdatus todennäköisyyslaskentaan ja tilastotieteeseen Tilastotiede tieteenalana TKK (c) Ilkka Mellin (2004) 2 Tilastotiede tieteenalana: Mitä opimme?

Lisätiedot

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme? TKK (c) Ilkka Melli (004) Tilastolliste aieistoje kuvaamie Tuusluvut Laatueroasteikolliste muuttujie tuusluvut Johdatus tilastotieteesee Tilastolliste aieistoje kuvaamie TKK (c) Ilkka Melli (004) Tilastolliste

Lisätiedot

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot TKK (c Ilkka Melli (004 Johdatus tilastotieteesee TKK (c Ilkka Melli (004 : Mitä opimme? Tarkastelemme tässä luvussa seuraavia järjestysasteikolliste muuttujie testejä: ja merkkitesti parivertailuille

Lisätiedot

Tilastolliset menetelmät: Tilastolliset testit

Tilastolliset menetelmät: Tilastolliset testit Tilastolliset meetelmät Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille.

Lisätiedot

TILASTOT: johdantoa ja käsitteitä

TILASTOT: johdantoa ja käsitteitä TILASTOT: johdatoa ja käsitteitä TOD.NÄK JA TILASTOT, MAA10 Tilastotietee tehtävää o esittää ja tulkita tutkimuskohteesee liittyvää havaitoaieistoa eli tilastoaieistoa. Tutkitaa valittua joukkoa ja se

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut Mat-2.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Kaksiulotteie ormaalijakauma Mitta-asteikot Havaitoaieisto kuvaamie ja otostuusluvut Avaisaat: Ehdollie jakauma, Ehdollie odotusarvo, Ehdollie variassi,

Lisätiedot

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Estimoitimeetelmät TKK (c) Ilkka Melli (2005) 1 Estimoitimeetelmät Todeäköisyysjakaumie parametrie estimoiti Momettimeetelmä Normaalijakauma parametrie estimoiti Ekspoettijakauma

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu ja tilastolliset mallit Johdanto TKK (c) Ilkka Mellin (2005) 1 Koesuunnittelu: Johdanto Johdattelevia esimerkkejä Tilastolliset kokeet TKK (c) Ilkka Mellin (2005) 2 Koesuunnittelu: Johdanto

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme? TKK (c) Ilkka Melli (4) Johdato Johdatus todeäköisyyslasketaa TKK (c) Ilkka Melli (4) : Mitä opimme? / Tutustumme tässä luvussa seuraavii ormaalijakaumasta (ks. lukua Jatkuvia jakaumia) johdettuihi jakaumii:

Lisätiedot

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2005) 1 Tilastollisten aineistojen kuvaaminen Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten muuttujien tunnusluvut

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Melli Tilastolliset meetelmät Osa 2: Otokset, otosjakaumat ja estimoiti Estimoitimeetelmät TKK (c) Ilkka Melli (2007) Estimoitimeetelmät >> Todeäköisyysjakaumie parametrie estimoiti Suurimma uskottavuude

Lisätiedot

Mat-2.090 Sovellettu todennäköisyyslasku A

Mat-2.090 Sovellettu todennäköisyyslasku A Mat-.090 Sovellettu todeäköiyylaku A Mat-.090 Sovellettu todeäköiyylaku A / Ratkaiut Aiheet: Avaiaat: Tilatollite aieito keräämie ja mittaamie Tilatollite aieitoje kuvaamie Oto ja otojakaumat Aritmeettie

Lisätiedot

Tunnuslukuja 27 III TUNNUSLUKUJA

Tunnuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 28 Tuuslukuja käytetää, ku tilastoaieistoa havaiollistetaa tiivistetysti yksittäisillä luvuilla. Tuusluvut lasketaa muuttujie arvoje perusteella ja e kuvaavat

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todeäköisyyslaskea ja tilastotietee peruskurssi 4A Satuaisotata ja parametrie estimoiti Lasse Leskelä Matematiika ja systeemiaalyysi laitos Perustieteide korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Tilastollinen todennäköisyys

Tilastollinen todennäköisyys Tilastollie todeäköisyys TOD.NÄK JA TILASTOT, MAA10 Klassisessa todeäköisyydessä oli ehdot: äärellisyys ja symmetrisyys. Tämä tilae o usei mahdoto ts. alkeistapauksia o usei ääretö määrä tai e eivät ole

Lisätiedot

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä Otatajakauma kuvaa tarkasteltava parametri jakauma eri otoksista laskettua parametria o joki yleesä tuusluku, esim. keskiarvo, suhteellie osuus, riskisuhde, korrelaatiokerroi, regressiokerroi, je. parametria

Lisätiedot

Tilastollisten aineistojen kuvaaminen

Tilastollisten aineistojen kuvaaminen Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2007) 1 Tilastollisten aineistojen kuvaaminen >> Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten

Lisätiedot

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489 Perusjoukko ja otos Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Havaitoyksikkö o empiirise mittaukse kohde Perusjoukko o kaikkie havaitoyksiköide muodostama kokoaisuus Otos o perusjoukkoa

Lisätiedot

8. laskuharjoituskierros, vko 11, ratkaisut

8. laskuharjoituskierros, vko 11, ratkaisut Mat-2.091 Sovellettu todeäköisyyslasku, kevät -05 Heliövaara, Palo, Melli 8. laskuharjoituskierros, vko 11, ratkaisut D1. Oletetaa, että havaiot X i, i = 1, 2,..., 100 muodostavat yksikertaise satuaisotokse

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Todennäköisyyslaskennan peruskäsitteet. Todennäköisyyslaskennan peruskäsitteet. Todennäköisyyslaskennan peruskäsitteet: Mitä opimme?

Todennäköisyyslaskennan peruskäsitteet. Todennäköisyyslaskennan peruskäsitteet. Todennäköisyyslaskennan peruskäsitteet: Mitä opimme? TKK (c) Ilkka Melli (2004) 1 Todeäköisyyslaskea peruskäsitteet Johdatus todeäköisyyslasketaa Todeäköisyyslaskea peruskäsitteet TKK (c) Ilkka Melli (2004) 2 Todeäköisyyslaskea peruskäsitteet: Mitä opimme?

Lisätiedot

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla. Kombiatoriikka, kesä 2010 Harjoitus 2 Ratkaisuehdotuksia (RT) (5 sivua) Käytä tehtävissä 1-3 kombiatorista päättelyä. 1. Osoita, että kaikilla 0 b a pätee ( ) a a ( ) k 1 b b 1 kb Biomikertoime määritelmä

Lisätiedot

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla. Kvatitatiivie metodologia verkossa Moitasomallius Pekka Ratae Helsigi yliopisto isältö Moitasomallit Matemaattisia peruskäsitteitä Esimerkki kovariassista Otatavirhe Esimerkki elittävie muuttujie lisäämie

Lisätiedot

Otantajakauman käyttö päättelyssä

Otantajakauman käyttö päättelyssä Keskiarvo otatajakauma Toisistaa tietämättä kaksi tutkijaa tutkii samaa ilmiötä, jossa perusjoukko koostuu kuudesta tutkittavasta ja tarkoituksea o laskea keskiarvo A: Kokoaistutkimus B: Otatatutkimus

Lisätiedot

Otannasta ja mittaamisesta

Otannasta ja mittaamisesta Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ). HY / Matematiika ja tilastotietee laitos Tilastollie päättely II, kevät 018 Harjoitus 5B Ratkaisuehdotuksia Tehtäväsarja I 1. (Jatkoa Harjoitus 5A tehtävää ). Moistee esimerki 3.3.3. mukaa momettimeetelmä

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollise aalyysi perusteet, kevät 007 6. lueto: Johdatus regressioaalyysii S ysteemiaalyysi Tekillie korkeakoulu Kai Virtae 1 Regressioaalyysi idea Tavoitteea selittää selitettävä tekiä/muuttua

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

****************************************************************** ****************************************************************** 7 Esim.

****************************************************************** ****************************************************************** 7 Esim. 8.3. Kombiaatiot MÄÄRITELMÄ 6 Merkitä k, joka luetaa yli k:, tarkoittaa lause- ketta k = k! ( k)! 6 3 2 1 6 Esim. 1 3 3! = = = = 3! ( 3)! 3 2 1 3 2 1 3 2 1 Laskimesta löydät äppäime, jolla kertomia voi

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Tilastolliset menetelmät: Tilastolliset testit

Tilastolliset menetelmät: Tilastolliset testit Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille 0. Testejä järjestysasteikollisille muuttujille. Testejä laatueroasteikollisille

Lisätiedot

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa. Testimuuttuja kriittie arvo 5 %: merkitsevyystasolla katsotaa taulukosta. Kriittie arvo o 9,488. Koska laskettu arvo 4,35 o pieempi kui taulukosta saatu kriittie arvo 9,488, ii ollahypoteesi jää voimaa.

Lisätiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot TKK (c) Ilkka Melli (4) Testit suhdeasteikollisille muuttujille Johdatus tilastotieteesee Testit suhdeasteikollisille muuttujille Testit ormaalikauma parametreille Yhde otokse t-testi Kahde otokse t-testi

Lisätiedot

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat: Mat-.090 Sovellettu todeäköisyyslasku A Mat-.090 Sovellettu todeäköisyyslasku A / Ratkaisut Aiheet: Avaisaat: Otos- ja otosjakaumat Estimoiti Estimoitimeetelmät Väliestimoiti Aritmeettie keskiarvo, Beroulli-jakauma,

Lisätiedot

4.3 Signaalin autokorrelaatio

4.3 Signaalin autokorrelaatio 5 4.3 Sigaali autokorrelaatio Sigaali autokorrelaatio kertoo kuika paljo sigaali eri illä korreloi itsesä kassa (josta imiki). Se o Fourier-muuokse ohella yksi käyttökelpoisimmista sigaalie aalysoitimeetelmistä.

Lisätiedot

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet Ilkka Melli Todeäköisyyslasketa Osa 2: Satuaismuuttujat ja todeäköisyysjakaumat Kovergessikäsitteet ja raja arvolauseet TKK (c) Ilkka Melli (2006) 1 Kovergessikäsitteet ja raja arvolauseet >> Kovergessikäsitteitä

Lisätiedot

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1 Johdatus todeäköisyyslasketaa Kovergessikäsitteet ja raja-arvolauseet TKK (c) Ilkka Melli (2004) 1 Kovergessikäsitteet ja raja-arvolauseet Kovergessikäsitteitä Suurte lukuje lait Keskeie raja-arvolause

Lisätiedot

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit Mat-.09 Sovellettu todeäköisyyslasku Mat-.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Estimoiti Luottamusvälit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Estimaattori, Estimoiti, Frekvessi,

Lisätiedot

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1 35 Naiivi Bayes Luokkamuuttua C o Bayes-verko uuri a attribuutit X i ovat se lehtiä Naiivi oletus o, että attribuutit ovat ehdollisesti riippumattomia toisistaa aettua luokka Ku käytössä o Boole muuttuat,

Lisätiedot

Todennäköisyyslaskenta: Todennäköisyys ja sen laskusäännöt

Todennäköisyyslaskenta: Todennäköisyys ja sen laskusäännöt Todeäköisyys ja se laskusääöt Todeäköisyyslasketa: Todeäköisyys ja se laskusääöt 1. Johdato 2. Joukko opi peruskäsitteet 3. Todeäköisyyslaskea peruskäsitteet 4. Todeäköisyyslaskea peruslaskusääöt 5. Klassie

Lisätiedot

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli TKK (c) Ilkka Melli (2005) Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää

Lisätiedot

Todennäköisyyslaskenta: Todennäköisyysjakaumia

Todennäköisyyslaskenta: Todennäköisyysjakaumia Todeäköisyysjakaumia Todeäköisyyslasketa: Todeäköisyysjakaumia 6. Diskreettejä jakaumia 7. Jatkuvia jakaumia 8. Normaalijakaumasta johdettuja jakaumia 9. Moiulotteisia jakaumia Ilkka Melli 35 Todeäköisyysjakaumia

Lisätiedot

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko

SELITETTÄVÄ MUUTTUJA SELITTÄVÄ MUUTTUJA. Välimatka- tai suhdelukuasteikko. Laatuero- tai järjestysasteikko. Laatuero- tai järjestysasteikko Moimuuttujameetelmät Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Mikko Mattila 009 1 Yhde muuttuja meetelmät (uivariate statistics): keskiluvut ja hajotaluvut Moimuuttujameetelmät:

Lisätiedot

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot

Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille. Testit laatueroasteikollisille muuttujille: Esitiedot TKK (c) Ilkk Melli (24) Johdtus tilstotieteesee TKK (c) Ilkk Melli (24) 2 : Mitä opimme? Trkstelemme tässä luvuss seurvi ltuerosteikolliste muuttujie testejä: Testukse kohtee testeissä o Beroulli-jkum

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.

Lisätiedot

Tilastotieteen johdantokurssi

Tilastotieteen johdantokurssi VAASAN YLIOPISTO Tilastotietee johdatokurssi Luetoruko Christia Gustafsso 1 SISÄLLYSLUETTELO 1. JOHDANTO... 1.1. Mitä tilastotiede o?... 1.. Tilastotietee historiaa... 3. HAVAINTOAINEISTON HANKINNASTA

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II Otokset MS-A050 Todeäköisyyslaskea ja tilastotietee peruskurssi Lueot, osa II Kaksi hyödyllista jakaumaa 3 Estimoiti G. Gripeberg 4 Luottamusvälit Aalto-yliopisto. helmikuuta 05 5 Hypoteesie testaus 6

Lisätiedot

Kandidaatintutkielman aineistonhankinta ja analyysi

Kandidaatintutkielman aineistonhankinta ja analyysi Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi

Lisätiedot

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa

Lisätiedot

2-suuntainen vaihtoehtoinen hypoteesi

2-suuntainen vaihtoehtoinen hypoteesi Mat-.6 Sovellettu todeäköisyyslasketa. harjoitukset Mat-.6 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Tilastolliset testit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, F-jakauma,

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2017 Käytännön järjestelyt Luennot: Luennot maanantaisin (sali E) ja keskiviikkoisin (sali U4) klo 10-12 Luennoitsija: (lauri.viitasaari@aalto.fi)

Lisätiedot

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen.

10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen. 10 Kertolaskusäätö Kahta tapahtumaa tai satuaisilmiötä saotaa riippumattomiksi, jos toise tulos ei millää tavalla vaikuta toisee. Esim. 1 A = (Heitetää oppaa kerra) ja B = (vedetää yksi kortti pakasta).

Lisätiedot

2. Mittaus ja data 2.1. Johdanto. 2.2. Mittaustyypit

2. Mittaus ja data 2.1. Johdanto. 2.2. Mittaustyypit 2. Mittaus ja data 2.. Johdato Voidaksemme keksiä tosimaailma relaatioita tarkastelemme sitä kuvaavaa dataa, jote esiksi selvitämme, mitä data perimmiltää o. Data kerätää kuvaamalla mielekiitoaluee oliot

Lisätiedot

Sormenjälkimenetelmät

Sormenjälkimenetelmät Sormejälkimeetelmät Matti Risteli mristeli@iksula.hut.fi Semiaariesitelmä 23.4.2008 T-106.5800 Satuaisalgoritmit Tietotekiika laitos Tekillie korkeakoulu Tiivistelmä Sormejälkimeetelmät ovat satuaisuutta

Lisätiedot

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op) Aalto-yliopisto 2016 Käytannön järjestelyt Luennot: Luennot ma 4.1. (sali E) ja ti 5.1 klo 10-12 (sali C) Luennot 11.1.-10.2. ke 10-12 ja ma 10-12

Lisätiedot

Kvantitatiivisen aineiston analyysi

Kvantitatiivisen aineiston analyysi Kvantitatiivisen aineiston analyysi Liiketalouden tutkimusmenetelmät SL 2014 Kvantitatiivinen vs. kvalitatiivinen? tutkimuksen lähtökohtana ovat joko tiedostetut tai tiedostamattomat taustaoletukset (tieteenfilosofiset

Lisätiedot

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus:

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus: 1. Tietyllä koeella valmistettavie tiivisterekaide halkaisija keskihajoa tiedetää oleva 0.04 tuumaa. Kyseisellä koeella valmistettuje 100 rekaa halkaisijoide keskiarvo oli 0.60 tuumaa. Määrää 95%: ja 99%:

Lisätiedot

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku Tilastollie päättely 6.1. Johdato Bayesi kaava, Bayeslaie lähestymistapa, Eakkotieto, Estimoiti, Frekvetistie lähestymistapa, Frekvessitulkita, Klassie lähestymistapa, Luottamustaso, Luottamusväli, Merkitsevyystaso,

Lisätiedot

Tilastotieteen perusteet

Tilastotieteen perusteet VAASAN YLIOPISTO Tilastotieteeperusteet Luetoruko Christia Gustafsso SISÄLLYSLUETTELO 1. JOHDANTO... 3 1.1. Mitä tilastotiede o?... 3 1.. Tilastotietee historiaa... 4. HAVAINTOAINEISTO JA MITTAAMINEN...

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat: Mat-.60 Sovellettu todeäköisyyslasketa B Mat-.60 Sovellettu todeäköisyyslasketa B / Ratkaisut Aiheet: Estimoiti Estimoitimeetelmät Väliestimoiti Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Beroulli-koe,

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

χ 2 -yhteensopivuustesti

χ 2 -yhteensopivuustesti Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Tilastollie

Lisätiedot

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N 11.9.2018/1 MTTTP1, luento 11.9.2018 KERTAUSTA Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N Populaation yksikkö tilastoyksikkö, havaintoyksikkö Otos populaation

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

S Laskennallinen systeemibiologia

S Laskennallinen systeemibiologia S-4250 Laskeallie systeemibiologia Harjoitus Mittaustuloksea o saatu havaitoparia (x, y ),, (x, y ) Muuttuja y käyttäytymistä voidaa selittää muuttuja x avulla esimerkiksi yksikertaise lieaarise riippuvuude

Lisätiedot

Valvontakortit. Sovelletun Matematiikan Erikoistyö. Pastinen Tommi 23.4.2010

Valvontakortit. Sovelletun Matematiikan Erikoistyö. Pastinen Tommi 23.4.2010 Valvotakortit Sovelletu Matematiika Erikoistyö Pastie Tommi 3.4. Tässä työssä perehdytää valvotakortteihi tilastollisessa laaduvalvoassa perusteoria ja esimerkkitapauste kautta. Sisältö Johdato... 3 Tilastollisesta

Lisätiedot

MONISTE 2 Kirjoittanut Elina Katainen

MONISTE 2 Kirjoittanut Elina Katainen MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

pisteet Frekvenssi frekvenssi Yhteensä

pisteet Frekvenssi frekvenssi Yhteensä 806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

χ 2 -yhteensopivuustesti

χ 2 -yhteensopivuustesti Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset Mat-.60 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Yhteesopivuude, homogeeisuude ja riippumattomuude testaamie Tilastollie

Lisätiedot

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Tilastollinen riippuvuus ja korrelaatio. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteesee Tilastollie riippuvuus ja korrelaatio TKK (c) Ilkka Melli (2004) 1 Tilastollie riippuvuus ja korrelaatio Tilastollie riippuvuus, korrelaatio ja regressio Kahde muuttuja havaitoaieisto

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Tilastotieteen perusteet

Tilastotieteen perusteet VAASANYLIOPISTO Tilastotieteeperusteet Luetoruko Christia Gustafsso SISÄLLYSLUETTELO. JOHDANTO... 3.. Mitä tilastotiede o?... 3.. Tilastotietee historiaa... 4. HAVAINTOAINEISTO JA MITTAAMINEN... 6.. Peruskäsitteitä...

Lisätiedot

Johda jakauman momenttiemäfunktio ja sen avulla jakauman odotusarvo ja varianssi.

Johda jakauman momenttiemäfunktio ja sen avulla jakauman odotusarvo ja varianssi. Mat-2.090 Sovellettu todeäköisyyslasku A Mat-2.090 Sovellettu todeäköisyyslasku A / Pistetehtävät 2, 4, 6, 8, 0 Aiheet: Avaisaat: Momettiemäfuktio Satuaismuuttujie muuokset ja iide jakaumat Kovergessikäsitteet

Lisätiedot

Tilastolliset luottamusvälit

Tilastolliset luottamusvälit Luku 8 Tilastolliset luottamusvälit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 8.1 Piste-estimaatti ja väliestimaatti Edellisessä luvussa opittii määrittämää parametreille estimaatteja suurimma uskottavuude

Lisätiedot