Sovellettu todennäköisyyslaskenta B

Samankaltaiset tiedostot
tilastotieteen kertaus

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Harjoitus 2: Matlab - Statistical Toolbox

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2004) 1

Tilastollisten aineistojen kerääminen ja mittaaminen. Tilastollisten aineistojen kerääminen ja mittaaminen

Johdatus tilastotieteeseen Tilastollisten aineistojen kerääminen ja mittaaminen. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1

Sovellettu todennäköisyyslaskenta B

Tilastollisten aineistojen kerääminen ja mittaaminen

Tilastollisten aineistojen kuvaaminen

pisteet Frekvenssi frekvenssi Yhteensä

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

7. laskuharjoituskierros, vko 10, ratkaisut

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Populaatio tutkimusobjektien muodostama joukko, johon tilastollinen tutkimus kohdistuu, koko N

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

Testit laatueroasteikollisille muuttujille

MONISTE 2 Kirjoittanut Elina Katainen

Mittaaminen menettely (sääntö), jolla tilastoyksikköön liitetään tiettyä ominaisuutta kuvaava luku, mittaluku.

Osa 2: Otokset, otosjakaumat ja estimointi

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B

Kvantitatiiviset menetelmät

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollinen aineisto Luottamusväli

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Otannasta ja mittaamisesta

1 TILASTOMATEMATIIKKA TILASTOTIETEEN PERUSKÄSITTEITÄ MUUTTUJAT FREKVENSSIJAKAUMA AINEISTON LUOKITTELU...

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Kandidaatintutkielman aineistonhankinta ja analyysi

Sovellettu todennäköisyyslaskenta B

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Testit järjestysasteikollisille muuttujille

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Til.yks. x y z

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Teema 8: Parametrien estimointi ja luottamusvälit

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

3 Mittaamisen taso ja tilaston keskiluvut

Teema 3: Tilastollisia kuvia ja tunnuslukuja

2. Aineiston kuvailua

Sovellettu todennäköisyyslaskenta B

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Johdatus tilastotieteeseen Tilastolliset testit. TKK (c) Ilkka Mellin (2005) 1

Matemaatikot ja tilastotieteilijät

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Tilastolliset testit. Tilastolliset testit. Tilastolliset testit: Mitä opimme? 2/5. Tilastolliset testit: Mitä opimme? 1/5

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Estimointi. Vilkkumaa / Kuusinen 1

1 TILASTOJEN KÄYTTÖ 7. Mitä tilastotiede on 7 Historiaa 8 Tilastotieteen nykyinen asema 9 Tilastollisen tutkimuksen vaiheet 10

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Harjoitus 7: NCSS - Tilastollinen analyysi

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

Tilastollisia peruskäsitteitä ja Monte Carlo

Testejä suhdeasteikollisille muuttujille

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Sovellettu todennäköisyyslaskenta B

Väliestimointi (jatkoa) Heliövaara 1

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

TUTKIMUSKURSSI I (407040A-02), OSA A), KVANTITATIIVISEN TUTKIMUKSEN PERUSKURSSI, TILASTOLLISET ANALYYSIMENETELMÄT

Koesuunnittelu ja tilastolliset mallit Johdanto. TKK (c) Ilkka Mellin (2005) 1

Kuvioita, taulukoita ja tunnuslukuja. Aki Taanila

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

Luottamusvälit. Normaalijakauma johnkin kohtaan

Tutkimustiedonhallinnan peruskurssi

MTTTP1, luento KERTAUSTA

Sisältö. Perusteiden Kertaus. Tilastollinen analyysi. Peruskäsitteitä. Peruskäsitteitä. Kvantitatiivinen metodologia verkossa

MTTTP1, luento KERTAUSTA

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Johdatus todennäköisyyslaskentaan Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2005) 1

Mat Tilastollisen analyysin perusteet, kevät 2007

Transkriptio:

Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15

1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä Kontrolloidut kokeet Tilastolliset mitta-asteikot 2 Aineistojen kuvaaminen Frekvenssit ja havaintoarvojen jakauma Tunnuslukuja suhdeasteikolliselle aineistolle Standardointi ja tilastollinen etäisyys Tunnuslukuja järjestysasteikollisille aineistolle Antti Rasila () TodB 11. lokakuuta 2007 2 / 15

Mitä tilastotiede on? Sana tilasto (statistics) viittaa valtioon. Hallitsijat halusivat saada tietoa asukkaistaan, kaupasta, jne. valtion asioiden hoitamista varten. Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa ilmiöitä koskeviin tietoihin liittyy epävarmuutta ja satunnaisuutta. Tilastotiede on todennäköisyyslaskennan tärkeimpiä sovellusalueita. Antti Rasila () TodB 11. lokakuuta 2007 3 / 15

Peruskäsitteitä Tilastolla tarkoitetaan johonkin joukkoon liittyvää numeerista informaatiota, joka saadaan yhdistelemällä ko. joukon yksittäisiin alkioihin liittyviä tietoja. Tarkastelun kohteena olevaa joukkoa kutsutaan perusjoukoksi eli populaatioksi ja sen alkioita yksiköiksi. Tilastoa tarkastellaessa tutkitaan jotakin yksiköiden ominaisuutta. Luotettavin tulos saadaan, jos tutkitaan jokainen perusjoukon alkio erikseen. Yleensä tämä ei ole mahdollista. Siksi yleensä tyydytään tutkimaan perusjoukkoa ottamalla siitä jokin otos. Antti Rasila () TodB 11. lokakuuta 2007 4 / 15

Tilastollisen kuvailun ja päättelyn menetelmiä Kuvailun menetelmiä: Tilastografiikka Tilastolliset tunnusluvut Tilastolliset mallit Päättelyn menetelmiä: Tilastolliset mallit Tilastollinen testaus Antti Rasila () TodB 11. lokakuuta 2007 5 / 15

Aineiston kerääminen Kohdistuuko tutkimus koko perusjoukkoon vai vain johonkin sen osaan? Tutkimusta kutsutaan kokonaistutkimukseksi, jos perusjoukon kaikki alkiot tutkitaan. Tutkimusta kutsutaan otantatutkimukseksi, jos perusjoukon alkioista vain osa tutkitaan. (Otoksen valitsemiseen on useita erilaisia tapoja.) Muutetaanko tutkimuksessa aktiivisesti tutkimuksen kohteiden olosuhteita? Tutkimus on koe, jos tutkitaan olosuhteiden muuttamisen vaikutusta tutkimuksen kohteisiin. Jos olosuhteita ei muuteta aktiiivisesti, sanomme, että tutkimus perustuu suoriin havaintoihin Antti Rasila () TodB 11. lokakuuta 2007 6 / 15

Kontrolloidut kokeet Kokeesta ei voida tehdä luotettavia johtopäätöksiä, ellei koe ole kontrolloitu: Kokeessa on vertailtava vähintään kahden erilaisen käsittelyn vaikutuksia. Käsittelyjen kohdistamisessa on käytettävä satunnaistusta. Kokeessa on tehtävä riittävästi koetoistoja. Antti Rasila () TodB 11. lokakuuta 2007 7 / 15

Mittaaminen Tilastollisen tutkimuksen kohdetta kuvaavat numeeriset ja kvantitatiiviset tiedot saadaan mittaamalla. Mittari on funktio, joka liittää mitattavan kohteen ominaisuuteen numeerisen arvon. Antti Rasila () TodB 11. lokakuuta 2007 8 / 15

Tilastolliset mitta-asteikot Nominaali- eli laatueroasteikkoa voidaan käyttää silloin, kun osataan erottaa keskenään erilaiset yksiköt. Esimerkiksi omena vai appelsiini? Ordinaali- eli järjestysasteikkoa käytetään silloin, kun tilastoyksiköt voidaan jakaa luokkiin, joiden välillä on järjestys. Esim. oppiarvot: ylioppilas, kandidaatti, di/maisteri, lisensiaatti, tohtori. Intervalli- eli välimatka-asteikko. Esim. lämpötila Celsius-asteina. Suhdeasteikossa on lisäksi absoluuttinen nollakohta. Suhdeasteikolla on mielekästä kysyä, kuinka monta kertaa enemmän tai vähemmän. Esimerkiksi pituus tai lämpötila Kelvin-asteikolla. Kvalitatiivisia ominaisuuksia kuvataan laatueroasteikollisilla muuttujilla ja kvantitatiivisia puolestaan välimatka- tai suhdeasteikollisilla muuttujilla. Antti Rasila () TodB 11. lokakuuta 2007 9 / 15

Frekvenssit ja havaintoarvojen jakauma Jos muuttuja on diskreetti, havaittujen arvojen jakaumaa kuvataan frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä, joka on pylväsdiagrammi. Jos muuttuja on jatkuva, havaittujen arvojen jakaumaa kuvataan luokitellulla frekvessijakaumalla ja sitä vastaavalla graafisella esityksellä, joka on histogrammi. Histogrammissa pinta-ala vastaa frekvenssiä ja pylväsdiagrammissa korkeus. Muuttujan x mahdolliset arvot y 1, y 2,..., y m yhdessä niiden havaittujen frekvenssien f 1, f 2,..., f m kanssa muodostavat muuttujan x havaittujen arvojen x 1, x 2,... x n frekvenssijakauman. Siinä missä todennäköisyyksien summa on aina yksi, on nyt f i = n. Antti Rasila () TodB 11. lokakuuta 2007 10 / 15

Tunnuslukuja suhdeasteikolliselle aineistolle 1/2 Aritmeettinen keskiarvo: x = 1 n n i=1 x i Otosvarianssi: s 2 = 1 n 1 i=1 Otoskeskihajonta: s = s 2 n (x i x) 2 = 1 ( n ) xi 2 n x 2 n 1 i=1 Antti Rasila () TodB 11. lokakuuta 2007 11 / 15

Tunnuslukuja suhdeasteikolliselle aineistolle 2/2 Origomomentit: Keskusmomentit: a k = 1 n m k = 1 n n xi k i=1 n (x i x) k i=1 Antti Rasila () TodB 11. lokakuuta 2007 12 / 15

Standardointi ja tilastollinen etäisyys Standardoitujen havaintoarvojen z i = x i x, i = 1, 2,..., n s x aritmeettinen keskiarvo ja otosvarianssi ovat z = 1 n n i=1 z i = 0 s 2 z = 1 n 1 n (z i z) 2 = 1 i=1 Havaintoarvojen x k ja x l tilastollinen etäisyys d kl on d kl = x k x l s x Antti Rasila () TodB 11. lokakuuta 2007 13 / 15

Tunnuslukuja järjestysasteikollisille aineistolle Järjestystunnusluvut: Suuruusjärjestyksessä k. havaintoarvoa z k kutsutaan k. järjestystunnusluvuksi. Minimi ja maksimi eli pienin ja suurin arvo. Vaihteluväli ja sen pituus. Prosenttipisteet z p : p. prosenttipiste jakaa aineiston kahteen osaan: p% havainnoista on prosenttipistettä pienempiä ja loput (100 p)% suurempia. Mediaani eli Me = z 50 jakaa aineiston kahteen yhtä suureen osaan. Kvartiilit: Q 1 = z 25, Q 2 = z 50 = Me ja Q 3 = z 75. Kvartiilipoikkeama: (Q 3 Q 1 )/2 Antti Rasila () TodB 11. lokakuuta 2007 14 / 15

Tunnuslukuja laatueroasteikollisille aineistoille Suhteelliset frekvenssit f i /n. Moodi eli tyyppiarvo eli yleisin havaintoarvo. Antti Rasila () TodB 11. lokakuuta 2007 15 / 15