((12345A, 5, 1, 5), (98759K, 1, 5, 2), (33312K, 4, 4, 3), (23453B, 4, 4, 3), (21453U, 3, 3, 3)),

Koko: px
Aloita esitys sivulta:

Download "((12345A, 5, 1, 5), (98759K, 1, 5, 2), (33312K, 4, 4, 3), (23453B, 4, 4, 3), (21453U, 3, 3, 3)),"

Transkriptio

1 Luku 6 Datajoukkoje jakaumat, tuusluvut ja kuvaajat Lasse Leskelä Aalto-yliopisto 28. marraskuuta Datajoukko ja datakehikko Tässä moisteessa datajoukko tarkoittaa järjestettyä listaa keskeää samatyyppisiä alkioita, esimerkiksi lukuja, merkkijooja tai äistä muodostettuja listoja. Moiulotteie datajoukko o datajoukko, joka alkiot ovat järjestettyjä listoja. Moiulotteie datajoukko esitetää yleesä datakehikkoa (egl. data frame) eli taulukkoa, joka jokaie rivi vastaa yhtä moiulotteise datajouko alkiota, ja joka sarakkeita kutsutaa datajouko muuttujiksi. Esimerkki 6.. Allaoleva datakehikko kuvastaa fiktiivise kurssi kurssipalautteesta koostettua eliulotteista datajoukkoa ((2345A, 5,, 5), (98759K,, 5, 2), (3332K, 4, 4, 3), (23453B, 4, 4, 3), (2453U, 3, 3, 3)), jossa o yksi merkkijooarvoie muuttuja (opiskelijaumero) ja kolme lukuarvoista muuttujaa (yleisarvio, työläys, hyödyllisyys). Opiskelijaumero Yleisarvio Työläys Hyödyllisyys 2345A K K B U Tämä datajoukko voidaa myös tulkita eljä yksiulotteise datajouko listaa, esimerkiksi muuttujaa Yleisarvio vastaa datajoukko (5,, 4, 4, 3). Datajoukko ei ole tarkassa matemaattisessa mielessä joukko, sillä datajoukossa sama alkio voi esiityä mota kertaa. 76

2 6.2 Empiirie jakauma Suuresta datajoukosta (x,..., x ) o hakala muodostaa mielikuvaa pelkästää tarkastelemalla sitä vastaavaa datakehikkoa. Silloi kaattaa tutkia eri arvoje esiityvyyksiä. Arvo x esiityvyys eli frekvessi (x) = #{i : x i = x} o datajoukossa arvoltaa x olevie alkioide lukumäärä. Yksiulotteiselle datajoukolle eri arvoje esiityvyydet o tapaa raportoida esiityvyystaulukkoa tai vaakasuutaisea palkkikaavioa. Esimerki 6. datakehiko muuttujaa Yleisarvio vastaava datajouko (5,, 4, 4, 3) esiityvyystaulukko o esitetty alla. 5 x (x) Taulukko 6.: Datajouko (5,, 4, 4, 3) esiityvyydet. Ku halutaa vertailla arvoje esiityvyyksiä moessa erikokoisissa datajoukoissa, o absoluuttiste lukumäärie sijaa suositeltavaa vertailla suhteellisia esiityvyyksiä. Arvo x suhteellie esiityvyys f(x) = (x) (6.) kertoo, mikä osuus datajouko alkioista o arvoltaa x. Suhteelliset esiityvyydet o tapaa raportoida taulukkoa tai pylväskaavioa. Taulukossa 6. esitety datajouko suhteelliset esiityvyydet o esitetty alla x f(x) Taulukko 6.2: Datajouko (5,, 4, 4, 3) suhteelliset esiityvyydet. Ylläoleva tauluko suhteelliset esiityvyydet ovat ei-egatiivisia ja summautuvat ykköseksi. Tästä seuraa, että kaava (6.) määrittämä fuktio f(x) o joki diskreeti jakauma tiheysfuktio. Kyseie diskreetti jakauma o 77

3 datajouko (x,..., x ) empiirie jakauma, ja fuktio f(x) sitä vastaava empiirie tiheysfuktio. Seuraava tulos ataa ituitiivise tulkia datajouko empiiriselle jakaumalle. Se mukaa empiirie jakauma voidaa tulkita todeäköisyysjakaumaa satuaismuuttujalle, joka saadaa valitsemalla datajoukosta yksi alkio tasaise satuaisesti. Datajouko empiirie tiheysfuktio f(x) kertoo siis todeäköisyyde, jolla datajoukosta tasaise satuaisesti valittu alkio o arvoltaa x. Fakta 6.2. Datajoukosta (x,..., x ) satuaisotaalla valitu alkio arvo X oudattaa datajouko empiiristä jakaumaa tiheysfuktioa f(x). Lisäksi pätee E[X] = x i (6.2) ja yleisemmi E[g(X)] = i= g(x i ). (6.3) Todistus. Datajoukosta tasaise satuaisesti poimittu alkio voidaa kirjoittaa satuaismuuttujaa X = x I, missä satuaismuuttuja I oudattaa ideksijouko {,..., } tasajakaumaa. Satuaismuuttuja X saa arvo x täsmällee silloi, ku satuaismuuttuja I kuuluu joukkoo A = {i : x i = x}, joka koko o #A = (x). Koska I oudattaa lukujouko {,..., } tasajakaumaa, pätee i= P(X = x) = P(I A) = #A = (x) = f(x). Perustellaa seuraavaksi kaava (6.3). Todetaa esiksi, että g(x i ) = x i= g(x)(x), sillä (x) kertoo lukumäärä, kuika mota kertaa arvo x esiityy yllä vasemma puole summassa. Odotusarvo yleistä laskukaavaa (3.2) ja empiirise tiheysfuktio määritelmää (6.) soveltamalla ähdää, että mielivaltaiselle fuktiolle g pätee E[g(X)] = x g(x)f(x) = x g(x) (x) = g(x)(x) = x g(x i ). i= Kaava (6.2) saadaa erikoistapauksea kaavasta (6.3), ku valitaa g(x) = x. 78

4 6.3 Ristitaulukko ja empiirie yhteisjakauma Kahde muuttuja datajoukko o järjestetty lista pareja ((x, y ),..., (x, y )). Arvopari (x, y) esiityvyys (x, y) = #{i : x i = x ja y i = y} o datajoukossa arvoltaa (x, y) olevie alkioide lukumäärä. Esimerki 6. muuttujat Yleisarvio ja Hyödyllisyys voidaa koostaa datajoukoksi ((5,5), (,2), (4,3), (4,3), (3,3)). Se arvoparie esiityvyydet voidaa taulukoida muodossa y x Yht Yht Ylläoleva esitys o muuttujie x ja y esiityvyyksie ristitaulukko (egl. cotigecy table) ja tällaista esitysmeetelmää kutsutaa ristiitaulukoimiseksi (egl. cross tabulatio). Ristitauluko rivisummista saadaa muuttuja x esiityvyydet (vrt. taulukko 6.) ja sarakesummista muuttuja y esiityvyydet. Arvopari (x, y) suhteellie esiityvyys määritellää kaavalla. f(x, y) = (x, y). (6.4) Datajouko ((5,5), (,2), (4,3), (4,3), (3,3)) suhteelliset esiityvyydet voidaa taulukoida muodossa y x Yht Yht Aiva kui yksiulotteisilleki datajoukoille, myös kaksiulotteise datajouko suhteelliset esiityvyydet f(x, y) ovat ei-egatiivisia ja summautuvat ykköseksi. Näi olle ylläoleva taulukko vastaa erää diskreeti yhteisjakauma tiheysfuktiota. Kyseie diskreetti jakauma o datajouko ((x, y ),..., (x, y )) empiirie yhteisjakauma, ja kaava (6.4) määrittämä fuktio f(x, y) sitä vastaava tiheysfuktio. Empiirise yhteisjakauma rivisummista saadaa datajouko (x,..., x ) empiirie jakauma (vrt. taulukko 6.2) ja sarakesummista datajouko (y,..., y ) empiirie jakauma. 79 5

5 Seuraava tulos tarjoaa todeäköisyystulkia empiiriselle yhteisjakaumalle. Se mukaa empiirie jakauma voidaa tulkita datajoukosta satuaisotaalla valitu pari yhteisjakaumaa, jolloi empiirie tiheysfuktio f(x, y) kertoo todeäköisyyde, jolla datajoukosta satuaisesti valitu pari arvot ovat x ja y. Tulokse todistus o raketeeltaa sama kui fakta 6.2 todistus. Fakta 6.3. Datajoukosta ((x, y ),..., (x, y )) satuaisotaalla valitu pari (X, Y ) yhteisjakauma o datajouko empiirie yhteisjakauma tiheysfuktioa f(x, y). Lisäksi pätee E[X] = x i, E[Y ] = y i, (6.5) ja yleisemmi i= E[g(X, Y )] = i= g(x i, y i ). (6.6) Todistus. Tarkastelu kohteea oleva datajoukko voidaa tulkita yksiulotteisea datajoukkoa (z,..., z ), joka alkiot koostuvat lukupareista z i = (x i, y i ). Satuaisesti valittu lukupari puolestaa voidaa esittää satuaismuuttujaa Z = (X, Y ). Tällöi fakta 6.2 mukaa P(Z = z) = i= ˆf(z), missä ˆf(z) o arvo z suhteellie esiityvyys datajoukossa (z,..., z ). Koska lukupari z = (x, y) suhteelliselle esiityvyydelle pätee ˆf(z) = f(x, y), havaitaa tästä että P(X = x, Y = y) = P(Z = z) = ˆf(z) = f(x, y). Satuaise lukupari (X, Y ) jakauma o siis datajouko empiirie yhteisjakauma. Kaava (6.6) perustelemiseksi tulkitaa g(x, y) yhde muuttuja fuktioa g(z) = g(x, y), joka syötteeä ovat lukuparit z = (x, y). Soveltamalla kaavaa (6.3) datajoukosta (z,..., z ) satuaisesti poimittuu alkioo Z havaitaa, että E[g(X, Y )] = E[ g(z)] = g(z i ) = g(x i, y i ). Näi olle kaava (6.6) o tosi. Kaavat (6.5) seuraavat erikoistapauksia sijoittamalla kaavaa (6.6) g(x, y) = x ja g(x, y) = y. 6.4 Datajouko keskiarvo ja keskihajota Yksiulotteise datajouko empiirie jakauma f(x) ataa hyvä kuva datajouko eri arvoje esiityvyyksistä. Kokoaise fuktio sijaa halutaa kuiteki usei raportoida yksittäisiä lukuja, jotka kuvaavat datajoukkoa. Tällaisia lukuja kutsutaa tuusluvuiksi. Lukuarvoise datajouko x = (x,..., x ) 80 i= i=

6 sijaitia kuvaavista tuusluvuista yleisi o keskiarvo m(x) = x i. i= Fakta 6.2 mukaa voidaa keskiarvo m(x) tulkita odotusarvoa E(X) datajoukosta satuaisotaalla poimitulle alkiolle X. Datajouko moodi o arvo, joka esiityvyys o suuri mahdollie. Toisi kui keskiarvo, moodi ei välttämättä ole yksikäsitteie. Datajouko hajotaa kuvaavia tuuslukuja ovat empiirie keskihajota sd e (x) = ( ) /2 (x i m(x)) 2, (6.7) i= ja otoskeskihajota sd s (x) = ( ) /2 (x i m(x)) 2. (6.8) i= Empiirie keskihajota o luoteva tapa mitata datajouko (x,..., x ) ormitettua eliöllistä vaihtelua, joka fakta 6.2 mukaa voidaa myös tulkita keskihajotaa SD(X) datajoukosta satuaisotaalla poimitulle alkiolle X. Otoskeskihajotaa puolestaa käytetää usei tilateissa, joissa tutemattoma datalähtee satuaisvaihtelu voimakkuutta pyritää estimoimaa siitä saadu rajallise havaio perusteella (tästä lisää luvussa 7). Empiirie keskihajota ja otoskeskihajota saadaa muuettua toisiksee kaava sd s (x) = ( ) /2 sd e (x) avulla, josta ähdää että sd s (x) sd e (x) suurille datajoukoille. Datajouko empiirie variassi ja otosvariassi määritellää kaavoilla var e (x) = sd e (x) 2 ja var s (x) = sd s (x) 2. (Yhteeveto tuusluvuista o kappaleessa 6.8.) 6.5 Kvatiilit Lukuarvoise datajouko kvatiili tasolla p (0, ) o tuusluku Q(p), joka avulla pilkotaa datajoukko kahtia ii, että alkioista suuri piirtei osuus p sijaitsee luvu Q(p) alapuolella ja loput alkioista luvu Q(p) yläpuolella. Tasoje 0.25, 0.5 ja 0.75 kvatiileja kutsutaa kvartiileiksi ja e tuetaa imillä alakvartiili, mediaai ja yläkvartiili. Tasoje 0.0, 0.02,... kvatiileja puolestaa kutsutaa prosetiileiksi. Yleisesti ottae kvatiilit määritellää järjestämällä datajouko (x,..., x ) alkiot suuruusjärjestyksee muodossa x () x (2) x (). 8

7 Luku x (k) o datajouko k:es järjestystuusluku. Taso p (0, ) kvatiili määritellää R-ohjelmistossa oletusarvoisesti peräkkäiste järjestystuuslukuje paiotettua keskiarvoa Q(p) = ( γ)x (j) + γx (j+), missä 2 j = p + ( p) ja γ = p + ( p) j. Ylläoleva kuvaus tulkittua p: fuktioksi o datajouko kvatiilifuktio 3. Kvatiilifuktio voi tulkita helpoite piirtämällä se kuvaaja seuraavasti: Jaetaa vaaka-akseli yksikköväli tasapituisee välii päätepisteiä luvut p k = (k )/( ), k =,...,. Piirretää tasoo pisteet (p k, x (k) ) ja yhdistetää e viivoilla. Esimerkki 6.4. Pieessä yrityksessä työsketelee eljä hekilöä, joide bruttopalkat ovat 2500, 3500, 2500, 9500 (eur/kk). Laske bruttopalkkoje järjestystuusluvut, piirrä kvatiilifuktio, ja määritä kvatiilifuktio avulla palkkajakauma alakvartiili, mediaai ja yläkvartiili. Datajouko (2500, 3500, 2500, 9500) järjestystuusluvut ovat x () = 2500, x (2) = 2500, x (3) = 3500 ja x (4) = Jaetaa vaaka-akseli yksikköväli kolmee yhtäpitkää osavälii päätepisteiä p = 0, p 2 = 3, p 3 = 2 3 ja p 4 =. Kvatiilifuktio kuvaaja saadaa piirtämällä tasoo pisteet (p, x () ),... (p 4, x (4) ) ja yhdistämällä e viivoilla Kvatiilifuktio kuvaajasta luetaa: alakvartiili Q(0.25) = 2500, mediaai Q(0.5) = 3000 ja yläkvartiili Q(0.75) = Tässä datajoukossa mediaai 3000 o reilusti pieempi kui keskiarvo x o luku x pyöristettyä alaspäi kokoaisluvuksi. 3 Kvatiilifuktio määritellää eri yhteyksissä hiema eri tavoi, esim. R-ohjelmisto tarjoaa kahdeksa vaihtoehtoista tapaa kvatiilifuktio laskemisee. 82

8 6.6 Kaksiulotteise datajouko tuusluvut Kahde muuttuja datajouko ((x, y ),..., (x, y )) yhteisvaihtelu suutaa ja voimakkuutta mitataa yleesä laskemalla empiirie kovariassi cov e (x, y) = (x i m(x))(y i m(y)) tai otoskovariassi cov s (x, y) = i= (x i m(x))(y i m(y)). i= Empiirie kovariassi ja otoskovariassi saadaa muuettua toisiksee kaava ( ) cov s (x) = cov e (x) avulla, josta ähdää että cov s (x) cov e (x) suurille datajoukoille. Kahde muuttuja datajouko korrelaatio määritellää ormittamalla empiirie kovariassi datajoukkoje x ja y empiirisillä keskihajooilla cor(x, y) = cov e(x, y) sd e (x) sd e (y). (6.9) Fakta 6.3 perusteella havaitaa, että empiirie kovariassi voidaa tulkita kovariassia Cov(X, Y ) satuaismuuttujie parille (X, Y ), joka saadaa poimimalla datajoukosta satuaie lukupari. Koska lisäksi pätee sd e (x) = SD(X) ja sd e (y) = SD(Y ), saadaa datajouko korrelaatiolle todeäköisyystulkita cor(x, y) = Cor(X, Y ). Soveltamalla faktaa (4.2) havaitaa, että mielivaltaise datajouko korrelaatio toteuttaa cor(x, y) +. Kaksiulotteie datajoukko voidaa visualisoida hajotakuvioa piirtämällä datajouko lukuparit (x, y)-tasoo. Alla o esitetty hajotakaaviot kolmelle kaksiulotteiselle sada alkio datajoukolle sekä iide korrelaatiot cor(x, y) = cor(x, y) = 0.44 cor(x, y) =

9 Koska määritelmässä (6.9) muotoa / olevat termit osoittajassa ja imittäjässä kumoavat toisesa, voidaa datajouko korrelaatio laskea myös muodossa i= cor(x, y) = (x i m(x))(y i m(y)) ( i= (x i m(x)) 2 ) /2 ( i= (y i m(y)) 2 ) /2 tai otoskovariassi ja otoskeskihajotoje avulla muodossa cor(x, y) = cov s(x, y) sd s (x) sd s (y). Datajouko korrelaatiota kutsutaa myös imellä Pearsoi korrelaatiokerroi erotuksea muista, järjestyslukuihi perustuvista korrelaatiokertoimista. 6.7 Histogrammi Silloi ku datajoukko sisältää suure määrä arvoja, saattaa tarkka esiityvyystaulukko tai empiirie jakauma olla liia yksityiskohtaie, jotta se voisi selkeästi hahmottaa. Tällöi o tapaa karkeistaa dataa osittamalla arvojoukko pieempää määrää lukuvälejä. Näi saadaa datajouko luokiteltu esiityvyystaulukko. Luokitellu esiityvyystauluko suhteellisia osuuksia esittävä kuvaaja o datajouko histogrammi. Histogrammi piirretää yleesä äi: Yksi pylväs per luokka Pylvää leveys = luokkaväli leveys (yksikköä vuosi) Pylvää korkeus = datapisteide suhteellie osuus jaettua palki leveydellä (yksikköä % per vuosi) Seuraava esimerkki valaisee asiaa. Esimerkki 6.5 (Suomalaiste ikärakee). Suomalaiste ikärakee sisältää = miljooaa datapistettä 4. Ei ole järkeä piirtää jokaista pistettä kuvaajaa, vaa jaetaa datapisteet luokkii. Esim: Suomalaiset Ikä (v) Lukumäärä Lähde: Tilastokeskus 84

10 . pylväs käsittää suomalaiset, joide ikä o 0 4 vuotta. pylvää leveys = 5 v Datapisteide lkm luokassa o ja suhteellie osuus / % Pylvää korkeus = 6.3/5.09 (yksikköä % per vuosi). prosettia per v %.7% 24.8% 26.7%.7% 8.8% v 6.8 Yhteeveto Alla o lista datajoukkoje ja satuaismuuttujie tuuslukuihi liittyvistä merkiöistä sekä iitä vastaavat R- ja Excel-komeot. Merkitä Selitys R Excel m(x) Datajouko (x,..., x ) keskiarvo mea(x) AVERAGE sd s(x) Datajouko (x,..., x ) otoskeskihajota sd(x) STDEV.S sd e(x) Datajouko (x,..., x ) empiirie keskihajota - STDEV.P var s(x) Datajouko (x,..., x ) otosvariassi var(x) VAR.S var e(x) Datajouko (x,..., x ) empiirie variassi - VAR.P cov s(x, y) Datajouko ((x, y ),..., (x, y )) otoskovariassi cov(x,y) COVARIANCE.S cov e(x, y) Datajouko ((x, y ),..., (x, y )) empiirie kovariassi - COVARIANCE.P cor(x, y) Datajouko ((x, y ),..., (x, y )) korrelaatio cor(x,y) CORREL E(X) Satuaismuuttuja X jakauma odotusarvo - - SD(X) Satuaismuuttuja X jakauma keskihajota - - Var(X) Satuaismuuttuja X jakauma variassi - - Cov(X, Y ) Satuaismuuttujie X ja Y jakauma kovariassi - - Cor(X, Y ) Satuaismuuttujie X ja Y jakauma korrelaatio

11 6.9 Saastoa Alla tässä luvussa esiityyttä saastoa eglaiksi kääettyä. Moet tähä aihepiirii liittyvät termit eivät kuitekaa ole täysi vakiitueita kummassakaa kielessä. suomi alakvartiili datajoukko datakehikko empiirie jakauma empiirie keskihajota empiirie kovariassi empiirie tiheysfuktio empiirie yhteisjakauma esiityvyys esiityvyystaulukko histogrammi järjestystuusluku keskiarvo keskihajota korrelaatio kovariassi kvatiili kvartiili mediaai moodi muuttuja otoskeskiarvo otoskeskihajota otoskorrelaatio otoskovariassi prosetiili ristiitaulukoiti ristitaulukko suhteellie esiityvyys taulukko tuusluku yläkvartiili eglati lower quartile data set data frame empirical distributio empirical/populatio stadard deviatio empirical/populatio covariace empirical desity fuctio empirical joit distributio frequecy cotigecy table histogram order statistic mea, average stadard deviatio correlatio covariace quatile quartile media mode variable sample mea/average sample stadard deviatio sample correlatio sample covariace percetile cross tabulatio cotigecy table relative frequecy table statistic upper quartile 86

12 Hakemisto alakvartiili, 8 Bayesi kaava, 7, 06 Beroulli-jakauma, 63, 88 betajakauma, 0 biomijakauma, 63 biomikerroi, 20 bitti, 47 Chebyshevi epäyhtälö, 54 datajoukko, 76 datakehikko, 76 ekspoettijakauma, 28 empiirie kovariassi, 82 etropia, 47 ergodie, 50 erotus, esiityvyysharha, 7 estimaattori, 97 harhato estimaattori, 97 hylkäysalue, 29 hyperparametri, 2 idikaattorifuktio, 29 järjestystuusluku, 8 jakauma, 24 diskreetti, 26 empiirie, 77, 79 jatkuva, 26 kertoma, 20 kertymäfuktio, 25 keskiarvo, 80 keskihajota jakauma, 52 satuaismuuttuja, 52 keskieliövirhe, 94 kombiatoriikka, 8 komplemetti, korrelaatio yhteisjakauma, 56 kovariassi yhteisjakauma, 55 kvatiilifuktio, 8 kvartiili, 8 leikkaus, lukumäärä listat, 9 osajoukot, 20 lukumäärä, järjestykset, 20 mediaai, 8 merkitsevyystaso, 26 mitallie fuktio, 37 joukko, 2 mometti, 46 moodi, 80 multiomijakauma, 35 muuttuja, 76 ollahypoteesi, 23 ormaalijakauma ormitettu, 69 osajoukko, 0 ositus, 0 osituskaava, 6 otoskovariassi, 82 p-arvo, 24 perusjoukko, 9 pieimmä eliösumma meetelmä, 94 pistemassafuktio, 26 38

13 pistetodeäköisyysfuktio, 26 Poisso-jakauma, 27, 74 posteriorijakauma, 06 priorijakauma, 06 prosetiili, 8 reuajakauma diskreetti, 32 jatkuva, 32 reuatiheysfuktio diskreetti, 32 jatkuva, 32 riippumattomat satuaismuuttujat, 33 tapahtumat, 4 satuaismuuttuja, 23 diskreetti, 26 sigma-algebra, 2 suppeemie stokastie, 4 suurimma uskottavuude estimaatti, 89 suurte lukuje laki, 4 vahva, 50 toteuma, 9 tulojoukko, tyhjä joukko, uskottavuusfuktio, 89, 06 logaritmie, 90 variassi jakauma, 52 satuaismuuttuja, 52 vastahypoteesi, 23 yhdiste, yhteisjakauma, 28 diskreetti, 30 jatkuva, 30 tiheysfuktio, 30 yläkvartiili, 8 tapahtuma, 9 poissulkevat, 0 tasajakauma diskreetti, 27 jatkuva, 27 tiheysfuktio, 26 empiirie, 77 tilastollie merkitsevyys, 24 tilastollie testi, 23 todeäköisyys aksiooma, 2 ehdollie, 4 frekvessitulkita, 43 jakauma, 2 mitta, 2 mootoisuus, 2 summasäätö, 2 tulosäätö, 4 todeäköisyysfuktio, 26 todeäköisyysväli, 20 39

14 Kirjallisuutta [JP04] Jea Jacod ad Philip Protter. Probability Essetials. Spriger, secod editio, [Kal02] Olav Kalleberg. Foudatios of Moder Probability. Spriger, secod editio, [Wil9] David Williams. Probability with Martigales. Cambridge Uiversity Press,

Tilastolliset luottamusvälit

Tilastolliset luottamusvälit Luku 8 Tilastolliset luottamusvälit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 8.1 Piste-estimaatti ja väliestimaatti Edellisessä luvussa opittii määrittämää parametreille estimaatteja suurimma uskottavuude

Lisätiedot

1. Valitaan tilanteeseen sopiva stokastinen malli. 2. Sovitetaan malli havaittuun dataan (estimoidaan mallin parametrit).

1. Valitaan tilanteeseen sopiva stokastinen malli. 2. Sovitetaan malli havaittuun dataan (estimoidaan mallin parametrit). Luku 7 Parametrie estimoiti Lasse Leskelä Aalto-yliopisto 2. lokakuuta 2017 7.1 Tilastollie päättely Tähä meessä o opittu eustamaa tapahtumie todeäköisyyksiä aetu stokastise malli pohjalta. Eusteide laskemiseksi

Lisätiedot

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3 Luku 6 Datajoukkojen jakaumat, tunnusluvut ja kuvaajat Lasse Leskelä Aalto-yliopisto. lokakuuta 207 6. Datajoukko ja datakehikko Tässä monisteessa datajoukko tarkoittaa järjestettyä listaa keskenään samantyyppisiä

Lisätiedot

Luku 7. Parametrien estimointi. 7.1 Parametriset jakaumat. Lasse Leskelä Aalto-yliopisto 29. marraskuuta 2017

Luku 7. Parametrien estimointi. 7.1 Parametriset jakaumat. Lasse Leskelä Aalto-yliopisto 29. marraskuuta 2017 Luku 7 Parametrie estimoiti Lasse Leskelä Aalto-yliopisto 29. marraskuuta 2017 7.1 Parametriset jakaumat Tarkastellaa tutematota datalähdettä, joka tuottaa toisistaa stokastisesti riippumattomia ja tiheysfuktio

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todeäköisyyslaskea ja tilastotietee peruskurssi 4A Satuaisotata ja parametrie estimoiti Lasse Leskelä Matematiika ja systeemiaalyysi laitos Perustieteide korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 Luku 1 Bayesläiset estimaattorit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 217 1.1 Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Melli Tilastolliset meetelmät Osa : Otokset, otosjakaumat ja estimoiti Otokset ja otosjakaumat TKK (c) Ilkka Melli (007) 1 Otokset ja otosjakaumat >> Satuaisotata ja satuaisotokset Otostuusluvut

Lisätiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (004) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo otosjakauma Otosvariassi otosjakauma

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

8. laskuharjoituskierros, vko 11, ratkaisut

8. laskuharjoituskierros, vko 11, ratkaisut Mat-2.091 Sovellettu todeäköisyyslasku, kevät -05 Heliövaara, Palo, Melli 8. laskuharjoituskierros, vko 11, ratkaisut D1. Oletetaa, että havaiot X i, i = 1, 2,..., 100 muodostavat yksikertaise satuaisotokse

Lisätiedot

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia. HY, MTL / Matemaattiste tieteide kadiohjelma Todeäköisyyslasketa IIb, syksy 08 Harjoitus 3 Ratkaisuehdotuksia Tehtäväsarja I Olkoot X ja X riippumattomia satuaismuuttujia, joille ja olkoo X EX, EX, var

Lisätiedot

4. Todennäköisyyslaskennan kertausta

4. Todennäköisyyslaskennan kertausta Sisältö Peruskäsitteet Diskreetit satuaismuuttujat Diskreetit jakaumat (lkm-jakaumat) Jatkuvat satuaismuuttujat Jatkuvat jakaumat (aikajakaumat) Muut satuaismuuttujat lueto04.ppt S-38.45 - Liikeeteoria

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (005) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo ja otosvariassi otosjakaumat

Lisätiedot

EX1 EX 2 EX =

EX1 EX 2 EX = HY, MTL / Matemaattiste tieteide kadiohjelma Todeäköisyyslasketa IIb, syksy Harjoitus Ratkaisuehdotuksia Tehtäväsarja I. Olkoot X ja X riippumattomia satuaismuuttujia, joille ja olkoo X EX, EX, var X,

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Melli Tilastolliset meetelmät Osa 2: Otokset, otosjakaumat ja estimoiti Estimoitimeetelmät TKK (c) Ilkka Melli (2007) Estimoitimeetelmät >> Todeäköisyysjakaumie parametrie estimoiti Suurimma uskottavuude

Lisätiedot

6.1 Riippumattomat satunnaismuuttujat

6.1 Riippumattomat satunnaismuuttujat Luku 6 Otatajakaumie teoria 6.1 Riippumattomat satuaismuuttujat Muistamme edellisistä luvuista, että satuaismuuttujat X 1 ja X 2 ovat riippumattomat (määritelmät 4.6 ja 5.5), jos f(x 1, x 2 ) f 1 (x 1

Lisätiedot

Johda jakauman momenttiemäfunktio ja sen avulla jakauman odotusarvo ja varianssi.

Johda jakauman momenttiemäfunktio ja sen avulla jakauman odotusarvo ja varianssi. Mat-2.090 Sovellettu todeäköisyyslasku A Mat-2.090 Sovellettu todeäköisyyslasku A / Pistetehtävät 2, 4, 6, 8, 0 Aiheet: Avaisaat: Momettiemäfuktio Satuaismuuttujie muuokset ja iide jakaumat Kovergessikäsitteet

Lisätiedot

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Estimoitimeetelmät TKK (c) Ilkka Melli (2005) 1 Estimoitimeetelmät Todeäköisyysjakaumie parametrie estimoiti Momettimeetelmä Normaalijakauma parametrie estimoiti Ekspoettijakauma

Lisätiedot

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:

Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat: Mat-.090 Sovellettu todeäköisyyslasku A Mat-.090 Sovellettu todeäköisyyslasku A / Ratkaisut Aiheet: Avaisaat: Otos- ja otosjakaumat Estimoiti Estimoitimeetelmät Väliestimoiti Aritmeettie keskiarvo, Beroulli-jakauma,

Lisätiedot

Tilastollinen päättely II, kevät 2017 Harjoitus 3B

Tilastollinen päättely II, kevät 2017 Harjoitus 3B Tilastollie päättely II, kevät 7 Harjoitus 3B Heikki Korpela 3. maaliskuuta 7 Tehtävä. Jatkoa harjoitukse B tehtävii -3. Oletetaa, että x i c kaikilla i, ku c > o vakio. Näytä, että ˆβ, T ja T ovat tarketuvia.

Lisätiedot

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?

Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme? TKK (c) Ilkka Melli (4) Johdato Johdatus todeäköisyyslasketaa TKK (c) Ilkka Melli (4) : Mitä opimme? / Tutustumme tässä luvussa seuraavii ormaalijakaumasta (ks. lukua Jatkuvia jakaumia) johdettuihi jakaumii:

Lisätiedot

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut

Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut Mat-2.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Kaksiulotteie ormaalijakauma Mitta-asteikot Havaitoaieisto kuvaamie ja otostuusluvut Avaisaat: Ehdollie jakauma, Ehdollie odotusarvo, Ehdollie variassi,

Lisätiedot

Tunnuslukuja 27 III TUNNUSLUKUJA

Tunnuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 28 Tuuslukuja käytetää, ku tilastoaieistoa havaiollistetaa tiivistetysti yksittäisillä luvuilla. Tuusluvut lasketaa muuttujie arvoje perusteella ja e kuvaavat

Lisätiedot

Keskihajonta ja korrelaatio

Keskihajonta ja korrelaatio Luku 4 Keskihajonta ja korrelaatio Lasse Leskelä Aalto-yliopisto 19. syyskuuta 2017 4.1 Jakauman varianssi ja keskihajonta Edellisessä luvussa opittiin, että satunnaismuuttujan odotusarvo on X:n jakauman

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mitä tilastotiede o? Mat-.04 Tilastollise aalyysi perusteet, kevät 007. lueto: Johdato Tilastotiede kehittää ja soveltaa meetelmiä: reaalimaailma ilmiöistä johtopäätökset ilmiöitä kuvaavie tietoje perusteella

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II Otokset MS-A050 Todeäköisyyslaskea ja tilastotietee peruskurssi Lueot, osa II Kaksi hyödyllista jakaumaa 3 Estimoiti G. Gripeberg 4 Luottamusvälit Aalto-yliopisto. helmikuuta 05 5 Hypoteesie testaus 6

Lisätiedot

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet

Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet Ilkka Melli Todeäköisyyslasketa Osa 2: Satuaismuuttujat ja todeäköisyysjakaumat Kovergessikäsitteet ja raja arvolauseet TKK (c) Ilkka Melli (2006) 1 Kovergessikäsitteet ja raja arvolauseet >> Kovergessikäsitteitä

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).

1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ). HY / Matematiika ja tilastotietee laitos Tilastollie päättely II, kevät 018 Harjoitus 5B Ratkaisuehdotuksia Tehtäväsarja I 1. (Jatkoa Harjoitus 5A tehtävää ). Moistee esimerki 3.3.3. mukaa momettimeetelmä

Lisätiedot

S Laskennallinen systeemibiologia

S Laskennallinen systeemibiologia S-4250 Laskeallie systeemibiologia Harjoitus Mittaustuloksea o saatu havaitoparia (x, y ),, (x, y ) Muuttuja y käyttäytymistä voidaa selittää muuttuja x avulla esimerkiksi yksikertaise lieaarise riippuvuude

Lisätiedot

Satunnaismuuttujan odotusarvo ja laskusäännöt

Satunnaismuuttujan odotusarvo ja laskusäännöt Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään

Lisätiedot

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku Tilastollie päättely 6.1. Johdato Bayesi kaava, Bayeslaie lähestymistapa, Eakkotieto, Estimoiti, Frekvetistie lähestymistapa, Frekvessitulkita, Klassie lähestymistapa, Luottamustaso, Luottamusväli, Merkitsevyystaso,

Lisätiedot

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.

( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla. Kombiatoriikka, kesä 2010 Harjoitus 2 Ratkaisuehdotuksia (RT) (5 sivua) Käytä tehtävissä 1-3 kombiatorista päättelyä. 1. Osoita, että kaikilla 0 b a pätee ( ) a a ( ) k 1 b b 1 kb Biomikertoime määritelmä

Lisätiedot

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin yliopisto Harjoitus 3, ratkaisuehdotuksia

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin yliopisto Harjoitus 3, ratkaisuehdotuksia Todeäköisyyslasketa I, kesä 207 Helsigi yliopisto/avoi yliopisto Harjoitus 3, ratkaisuehdotuksia. Aikaisemma viiko teemaa. Edessäsi o kaksi laatikkoa A ja B. Laatikossa A o 8 palloa, joista puolet valkoisia.

Lisätiedot

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä

Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä Otatajakauma kuvaa tarkasteltava parametri jakauma eri otoksista laskettua parametria o joki yleesä tuusluku, esim. keskiarvo, suhteellie osuus, riskisuhde, korrelaatiokerroi, regressiokerroi, je. parametria

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa.

Todennäköisyys, että yhden minuutin aikana saapuu 2 4 autoa. Testimuuttuja kriittie arvo 5 %: merkitsevyystasolla katsotaa taulukosta. Kriittie arvo o 9,488. Koska laskettu arvo 4,35 o pieempi kui taulukosta saatu kriittie arvo 9,488, ii ollahypoteesi jää voimaa.

Lisätiedot

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua)

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua) Algebra I Matematiika ja tilastotietee laitos Ratkaisuehdotuksia harjoituksii 5 (6 sivua) 14.2. 17.2.2011 1. Määritellää kuvaus f : S 3 S 3, f(α) = (123) α. Osoita, että f o bijektio. Mikä o se kääteiskuvaukse

Lisätiedot

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku

Estimaattori, Estimointi, Mediaani, Moodi, Odotusarvo, Parametri, Posteriorijakauma, Tunnusluku Tilastollie päättely 6.1. Johdato Bayesi kaava, Bayeslaie lähestymistapa, Eakkotieto, Estimoiti, Frekvetistie lähestymistapa, Frekvessitulkita, Klassie lähestymistapa, Luottamustaso, Luottamusväli, Merkitsevyystaso,

Lisätiedot

Satunnaismuuttujien summa ja keskiarvo

Satunnaismuuttujien summa ja keskiarvo Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 5.1 Satunnaismuuttujien summa Kahden satunnaismuuttujan summa X + Y on satunnaismuuttuja, jonka jakauma

Lisätiedot

Liite B. Suomi englanti-sanasto

Liite B. Suomi englanti-sanasto Liite B Suomi englanti-sanasto Alla tässä monisteessa esiintynyttä sanastoa englanniksi käännettynä. Monet tähän aihepiiriin liittyvät termit eivät kuitenkaan ole täysin vakiintuneita kummassakaan kielessä.

Lisätiedot

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1

Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1 Johdatus todeäköisyyslasketaa Kovergessikäsitteet ja raja-arvolauseet TKK (c) Ilkka Melli (2004) 1 Kovergessikäsitteet ja raja-arvolauseet Kovergessikäsitteitä Suurte lukuje lait Keskeie raja-arvolause

Lisätiedot

Bayesläiset tilastolliset mallit

Bayesläiset tilastolliset mallit Luku 9 Bayesläiset tilastolliset mallit Lasse Leskelä Aalto-yliopisto 8. lokakuuta 07 9. Priorijakauma ja posteriorijakauma Bayesläisen tilastollisen päättelyn lähtökohtana on päivittää satunnaisilmiöön

Lisätiedot

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit

Mat Sovellettu todennäköisyyslasku 9. harjoitukset/ratkaisut. Luottamusvälit Mat-.09 Sovellettu todeäköisyyslasku Mat-.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Estimoiti Luottamusvälit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Estimaattori, Estimoiti, Frekvessi,

Lisätiedot

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen T-1.1 Datasta tietoo, syksy 5 Laskuharjoitus.1., ratkaisuja Joui Seppäe 1. Simuloidaa tasoittaista algoritmia. Esimmäisessä vaiheessa ehdokkaia ovat kaikki yhde muuttuja joukot {a}, {b}, {c} ja {d}. Aaltosulkeide

Lisätiedot

Tilastollinen todennäköisyys

Tilastollinen todennäköisyys Tilastollie todeäköisyys TOD.NÄK JA TILASTOT, MAA10 Klassisessa todeäköisyydessä oli ehdot: äärellisyys ja symmetrisyys. Tämä tilae o usei mahdoto ts. alkeistapauksia o usei ääretö määrä tai e eivät ole

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Ssteemiaalsi laboratorio Mat-2.9 Sovellettu todeäköisslasku A Nordlud Harjoitus 6 (vko 43/23) (Aihe: sekamalli, hteisjakaumia, Laiie luvut 6. 6.3, 8. 8.9). Tässä o edellise viiko laskareissa luvattu

Lisätiedot

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.

Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla. Kvatitatiivie metodologia verkossa Moitasomallius Pekka Ratae Helsigi yliopisto isältö Moitasomallit Matemaattisia peruskäsitteitä Esimerkki kovariassista Otatavirhe Esimerkki elittävie muuttujie lisäämie

Lisätiedot

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A

Tilastollinen päättömyys, kevät 2017 Harjoitus 6A Tilastollie päättömyys, kevät 07 Harjoitus 6A Heikki Korpela 8. helmikuuta 07 Tehtävä. Moistee teht. 5.. Olkoo Y,..., Y riippumato otos ekspoettiperhee jakaumasta, joka ptf/tf o muotoa fy i ; θ cθhye φθtyi

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 2

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 2 Todeäköisyyslaskea ja tilastotietee peruskurssi Esimerkkikokoelma 2 Aiheet: Satuaismuuttujat ja todeäköisyysjakaumat Kertymäfuktio, pistetodeäköisyysfuktio ja tiheysfuktio Jakaumie tuusluvut Tärkeimmät

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiika tukikurssi Kertauslueto. välikokeesee Algebraa Tämäkertaie kurssimoiste sisältää rusaasti harjoitustehtäviä. Syyä tähä o se, että matematiikkaa oppii parhaite itse tekemällä ja laskemalla.

Lisätiedot

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme?

Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen. Tilastollisten aineistojen kuvaaminen: Mitä opimme? TKK (c) Ilkka Melli (004) Tilastolliste aieistoje kuvaamie Tuusluvut Laatueroasteikolliste muuttujie tuusluvut Johdatus tilastotieteesee Tilastolliste aieistoje kuvaamie TKK (c) Ilkka Melli (004) Tilastolliste

Lisätiedot

Yhden selittäjän lineaarinen regressiomalli

Yhden selittäjän lineaarinen regressiomalli Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli

Lisätiedot

TILASTOT: johdantoa ja käsitteitä

TILASTOT: johdantoa ja käsitteitä TILASTOT: johdatoa ja käsitteitä TOD.NÄK JA TILASTOT, MAA10 Tilastotietee tehtävää o esittää ja tulkita tutkimuskohteesee liittyvää havaitoaieistoa eli tilastoaieistoa. Tutkitaa valittua joukkoa ja se

Lisätiedot

Satunnaismuuttujan odotusarvo ja laskusäännöt

Satunnaismuuttujan odotusarvo ja laskusäännöt Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 16. syyskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään

Lisätiedot

6. Kombinaatio-oppi, todennäköisyys ja tilastot

6. Kombinaatio-oppi, todennäköisyys ja tilastot 6. Kombiaatio-oppi, todeäköisyys ja tilastot 6.1 Satuaisotata takaisipaolla Poimimme 3 alkiota takaisipaolla 1 alkio perusjoukosta. Kuika mota erilaista kolme alkio osajoukkoa voimme saada? Ratkaisu. Vastaus:

Lisätiedot

MATP153 Approbatur 1B Harjoitus 1, ratkaisut Maanantai

MATP153 Approbatur 1B Harjoitus 1, ratkaisut Maanantai MATP53 Approbatur B Harjoitus, ratkaisut Maaatai..05. (Lämmittelytehtävä.) Oletetaa, että op = 7 tutia työtä. Kuika mota tutia Oili Opiskelija työsketelee itseäisesti kurssilla, joka laajuus o 4 op, ku

Lisätiedot

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b

Tilastollinen päättömyys, kevät 2017 Harjoitus 5b Tilastollie päättömyys, kevät 07 Harjoitus b Heikki Korpela 3. helmikuuta 07 Tehtävä. a Olkoot Y,..., Y Bθ. Johda uskottavuusosamäärä testisuuree ry, Waldi testisuuree wy ja Rao pistemäärätestisuuree uy

Lisätiedot

Satunnaismuuttujien muunnokset ja niiden jakaumat. Satunnaismuuttujien muunnokset ja niiden jakaumat

Satunnaismuuttujien muunnokset ja niiden jakaumat. Satunnaismuuttujien muunnokset ja niiden jakaumat TKK (c) Ilkka Melli (4) Satuaismuuttujie muuokset ja iide jakaumat Satuaismuuttujie muuoste jakaumat Kaksiulotteiste satuaismuuttujie muuoste jakaumat Riippumattomie satuaismuuttujie summa jakauma Riippumattomie

Lisätiedot

****************************************************************** ****************************************************************** 7 Esim.

****************************************************************** ****************************************************************** 7 Esim. 8.3. Kombiaatiot MÄÄRITELMÄ 6 Merkitä k, joka luetaa yli k:, tarkoittaa lause- ketta k = k! ( k)! 6 3 2 1 6 Esim. 1 3 3! = = = = 3! ( 3)! 3 2 1 3 2 1 3 2 1 Laskimesta löydät äppäime, jolla kertomia voi

Lisätiedot

Mat Sovellettu todennäköisyyslasku A. Diskreetit jakaumat Jatkuvat jakaumat. Avainsanat:

Mat Sovellettu todennäköisyyslasku A. Diskreetit jakaumat Jatkuvat jakaumat. Avainsanat: Mat-2.090 Sovellettu todeäköisyyslasku A / Ratkaisut Aiheet: Avaisaat: Diskeetit jakaumat Jatkuvat jakaumat Biomijakauma, Ekspoettijakauma, Jatkuva tasaie jakauma, Ketymäfuktio, Mediaai, Negatiivie biomijakauma,

Lisätiedot

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489

pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489 Perusjoukko ja otos Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Havaitoyksikkö o empiirise mittaukse kohde Perusjoukko o kaikkie havaitoyksiköide muodostama kokoaisuus Otos o perusjoukkoa

Lisätiedot

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat:

Mat Sovellettu todennäköisyyslaskenta B 9. harjoitukset / Ratkaisut Aiheet: Estimointi Estimointimenetelmät Väliestimointi Avainsanat: Mat-.60 Sovellettu todeäköisyyslasketa B Mat-.60 Sovellettu todeäköisyyslasketa B / Ratkaisut Aiheet: Estimoiti Estimoitimeetelmät Väliestimoiti Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, Beroulli-koe,

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Markov-ketjun hetkittäinen käyttäytyminen

Markov-ketjun hetkittäinen käyttäytyminen Matematiika ja systeemiaalyysi laitos 1B Markov-ketju hetkittäie käyttäytymie Tämä harjoitukse tavoitteea o oppia muodostamaa Markov-malleja satuaisilmiöille, piirtämää tiettyä siirtymämatriisia vastaava

Lisätiedot

Otantajakauman käyttö päättelyssä

Otantajakauman käyttö päättelyssä Keskiarvo otatajakauma Toisistaa tietämättä kaksi tutkijaa tutkii samaa ilmiötä, jossa perusjoukko koostuu kuudesta tutkittavasta ja tarkoituksea o laskea keskiarvo A: Kokoaistutkimus B: Otatatutkimus

Lisätiedot

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3

LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3 LIITTEET... 2 Liite A Stirligi kaava tarkkuudesta...2 Liite B Lagrage kertoimet... 2 Liitteet Liitteet Liite A Stirligi kaava tarkkuudesta Luoollista logaritmia suureesta! approksimoidaa usei Stirligi

Lisätiedot

Matematiikan tukikurssi. Kertausta 1. välikokeeseen. Tehtävät

Matematiikan tukikurssi. Kertausta 1. välikokeeseen. Tehtävät Matematiika tukikurssi Kertausta. välikokeesee Tehtävät Algebraa Tämä kappale sisältää rusaasti harjoitustehtäviä. Suurimpaa osaa tehtävistä löytyy ratkaisut lopusta. Syyä rusaasee tehtävämäärää o, että

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiika tukikurssi Kurssikerta 1 Iduktiotodistus Iduktiotodistukse logiikka Tutkitaa tapausta, jossa haluamme todistaa joki väittee P() site, että se pätee kaikilla luoollisissa luvuilla. Eli halutaa

Lisätiedot

11.1 Nollahypoteesi, vastahypoteesi ja p-arvo

11.1 Nollahypoteesi, vastahypoteesi ja p-arvo Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 4. joulukuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja p-arvo Aiemmissa luvuissa opittiin määrittämään piste-estimaatteja ja väliestimaatteja

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Tilastolliset menetelmät: Tilastolliset testit

Tilastolliset menetelmät: Tilastolliset testit Tilastolliset meetelmät Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille.

Lisätiedot

2-suuntainen vaihtoehtoinen hypoteesi

2-suuntainen vaihtoehtoinen hypoteesi MS-A53 Todeäköisyyslaskea ja tilastotietee peruskurssi Esimerkkikokoelma 5 Aiheet: Tilastolliset testit Yhde otokse t-testi Testausasetelma yhde otokse t-testissä odotusarvolle Olkoo X i, i =,,, riippumato

Lisätiedot

Todennäköisyyslaskenta: Todennäköisyysjakaumia

Todennäköisyyslaskenta: Todennäköisyysjakaumia Todeäköisyysjakaumia Todeäköisyyslasketa: Todeäköisyysjakaumia 6. Diskreettejä jakaumia 7. Jatkuvia jakaumia 8. Normaalijakaumasta johdettuja jakaumia 9. Moiulotteisia jakaumia Ilkka Melli 35 Todeäköisyysjakaumia

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiika tukikurssi Kurssikerta 3 1 Lisää iduktiota Jatketaa iduktio tarkastelua esimerki avulla. Yritetää löytää kaava : esimmäise (positiivise) parittoma luvu summalle eli summalle 1 + 3 + 5 + 7 +...

Lisätiedot

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1 35 Naiivi Bayes Luokkamuuttua C o Bayes-verko uuri a attribuutit X i ovat se lehtiä Naiivi oletus o, että attribuutit ovat ehdollisesti riippumattomia toisistaa aettua luokka Ku käytössä o Boole muuttuat,

Lisätiedot

Satunnaismuuttujien summa ja keskiarvo

Satunnaismuuttujien summa ja keskiarvo Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 21. syyskuuta 2017 5.1 Satunnaismuuttujien summa Satunnaismuuttujien summa S n = X 1 + +X n ja keskiarvo n 1 S n ovat satunnaismuuttujia,

Lisätiedot

Kurssin alkuosan sisältö. Tilastotieteen jatkokurssi. Kurssin loppuosan sisältö. 1. Todennäköisyyslaskenta. Heikki Hyhkö. 1. Todennäköisyyslaskenta

Kurssin alkuosan sisältö. Tilastotieteen jatkokurssi. Kurssin loppuosan sisältö. 1. Todennäköisyyslaskenta. Heikki Hyhkö. 1. Todennäköisyyslaskenta Tilastotietee jatkokurssi Heikki Hyhkö kesä 03. Todeäköisyyslasketa Kurssi alkuosa sisältö Klassie todeäköisyys Kombiatoriikka Kokoaistodeäköisyys. Todeäköisyysjakaumat Satuaismuuttuja Odotusarvo& variassi

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi

Lisätiedot

4.3 Signaalin autokorrelaatio

4.3 Signaalin autokorrelaatio 5 4.3 Sigaali autokorrelaatio Sigaali autokorrelaatio kertoo kuika paljo sigaali eri illä korreloi itsesä kassa (josta imiki). Se o Fourier-muuokse ohella yksi käyttökelpoisimmista sigaalie aalysoitimeetelmistä.

Lisätiedot

30A02000 Tilastotieteen perusteet

30A02000 Tilastotieteen perusteet 30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot

Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot TKK (c Ilkka Melli (004 Johdatus tilastotieteesee TKK (c Ilkka Melli (004 : Mitä opimme? Tarkastelemme tässä luvussa seuraavia järjestysasteikolliste muuttujie testejä: ja merkkitesti parivertailuille

Lisätiedot

Harjoitukset 1 : Tilastokertaus

Harjoitukset 1 : Tilastokertaus 31C99904, Capstoe: Ekoometria ja data-aalyysi TA : markku.siikae(a)aalto.fi & tuuli.vahapelto(a)aalto.fi Harjoitukset 1 : Tilastokertaus (Palautus 10.1.2017) Palautellaa mielii hiema tilasto-oppia ja todeäköisyyslasketaa.

Lisätiedot

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus:

n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus: 1. Tietyllä koeella valmistettavie tiivisterekaide halkaisija keskihajoa tiedetää oleva 0.04 tuumaa. Kyseisellä koeella valmistettuje 100 rekaa halkaisijoide keskiarvo oli 0.60 tuumaa. Määrää 95%: ja 99%:

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

1. osa, ks. Solmu 2/ Kahden positiivisen luvun harmoninen, geometrinen, aritmeettinen ja + 1 u v 2 1

1. osa, ks. Solmu 2/ Kahden positiivisen luvun harmoninen, geometrinen, aritmeettinen ja + 1 u v 2 1 Epäyhtälötehtävie ratkaisuja. osa, ks. Solmu 2/200. Kahde positiivise luvu harmoie, geometrie, aritmeettie ja kotraharmoie keskiarvo määritellää yhtälöillä H = 2 +, G = uv, A = u + v 2 u v ja C = u2 +

Lisätiedot

11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot

11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 17. lokakuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot Datalähteen tuottamia arvoja mallinnetaan jakaumaa f(x θ) noudattavina

Lisätiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot

Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille. Testit suhdeasteikollisille muuttujille: Esitiedot TKK (c) Ilkka Melli (4) Testit suhdeasteikollisille muuttujille Johdatus tilastotieteesee Testit suhdeasteikollisille muuttujille Testit ormaalikauma parametreille Yhde otokse t-testi Kahde otokse t-testi

Lisätiedot

Stokastiikan perusteet Harjoitukset 1 (Todennäköisyysavaruus, -mitta ja -funktio) 2.11.2015

Stokastiikan perusteet Harjoitukset 1 (Todennäköisyysavaruus, -mitta ja -funktio) 2.11.2015 Stokastiika perusteet Harjoitukset (Todeäköisyysavaruus, -mitta ja -fuktio) 2..205. Määritä potessijoukko 2,ku (a) {0, } (b) {(0, ]} ja ku (c) (0, ]. Ratkaisu: (a) 2 {;, {0}, {}, {0, }} (b) 2 {;, {(0,

Lisätiedot

Vastaus: Kertymäfunktio on F( x) = x, kun 0 x 20. Todennäköisyydet ovat molemmat 1. Frekvenssi f

Vastaus: Kertymäfunktio on F( x) = x, kun 0 x 20. Todennäköisyydet ovat molemmat 1. Frekvenssi f 0, ku x < 0 Vastaus: Kertymäfuktio o F( x) = x, ku 0 x 0 0, ku x > 0 Todeäköisyydet ovat molemmat 0. Laudatur MAA ratkaisut kertausharjoituksii Tilastoje esittämie 3. a) Tietty kasvi b) Kukkie lukumäärä

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi

Lisätiedot

Markov-ketjun hetkittäinen käyttäytyminen

Markov-ketjun hetkittäinen käyttäytyminen Matematiika ja systeemiaalyysi laitos B Markov-ketju hetkittäie käyttäytymie Tämä harjoitukse tavoitteea o oppia muodostamaa Markov-malleja satuaisilmiöille, piirtämää tiettyä siirtymämatriisia vastaava

Lisätiedot

Ehdollinen todennäköisyys

Ehdollinen todennäköisyys Ehdollie todeäköisyys Kerrataa muutama todeäköisyyslaskea laskusäätö. Tapahtuma E komplemettitapahtuma E o "E ei tapahdu". Koska todeäköisyyksie summa o 1, P ( E = 1 P (E. Joskus o helpompi laskea komplemettitapahtuma

Lisätiedot

2-suuntainen vaihtoehtoinen hypoteesi

2-suuntainen vaihtoehtoinen hypoteesi Mat-.6 Sovellettu todeäköisyyslasketa. harjoitukset Mat-.6 Sovellettu todeäköisyyslasketa B. harjoitukset / Ratkaisut Aiheet: Tilastolliset testit Avaisaat: Aritmeettie keskiarvo, Beroulli-jakauma, F-jakauma,

Lisätiedot

Tilastolliset menetelmät

Tilastolliset menetelmät Tilastolliset meetelmät tilastolliste meetelmie tarkoitus o: estimoida eliaika- (vikaatumisaika, korjausaika- jakaumie ja -mallie parametreja eliaikakokeide, laitteide käyttökokemustiedo yms. perusteella

Lisätiedot

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli TKK (c) Ilkka Melli (2005) Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää

Lisätiedot

TKK @ Ilkka Mellin (2008) 1/5

TKK @ Ilkka Mellin (2008) 1/5 Mat-1.2620 Sovellettu todennäköisyyslaskenta B / Tehtävät Demo-tehtävät: 1, 3, 6, 7 Pistetehtävät: 2, 4, 5, 9 Ylimääräiset tehtävät: 8, 10, 11 Aiheet: Moniulotteiset jakaumat Avainsanat: Diskreetti jakauma,

Lisätiedot