Bayesläiset tilastolliset mallit

Koko: px
Aloita esitys sivulta:

Download "Bayesläiset tilastolliset mallit"

Transkriptio

1 Luku 9 Bayesläiset tilastolliset mallit Lasse Leskelä Aalto-yliopisto 8. lokakuuta Priorijakauma ja posteriorijakauma Bayesläisen tilastollisen päättelyn lähtökohtana on päivittää satunnaisilmiöön liittyvien tapahtumien todennäköisyyksiä sitä mukaa kuin ilmiöstä saadaan uutta dataa. Tämä edellyttää todennäköisyyden käsitteen subjektiivista tulkintaa. Bayesläisessä ajattelussa datalähteen käyttäytymistä kuvaava tuntematon parametri mielletään satunnaismuuttujaksi, jonka jakauma kuvaa havainnoijan uskomusta parametrin arvosta. Uskomusta päivitetään, kun havaitaan uutta dataa. Havainnoijan uskomusta parametrin arvosta kuvaa priorijakauma p(θ), joka kertoo millä todennäköisyydellä havainnoija uskoo parametrin arvon olevan θ. Kun datalähteestä havaitaan uusi datapiste x, uskomus päivitetään uudeksi jakaumaksi. Päivitetty jakauma p(θ x) on parametrin posteriorijakauma. Uskomuksen päivittäminen perustuu uskottavuusfunktioon f(x θ), joka määrittää parametrin θ mukaan käyttäytyvän datalähteen tuottamien arvojen jakauman. Diskreetti priorijakauma p(θ) päivitetään posteriorijakaumaksi soveltamalla Bayesin päivityskaavaa p(θ x) = p(θ)f(x θ) θ p(θ )f(x θ ). (9.) Posteriorijakauma saadaan siis priorijakauman ja uskottavuusfunktion normitettuna tulona. Päivityskaava jatkuville priorijakaumille saadaan vaihtamalla lat. prior = edeltävä, posterior = seuraava Funktiota f(x θ) kutsutaan tiheysfunktioksi silloin, kun se tulkitaan x:n funktiona, ja uskottavuusfunktioksi silloin, kun se tulkitaan θ:n funktiona. 96

2 summa integraaliksi ylläolevassa kaavassa. Päivityskaava voidaan johtaa luvun.7 tuloksista ja siinä esiintyvät funktiot voidaan tulkita satunnaismuuttujien yhteisjakauman reunajakaumina (luku 9.6). Esimerkki 9. (Tuntematon kolikko). Laatikossa tiedetään olevan kolme tasaista (kruunan tn θ = 0.5), yksi lievästi vino (θ = ) ja yksi vahvasti vino (θ = 0.9) kolikko. Satunnaisesti valittua kolikkoa heitettäessä havaitaan klaava. Millä todennäköisyydellä heitetty kolikko oli tasainen? Ennen datan havaitsemista laatikosta satunnaisesti valittu kolikko on tasainen todennäköisyydellä 3, lievästi vino todennäköisyydellä ja vahvasti vino 5 5 todennäköisyydellä. Kun tuntematonta parametria θ mallinnetaan satunnaismuuttujana Θ, on parametrin jakauma ennen datan havaitsemista ao. taulukon 5 mukainen..0 θ p(θ) Koska θ edustaa kruunan todennäköisyyttä, on parametrin θ uskottavuusfunktio havainnon klaava suhteen f(klaava θ) = θ. Näin ollen p(θ)f(klaava θ) = ( 0.5) + 0. ( ) + 0. ( 0.9) θ =, joten kaavan (9.) mukaan parametriarvon 0.5 posterioritodennäköisyys on p(0.5 klaava) = p(0.5)f(klaava 0.5) ( 0.5) = p(θ)f(klaava θ) θ = Klaavan havaitseminen siis kasvatti kolikon tasaisuuden todennäköisyyttä arvosta 0.5 arvoon 0.75, mutta kolikolle itselleen ei heiton aikana tapahtunut mitään. Satunnaismuuttuja Θ ei siis kuvasta heitettyä kolikkoa, vaan kolikon heittäjän subjektiivista uskomusta heitetyn kolikon tyypistä. Kaavan (9.) avulla voidaan laskea posterioritodennäköisyydet myös parametriarvoille ja 0.9. Tuloksena saadaan allaolevassa taulukossa esitetty posteriorijakauma. 97

3 .0 θ p(θ klaava) Käytännössä posteriorijakauman kannattaa laskea vaiheittain sarake sarakkeelta allaolevan taulukon avulla. Kolme ensimmäistä saraketta saadaan suoraan tehtävänannosta. Sarake 4 eli normittamaton posterioritiheys saadaan kertomalla pareittain sarakkeiden ja 3 alkiot. Päivityskaavassa (9.) esiintyvä normitusvakio saadaan summaamalla sarakkeen 4 alkiot, eli tässä tapauksessa. Sarake 5 saadaan jakamalla sarakkeen 4 alkiot normitusvakiolla. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(klaava θ) p(θ)f(klaava θ) p(θ klaava) Lasketaan samalla tapaa vielä posteriorijakauma havainnon x = kruuna suhteen. Laskelman välivaiheet on esitetty allaolevassa taulukossa. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(kruuna θ) p(θ)f(kruuna θ) p(θ kruuna) Alkuperäinen priorijakauma ja tuloksena saadut kaksi posteriorijakaumaa on esitetty alla Priorijakauma p(θ) Posteriorijakauma p(θ klaava) Posteriorijakauma p(θ kruuna) 98

4 9. Usean datapisteen posteriorijakauma Bayesin päivityskaavaa (9.) voidaan soveltaa myös silloin, kun havaitaan monta datapistettä. Tällöin kaavan muuttuja x tulkitaan datapisteiden listaksi x = (x,..., x n ). Tarkastellaan esimerkiksi saman kolikon heittämistä monta kertaa peräkkäin. Kun havaitaan kaksi klaavaa, uskottavuusfunktio datajoukolle (x, x ) = (0, 0) on f(0, 0 θ) = f(0 θ)f(0 θ) = ( θ). Parametrin θ posteriorijakauma kahden klaavan suhteen saadaan allaolevan taulukon mukaisilla laskuilla. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(0, 0 θ) p(θ)f(0, 0 θ) p(θ 0, 0) Samaan tapaan voidaan laskea posteriorijakauma useampienkin klaavojen sarjoille. Alla muutama posteriorijakauma Posteriorijakauma p(θ 0) 0..0 Posteriorijakauma p(θ 0, 0) 0..0 Posteriorijakauma p(θ 0, 0, 0, 0, 0) Sadan klaavan havaitsemisen jälkeen posteriorijakauman massa keskittyy tähtitieteellisen pientä poikkeamaa vaille arvoon 0.5. Tämä tuntuu paradoksaaliselta, sillä tn saada 00 klaavaa peräkkäin tasaisella kolikolla on 00. Paradoksi selittyy priorin valinnalla: Ylläoleva priorijakauma p(θ) kuvastaa absoluuttista 00% varmuutta siitä, että kolikko ei puolla klaavan suuntaan. 9.3 Uskomuksen vaiheittainen päivittäminen Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia satunnaismuuttujia. Havainnoijan uskomusta tuntemattoman parametrin arvosta kuvastaa priorijakauma p(θ). Havaittuaan datapisteen x hän päivittää uskomuksensa posteriorijakaumaksi p(θ x ). Miten uskomus tulee päivittää, kun sen jälkeen havaitaan vielä toinen uusi datapiste x? 99

5 Havaittuja datapisteitä x ja x vastaava posteriorijakauma voidaan laskea soveltamalla Bayesin päivityskaavaa (9.) muodossa p(θ x, x ) = p(θ)f(x, x θ) θ p(θ )f(x, x θ ), (9.) missä f(x, x θ) on todennäköisyys havaita pistepari (x, x ) parametrin θ mukaan käyttäytyvästä datalähteestä. Toinen tapa päivittää uskomusta on ensin laskea posteriorijakauma ˆp(θ) = p(θ x ) datapisteen x suhteen ja sen jälkeen laskea uusi posteriorijakauma priorijakaumasta ˆp(θ) datapisteen x suhteen. Seuraava tärkeä tulos osoittaa, että vaiheittainen päivitys saman tuloksen kuin suorakin tapa. Tästä seuraa, että sarjamuotoista dataa havainnoivan henkilön tai tietokoneohjelman ei tarvitse pitää kirjaa menneistä datapisteitä: nykyinen uskomus jakaumaksi koodattuna sisältää ennustamisen kannalta kaiken oleellisen informaation menneestä. Fakta 9.. Kaavan (9.) määrittämä posteriorijakauma voidaan laskea vaiheittain muodossa ˆp(θ)f(x θ) p(θ x, x ) = θ ˆp(θ )f(x θ ), missä ˆp(θ) = p(θ x ). Todistus. Bayesin päivityskaavan (9.) mukaan ˆp(θ) = p(θ x ) = c p(θ)f(x θ), missä normitusvakio c = θ p(θ)f(x θ). Koska datalähde tuottaa riippumattomia satunnaismuuttujia, pätee lisäksi Näin ollen f(x, x θ) = f(x θ)f(x θ). ˆp(θ)f(x θ) θ ˆp(θ )f(x θ ) = c p(θ)f(x θ)f(x θ) θ c p(θ )f(x θ )f(x θ ) p(θ)f(x, x θ) = θ p(θ )f(x, x θ ) = p(θ x, x ). 9.4 Bayesläinen binaarimalli Binaarinen datalähde tuottaa riippumattomia {0, }-arvoisia satunnaislukuja siten, että arvon todennäköisyys on θ. Lähtökohtaisesti parametrista θ ei tiedetä mitään, joten sen uskotaan noudattavan jatkuvan välin [0, ] tasajakaumaa tiheysfunktiona {, x (0, ), p(θ) = 0, muuten. 00

6 Kun datalähteestä havaitaan arvot x = (x,..., x n ), halutaan priorijakauma päivittää posteriorijakaumaksi. Bayesläisen binaarisen mallin kannalta keskeisiä jatkuvia jakaumia ovat betajakaumat. Yleinen betajakauma parametreina a > 0 ja b > 0 on jatkuva jakauma, jonka tiheysfunktio on { c a,b f(θ) = θa ( θ) b, kun θ [0, ], 0, muuten, missä normitusvakio 3 c a,b = (a )!(b )!. Betajakaumien tiheysfunktioita on piirretty kuvaan 9.. Yksikkövälin [0, ] tasajakauma on erikoistapaus betajakau- (a+b )! masta parametreina a = ja b = a =, b = a = 3, b = 9 Kuva 9.: Betajakaumien tiheysfunktioita a = 9, b = 3 Bayesläisen binaarimallin erityispiirre on, että päivityskaavassa datajoukosta x riittää tietää ykkösten lukumäärä x ja nollien lukumäärä n x. Betajakauma parametreina a ja b päivittyy betajakaumaksi parametreina a + x ja b + n x. Erityistapauksessa a = ja b = allaolevasta tuloksesta saadaan päivityskaava tasaiselle priorijakaumalle. Fakta 9.3. Jos binaarisen datalähteen parametrin priorijakauma on betajakauma parametreina a ja b, niin posteriorijakauma havainnon x = (x,..., x n ) suhteen on betajakauma parametreina a + x ja b + n x, missä x = n i= x i on ykkösten lukumäärä datajoukossa x. Todistus. Yksittäisen datapisteen x i uskottavuusfunktio on { θ, x i = 0, f(x i θ) = θ, x i =, joten riippumattomuuden perusteella koko datajoukon uskottavuusfunktioksi saadaan n f(x θ) = f(x i θ) = θ x ( θ) n x. i= 3 Betajakauma voidaan määritellä myös silloin, kun a ja b eivät ole kokonaislukuja. Tällöin normitusvakiossa esiintyvät kertomat korvataan gammafunktiolla. 0

7 Normittamaton posteriorijakauma saadaan priorijakauman ja uskottavuusfunktion tulona muotoon p(θ)f(x θ) = ( c a,b θa ( θ) b ) θ x ( θ) n x = c a,b θa+ x ( θ) b+n x. Bayesin päivityskaavan (9.) mukaan posteriorijakauma on näin ollen p(θ x) = p(θ)f(x θ) p(η)f(x η)dη = θ a ( θ) b η a ( η) b dη, missä a = a + x ja b = b + x. Ylläoleva lauseke on betajakauman tiheysfunktio parametreina a ja b. Esimerkki 9.4 (Tuntematon kolikko). Tuntematonta kolikkoa heitettäessä havaittiin kruunaa ja 8 klaavaa. Kolikosta ei ole ennalta mitään taustatietoja. Määritä kruunan todennäköisyyttä kuvaavan parametrin posteriorijakauma. Kuvaile posteriorijakauma myös tapauksessa, kun havaitaan 0 kruunaa ja 80 klaavaa. Koska kolikosta ei ennalta tiedetä mitään, valitaan kruunan todennäköisyyttä kuvaavan parametrin θ priorijakaumaksi yksikkövälin [0, ] tasajakauma, joka on erityistapaus betajakaumasta parametreina a = ja b =. Posteriorijakauma on faktan 9.3 mukaan betajakauma parametreina a + = 3 ja b + 8 = 9. Jos havaittaisiinkin 0 kruunaa ja 80 klaavaa, saataisiin posteriorijakaumaksi betajakauma parametreina a + 0 = ja b + 80 = 8. Molempien tapauksien posteriorijakaumat on esitetty alla Kuva 9.: Binaarimallin posteriorijakauma havainnon kruunaa ja 8 klaavaa suhteen (punainen) sekä havainnon 0 kruunaa ja 80 klaavaa suhteen (pinkki). Priorijakauma on esitetty sinisellä. 0

8 9.5 Bayesläinen normaalimalli Tarkastellaan datalähdettä, joka tuottaa riippumattomia normaalijakautuneita satunnaislukuja X, X,..., joiden odotusarvo θ on tuntematon ja keskihajonta σ tunnettu. Mallin tuntematon odotusarvoparametri tulkitaan satunnaismuuttujaksi, joka noudattaa normaalijakaumaa odotusarvona µ 0 ja keskihajontana σ 0. Priorijakauman parametreja µ 0 ja σ 0 kutsutaan hyperparametreiksi erotuksena datalähteen käyttäytymistä suoraan kuvaaville parametreille. Datalähteen varsinaiset parametrit (θ, σ) kuvaavat siis datalähteen toimintaa, ja hyperparametrit (µ 0, σ 0 ) havainnoijan uskomusta mallin tuntemattomasta parametrista θ. Normaalimallissa datalähteen odotusarvoparametrin priorijakauma on normaalijakauma tiheysfunktiona p(θ) = (πσ0) / e (θ µ 0) σ 0 (9.3) ja uskottavuusfunktio havaitun datajoukon (x,..., x n ) suhteen on f(x,..., x n θ) = n i= n f(x i θ) = (πσ ) n/ e i= (x i θ) σ. (9.4) Normaalimallin tekee erityisen käyttökelpoiseksi se, että normaalijakautunutta prioria vastaa normaalijakautunut posteriori. Lisäksi posteriorijakauman odotusarvon ja keskihajonnan laskemiseksi riittää tietää havaitun datajoukon keskiarvo m(x) ja koko n. Allaolevassa normaalimallin päivityskaavassa posteriorijakauman odotusarvo on painotettu keskiarvo priorijakauman odotusarvosta ja havaitun datajoukon keskiarvosta. Fakta 9.5. Bayesläisen normaalimallin posteriorijakauma on normaalijakauma, jonka odotusarvo ja keskihajonta saadaan kaavoista µ = µ σ0 0 + n m(x) σ σ 0 + n σ ja σ = σ0 + n σ, (9.5) missä m(x) = n n i= x i on havaitun datajoukon keskiarvo. Todistus. Posterijakauman normittamaton tiheysfunktio saadaan lausekkeiden (9.3) ja (9.4) tulona kirjoitettua muotoon p(θ)f(x θ) = c 0 e h(θ), missä h(θ) = (θ µ 0) σ 0 + i (x i θ) σ. ja c 0 = (πσ 0) / (πσ ) n/. Ylläoleva toisen asteen polynomi voidaan sieventää muotoon h(θ) = aθ + bθ + c, 03

9 missä a = (σ 0 +nσ ), b = ( σ0 µ 0 + σ i x ) i ja c = Yleistä neliöksi täydentämisen kaavaa ( aθ + bθ + c = a θ + b ) + c b a 4a soveltamalla saadaan funktiolle h(θ) esitys (σ 0 µ 0+σ i x i ). h(θ) = (θ µ ) σ + c b 4a, missä ja µ = b a = σ 0 µ 0 + nσ m(x) σ0. + nσ σ = (a) / = (σ 0 + nσ ) /. Posterijakauman normittamaton tiheysfunktio saadaan siis muotoon p(θ)f(x θ) = c 0 e h(θ) = c 0 e (θ µ ) σ Posterijakauman tiheysfunktio on siis +c b 4a. p(θ x) = p(θ)f(x θ) p(θ )f(x θ )dθ = e (θ µ ) σ = (θ µ ) e σ dθ e (θ µ ) πσ σ, missä viimeinen yhtälö on seurausta siitä, että normaalijakauman tiheysfunktio integroituu ykköseksi. Esimerkki 9.6 (Kohinainen kanava). Lukuarvoisia signaaleja lähetetään kohinaisen tiedonsiirtokanavan välityksellä. Kohinan seurauksena pisteestä A lähetetyn signaalin arvo θ vastaanotetaan pisteessä B satunnaismuuttujana, joka noudattaa normaalijakaumaa odotusarvona θ ja keskihajontana σ =. Tiedonsiirtovirheiden kompensoimiseksi sama signaali lähetetään kolme kertaa peräkkäin. Vastaanottaja arvelee ennalta, että lähetetyn signaalin arvo on peräisin normaalijakaumasta, jonka odotusarvo on µ 0 = 5 ja keskihajonta σ 0 =. Mikä on lähetetyn signaalin posteriorijakauma vastaanotettujen signaaliarvojen x = (3., 7.9, 7.0) suhteen? Lähetetyn signaalin posteriorijakauma on normaalijakauma, jonka parametrit saadaan sijoittamalla normaalimallin päivityskaavoihin (9.5) havaitun datajoukon keskiarvo m(x) = 6.0 ja koko n = 3. Posteriorijakauman odotusarvo on µ = µ σ0 0 + n m(x) σ σ 0 + n σ =

10 ja keskihajonta σ = σ 0 + n σ = Vastaanotettu datajoukko x = (3., 7.9, 7.0) päivittää vastaanottajan uskomusta lähetetyn signaalin arvosta niin, että odotusarvo siirtyy tasolta 5 tasolle 5.43 ja keskihajonta pienenee tasolta tasolle Priori- ja posterijakauma on esitetty kuvassa Kuva 9.3: Lähetetyn signaalin priorijakauma (sininen) ja posteriorijakauma (punainen). 9.6 Kommentteja ja täsmennyksiä Diskreetti bayesläinen malli voidaan tulkita satunnaismuuttujien parina (Θ, X), jonka yhteisjakaumalla on tiheysfunktio f Θ,X (θ, x) = p(θ)f(x θ). Satunnaismuuttujien Θ ja X jakaumien tiheysfunktiot voidaan kirjoittaa yhteisjakauman reunajakaumina (luku.4) muodossa f Θ (θ) = x p(θ)f(x θ) = p(θ) ja f X (x) = θ p(θ)f(x θ) = f(x). Lisäksi uskottavuusfunktio f(x θ) = f X Θ (x θ) voidaan mieltää satunnaismuuttujan X ehdolliseksi tiheysfunktioksi satunnaismuuttujan Θ suhteen (luku.5). Vastaavat kaavat ovat voimassa jatkuville jakaumille, kun summat vaihdetaan integraaleiksi. 05

11 Jos havaintoa x vastaava Bayesin päivityskaava (9.) tulkitaan todennäköisyysjakaumien avaruudessa operoivana kuvauksena U x : priorijakauma posteriorijakauma, voidaan fakta 9. ilmaista ytimekkäästi muodossa U x (U x (p)) = U (x,x )(p). Tai vielä ytimekkäämmin muodossa U x U x = U x,x. Tämä kaava yleistyy induktiolla muotoon U xn U x = U x,x,,x n, josta saadaan rekursiokaavat U x,x,,x n = U xn U x,x,,x n, U x,x,,x n = U x,x 3,...,x n U x. Bayesläinen binaarimalli oli Thomas Bayesin 763 artikkelin keskeinen tutkimuskohde. 06

12 Hakemisto Bayesin kaava, 5, 96 Bernoulli-jakauma, 57 betajakauma, 00 binomijakauma, 57 binomikerroin, 8 bitti, 4 Chebyshevin epäyhtälö, 49 eksponenttijakauma, 5 entropia, 4 ergodinen, 45 erotus, 9 esiintyvyysharha, 5 estimaattori, 80 harhaton estimaattori, 8 hylkäysalue, 8 hyperparametri, 0 indikaattorifunktio, 6 jakauma, diskreetti, 3 empiirinen, 70 jatkuva, 3 kertoma, 7 kertymäfunktio, keskihajonta jakauman, 47 satunnaismuuttujan, 47 kombinatoriikka, 6 komplementti, 9 korrelaatio yhteisjakauman, 50 kovarianssi yhteisjakauman, 50 leikkaus, 9 lukumäärä listat, 7 osajoukot, 8 lukumäärä, järjestykset, 7 merkitsevyystaso, 5 mitallinen funktio, 33 joukko, 9 momentti, 4 multinomijakauma, 4 nollahypoteesi, normaalijakauma normitettu, 6 osajoukko, 8 ositus, 8 osituskaava, 4 otoskeskihajonta, 73 otoskorrelaatio, 74 otoskovarianssi, 74 p-arvo, 3 perusjoukko, 7 pistemassafunktio, 3 pistetodennäköisyysfunktio, 3 Poisson-jakauma, 4, 67 posteriorijakauma, 96 priorijakauma, 96 reunajakauma diskreetti, 8 jatkuva, 8 reunatiheysfunktio diskreetti, 8 jatkuva, 8 riippumattomat satunnaismuuttujat, 30 7

13 tapahtumat, satunnaismuuttuja, 0 diskreetti, 3 sigma-algebra, 9 suppeneminen stokastinen, 36 suurimman uskottavuuden estimaatti, 78 suurten lukujen laki, 36 vahva, 45 diskreetti, 6 jatkuva, 6 tiheysfunktio, 7 tapahtuma, 7 poissulkevat, 8 tasajakauma diskreetti, 4 jatkuva, 4 tiheysfunktio, 3 empiirinen, 70 tilastollinen merkitsevyys, 3 tilastollinen testi, todennäköisyys aksiooma, 0 ehdollinen, frekvenssitulkinta, 38 jakauma, 0 mitta, 0 monotonisuus, 0 summasääntö, 0 tulosääntö, todennäköisyysfunktio, 3 todennäköisyysväli, 09 toteuma, 7 tulojoukko, 9 tyhjä joukko, 9 uskottavuusfunktio, 78, 96 logaritminen, 79 varianssi jakauman, 47 satunnaismuuttujan, 47 vastahypoteesi, yhdiste, 9 yhteisjakauma, 5 8

14 Kirjallisuutta [JP04] Jean Jacod and Philip Protter. Probability Essentials. Springer, second edition, 004. [Kal0] Olav Kallenberg. Foundations of Modern Probability. Springer, second edition, 00. [Wil9] David Williams. Probability with Martingales. Cambridge University Press, 99. 9

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 Luku 1 Bayesläiset estimaattorit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 217 1.1 Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3

Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3 Luku 6 Datajoukkojen jakaumat, tunnusluvut ja kuvaajat Lasse Leskelä Aalto-yliopisto. lokakuuta 207 6. Datajoukko ja datakehikko Tässä monisteessa datajoukko tarkoittaa järjestettyä listaa keskenään samantyyppisiä

Lisätiedot

11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot

11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 17. lokakuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot Datalähteen tuottamia arvoja mallinnetaan jakaumaa f(x θ) noudattavina

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

11.1 Nollahypoteesi, vastahypoteesi ja p-arvo

11.1 Nollahypoteesi, vastahypoteesi ja p-arvo Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 4. joulukuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja p-arvo Aiemmissa luvuissa opittiin määrittämään piste-estimaatteja ja väliestimaatteja

Lisätiedot

Satunnaismuuttujan odotusarvo ja laskusäännöt

Satunnaismuuttujan odotusarvo ja laskusäännöt Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Satunnaismuuttujien summa ja keskiarvo

Satunnaismuuttujien summa ja keskiarvo Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 21. syyskuuta 2017 5.1 Satunnaismuuttujien summa Satunnaismuuttujien summa S n = X 1 + +X n ja keskiarvo n 1 S n ovat satunnaismuuttujia,

Lisätiedot

Liite B. Suomi englanti-sanasto

Liite B. Suomi englanti-sanasto Liite B Suomi englanti-sanasto Alla tässä monisteessa esiintynyttä sanastoa englanniksi käännettynä. Monet tähän aihepiiriin liittyvät termit eivät kuitenkaan ole täysin vakiintuneita kummassakaan kielessä.

Lisätiedot

Satunnaismuuttujien summa ja keskiarvo

Satunnaismuuttujien summa ja keskiarvo Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 5.1 Satunnaismuuttujien summa Kahden satunnaismuuttujan summa X + Y on satunnaismuuttuja, jonka jakauma

Lisätiedot

Satunnaismuuttujan odotusarvo ja laskusäännöt

Satunnaismuuttujan odotusarvo ja laskusäännöt Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 16. syyskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Tilastollisen merkitsevyyden testaus (+ jatkuvan parametrin Bayes-päättely) Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Keskihajonta ja korrelaatio

Keskihajonta ja korrelaatio Luku 4 Keskihajonta ja korrelaatio Lasse Leskelä Aalto-yliopisto 19. syyskuuta 2017 4.1 Jakauman varianssi ja keskihajonta Edellisessä luvussa opittiin, että satunnaismuuttujan odotusarvo on X:n jakauman

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Todennäköisyyden käsite ja laskusäännöt

Todennäköisyyden käsite ja laskusäännöt Luku 1 Todennäköisyyden käsite ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 1.1 Todennäköisyyden käsite Todennäköisyys on tapa kuvailla kvantitatiivisesti jonkin tapahtuman uskottavuutta,

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

30A02000 Tilastotieteen perusteet

30A02000 Tilastotieteen perusteet 30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi

Lisätiedot

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu 1. Tyhjentävä tunnusluku (sucient statistics ) Olkoon (P(X = x θ) : θ Θ) todennäköisyysmalli havainnolle X. Datan funktio T (X ) on Tyhjentävä tunnusluku jos ehdollinen todennäköisyys (ehdollinen tiheysfunktio)

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1 Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko ÌÓÒÒĐĐÓ ÝÝ ÔÖÙ ØØ Naiiveja määritelmiä Suhteellinen frekvenssi kun ilmiö toistuu Jos tehdas on valmistanut 1000000 kpl erästä tuotetta, joista 5013 ovat viallisia, niin todennäköisyys, että tuote on viallinen

Lisätiedot

Satunnaismuuttujat ja jakaumat

Satunnaismuuttujat ja jakaumat Luku 2 Satunnaismuuttujat ja jakaumat Lasse Leskelä Aalto-yliopisto 2. syyskuuta 207 2. Satunnaismuuttujan käsite Käytännön tilanteissa ei yleensä olla kiinnostuneita satunnaisilmiön kaikista yksityiskohdista,

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Matemaattinen tilastotiede Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Alkusanat Tämä moniste perustuu vuosina 2002-2004 pitämiini matemaattisen tilastotieteen luentoihin

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastollisen merkitsevyyden testaus Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: 8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Tilastollinen päättely, 10 op, 4 ov

Tilastollinen päättely, 10 op, 4 ov Tilastollinen päättely, 0 op, 4 ov Arto Luoma Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede 3304 TAMPEREEN YLIOPISTO Syksy 2006 Kirjallisuutta Garthwaite, Jolliffe, Jones Statistical Inference,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

Todennäköisyyden käsite ja laskusäännöt

Todennäköisyyden käsite ja laskusäännöt Luku 1 Todennäköisyyden käsite ja laskusäännöt Lasse Leskelä Aalto-yliopisto 12. syyskuuta 2017 1.1 Todennäköisyyden käsite Todennäköisyys on tapa kuvailla kvantitatiivisesti jonkin tapahtuman uskottavuutta,

Lisätiedot

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu Stokastiikka ja tilastollinen ajattelu Versio 0.9 Lasse Leskelä Aalto-yliopisto 3. tammikuuta 208 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite...................... 5.2 Satunnaisilmiön

Lisätiedot

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu Stokastiikka ja tilastollinen ajattelu Versio 0.93 Lasse Leskelä Aalto-yliopisto 7. helmikuuta 208 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite...................... 5.2 Satunnaisilmiön

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 21. syyskuuta 2007 Antti Rasila () TodB 21. syyskuuta 2007 1 / 19 1 Satunnaismuuttujien riippumattomuus 2 Jakauman tunnusluvut Odotusarvo Odotusarvon ominaisuuksia

Lisätiedot

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu Stokastiikka ja tilastollinen ajattelu Versio 0.96 Lasse Leskelä Aalto-yliopisto 7. syyskuuta 208 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite...................... 5.2 Satunnaisilmiön

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Stokastiikka ja tilastollinen ajattelu

Stokastiikka ja tilastollinen ajattelu Stokastiikka ja tilastollinen ajattelu Versio 0.990 Lasse Leskelä Aalto-yliopisto 8. maaliskuuta 209 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite...................... 5.2

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Aiheet: Satunnaisvektorit ja moniulotteiset jakaumat Tilastollinen riippuvuus ja lineaarinen korrelaatio Satunnaisvektorit ja moniulotteiset

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Inversio-ongelmien laskennallinen peruskurssi Luento 7 Inversio-ongelmien laskennallinen peruskurssi Luento 7 Kevät 2012 1 Tilastolliset inversio-ongelmat Tilastollinen ionversio perustuu seuraaviin periaatteisiin: 1. Kaikki mallissa olevat muuttujat mallinnetaan

Lisätiedot

4.2.2 Uskottavuusfunktio f Y (y 0 X = x)

4.2.2 Uskottavuusfunktio f Y (y 0 X = x) Kuva 4.6: Elektroniikassa esiintyvän lämpökohinan periaate. Lämpökohinaa ε mallinnetaan additiivisella häiriöllä y = Mx + ε. 4.2.2 Uskottavuusfunktio f Y (y 0 X = x) Tarkastellaan tilastollista inversio-ongelmaa,

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 018 Harjoitus B Ratkaisuehdotuksia Tehtäväsarja I 1 (Monisteen tehtävä 14) Olkoon f Y (y; θ) tilastollinen malli, jonka

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Satunnaismuuttujat ja todennäköisyysjakaumat Mitä tänään? Jos satunnaisilmiötä halutaan mallintaa matemaattisesti, on ilmiön tulosvaihtoehdot kuvattava numeerisessa muodossa. Tämä tapahtuu liittämällä

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 2 Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden

Lisätiedot

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Väliestimointi TKK (c) Ilkka Mellin (2005) 1 Väliestimointi Todennäköisyysjakaumien parametrien estimointi Luottamusväli Normaalijakauman odotusarvon luottamusväli Normaalijakauman

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Maximum likelihood-estimointi Alkeet

Maximum likelihood-estimointi Alkeet Maximum likelihood-estimointi Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Maximum likelihood-estimointi p.1/20 Maximum Likelihood-estimointi satunnaismuuttujan X

Lisätiedot

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa? 21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 20. syyskuuta 2007 Antti Rasila () TodB 20. syyskuuta 2007 1 / 17 1 Kolmogorovin aksioomat σ-algebra Tapahtuman todennäköisyys 2 Satunnaismuuttujat Todennäköisyysjakauma

Lisätiedot

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx. Yhteenveto: Satunnaisvektorit ovat kuvauksia tn-avaruudelta seillaiselle avaruudelle, johon sisältyy satunnaisvektorin kaikki mahdolliset reaalisaatiot. Satunnaisvektorin realisaatio eli otos on jokin

Lisätiedot

Jatkuvat satunnaismuuttujat

Jatkuvat satunnaismuuttujat Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään

Lisätiedot

3.7 Todennäköisyysjakaumia

3.7 Todennäköisyysjakaumia MAB5: Todennäköisyyden lähtökohdat 4 Luvussa 3 Tunnusluvut perehdyimme jo jakauman käsitteeseen yleensä ja normaalijakaumaan vähän tarkemmin. Lähdetään nyt tutustumaan binomijakaumaan ja otetaan sen jälkeen

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 15 1 Tilastollisia testejä Z-testi Normaalijakauman odotusarvon testaus, keskihajonta tunnetaan

Lisätiedot

2. Uskottavuus ja informaatio

2. Uskottavuus ja informaatio 2. Uskottavuus ja informaatio Aluksi käsittelemme uskottavuus- ja log-uskottavuusfunktioita Seuraavaksi esittelemme suurimman uskottavuuden estimointimenetelmän Ensi viikolla perehdymme aiheeseen lisääkö

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio

Lisätiedot

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla? 6.10.2006 1. Keppi, jonka pituus on m, taitetaan kahtia täysin satunnaisesti valitusta kohdasta ja muodostetaan kolmio, jonka kateetteina ovat syntyneet palaset. Kolmion pinta-ala on satunnaismuuttuja.

Lisätiedot

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2 HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 208 Harjoitus 4 Ratkaisuehdotuksia Tehtäväsarja I. Satunnaismuuttuja U Exp(2) ja V = U/(3 + U). Laske f V käyttämällä muuttujanvaihtotekniikkaa.

Lisätiedot

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava TKK (c) Ilkka Mellin (2005) 1 Kokonaistodennäköisyys ja Bayesin kaava Kokonaistodennäköisyys ja Bayesin kaava: Johdanto Kokonaistodennäköisyyden

Lisätiedot

Satunnaismuuttujien muunnokset ja niiden jakaumat

Satunnaismuuttujien muunnokset ja niiden jakaumat Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Satunnaismuuttujien muunnokset ja niiden jakaumat TKK (c) Ilkka Mellin (2007) 1 Satunnaismuuttujien muunnokset ja

Lisätiedot

3.11.2006. ,ܾ jaü on annettu niin voidaan hakea funktion 0.1 0.2 0.3 0.4

3.11.2006. ,ܾ jaü on annettu niin voidaan hakea funktion 0.1 0.2 0.3 0.4 Ü µ ½ ¾Ü¾µ Ü¾Ê 3.11.2006 1. Satunnaismuuttujan tiheysfunktio on ¼ ļ ܽ ܾ ÜÒµ Ä Ü½ ÜÒµ Ò Ä Ü½ ܾ ÜÒµ ܽ µ ܾ µ ÜÒ µ Ò missä tietenkin vaaditaan, että ¼. Muodosta :n ¾Ä ܽ ÜÒµ Ò ½¾ ܾ Ò ½ ¾Ü¾½µ ½ ¾Ü¾Òµ

Lisätiedot

Todennäköisyyslaskenta. β versio. Todennäköisyyslaskenta. Ilkka Mellin. Teknillinen korkeakoulu, Matematiikan laboratorio. Ilkka Mellin (2006) I

Todennäköisyyslaskenta. β versio. Todennäköisyyslaskenta. Ilkka Mellin. Teknillinen korkeakoulu, Matematiikan laboratorio. Ilkka Mellin (2006) I β versio Todennäköisyyslaskenta Ilkka Mellin Teknillinen korkeakoulu, Matematiikan laboratorio TKK @ Ilkka Mellin (2006) I TKK @ Ilkka Mellin (2006) II Esipuhe Tämä moniste antaa perustiedot todennäköisyyslaskennasta.

Lisätiedot

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A TKK / Systeemianalyysin laboratorio Nordlund Mat-.090 Sovellettu todennäköisyyslasku A Harjoitus 7 (vko 44/003) (Aihe: odotusarvon ja varianssin ominaisuuksia, satunnaismuuttujien lineaarikombinaatioita,

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu) 21.11.2017/1 MTTTP5, luento 21.11.2017 Otossuureita ja niiden jakaumia (jatkuu) 4) Olkoot X 1, X 2,..., X n satunnaisotos (, ):sta ja Y 1, Y 2,..., Y m satunnaisotos (, ):sta sekä otokset riippumattomia.

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio TKK (c) Ilkka Mellin (2007) 1 Kertymäfunktio >> Kertymäfunktio: Määritelmä Diskreettien jakaumien

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Kun datasta halutaan muodostaa malleja, ne ovat yleensä tilastollisia (esim. regressio, luokittelu, ryhmittely...) F(x 0 ) = P(x x 0 ) (1)

Kun datasta halutaan muodostaa malleja, ne ovat yleensä tilastollisia (esim. regressio, luokittelu, ryhmittely...) F(x 0 ) = P(x x 0 ) (1) 5. ESTIMOINTITEORIAN PERUSTEITA 5.1. Perusjakaumat 1-ulotteisina Kun datasta halutaan muodostaa malleja, ne ovat yleensä tilastollisia (esim. regressio, luokittelu, ryhmittely...) Siksi tarvitaan todennäköisyyslaskentaa

Lisätiedot

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾ ËØÙ ÓØÓ Ø Mitta-asteikot Nominaali- eli laatueroasteikko Ordinaali- eli järjestysasteikko Intervalli- eli välimatka-asteikko ( nolla mielivaltainen ) Suhdeasteikko ( nolla ei ole mielivaltainen ) Otos

Lisätiedot

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio. Todennäköisyyslaskenta I, kesä 7 Harjoitus 4 Ratkaisuehdotuksia. Satunnaismuuttujalla X on ns. kaksipuolinen eksponenttijakauma eli Laplacen jakauma: sen tiheysfunktio on fx = e x. a Piirrä tiheysfunktio.

Lisätiedot

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

Tilastollinen päättely II, kevät 2017 Harjoitus 1A Tilastollinen päättely II, kevät 207 Harjoitus A Heikki Korpela 23. tammikuuta 207 Tehtävä. Kertausta todennäköisyyslaskennasta. Ilmoita satunnaismuuttujan Y jakauman nimi ja pistetodennäköisyys- tai tiheysfunktio

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 28. syyskuuta 2007 Antti Rasila () TodB 28. syyskuuta 2007 1 / 20 1 Jatkoa diskreeteille jakaumille Negatiivinen binomijakauma Poisson-jakauma Diskreettien

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 12.1.2016/1 MTTTP5, luento 12.1.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

Tilastolliset luottamusvälit

Tilastolliset luottamusvälit Luku 8 Tilastolliset luottamusvälit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 8.1 Piste-estimaatti ja väliestimaatti Edellisessä luvussa opittii määrittämää parametreille estimaatteja suurimma uskottavuude

Lisätiedot

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat: Mat-.9 Sovellettu todennäköisyyslasku A Mat-.9 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Moniulotteiset jakaumat Diskreetti jakauma, Ehdollinen jakauma, Ehdollinen odotusarvo, Jatkuva

Lisätiedot

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia KE (2014) 1 Hypergeometrinen jakauma Hypergeometrinen jakauma

Lisätiedot