MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

Samankaltaiset tiedostot
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Todennäköisyyslaskun kertaus. Heliövaara 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Tilastomatematiikka Kevät 2008

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

Sovellettu todennäköisyyslaskenta B

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Sovellettu todennäköisyyslaskenta B

Todennäköisyyden ominaisuuksia

Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin (2008) 1/5

3. laskuharjoituskierros, vko 6, ratkaisut

Sovellettu todennäköisyyslaskenta B

D ( ) Var( ) ( ) E( ) [E( )]

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

4. laskuharjoituskierros, vko 7, ratkaisut

D ( ) E( ) E( ) 2.917

Moniulotteiset satunnaismuuttujat ja jakaumat

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

30A02000 Tilastotieteen perusteet

Varma tapahtuma, Yhdiste, Yhdistetty tapahtuma, Yhteenlaskusääntö

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

5. laskuharjoituskierros, vko 8, ratkaisut

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Moniulotteisia todennäköisyysjakaumia

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Sovellettu todennäköisyyslaskenta B

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

Verkot ja todennäköisyyslaskenta Verkko Verkko eli graafi muodostuu pisteiden joukosta V, särmien joukosta A ja insidenssikuvauksesta : A V V jossa

(x, y) 2. heiton tulos y

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Satunnaismuuttujien muunnokset ja niiden jakaumat

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

ABHELSINKI UNIVERSITY OF TECHNOLOGY

1. laskuharjoituskierros, vko 4, ratkaisut

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku A

Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

B. Siten A B, jos ja vain jos x A x

4. Todennäköisyyslaskennan kertausta

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Jakaumien tunnusluvut. TKK (c) Ilkka Mellin (2007) 1

Mat Sovellettu todennäköisyyslasku A

Todennäköisyyslaskenta. β versio. Todennäköisyyslaskenta. Ilkka Mellin. Teknillinen korkeakoulu, Matematiikan laboratorio. Ilkka Mellin (2006) I

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Satunnaismuuttujien summa ja keskiarvo

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Mat Sovellettu todennäköisyyslaskenta B

Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastomatematiikka Kevät 2008

Harjoitus 2: Matlab - Statistical Toolbox

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan:

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Poisson-prosessien ominaisuuksia ja esimerkkilaskuja

Mat Sovellettu todennäköisyyslasku A

Sovellettu todennäköisyyslaskenta B

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Osa 1: Todennäköisyys ja sen laskusäännöt

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Transkriptio:

MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa I G. Gripenberg 1 Todennäköisyys Satunnaismuuttujat Keskeinen raja-arvolause Aalto-yliopisto. tammikuuta 015 Kaksiulotteiset satunnaismuuttujat G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 1 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I / 64 Todennäköisyys? Suhteellinen osuus toistoista eli empiirinen todennäköisyys: Jos tehdas on tuottanut 1000 000 kappaletta tiettyä tuotetta ja näistä 5015 ovat viallisia, niin todennäköisyys, että tuote on viallinen on 0.005. Suotuisten vaihtoehtojen osuus eli klassinen todennäköisyys: Jos uurnassa on 6 mustaa ja 4 valkoista kuulaa ja jos poimimme umpimähkään uurnasta kuulan niin todennäköisyys, että se on musta on 6 6+4 = 0.6. Epävarmuuden mitta: Sateen todennäköisyys ensi keskiviikkona on 0%. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I / 64 Satunnaiskoe, otosavaruus, alkeistapahtuma, tapahtuma, todennäköisyys Satunnaiskoe: Heitämme noppaa kerran. Otosavaruus: Kokeen tulos on jokin luvuista 1,,, 4, 5 tai 6 jos katsomme silmälukua ja kaikkien mahdollisten tulosten joukko {1,,, 4, 5, 6} on otosavaruus. Tapahtuma: Jokaisen otosavaruuden osajoukko on tapahtuma, esim. parillisten silmälukujen joukko {, 4, 6}. Alkeistapahtuma: Jokainen otosavaruuden alkio 1,,, 4, 5 ja 6 on alkeistapahtuma. Todennäköisyys: Tässä tapauksessa on luonnollista, että oletamme että tapahtuman A todennäköisyys on PrA = A missä A on A:n 6 alkioiden lukumäärä mutta se ei ole ainoa vaihtoehto! Huom! Kun sanomme, että tapahtuma A sattuu, tarkoitamme aina sitä, että jokin tapahtumaan A kuuluva alkeistapahtuma sattuu. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 4 / 64

Joukko-opin kertausta Jos A ja B sekä A j, j 1 ovat tapahtumia eli otosavaruuden S osajoukkoja niin A B jos jokainen A:n alkio on B:n alkio eli alkeistapahtuma. A B = { s S : s A tai s B } eli tapahtuma A sattuu tai tapahtuma B sattuu tai molemmat sattuvat. A A B = { s S : s A ja s B } eli tapahtuma A sattuu ja tapahtuma B sattuu. A A \ B = { s S : s A mutta s / B } eli tapahtuma A sattuu mutta tapahtuma B ei satu. A A c = S \ A = { s S : s / A } eli tapahtuma A ei satu. B A A B B B Satunnaiskoe, otosavaruus, tapahtuma, todennäköisyys Otosavaruus S on satunnaiskokeen kaikkien mahdollisten tulosten muodostama joukko. Otosavaruuden alkio on alkeistapahtuma. Tapahtuma ovat otosavaruuden osajoukko. Jokaisella tapahtumalla A on todennäköisyys PrA ja nämä todennäköisyydet toteuttavat seuraavat ehdot on tyhjä joukko, johon ei kuulu yhtään alkiota: 0 PrA 1 jokaiselle tapahtumalle A. PrS = 1. Pr i=1 A i = i=1 PrA i jos A j A k = kun j k. j=1 A j = { s S : s A j jollakin j 1 } eli ainakin jokin tapahtumista A j sattuu. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 5 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 6 / 64 Huom! Todennäköisyysfunktiota koskevista oletuksista seuraa myös, että missä S on otosavaruus Pr = 0. PrA B = PrA + PrB PrA B. PrA c = PrS \ A = 1 PrA. A B PrA PrB. Huom! Kun S sisältää äärellisen monta alkiota on luonnollista, että kaikki otosavaruuden S osajoukot ovat tapahtumia mutta yleisesti tämä ei ole mahdollista tai edes toivottavaa ja silloin Pr on funktio, joka on määritelty S:n σ-algebrassa A, eli joukossa A jolla on seuraavat ominaisuudet: A A A S, S A, A A S \ A A, A i A, i = 1,,... i=1 A i A. Riippumattomuus Tapahtumat A ja B ovat riippumattomia jos PrA B = PrA PrB, ja tapahtumat A j, j J ovat riippumattomia jos PrA j1 A j... A jm = PrA j1 PrA j... PrA jm aina kun j k J, k = 1,..., m ja j p j q kun p q. Huom! Jos tapahtumat A j, j J ovat riippumattomia niin A jp ja A jq ovat riippumattomia kun j p j k mutta jos tapahtumat A j, j J, ovat vain pareittain riippumattomia, eli A jp ja A jq ovat riippumattomia kaikilla j p j k niin tapahtumat A j, j J eivät välttämättä ole riippumattomia. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 7 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 8 / 64

Riippumattomuus Heitetään virheetöntä kolikkoa kaksi kertaa ja olkoot A 1 = { Ensimmäisellä heitolla kruuna }, A = { Toisella heitolla kruuna } ja A = { Saadaan yksi kruuna }. Mitkä tapahtumat ovat riippumattomia ja mitkä eivät ole? Ratkaisu: Otosavaruus on tässä tapauksessa S = {HH, HT, TH, TT } missä siis H on kruuna ja T klaava. Tässä tapauksessa on siis A 1 = {HH, HT }, A = {HH, TH} ja A = {HT, TH}. Koska kolikko oletetaan olevan virheetön niin tapahtuman A S todennäköisyys on PrA = A S jolloin PrA 1 = PrA = PrA = 4 = 1 ja PrA 1 A = Pr{HH} = 1 4, PrA 1 A = Pr{HT } = 1 4 sekä PrA A = Pr{TH} = 1 4. Tästä nähdään, että tapahtumat A i ja A j ovat riippumattomia kun i, j {1,, } ja i j koska silloin PrA i A j = 1 4 = PrA i PrA j. Mutta PrA 1 A A = Pr = 0 PrA 1 PrA PrA joten tapahtumat A 1, A ja A eivät ole riippumattomia ainoastaan pareittain riippumattomia. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 9 / 64 Esimerkki Jos tapahtumat A ja B ovat riippumattomia, niin ovatko myös tapahtumat A c = S \ A ja B c = S \ B riippumattomia? Ratkaisu: Osoitamme ensin, että A c ja B ovat riippumattomia. Määritelmän mukaan S = A A c joten B = B S = B A B A c ja PrB = PrB A + PrB A c. Tämähän on kokonaistodennäköisyyden kaava. Koska A ja B ovat riippumattomia niin PrB A = PrB PrA ja PrB = PrB PrA + PrB A c = PrB + PrA c B. josta seuraa, että PrA c B = PrB PrB PrA = 1 PrA PrB = PrA c PrB. Nyt olemme osoittaneet oikeaksi implikaation A ja B riippumattomia A c ja B riippumattomia ja oletuksesta, että A ja B ovat riippumattia seuraa silloin, että A c ja B eli myös B ja A c ovat riippumattomia jolloin implikaation nojalla saame myös, että B c ja A c ovat riippumattomia. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 10 / 64 Ehdollinen todennäköisyys Tapahtuman A ehdollinen todennäköisyys ehdolla, että tapahtuma B on sattunut on PrA B PrA B =, PrB olettaen, että PrB > 0. Kun tapahtuma B on sattunut voimme rajoittaa otosavaruuden S joukoksi B ja laskea uudet todennäköisyydet tapahtumille A B, jotka ovat uuden otosavaruuden osajoukkoja. Ehdollisen todennäköisyyden tulosääntö Ehdollisen todennäköisyyden määritelmästä seuraa ns. tulosääntö ja yleisemmin PrA B = PrA PrB A, PrA 1... A k = PrA 1 PrA A 1 PrA A 1 A... PrA k A 1... A k 1. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 11 / 64 Puuverkko apuvälineenä Uurnassa on alunperin 5 valkoista ja 5 mustaa palloa. Nostamme satunnaisesti pallon uurnasta ja jos se on valkoinen laitamme mustan pallon uurnaan emmekä siis laita nostettua valkoista palloa takaisin ja jos se on musta emme laita yhtään palloa uurnaan. Toistamme tämän vielä kaksi kertaa. Mikä on todennäkösyys, että tämän jälkeen uurnassa on 6 mustaa palloa? Ratkaisu: Tässä voimme käyttää ehdollisen todennäköisyyden tulosääntöä mutta tämä on yksinkertaisinta jos piirrämme puun siten, että kaari vasemmalle alas valitaan jos nostamme valkoisen pallon ja kaari oikealle alas valitaan jos nostamme mustan pallon. Jokaiseen solmuun kirjoitamme siinä vaiheessa uurnassa olevien valkoisten ja mustien pallojen lukumäärät ja jokaisen kaaren kohdalle kirjoitamme todennäköisyyden, että tämä kaari valitaan olettaen, että uurnassa on solmun mukaiset lukumäärät valkoisia ja mustia palloja. Silloin puu näyttää seuraavanlaiselta: G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 1 / 64

Puuverkko apuvälineenä, jatk. 10 4 10 5 10 5,5 4,6 5,4 6 10,7 4,5 4,5 5, 7 10 4 9 5 9,8,6,6 4,4,6 4,4 4,4 5, Näin ollen kolmessa tapauksessa uurnassa on 6 mustaa palloa ja näiden todennäköisyydet saamme laskemalla niihin johtavien polkujen todennäköisyyksien tulot jolloin vastaukseksi saamme laskemalla yhteen: 5 10 4 10 7 10 + 5 10 4 9 5 10 5 9 5 9 5 8 4 9 6 10 4 9 + 5 10 5 9 4 9 = 1607 4050 0.4. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 1 / 64 8 Bayesin kaava: Esimerkki Eräässä maassa asuu kaksi yhtä suurta heimoa kierot ja lierot. Kieroista 60% vastaavat kaikkiin kysymyksiin oikein ja lieroista 80% vastaavat kaikkiin kysymyksiin oikein. Tapaat maan asukkaan, jolta kysyt onko hän kiero vai liero ja hän vastaa olevansa kiero. Mikä on todennäköisyys, että hän todella on kiero? Oletamme yksinkertaisuuden vuoksi että kieroja on yhteensä 1000 henkilöä ja lieroja samoin 1000 henkilöä. Silloin tiedämme, että kieroista 600 vastaavat kysymyksiin oikein ja sanovat olevansa kieroja. Vastaavasti lieroista 00 vastaavat kysymyksiin väärin, eli sanovat olevansa kieroja. Näin ollen yhteensä 800 henkilöä sanovat olevansa kieroja ja näistä 600 ovat todella kieroja joten todennäköisyys, että tapaamasi henkilö on kiero on 600 800 = 0.75. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 14 / 64 Kokonaistodennäköisyys Jos B j, j = 1,..., n ovat tapahtumia siten, että n j=1 B j = S, B j B k = kun j k ja PrB j > 0 kun j = 1,..., n niin kaikille tapahtumille A pätee PrA = n PrB j PrA B j j=1 Miksi? Koska A = A S = n j=1 A B j ja A B j A B k = kun j k niin PrA = n j=1 PrA B j ja tulosäännön mukaan PrA B j = PrB j PrA B j. Bayesin kaava Jos n j=1 B j = S, B j B k = kun j k, PrB j > 0 kun j = 1,..., n ja PrA > 0 niin pätee Miksi? PrB k A = PrB k PrA B k n j=1 PrB j PrA B j. PrB k A = PrB k A, PrA PrB k A = PrB k PrA B k ja n PrA = PrB j PrA B j. j=1 Bayesin kaava kuvaa miten meidän pitää päivittää käsitystämme tapahtumien B k todennäköisyyksistä PrB k todennäköisyykseiksi PrB k A kun saamme tietää, että tapahtuma A on sattunut. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 15 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 16 / 64

Bayesin kaava: Esimerkki Eräässä maassa asuu kaksi yhtä suurta heimoa kierot ja lierot. Kierot vastaavat kaikkiin kysymyksiin oikein todennäköisyydellä 0.6 ja lierot vastaavat kaikkiin kysymyksiin oikein todennäköisyydellä 0.8. Tapaat maan asukkaan, jolta kysyt onko hän kiero vai liero ja hän vastaa olevansa kiero. Mikä on todennäköisyys, että hän todella on kiero? Ratkaisu: Olkoon K tapahtuma, että vastaan tulee kiero ja L tapahtuma että vastaan tulee liero. Oletusten mukaan PrK = PrL = 0.5. Olkoon SK tapahtuma, että vastaan tuleva henkilö sanoo olevansa kiero. Oletusten mukaan pätee PrSK K = 0.6 ja PrSK L = 1 0.8 = 0.. Nyt haluamme laskea PrK SK ja Bayesin kaavan nojalla saamme PrSK K PrK PrK SK = PrSK K PrK + PrSK L PrL 0.6 0.5 = 0.6 0.5 + 0. 0.5 = 0. 0.4 = 0.75. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 17 / 64 Klassinen todennäköisyys ja kombinatoriikka PrA = Tapahtuman A alkeistapahtumien lukumäärä Kaikkien otosavaruuden alkeistapahtumien lukumäärä Tässä siis oletamme, että kaikki alkeistapahtumat ovat yhtä todennäköisiä ja että niitä on vain äärellisen monta ja meidän pitää laskea montako alkiota kuuluu otosavaruuteen S ja montako näistä kuuluu joukkoon A. Tuloperiaate Jos valintaprosessissa on k vaihetta ja vaiheessa j on n j vaihtoehtoa, riippumatta siitä mitä valintoja aikaisemmin on tehty mutta vaihtoehdot saattavat riippua valinnoista niin kaikkien vaihtoehtojen lukumäärä on n 1 n... n k. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 18 / 64 Permutaatiot, binomikertoimet jne. Jos joukossa on n alkiota voimme asettaa ne järjestykseen eri tavalla. Muista: 0! = 1 n! = 1... n 1 n, Joukosta, jossa on n alkiota, voimme valita k alkiota ja asettaa ne järjestykseen eri tavalla. n n 1... n k + 1 = n! n k! Joukosta, jossa on n alkiota voimme valita osajoukon, jossa on k alkiota n n! = k k!n k!, eri tavalla. Kaikissa näissä tapauksissa valitsemme joukosta alkion vain kerran, eli jos poimimme kuulia uurnasta emme laita niitä takaisin. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 19 / 64 Esimerkki Henkilöt A, B, C, D, E ja F asettuvat peräkkäin jonoon täysin satunnaisesti. Millä todennäköisyydellä A ja B joutuvat vierekkäin? Ratkaisu: 6 henkilöä voivat asettua järjestykseen 6! eri tavalla eli tämä on kaikkien alkeistapahtumien lukumäärä. Jos A ja B asettuvat vierekkäin he ovat sijoilla 1,,,,, 4, 4, 5 tai 5, 6 eli tässä on 5 vaihtoehtoa. Lisäksi he voivat asettua järjestykseen AB tai BA mikä antaa vaihtoehtoa. Kun A ja B ovat asettuneet paikoilleen niin henkilöillä C, D, E ja F on yhteensä 4! vaihtoehtoa asettua järjestykseen jäljelle jääneille paikoille. Tuloperiaatteen nojalla henkilöt A ja B voivat asettua vierekkäin 5 4!, eri tavalla joten todennäköisyys, että näin käy tulee olemaan 5 4! 6! = 1. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 0 / 64

Satunnaismuuttuja ja kertymäfunktio Reaalinen satunnaismuuttuja on funktio X : S R siis ei varsinaisesti mikään muuttuja missä S on jonkin kokeen otosavaruus, jossa on annettu todennäköisyys ja { s S : X s t } on tapahtuma kaikilla t R eli X on mitallinen funktio. Jos X on reaalinen satunnaismuuttuja niin sen kertymäfunktio on funktio F X t = PrX t = Pr { s S : X s t }, t R. Funktio F : R [0, 1] on kertymäfunktio jos ja vain jos 0 F t 1 F t 1 kun t 1 < t, lim t F t = 0 ja lim t F t = 1, lim u t+ F u = F t kun t R. Tässä tapauksessa pätee lisäksi lim u t F u = PrX < t, lim t t+ F y lim u t F u = PrX = t. F u F t = Prt < X u jos t < u. Huom! Lausekkeet X t ja X < t eivät muodollisesti ole tapahtumia eli S:n osajoukkoja mutta tavallisesti kirjoitetaan PrX t pitemmän lausekkeen Pr { s S : X s t } sijasta. Riippumattomat satunnaismuuttujat Satunnaismuuttujat X j, j J joilla on sama otosavaruus eli määrittelyjoukko ovat riippumattomia jos tapahtumat { X j a j }, j J ovat riippumattomia kaikilla a j R, j J ja silloin myös tapahtumat { X j A j }, j J ovat riippumattomia kaikilla Borel joukoilla A j. Satunnaismuuttujan todennäköisyysjakauma Satunnaismuuttujan X : S R todennäköisyysjakauma tai vain jakauma on todennäköisyysfunktio Pr X A = PrX A missä A R on sellainen, että { s S : X s A } on tapahtuma eli uudeksi otosavaruudeksi otetaan R ja määritetään sen tapahtumille todennäköisyydet funktiolla Pr X. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 1 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I / 64 Diskreetit satunnaismuuttujat Satunnaismuuttuja X on diskreetti jos on olemassa joukko A R ja positiivisia lukuja f X a, a A siten, että F X t = f X a. a t a A Tästä seuraa, että PrX = a = f X a kun a A ja a A f X a = 1 joten PrX / A = 0 ja joukossa A on korkeintaan numeroituvan monta alkiota ja voimme olettaa, että f X t = 0 kun t / A. f X on diskreetin satunnaismuuttujan X pistetodennäköisyysfunktio. Jatkuvat satunnaismuuttujat Satunnaismuuttuja X on jatkuva jos sen kertymäfunktio on jatkuva eli PrX = a = 0 kaikilla a R. Tavallisesti tehdään kuitenkin lisäoletus, että satunnaismuuttujalla X on tiheysfunktio f X siten, että F X t = t f X u du. Tässä tapauksessa f X u 0, f X u du = 1 ja d dt F X t = f X t. F X F X b F X a f X F X f X a b a b b Pra X b = Pra < X < b = F X b F X a = a f x t dt. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 4 / 64

Odotusarvo Jos X on diskreetti satunnaismuuttuja niin sen odotusarvo on EX = a a PrX = a = a af X a, missä f X on sen pistetodennäköisyysfunktio ja jos X :llä on tiheysfunktio f x niin sen odotusarvo on EX = tf X t dt, molemmissa tapauksissa olettaen, että summa tai integraali on olemassa eli a>0 af X a < tai a<0 a f X a < ja 0 tf X t dt < tai 0 t f t dt <, muuten kirjoitetaan EX = NaN ja sanotaan ettei tällä satunnaismuuttujalla ole odotusarvoa. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 5 / 64 Veto tai vedonlyöntisuhde odds ja Bayesin kaava Oleta, että osallistut rahapeliin, jossa voitat ja saat vastapeluriltasi yhden euron todennäköisyydellä p ja häviät ja annat vastapelurillesi v euroa todennäköisyydellä 1 p. Millä v:n arvolla kyseessä on reilu peli? Voittosi ja häviösi on satunnaismuuttuja X joka saa arvon 1 todennäköisyydellä p ja arvon v todennäköisyydellä 1 p ja vastapelurisi voitto on X. Nyt järkevä reiluuden kriiteri on että molempien voiton odotusarvo on 0, eli EX = 1 p v 1 p = 0 josta saadaan v = p 1 p, joka on pelin veto tai vedonlyöntisuhde eng. odds sinun kannaltasi. Tämä käsite tulee myös vastaan Bayesin kaavan yhteydessä seuraavalla tavalla: Jos B on jokin tapahtuma niin sen veto on PrB PrB c = PrB 1 PrB. Jos tiedämme, että tapahtuma A on sattunut niin saamme Bayesin kaavan nojalla päivitetyn vedon tapahtumalle B olettaen, että A on sattunut, eli PrB A PrB c A = PrA B PrA B c PrB PrB c. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 6 / 64 Satunnaismuuttujan funktion odotusarvo Jos X on satunnaismuuttuja ja g on mitallinen funktio niin EgX = a jos X on diskreetti ja EgX = ga PrX = a = a gtf X t dt gaf X a jos X on jatkuva satunnaismuuttuja, jolla on tiheysfunktio f X. Erityisesti jos gt = 1 kun t A ja gt = 0 muuten jolloin usein kirjoitetaan g = 1 A niin EgX = PrX A, eli todennäköisyydetkin voidaan esittää odotusarvoina. Pietarin paradoksi Saat maksua vastaan mahdollisuuden osallistua seuraavaan peliin: Heitetään kolikkoa kunnes tulee kruuna. Jos tämä tapahtuu n:nnellä heitolla saat n euroa. Miten paljon kannattaa maksaa mahdollisuudesta osallistua tähän peliin? Todennäköisyys, että ensimmäinen kruuna tulee n:nnellä heitolla on n ainoa mahdollisuus on n 1 klaavaa ja sitten kruuna, joten voiton odotusarvo on n Prkruuna n:nnellä heitolla = n=1 n n = n=1 1 =. On monta syytä miksi ei ole järkevää maksaa mitä tahansa jotta tähän peliin saisi osallistua tai yleensä lähteä mukaankin, ja tämä esimerkki osoittaakin ettei odotusarvo ole kaikkiin tilanteisiin sopiva käsite. n=1 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 7 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 8 / 64

Varianssi ja standardipoikkeama Jos satunnaismuuttujalla X on äärellinen odotusarvo niin sen varianssi on VarX = σ X = E X EX, ja sen standardipoikkeama eli keskihajonta on DX = σ X = VarX. Keskihajonnan etu varianssiin nähden on, että sen mittayksikkö on sama kuin X :n ja DαX = α DX. Odotusarvo on lineaarinen ja monotoninen Jos X 1 ja X ovat kaksi samalla otosavaruudella määriteltyä satunnaismuuttujaa, joilla on äärelliset odotusarvot niin ja jos lisäksi PrX 1 X = 1 niin Ec 1 X 1 + c X = c 1 EX 1 + c EX, EX 1 EX. Tästä seuraa erityisesti, että missä 1 on satunnaismuuttuja joka saa todennäköisyydellä 1 arvon 1 VarX = E X EX = E X X EX + EX = EX EX EX + EX E1 = EX EX 0. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 9 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 0 / 64 Summan varianssi Jos X 1 ja X ovat saman otosavaruuden riippumattomia satunnaismuuttujia niin Varc 1 X 1 + c X = c 1 VarX 1 + c VarX. ja yleisessä tapauksessa olettaen, että varianssit ovat äärellisiä Varc 1 X 1 + c X = c 1 VarX 1 + c 1 c E X 1 EX 1 X EX + c VarX. Tsebysovin epäyhtälö Pr X EX k VarX Miksi? 1 k, k > 1. t EX Olkoon gt = 1 jos 1 ja 0 muuten. Näin ollen k VarX EgX = Pr X EX k VarX. Nyt pätee gt koska gt on 0 jos oikea puoli on pienempi kuin 1 joten Pr X EX k VarX = EgX E X EX k VarX t EX k VarX = 1 k VarX VarX = 1 k. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 1 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I / 64

Kvantiilit Olkoon X satunnaismuuttuja, jonka kertymäfunktio on F X ja 0 < p < 1. Jos F X :llä on käänteisfunktio, niin x p = F 1 X p on satunnaismuuttujan X ja sen jakauman kvantiili kertalukua p. Yleisesti, x p on kvantiili kertalukua p jos PrX < x p p PrX x p, PrX > x p 1 p PrX x p. Mediaani on kvantiili kertalukua 0.5. Kvantiilit eivät välttämättä ole yksikäsitteisiä mutta ne ovat aina olemassa. Kvanttiilit, jatk. Monessa tilastomatemaattisessa laskussa muodostamme ensin testimuuttujan V, jonka kertymäfunktio F V ja tiheysfunktio f V on tunnettu ainakin approksimatiivisesti. Sitten laskemme luvut a ja b siten, että PrV < a = p a ja PrV > b = p b missä useimmiten p a = p b mutta joskus toinen on 0. Olettaen, että kertymäfunktiolla on käänteisfunktio niin saamme a = F 1 V p a ja b = F 1 V 1 p b 1 p b f V F V p a p b p a Näiden lukujen a ja b sekä testimuuttujan määritelmän avulla voimme sitten laskea ne suureet joista todella olemme kiinostuneita. Kun V kuten tässä on jatkuva niin PrV < a = PrV a ja Pra V b = Pra < V < b = 1 p a p b. a b G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 4 / 64 Tärkeitä jatkuvia satunnaismuuttjia ja niiden jakaumat Tasainen jatkuva jakauma missä < a < b < : { 1 f X t = b a, a t b, 0, t < a tai t > b. Odotusarvo on 1 a + b ja varianssi 1 1 b a. Normaalijakauma X Nµ, σ : f X t = 1 σ t µ π e σ. Odotusarvo on µ ja varianssi σ. Kertymäfunktiolle pätee F Nµ,σ t = F t µ N0,1 σ. Eksponenttijakauma X Expλ missä λ > 0: { λe λt, t 0, f X t = 0, t < 0. Odotusarvo on 1 λ ja varianssi 1 λ. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 5 / 64 Tärkeitä diskreettisiä satunnaismuuttujia ja niiden jakaumat Tasainen diskreetti jakauma: PrX = x i = 1 n, i = 1,,..., n jolloin oletetaan, että x i x j kun i j. Bernoulli-jakauma X Bernoullip, 0 p 1: PrX = 1 = p, PrX = 0 = 1 p eli X s = 1 kun s A S ja X s = 0 kun s S \ A missä PrA = p. EX = p ja VarX = p1 p. Binomijakauma X Binn, p, n 0, 0 p 1: n PrX = k = p k 1 p n k, k = 0, 1,..., n. k X on n:n riippumattoman Bernoullip-jakautuneen satunnaismuuttujan summa eli koe toistetaan n kertaa riippumattomin tuloksin ja tapahtuma A jolle pätee PrA = p, sattuu X kertaa. EX = np ja VarX = np1 p. Poisson-jakauma X Poissonλ, λ 0: λ λk PrX = k = e, k = 0, 1,,.... k! Saadaan binomijakauman raja-arvona kun n ja np λ. EX = VarX = λ. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 6 / 64

Tärkeitä diskreettisiä satunnaismuuttujia ja niiden jakaumat, jatk. Hypergeometrinen jakauma X HyperGeomN, r, n 0 n, r N: Jos uurnasta, missä on r valkoista ja N r mustaa kuulaa nostetaan satunnaisesti n kuulaa niin nostetuiksi tulleiden valkoisten kuulien lukumäärä noudattaa HyperGeomN, r, n-jakaumaa. r N r k PrX = k = n k N n. EX = nr N, VarX = nr N N r N N n. N 1 Geometrinen jakauma kaksi muunnelmaa X Geomp, 0 < p 1: Koe toistetaan kunnes tapahtuma A, jonka todennäköisyys on p, sattuu jolloin X 1 toistojen lukumäärä ja X toistojen lukumäärä ennenkuin A sattuu joten X 1 = X + 1. PrX 1 = k = 1 p k 1 p, k 1. PrX = k = 1 p k p, k 0. EX 1 = 1 p, EX = 1 p p, VarX 1 = VarX = 1 p p. Tärkeitä diskreettisiä satunnaismuuttujia ja niiden jakaumat, jatk. Negatiivinen binomijakauma X NegBinp, r, 0 < p 1, r 1: Koe toistetaan kunnes tapahtuma A, jonka todennäköisyys on p, on sattunut r kertaa ja X on toistojen lukumäärä. n 1 PrX = n = p r 1 p n r. r 1 EX = r r1 p p, VarX =. p Poisson- ja eksponenttijakauman välinen yhteys Jos X 1, X,... ovat riippumattomia Expλ-jakautuneita satunnaismuuttujia, T > 0 ja Y = max{ k 0 : X 1 + X +... X k T } niin Y PoissonλT. Eli jos asiakkaat saapuvat palvelupisteeseen riippumattomin ja Expλ-jakautunein väliajoin, niin T -pituisella aikavälillä saapuneiden asiakkaiden lukumäärä on PoissonλT -jakautunut. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 7 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 8 / 64 Poiminta takaisinpanolla ja ilman takaisinpanoa Oletamme, että uurnassa on m mustaa ja v valkoista kuulaa ja poimimme siitä n kuulaa. a Jos jokaisen poimitun kuulan kohdalla katsomme minkävärinen se on ja laitamme sen sitten takaisin uurnaan niin käytämme takaisinpanoa, ja todennäköisyys, että poimimme mustan kuulan on joka kerralla m m+v joten todennäköisyys, että poimimme kaiken kaikkiaan k mustaa kuulaa on binomijakauman mukaisesti k n m n k. k m+v 1 m m+v b Jos sen sijaan emme käytä takaisinpanoa niin todennäköisyys että poimimme mustan kuulan riippuu siitä minkävärisiä kuulia olemme jo poimineet ja todennäköisyys, että saamme k mustaa kuulaa on m k v hypergeometrisen jakauman mukaisesti m+v n n k. c Jos m ja v kasvavat siten, että m+v pysyy vakiona niin b-kohdan todennäköisyys lähestyy a-kohdan todennäköisyyttä. m Eksponenttijakauman unohtamisominaisuus Olkoon X satunnaismuuttuja, joka on Expλ-jakautunut. Jos t, u 0 niin pätee PrX > t + u X > u = PrX > t, eli laite joka toimii ajan X on kuin uusi joka hetkellä kun se vielä toimii. Miksi? Eksponenttijakauman kertymäfunktio on 1 e λt joten PrX > t + u = 1 F X t + u = e λt+u, PrX > u = e λu ja {X > t + u} {X > u} = {X > t + u} joten PrX > t + u X > u = PrX > t + u ja X > u PrX > u = e λt+u e λu = PrX > t + u PrX > u = e λt = PrX > t. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 9 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 40 / 64

Hasardifunktio Jos X on satunnaismuuttuja jolla on tiheysfunktio f X ja kertymäfunktio F X niin sen hasardifunktio on jolloin ja jos λ X on oikealta jatkuva pisteessä t niin λ X t = f X t 1 F X t, F X t = 1 e t λ X u du 1 λ X t = lim PrX t, t + h X > t, h 0+ h eli jos X on aika, jonka laite toimii, ja se on toiminut ajan t niin todennäköisyys, että se lakkaa toimimasta seuravaalla h-pituisella aikavälillä on noin λ X th. Eksponenttijakaumalla hasardifunktio on siis positiivinen vakio λ kun t 0 ja 0 kun t < 0. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 41 / 64 Keskeinen raja-arvolause Jos satunnaismuuttujat X 1, X,... ovat riippumattomia ja niillä on sama jakauma siten, että EX j = µ ja VarX j = σ <, j = 1,,..., niin pätee 1 n n j=1 X j µ n j=1 = X j nµ σ σ a N0, 1 kun n, n n eli lim Pr n n j=1 X j nµ σ t = F n N0,1 t = Normaaliapproksimaatio t 1 π e 1 u du. Jos X on riittävän monen riippumattoman satunnaismuuttujan summa missä jokaisen satunnaismuuttujan varianssi on äärellinen eikä liian iso tai liian pieni niin satunnaismuuttuja X EX on suurin piirtein VarX N0, 1-jakautunut. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 4 / 64 Binomijakauma ja normaaliapproksimaatio Heitämme noppaa 1500 kertaa. Millä todennäköisyydellä tulos on 5 tai 6 korkeintaan 450 kertaa? Ratkaisu: Koska todennäkösyys, että tulos on 5 tai 6 yhdessä heitossa on 1 ja koska on järkevää olettaa, että heittojen tulokset ovat riippumattomia niin vastaus saadaan binomijakauman avulla ja se on 450 1500 k k=0 1 k 1 1 1500 k. Voimme laskea tämän summan komennolla binocdf450,1500,1/ jolloin tulokseksi saamme 0.00147. Toinen tapa on käyttää normaaliapproksimaatiota: Olkoon X j = 1 jos heiton j tulos on 5 tai 6 ja muuten 0. Jos nyt Y = 1500 j=1 X j niin EY = 1500 1 = 500 ja VarY = 1500 1 1 1 = 1000. Keskeisen raja-arvolauseen nojalla Y EY a N0, 1 joten VarY Binomijakauma ja normaaliapproksimaatio, jatk. Y EY 450 EY PrY 450 = Pr VarY VarY = Pr Y EY VarY 450 500 Y EY = Pr.7861 1000 VarY F N0,1.7861 = 0.00085. Jos olisi kysytty millä todennäköisyydellä tulos on 5 tai 6 vähintään 470 ja enintään 50 kertaa niin tulos olisi Pr470 Y 50 = Pr 470 500 1000 = Pr Y EY VarY 1.64 Y EY VarY 1.0954 50 500 1000 F N0,1 1.0954 F N0,1 1.64 = 0.8116. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 4 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 44 / 64

Kaksiulotteiset satunnaismuuttujat ja niiden jakaumat Jos S on otosavaruus jossa on annettu todennäköisyysfunktio niin X, Y : S R on kaksiulotteinen satunnasimuuttuja, jonka kertymäfunktio on F XY t, u = PrX t, Y u olettaen, että { s S : X s t, Y s u } on tapahtuma otosavaruudessa kaikilla reaaliluvuilla t ja u. Kaksiulotteinen satunnaismuuttuja X, Y on diskreetti ja sen pistetodennäköisyysfunktio on f XY t, u jos PrX = t, Y = u = f XY t, u 0 kaikilla t ja u ja t u f XY t, u = 1 jolloin löytyy korkeintaan numeroituvan monta lukuparia t, u siten, että f XY t, y > 0. Kaksiulotteinen satunnaismuuttuja X, Y on jatkuva jos F XY on jatkuva ja sillä on tiheysfunktio f XY t, u mikäli f XY t, u 0 kaikilla t ja u, ja F XY t, u = t u f XY τ, ν dτ dν kaikilla t ja u jolloin f XY t, u dt du = 1. Reunajakaumat Jos f XY t, u on diskreetin kaksiulotteisen satunnaismuuttujan X, Y pistetodennäköisyys niin satunnaismuuttujien X ja Y reunajakaumat ovat f X t = PrX = t = u f XY t, u ja f Y u = PrY = u = t f XY t, u. Jos f XY t, u on jatkuvan kaksiulotteisen satunnaismuuttujan X, Y tiheysfunktio niin satunnaismuuttujien X ja Y reunatiheysfunktiot ovat f X t = f XY t, u du ja f Y u = f XY t, u dt. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 45 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 46 / 64 Odotusarvot Jos X, Y on kaksiulotteinen satunnaismuuttuja ja hx, y on mitallinen funktio niin E hx, Y = ht, uf XY t, u, t u kun X, Y on diskreetti satunnaismuuttuja ja summa on olemassa ja E hx, Y = ht, uf XY t, u dt du, kun X, Y on jatkuva satunnaismuuttuja jolla on tiheysfunktio ja integraali on olemassa. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 47 / 64 Riippumattomat satunnaismuuttujat Jos X, Y on diskreetti kaksiulotteinen satunnaismuuttuja tai jatkuva kaksiulotteinen satunnaismuuttuja, jolla on tiheysfunktio niin X ja Y ovat riippumattomia f XY t, u = f X tf Y u. Jos X ja Y ovat riippumattomia ja f sekä g ovat mitallisia funtkioita niin Kovarianssi ja korrelaatio Ef X gy = Ef X EgY. Kovarianssi: CovX, Y = E X EX Y EY = EXY EX EY, jos VarX < ja VarY <. Korrelaatio: CorX, Y = 0 < VarX < ja 0 < VarY <. CovX, Y VarX VarY, 1 CorX, Y 1 jos X ja Y riippumattomia CovX, Y = CorX, Y = 0, mutta jos korrelaatio on 0 niin X ja Y eivät välttämättä ole riippumattomia, paitsi kun X, Y on normaalijakautunut. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 48 / 64

Esimerkki Heitämme kolikkoa kertaa. Olkoon X kruunojen lukumäärä kahdessa ensimmäisessä heitossa ja Y klaavojen lukumäärä kahdessa jälkimmäisessä heitossa. Mikä on X :n ja Y :n välinen korrelaatio? Ratkaisu: Satunnaismuuttujan X, Y pistetodennäköisyysfunktio on f XY x, y Y 0 1 0 0 0.15 0.15 X 1 0.15 0.5 0.15 0.15 0.15 0 Nyt PrX = 0 = 0.5, PrX = 1 = 0.5 ja PrX = = 0.5 ja Y on samalla tavalla jakautunut. Näin ollen EX = EY = 0 0.5 + 1 0.5 + 0.5 = 1 ja VarX = VarY = 0 0.5 + 1 0.5 + 0.5 1 = 0.5. Lisäksi EXY = x=0 y=0 xyf XY x, y = 0 + 1 1 0.5 + 1 0.15 + 1 0.15 = 0.75. Näin ollen EXY EX EY CorX, Y = = 0.75 1 1 = 0.5 VarX VarY 0.5 0.5 Esimerkki, jatk. Matlab/Octavessa voimme laskea samat laskut seuraavalla tavalla: Määritelemme ensin pistetodennäköisyysfunktion komennolla f=[0 0.15 0.15; 0.15 0.5 0.15; 0.15 0.15 0] Sitten laskemme X :n ja Y :n pistetodennäköisyysfunktiot komennoilla fx=sumf, fy=sumf Määritelemme myös muuttjien saamat arvot x=[0 1 ], y=[0 1 ] Sitten laskemme EX ja EY ex=x*fx, ey=y*fy tai ex=sumx.*fx, ey=sumy.*fy ja varianssit VarX ja VarY vx=x.ˆ*fx -exˆ, vy=y.ˆ*fy -eyˆ sekä EXY exy=x*f*y jolloin korrelaatiokertoimeksi saamme corxy=exy-ex*ey/sqrtvx*vy. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 49 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 50 / 64 Poisson-jakautuneiden satunnaismuuttujien summa Jos X 1 Poissonλ 1 ja X Poissonλ ovat riippumattomia satunnaismuuttujia niin X 1 + X Poissonλ 1 + λ. Miksi? Jos X 1 ja X ovat riippumattomia satunnaismuuttujia jotka saavat arvonsa joukosta {0, 1,,...} ja joiden pistetodennäkösyysfunktiot ovat f X1 ja f X ei käytetä vielä Poisson-oletusta niin tapahtuma {X 1 + X = n} on unioni toisiaan poissulkevista tapahtumista {X 1 = k, X = n k}, k = 0, 1,..., n joten n f X1 +X n = PrX 1 + X = n = PrX 1 = k, X = n k = k=0 n PrX 1 = k PrX = n k = k=0 n f X1 kf X n k. Jos nyt X j Poissonλ j niin f Xj k = e λ j λk j k! joten binomikaavan nojalla n f X1 +X n = e λ λk λ n k 1 1 k! e λ j n k! k=0 = e λ 1+λ 1 n n! n! k!n k! λk 1λ n k = e λ 1+λ λ 1 + λ n. n! k=0 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 51 / 64 k=0 Kahden satunnaismuuttujan summan kertymäfunktio ym. Oletamme, että X ja Y ovat kaksi riippumatonta satunnaismuuttujaa ja X :llä on tiheysfunktio f X ja Y :n kertymäfunktio on F Y. Vastaava tulos pätee myös jos X on diskreetti. Jos a b ja Au Bu kaikilla u R niin PrX a, b], Y AX, BX ]= = b b Satunnaismuuttujan X + Y kertymäfunktio on a a PrY Au, Bu]f X u du FY Bu F Y Au f X u du. F X +Y t = PrX + Y t = PrX,, Y t X = PrY t uf X u du = F Y t uf X u du. Jos Y :n tiheysfunktio on f Y niin X + Y :n tiheysfunktio on f X +Y t = f Y t uf X u du. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 5 / 64

Esimerkki Oleta, että meillä on mahdollisuus tehdä sopimus kahden eri vastapuolen kanssa esim. ostaa maitoa kahdesta eri kaupasta mutta sillä rajoituksella, että kun kuulemme ensimmäisen vastapuolen ehdot, esim. hinta, meidän pitää joko hyväksyä ne jolloin sopimus syntyy, tai hylätä ne, jolloin meidän täytyy hyväksyä toisen vastapuolen ehdot. Onko olemassa parempi tapa toimia tällaisessa tilanteessa kuin satunnaisesti valita kenen kanssa sopimus tehdään, tai suoraan valita toinen heistä? Vastaus on, ainakin tietyin oletuksin, että on olemassa parempi tapa: Oletamme ensinnäkin, että ainoa ehto on hinta ja että tässä tapauksessa alhaisempi hinta on parempi. Lisäksi oletamme että molempien hintatarjoukset X ja Y ovat riippumattomia positiivisia satunnaisuureita, joilla molemmilla on sama kertymäfunktio F ja tiheysfunktio f. Nyt PrX Y = PrY X = 1 mikä on on perusteltavissa sillä, että symmetrian nojalla PrX < Y = PrY < X, jatkuvuuden nojalla PrX = Y = 0 ja PrX < Y tai Y < X tai X = Y = 1. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 5 / 64 Esimerkki, jatk. Toisella tavalla, käyttämällä tulosta d dt t PrX < Y = Pr0 < X <, X < Y < = = 1 / 0 f u du = 0 + 1 t f u du = f u, saamme 0 t 0 f u du f tdt f u du = 1. Jos nyt valitsemme ensimmäisen tarjouksen todennäköisyydellä q [0, 1] ja toisen todennäköisyydellä 1 q niin todennäköisyys, että valitsemme pienemmän on 1. Parempi tapa on se että valitsemme tietyn hinnan a ja jos ensimmäinen tarjous on korkeintaan a niin valitsemme sen ja muuten valitsemme toisen tarjouksen. Todennäköisyys, että silloin valitsemme edullisemman tarjouksen on p = Pr X a ja X Y tai X > a ja Y X. Tapahtumat {X a ja X Y } ja {X > a ja Y X } ovat toisiaan poissulkevia joten G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 54 / 64 Esimerkki, jatk. a p = f u du f t dt + 0 t a t 0 / f u du f t dt = 1 / a f u du + 1 t 0 t a 0 = 1 f u du + 1 f u du a 0 + 1 f u du 1 a f u du 0 = 1 1 F a + 1 + 1 1 F a 0 f u du = 1 + F a F a = 1 + F a1 F a. Tämä todennäköisyys on suurimmillaan 4 jos pystymme valitsemaan a:n niin että F a = 1, eli se on X :n ja Y :n mediaani. Mutta jos vain PrX < a > 0 ja PrX > a > 0 niin todennäköisyys, että teemme parhaan mahdollisen valinnan on suurempi kuin 1. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 55 / 64 Ehdolliset jakaumat Jos X, Y on diskreetti kaksiulotteinen satunnaismuuttuja tai jatkuva kaksiulotteinen satunnaismuuttuja, jolla on tiheysfunktio niin f Y X u t = f XY t, u, kun f X t > 0, f X t on Y :n ehdollinen pistetodennäköisyysfunktio tai tiheysfunktio ehdolla X = t. { u uf Y X u t tai EY X = t = uf Y X u t du EY X on satunnaismuuttuja siten, että EY X s = EY X = X s kun s S. EEY X = EY. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 56 / 64

Reuna- ja ehdolliset jakaumat Kaksiulotteisen diskreetin satunnaismuuttujan X, Y pistetodennäköisyysfunktio on annettu seuraavassa taulukossa. f XY x, y Y -5-0 4 1 0.1 0.1 0. 0.1 X 0.1 0 0.1 0.1 4 0.1 0 0.1 0 Laskemalla rivisummat sumf saadaan X :n reunajakauma: 1 4 f X x 0.5 0. 0. Laskemalla sarakesummat sumf saadaan Y :n reunajakauma: -5-0 4 f Y y 0. 0.1 0.4 0. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 57 / 64 Reuna- ja ehdolliset jakaumat, jatk. Ehdolliset jakaumat saadaan jakamalla vastaava rivi tai sarake kaksiulotteisessa jakaumassa vastaavalla reunajakauman todennäköisyydellä, eli esimerkiksi: X :n ehdollinen jakauma ehdolla Y = 0 on 1 4 f X Y x 0 0.5 0.5 0.5 Y :n ehdollinen jakauma ehdolla X = 1 on -5-0 4 f Y X y 1 0. 0. 0.4 0. Ehdollisesta jakaumasta voidaan laskea ehdollinen odotusarvo jolloin esimerkiksi EX Y = 0 = 1 0.5 + 0.5 + 4 0.5 =.5. EY X = 1 = 5 0. 0. + 0 0.4 + 4 0. = 0.8. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 58 / 64 Reuna- ja ehdolliset jakaumat, jatk. Ehdollinen odotusarvo EX Y on satunnaismuuttuja joka saa arvot EX Y = 5, EX Y =, EX Y = 0 ja EX Y = 4 todennäköisyyksillä f Y 5, f Y, f Y 0 ja f Y 4 joten sen jakauma on.6667 1.5 f EX Y 0. 0.1 0.4 0. Ehdollinen odotusarvo EY X on satunnaismuuttuja joka saa arvot EY X = 1, EY X = ja EY X = 4 todennäköisyyksillä f X 1, f X ja f X 4 joten sen jakauma on -0.8-0. -.5 f EY X 0.5 0. 0. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 59 / 64 Ehdolliset jakaumat, esimerkki Oletamme, että kaksi henkilöä, jotka eivät tunne toisiaan saapuvat samaan kadunkulmaan. Mikä on toisen pituus jos heidän yhteenlaskettu pituutensa on 40 cm? Mikä on toisen voitto lotossa edellisellä viikolla jos heidän yhteenlaskettu voittonsa edellisellä viikolla on 4 miljoona euroa? Tässä meillä on siis kaksi riippumatonta samalla tavalla jakautunutta satunnaismuuttujaa X ja Y ja kysymys on toisen muuttujan jakaumasta ehdolla X + Y = t ja erityisesti mitä jokin mielikuva tästä jakaumasta kertoo muuttujien X ja Y jakaumasta. Olkoon Z = X + Y jolloin Y = Z X ja olkoon f satunnaismuuttujan X ja Y :n kertymäfunktio. Silloin satunnaismuuttujan X, Z kertymäfunktio on F XZ t, u = PrX t, Z u = PrX t, Y u X t u x t u = f η dη f x dx η = = z x f z xf x dz dx. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 60 / 64

Ehdolliset jakaumat, esimerkki, jatk. Tästä seuraa, että X, Z:n tiheysfunktio on f xf z x. Näin ollen satunnaismuuttujan X Z = z, eli X ehdolla Z = z, tiheysfunktio on f X Z x z = f xf z x. f tf t z dt Seuraavaksi katsomme mikä tämä jakauma on kolmessa erikoistapauksessa: Jos X ja Y Expλ niin f t = λe λt kun t 0 ja 0 kun t < 0 joten Ehdolliset jakaumat, esimerkki, jatk. Jos X ja Y Nµ, σ niin f t = 1 πσ e 1 t µ σ ja mekaaninen lasku osoittaa, että z X Z = z N, σ. Jos X :n ja Y :n tiheysfunktio on f t = kun t > 0 ja f t = 0 π1+t kun t < 0 niin numeerinen lasku osoittaa, että esimerkiksi f X Z x, 100 näyttää seuraavanlaiselta: f X Z x, z = λ e λx e λz x λ z 0 e λt e λz t dt = 1 z, 0 x z, ja f X Z x, z = 0 jos x < 0 tai x > z. Ehdollinen jakauma on siis tasajakauma välillä [0, z]. 0. 0. 0.1 10 0 0 40 50 60 70 80 90 100 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 61 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 6 / 64 Kaksiulotteinen normaalijakauma Satunnaismuuttuja X, Y on normaalijakautunut jos jokainen lineaarikombinaatio αx + βy on normaalijakautunut. Jos X, Y on normaalijakautunut niin myös X ja Y ovat normaalijakautuneita, eli X Nµ X, σ X ja Y Nµ Y, σ Y. Jos X, Y on normaalijakautunut ja CovX, Y = 0 ja silloin myös ρ = CorX, Y = 0 niin X ja Y ovat riippumattomia. Jos X, Y on normaalijakautunut, σ X > 0, σ Y f Y X u t = 1 πσy 1 ρ e 1 u µ Y ρ σ Y σx t µ X σ Y 1 ρ > 0 ja ρ ±1 niin Y X = t N µ Y + ρ σ Y σ X t µ X, 1 ρ σy, ja vastaava tulos pätee X Y = u:lle. Jos X, Y on normaalijakautunut, σx > 0, σ Y > 0 ja ρ ±1 niin X, Y :llä on tiheysfunktio 1 t µ X f XY t, u = 1 e 1 ρ σ + u µ Y σ X ρt µ X u µ Y σ Y X σ Y πσ X σ Y 1 ρ eli Huom! Jos X, Y on satunnaismuuttuja siten, että X on normaalijakautunut ja Y on normaalijakautunut niin satunnaismuuttuja X, Y ei välttämättä ole normaalijakautunut. Jos X ja Y ovat riippumattomia normaalijakautuneita satunnaismuuttujia niin X, Y on normaalijakautunut. Jos X j Nµ j, σj, j = 1,..., n ovat riippumattomia niin j=1 c n jx j N j=1 c jµ j, n j=1 c j σ j. Paluu keskiarvoon Jos X, Y on normaalijakautunut siten, että X :llä ja Y :llä on sama jakauma Nµ, σ ja korrelaatiokerroin ρ = CorX, Y ±1 niin EY X = t µ = ρ t µ < t µ. G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 6 / 64 G. Gripenberg Aalto-yliopisto MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssiluennot,. tammikuuta 015 osa I 64 / 64