Tilastomatematiikka TUDI



Samankaltaiset tiedostot
Todennäköisyyden ominaisuuksia

Sovellettu todennäköisyyslaskenta B

031021P Tilastomatematiikka (5 op) Kurssi-info ja lukion kertausta

B. Siten A B, jos ja vain jos x A x

Todennäköisyyslaskenta sivuaineopiskelijoille

30A02000 Tilastotieteen perusteet

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Mat Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus tn-laskentaan perjantai

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Todennäköisyysjakaumia

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4. laskuharjoituskierros, vko 7, ratkaisut

Määritelmä 3.1 (Ehdollinen todennäköisyys) Olkoot A ja B otosavaruuden Ω tapahtumia. Jos P(A) > 0, niin tapahtuman B ehdollinen todennäköisyys

Testejä suhdeasteikollisille muuttujille

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Jatkuvat satunnaismuuttujat

Sovellettu todennäköisyyslaskenta B

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Johdatus tn-laskentaan torstai

Luku 1. Johdanto. 1.1 Todennäköisyys ja tilastotiede. 1.2 Havaitut frekvenssit ja empiiriset jakaumat

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) viikko 3

ABHELSINKI UNIVERSITY OF TECHNOLOGY

D ( ) E( ) E( ) 2.917

TODENNÄKÖISYYS JA TILASTOT MAA6 KERTAUS

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Sovellettu todennäköisyyslaskenta B

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

dx=2&uilang=fi&lang=fi&lvv=2015

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

(x, y) 2. heiton tulos y

Otoskoko 107 kpl. a) 27 b) 2654

D ( ) Var( ) ( ) E( ) [E( )]

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Tilastomatematiikka Kevät 2008

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

Todennäköisyys (englanniksi probability)

Tilastollinen aineisto Luottamusväli

Todennäköisyyslaskenta

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Sovellettu todennäköisyyslaskenta B

ABHELSINKI UNIVERSITY OF TECHNOLOGY

031021P Tilastomatematiikka (5 op) viikot 5 6

Harjoitus 2: Matlab - Statistical Toolbox

Odotusarvo. Odotusarvon ominaisuuksia Satunnaismuuttujien ominaisuuksia 61

Todennäköisyyslaskenta 1/7 Sisältö ESITIEDOT: joukko-oppi, lukumäärän laskeminen, funktiokäsite Hakemisto

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

dx=5&uilang=fi&lang=fi&lvv=2014

&idx=2&uilang=fi&lang=fi&lvv=2015

Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

811120P Diskreetit rakenteet

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Väliestimointi (jatkoa) Heliövaara 1

Testit laatueroasteikollisille muuttujille

Todennäköisyyslaskun kertaus. Heliövaara 1

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op)

Mat Sovellettu todennäköisyyslasku A

tilastotieteen kertaus

Hypoteesin testaus Alkeet

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Mat Sovellettu todennäköisyyslasku A

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

6. laskuharjoitusten vastaukset (viikot 10 11)

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

&idx=2&uilang=fi&lang=fi&lvv=2015

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Satunnaismuuttujan odotusarvo ja laskusäännöt

riippumattomia ja noudattavat samaa jakaumaa.

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Otanta ilman takaisinpanoa

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Transkriptio:

Miika Tolonen http://www.mafy.lut.fi/tilmattudi Laboratory of Applied Mathematics Lappeenranta University of Technology 10. syyskuuta 2014

Sisältö I Johdanto 1 Johdanto 2 Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava 3 Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi

Sisältö II Johdanto Diskreettejä jakaumia Jatkuvia jakaumia 4 Havaintoainesto: otos Havaintoaineiston kuvaus Otossuureet, otostunnusluvut 5 Piste-estimaatit Luottamusvälit 6 Testauksen periaatteet ja peruskäsitteet Parametrien testaus Ei-parametrisiä testejä

Sisältö III 7 Korrelaatio Regressioanalyysin periaatteet Usean selittävän muuttujan lineaarinen regressioanalyysi

Johdanto Mihin tilastotiedettä tarvitaan? Suuren havaintomäärän (datan) keräämiseen, tietojen tiivistämiseen ja kuvailuun Johtopäätösten tekemiseen epätäydellisen ja epävarman informaation perusteella. tulevaisuuden ennustamiseen. Mihin tilastotiede perustuu? Tilastollisen päättelyn menetelmät nojaavat toisaalta ilmiöistä kerättyyn käytännön kokemukseen ja toisaalta todennäköisyyslaskentaan, joka perustuu aksioomiin. Näistä aksioomista johdetaan laskusääntöjä ja päättelyssä käytettäviä kaavoja

Johdanto Tilastotieteen perusongelmia: Mitä on tieto ja miten epävarmuutta mitataan? Mitä on sattumanvaraisuus? Miten erotellaan systemaattinen ja satunnainen vaihtelu toisistaan? Millä perusteella tehdään johtopäätöksiä? Miten tutkimustulosten luotettavuutta arvoidaan?

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Satunnaiskoe ja satunnaismuuttujat 7 Satunnaiskoe on toisettavissa oleva ilmiö, jonka lopputuloksen määrää satunnainen mekanismi. Satunnaiskokeen mahdolliset lopputulokset ovat alkeistapahtumia Otosavaruus on kaikkien alkeistapahtumien joukko. Nopan heitto: S = {1, 2, 3, 4, 5, 6} Hehkulamput pakataan 4 kappaleen rasioihin. Otetaan yksi rasia ja testataan lamput: S = {kkkk, kkkv, kkvk,..., vvvv} Laitevikojen lkm/v: S = {0, 1, 2,...} Pariston elinikä: S = {t R t > 0} Otosavaruuden määrittely riippuu tutkimuksen kohteesta, joka määrää sen mitä mitatataan tai rekisteröidään.

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Satunnaiskoe ja satunnaismuuttujat 8 Tapahtuma tarkoittaa otosavaruuden osajoukkoa. Tapahtuma voidaan kuvailla sanallisesti matemaattisilla symboleilla luettelemalla tapahtumaan kuuluvat alkeistapahtumat Vennin diagrammilla. Satunnaismuuttuja on kuvaus X : S R, eli se liittää kuhunkin alkeistapaukseen reaaliluvun, joka on satunnaismuuttujan arvo. Koska kokeen tulosta säätele satunnaismekanismi, on X :n arvokin tätä kautta satunnainen. Koetta toistettaessa eri arvot vaihtelevat ja tätä vaihtelua kuvaa satunnaismuuttujan jakauma.

Tarkastellaan hehkulamppujen toimivuutta 4 kappaleen rasiasssa. Otosavaruutena on S = {kkkk, kkkv, kkvk, kvkk, vkkk, kkvv, kvkv, kvvk, vkkv, vvkk, kvvv, vkvv, vvkv, vvvk, vvvv}. Esimerkki kokeeseen liittyvästä tapahtumasta: A = Rasiassa on yksi toimiva lamppu = {kvvv, vkvv, vvkv, vvvk} Esimerkki kokeeseen liittyvästä satunnaismuuttujasta: X =viallisten lamppujen lukumäärä. Tapahtuma A voidaan esittää myös symbolisessa muodossa A = {X = 3}

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Joukko-oppia 10 Tapahtumien käsittelyssä tarvitaan joukko-opin merkintöjä, käsitteitä ja operaatioita. Merkintä: Selitys a A alkio a kuuluu joukkoon A A B joukko A sisältyy joukkoon B eli A on B:n osajoukko A B joukkojen A ja B yhdiste eli unioni A B joukkojen A ja B leikkaus Ā tai A c A:n komplementti A B tai A B Joukkojen A ja B erotus tyhjä joukko

Komponentit k 1,..., k n muodostavat rinnan kytketyn systeemin, jos systeemi toimii aina, kun yksikin komponentti toimii. Komponentit muodostavat sarjaan kytketyn systeemin, jos systeemi toimii vain, kun kaikki komponentit toimivat. Olkoot tiettyyn aikaväliin liittyvat tapahtumat A i ="komponentti k i toimii". Lausu seuraavat tapahtumat tapahtumien A i avulla: a) Rinnan kytketty systeemi toimii. b) Rinnan kytketty systeemi ei toimi. c) Sarjaan kytketty systeerni toimii. d) Sarjaan kytketty systeemi ei toimi. Komplementeissa käytetään de Morganin kaavaa a) A 1 A 2... A n b) A 1 A 2... A n = Ā 1 Ā 2... Ā n c) A 1 A 2... A n d) A 1 A 2... A n = Ā 1 Ā 2... Ā n

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Todennäköisyyden lajit 13 Tapahtuman A todennäköisyyttä merkitään P(A):lla. Todennäköisyys ilmoitetaan lukuna väliltä [0, 1] tai prosenttina. 1) Klassinen todennäköisyys P(A) = A:n alkeistapahtumien lukumäärä kaikkien alkeistapahtumien lukumäärä Nopanheitto: kaikki luvut 1, 2, 3, 4, 5, 6 ovat yhtä todennäköisiä. Tapahtuman A = kolmella jaollinen luku todennäköisyys on silloin P(A) = 2 6 = 1 3

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Todennäköisyyden lajit 14 2) Tilastollinen todennäköisyys, todennäköisyyden frekvenssitutkinta P(A) = raja-arvo, jota A:n suhteelinen esiintymisfrekvenssi lähestyy koetta toistettaessa Ongelmana on tämän raja-arvon määrittely, sillä kysymys ei ole matemaattisesta raja-arvon käsitteestä. Käytännössä toistoja voidaan tehdä vain äärellinen määrä, jolloin P(A) tapahtuman A esiintymiskertojen lukumäärä satunnaiskokeen toistokertojen lukumäärä

Teollinen kappaletuotanto. Millä todennäköisyydellä sattumanvaraisesti poimittu tuote on viallinen? Todennäköisyys on viallisten suhteellinen osuus toistettaessa poimintaa äärettömän monta kertaa samanlaisissa olosuhteissa, ts. suhteellinen osuus koko tuotannossa. Oletetaan että on poimittu n = 1000 satunnaista tuotetta, sattumanvaraisina aikoina, ja havaittu näiden joukossa 12 viallista. Viallisen todennäköisyyden arvioidaan olevan noin 12/1000 = 0.012 = 1.2%.

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Todennäköisyyden lajit 16 3) Geometrinen todennäköisyys Jos n-ulotteisesta joukosta Ω valitaan piste X umpimähkään eli siten, että kaikilla pisteillä on sama valintamahdollisuus (poimintatodennäköisyys), ja A on jokin Ω:n osajoukko, niin P(X A) = m(a) m(ω) missä m on joukon n-ulotteinen mitta (pituus, pinta-ala, tilavuus jne.). Määrittely perustuu todennäköisyyden frekvenssitulkintaan, mutta se on myös yleistys klassisen todennäköisyyden määrittelyyn, kuten aiemmin huomautettiin.

Ystävättäret Leila ja Annukka ovat sopineet, että he saapuvat lounasaikaan tietyn ravintolan eteen ja lounastavat yhdessä, jos tapaavat toisensa. Tapaamisehdot ovat seuraavat: Kumpikin valitsee saapumisajankohdan täysin sattumanvaraisesti klo 12.00 ja 13.00 väliltä. Ensiksi saapuva odottaa ravintolan edessä tasan 10 minuuttia, jos toinen ei ole paikalla. Kuinka suurella todennäköisyydellä ystävättäret tapaavat toisensa? Olkoon saapumisajat X ja Y. Kumpikin valitaan umpimähkää väliltä [0,1] Piste (X,Y) valitaan umpimähkää (täysin satunnaisesti) neliössä S = [0, 1]x[0, 1] (eli jokainen pistepari (X,Y) neliössä on yhtä todennäköinen) Tapaaminen onnistuu, jos X Y 1/6. Kysytty todennäköisyys on P((X, Y ) A) = m(a) A:n pinta-ala = m(s) S:n pinta-ala = 1 5 6 1 5 6 = 11 36

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Todennäköisyyden lajit 18 4) Subjektiivinen todennäköisyys P(A) = uskomuksen aste (siihen, että A tapahtuu) Saipa voittaa HIFK:n seuraavassa ottelussa 25%:n varmuudella.

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Todennäköisyyden ominaisuudet 19 Todennäköisyyden perusominaisuudet (aksioomat) A1 0 P(A) 1 jokaiselle tapahtumalle A B A2 P(S) = 1 varma tapahtuma A3 Jos A ja B ovat erilliset (toisensa poissulkevat) tapahtumat eli A B =, niin A tai B tapahtuu todennäköisyydellä P(A B) = P(A) + P(B). Kun S on ääretön joukko, vaaditaan lisäksi A3 Jos A 1, A 2,... ovat erillisiä tapahtumia eli A i A j = kun i j, niin P(A 1 A 2...) = P(A 1 ) + P(A 2 ) +...

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Todennäköisyyden ominaisuudet 20 Seurausominaisuuksia (i) Mahdoton tapahtuma: P( ) = 0 (ii) Komplementtitapauksen todennäköisyys: P(Ā) = 1 P(A) (iii) Jos A B eli A:sta seuraa B, niin P(A) P(B) (iv) A tai B tapahtuu: P(A B) = P(A) + P(B) P(A B) (v) A tapahtuu, B ei: P(A B) = P(A) P(A B) Diskreetti todennäköisyyskenttä Jatkuva todennäköisyyskenttä

Valitaan koehenkilö tai haastateltava Suomen kansalaisista. Oletetaan, että opiskelijoita on noin 8% väestöstä ja alle 30-vuotiaiden osuus väestöstä on 36%. Alle 30- vuotiaita opiskelijoita on 7% koko väestöstä. Merkitään tapahtumia A = "opiskelija" B = "alle 30-vuotias" Tiedetään todennäköisyydet P(A) = 0.08, P(B) = 0.36 ja P(A B) = 0.07 Laske, millä todennäköisyydellä henkilö a) ei ole opiskelija? P(Ā) = 1 0.08 = 0.92 b) on vähintään 30-vuotias opiskelija? P(A B) = P(A B) = P(A) P(A B) = 0.08 0.07 = 0.01. c) vähintään 30-vuotias, ei opiskelija? P(Ā B) = P(A B) = 1 P(A B) = 1 [P(A)+P(B) P(A B)] = 1 (0.08+0.36 0.07) = 0.63.

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Diskreettejä todennäköisyysmalleja 22 Äärellinen todennäköisyysmalli Olkoon otosavaruutena S = {e 1, e 2,..., e N } ja alkeistapahtumien N todennäköisyydet P(e i ) = p i, missä 0 p i 1 ja p i = 1 Tapahtuman A S todennäköisyys on silloin P(A) = P(e i ) e i A i=1

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Diskreettejä todennäköisyysmalleja 23 Tasainen, äärellinen todennäköisyysmalli Olkoon otosavaruutena S = {e 1, e 2,..., e N } ja alkeistapaukset yhtä todennäköisiä. Silloin P(e i ) = p i = 1 N Tapahtuman A S todennäköisyys on edellisen summakaavan perusteella P(A) = N A N Missä N A = A:n alkioiden lukumäärä eli A:lle suotuisien alkeistapahtumien lukumäärä.

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Diskreettejä todennäköisyysmalleja 24 Numeroituva todennäköisyysmalli Olkoon otosavaruutena S = {e 1, e 2,..., e N } ja alkeistapahtumien N todennäköisyydet P(e i ) = p i, missä 0 p i 1 ja p i = 1 Kuten äärellisessä tapauksessa, tapahtuman A S todennäköisyys on P(A) = e i A P(e i ) i=1

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Riippumattomien kokeiden yhdistäminen: tulotodennäköisyyskenttä 25 Suoritetaan n riippumatonta satunnaiskoetta, joiden otosavaruudet ovat S 1, S 2,..., S n ja todennäköisyysmitat P 1, P 2,..., P n. Yhdistetyn kokeen otosavaruus on tällöin S = S 1 S 2... S n = {(x 1, x 2,..., x n ) x i S i, i = 1, 2,..., n} ja tapahtuman A = A 1 A 2... A n = {(x 1, x 2,..., x n ) x i A i, i = 1, 2,..., n}, missä A i S i todennäköisyys on P(A) = P 1 (A 1 )P 2 (A 2 )... P n (A n )

Erästä tuotetta valmistetaan tehtaassa kahdella koneella. Ensimmäisen koneen tuotannosta on viallisia 3% ja toisen koneen tuotannosta 5%. Otetaan satunnaisesti yksi kappale kummankin koneen tuotannosta. Kiinnostuksen kohteena on se ovatko tuotteet kunnollisia. Yksittäisen kokeiden otosavaruudet ja todennäköisyydet ovat S 1 = {k, v} S 2 = {k, v} P 1 (k) = 0.97 P 2 (k) = 0.95 P 1 (v) = 0.03 P 2 (v) = 0.05 Yhdistetyn kokeen otosavaruus on silloin S = {(k, k), (k, v), (v, k), (v, v)} ja alkeistapausten todennäköisyydet lasketaan tuloina: P(k, k) = P 1 (k)p 2 (k) = 0.9215, P(k, v) = P 1 (k)p 2 (v) = 0.0485, P(v, k) = P 1 (v)p 2 (k) = 0.0285, P(v, v) = P 1 (v)p 2 (v) = 0.0015 Todennäköisyys, että saadaan yksi kunnollinen, on P(X = 1) = P{(k, v), (v, k)} = P(v, k) + P(k, v) = 0.0485 + 0.0285 = 0.0770

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Tuloperiaate 27 Jos jokin operaatio on mahdollista suorittaa p eri vaiheessa ja i:nnessä vaiheessa on n i eri valintamahdollisuutta (i = 1,..., p), niin eri vaihtoehtoja on kappaletta. p n i = n 1 n 2... n p i=1

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Permutaatiot, variaatiot ja kombinaatiot 28 n-alkioisen joukon permutaatio on joukon alkioista muodostettu järjestetty jono k-variaatio on joukon k-alkioinen järjestetty jono k-kombinaatio on joukon k-alkioinen osajoukko n-alkioisella joukolla on n! = 1 2 3... n (n:n kertoma) eri permutaatiota Perustelu: Tuloperiaatteen mukaan 1. alkio voidaan valita n tavalla, 2. alkio n 1 tavalla jne. ja viimeinen alkio yhdellä tavalla.

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Permutaatiot, variaatiot ja kombinaatiot 29 n-alkioisella joukolla on (n) k = n (n 1)... (n k + 1) = n! (n k)! eri k-variaatiota Perustelu: Koska jokainen k joukko voidaan järjestää k! eri tavalla, on k-variaatioita siis k! kertaa k-kombinaatioiden määrä. Näin ollen n-alkioisella joukolla on ( n k eli k-kombinaatiota. ) = n! k!(n k)!

Arvanmyyjällä on N arpaa, joista voittoarpoja on m kpl. Asiakas ostaa n arpaa. Millä todennäköisyydellä hän saa k voittoarpaa? Otetaan alkeistapauksiksi ( ) n kappaleen kombinaatiot N:n arvan N joukosta, joita on kpl. n ( ) m k voittoarpaa voidaan valita m:n joukosta loput n k ei-voittoarpaa voidaan valita ( k N m n k eri tavalla ) eri tavalla Koska arvat valitaan umpimähkään, on jokainen yhdistelmä yhtä mahdollinen, joten todennä- köisyys saada k voittoa on ( )( ) m N m k n k P( k voittoa ) = ( ) N n

Tilastomatematiikan luennoitsijalla on varatossa 25 tenttikysymystä, joista hän päättää valita 5 kysymystä seuraavaan tenttiin täysin satunnaisesti. a) Kuinka monta erilaista tenttiä näin voidaan saada aikaan? b) Opettaja on päättänyt helpottaa opiskelijoiden tenttiinvalmistautumista jakamalla näille kyseisen 25 kysymyksen sarjan ratkaisuineen. Opiskelija, joka ei halua vaivata terävää päätään pänttäämällä teoriaa, päättää selviytyä tentistä opettelemalla ulkoa 10 tärppiä. Millä todennäköisyydellä opiskelija saa tentissa k tehtävää oikein? c) Millä todennaköisyydellä hän pääsee tentistä läpi, jos läpipääsyrajana on 3 oikein? N = 25 tehtävien määrä m = 10 opiskelijan tärpit n = 5 opettajan valitsemat tenttikysymykset a) Erilaisia tenttejä voidaan muodostaa ( ) ( ) N 25 = = 25! 25 24 23 22 21 = = 55130 n 5 5!20! 5 4 3 2 1

b) P("k oikein")=p("kymmeneen tärppiin osuu k viidestä tenttikysymyksestä") ( )( ) ( )( ) m N m 10 15 k n k k 5 k = ( N n ) = ( 25 5 10! 15! = k! (10 k)! (5 k)! (10 + k)! 53130 c) P("tentti läpi")= P("3, 4 tai 5 oikein")= P(3) + P(4) + P(5) ( )( ) 10 15 ) P(3) = P(4) = 3 2 ( ) = 25 5 ( )( ) 10 15 4 1 ( ) = 25 5 10! 15! 3! 7! 2! 13! 53130 = 0.2372 10! 15! 4! 6! 1! 14! 53130 = 0.0593

( )( ) 10 15 P(5) = 5 0 ( ) 25 = 5 10! 15! 5! 5! 0! 15! 53130 = 0.0047 joten P("tentti läpi") = 0.2372 + 0.0593 + 0.0047 = 0.3012 eli noin 30%:n mahdollisuus.

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Ehdollinen todennäköisyys 34 Tapahtuman A ehdollinen todennäköisyys ehdolla B on P(A B) = P(A B) P(B) kun P(B) 0 Tulkinta: A:n todennäköisyys (suhteelinen osuus) perusjoukossa B A:n todennäköisyys, jos B varma ominaisuuden A toteuttavien alkeistapausten suhteelinen osuus niiden alkeistapausten joukossa, joilla on ominaisuus B

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Ehdollinen todennäköisyys 35 Kertosääntö: P(A B) = P(B)P(A B) = P(A)P(B A) Yleistys: Jos P(A 1 A 2... A n 1 ) > 0, niin P(A 1 A 2... A n ) = P(A 1 )P(A 2 A 1 )P(A 3 A 1 A 2 )... P(A n A 1 A 2... A n 1 ) HUOM: Ehdollinen todennäköisyys toteuttaa todennäköisyyden perusominaisuudet, esim. P(Ā B) = 1 P(A B)

Eräällä osastolla on 100 fuksia, joista 80 osallistuu kurssille A ja 30 kurssille B. Molemmille kursseille osallistuu 20 fuksia. Vastaan osuu satunnainen tuta osaston fuksi, joka on nähty ainakin kurssilla B. Millä todennäköisyydellä häneen törmää myös kurssilla A? Ratkaisu: P(A) = 80 100 = 8 30 10, P(B) = 100 = 3 20 10, P(A B) = 100 = 2 10, joten P(A B) = P(A B) P(B) = 2 3

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Tilastollinen riippumattomuus 37 Tapahtumat A ja B ovat keskenään riippumattomat, jos ja vain jos Tulkinta P(A B) = P(A)P(B) eli jos P(A B) = P(A), kun P(B) 0 eli jos P(B A) = P(B), kun P(A) 0 toisen sattuminen (varmasti) ei vaikuta toisen todennäköisyyteen tapahtumat eivät ole missään vuorovaikutuksessa keskenään

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Tilastollinen riippumattomuus 38 A: todennäköisyys (suhteellinen osuus) joukossa B on sama kuin koko otosavaruudessa S B: todennäköisyys (suhteellinen osuus) joukossa A on sama kuin koko otosavaruudessa S

Jatkoa edelliseen esimerkkiin fukseista: P(A)P(B) = 0.8 0.3 = 0.24 P(A B) = 0.2 joten kursseille A ja B osallistuminen eivät ole riippumattomia, eli se osallistuuko kurssille B vaikuttaa siihen, että osallistuuko kurssille A

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Kokonaistodennäköisyys 40 Oletetaan, että otosavaruus S jakaantuu erillisiin ositteisiin A 1, A 2,..., A n eli S = A 1 A 2... A n ja A i A j =, kun i j Kun tapahtuman B todennäköisyys joukoissa A i tunnetaan, voidaan laskea tapahtuman B kokonaistodennäköisyys: P(B) = P(A 1 )P(B A 1 ) +... + P(A n )P(B A n ) Perustelu: Koska B = B S = B (A 1... A n ) = (B A 1 )... (B A n ), ja yhdisteen joukot ovat erillisiä, saadaan yo. kaava soveltamalla sääntöä P(B A i ) = P(A i )P(B A i ).

Satunnaiskokeet ja satunnaismuuttujat Joukko-oppia Todennäköisyys Kombinaatio-oppia Ehdollinen todennäköisyys Tilastollinen riippumattomuus Kokonaistodennäköisyys ja Bayesin kaava Bayesin kaava 41 Edellisestä seuraa Bayesin kaava, jolla lasketaan käänteiset ehdolliset todennäköisyydet: P(A i B) = P(A i)p(b A i ) P(B) = P(A i )P(B A i ) P(A 1 )P(B A 1 ) +... + P(A n )P(B A n )

Väestöstä 0.1 % on erään viruksen kantajia. Laboratoriotesti viruksen toteamiseksi antaa oikean (positiivisen) tuloksen todennäköisyydellä 0.99, jos henkilö on viruksen kantaja. Jos henkilö on terve, testi antaa oikean (negatiivisen) tuloksen todennäköisyydellä 0.95. Jos satunnaisesti valittu henkilö testataan ja tulos on positiivinen, millä todennäköisyydellä kyseinen henkilö on todella viruksen kantaja? Merkitään V = "viruksen kantaja" T = "terve" + = "testi positiivinen" - = "testi negatiivinen" Tiedetään todennäköisyydet P(V ) = 0.001 P(T ) = 0.999 P(+ V ) = 0.99 P(+ T ) = 0.05 P( V ) = 0.01 P( T ) = 0.95

Kysytty todennäköisyys on P(V +) P(V +) = = P(+) P(V ) P(+ V ) P(+) missä P(+) = P(V )P(+ V ) + P(T )P(+ T ) = 0.001 0.99 + 0.999 0.05 = 0.05094 josta P(V +) = 0.001 0.99 0.05094 = 0.00099 0.05094 = 0.02 (Bayesin kaava), Suurin osa positiivisiksi testatuista on siis terveitä! (Tulos tunnetaan kirjallisuudessa nimellä "False positive paradox".) Helpommin ymmärrettävissa suhteellisten frekvenssien avulla: Jos väeston koko on N, niin terveitä on 0.999N, viruksen kantajia 0.001N. Positiivisen tuloksen saavia terveitä on 0.05(0.999N)yksilöä ja positiivisen tuloksen saavia viruksen kantajia on 0.99(0.001N) yksilöä. Positiivisen tuloksen saavia on yhteensa 0.05094N, joista viruksen 0.99 (0.001N) kantajien suhteellinen osuus on = 0.02 0.05094N

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia 44 Satunnaismuuttuja on muuttuja, jonka arvo koetta tai mittausta toistettaessa vaihtelee enalta arvaamattomasti, jonkin satunnaismekanismin mukaan Satunnaismuuttujan jakauma on malli, joka kuvaa satunnaismuuttujan arvojen vaihtelua pitkällä tähtäimellä, koko perusjoukossa

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Diskreetti satunnaismuuttuja 45 Satunnnaismuuttuja X on diskreetti, jos sillä on äärellinen tai numeroituva määrä mahdollisia arvoja. Pistetodennäköisyysfunktio p(x) = P(X = x) ilmaisee kaikkien mahdollisten arvojen todennäköisyydet eli määrittää X :n jakauman Jakauman kertymäfunktio pisteessä x on F (x) = P(X x) Kertymäfunktio on määritelty kaikilla reaaliluvuilla. F (x) = x i x p(x i )

Olkoon X =koneen käyttökatkojen määrä vuorokaudessa. Oletetaan, että seuraavat todennäköisyydet on määritetty (suhteellisina frekvensseinä pitkällä aikavälillä): p(0) = P(X = 0) = 0.45 p(1) = P(X = 1) = 0.30 p(2) = P(X = 2) = 0.15 p(3) = P(X = 3) = 0.06 p(4) = P(X = 4) = 0.04 Jakauman kertymäfunktio on F (x) = 0 kun x < 0 0.45 kun 0 x < 1 0.75 kun 1 x < 2 0.90 kun 2 x < 3 0.96 kun 3 x < 4 1 kun x 4 Todennäköisyys että vuorokaudessa on korkeintaan 2 katkoa on P(X 2) = F (2) = 0.9 Todennäköisyys, että vuorokaudessa on vähintään 3 katkoa on kertymäfunktion avulla P(X 3) = 1 P(X 2) = 1 F (2) = 1 0.9 = 0.1

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Diskreetin jakauman ominaisuuksia 47 1. 0 p(x) 1 2. p(x) = 1 x 3. Diskreetin satunnaismuuttujan kertymäfunktio on porrasfunktio 4. P(a < X b) = F (b) F (a). Jos X saa vain kokonaislukuarvoja ja a < b kokonaislukuna, niin b P(a X b) = p(x) = F (b) F (a 1) x=a

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Jatkuva satunnaismuuttuja 48 Olkoon X nyt jatkuva satunnaismuuttuja. Sen arvojen jakautumista kuvaa ei-negatiivinen tiheysfunktio f (x), josta eri arvovälien todennäköisyydet saadaa integroimalla. Jakauman kertymäfunktio on F (x) = P(X x) = x f (t)dt ja välin a X b todennäköisyys lasketaan kaavalla P(a X b) = b a f (t)dt

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Jatkuva jakauman ominaisuuksia 49 1. f (x) 0 2. f (t)dt = 1 3. Jatkuvan jakauman kertymäfunktio on jatkuva, ja F (x) = f (x) 4. P(a X b) = P(a < X b) = P(a X < b) = P(a < X < b) = F (b) F (a) = 5. P(X = a) = a a f (x)dx = 0 b a f (x)dx.

Oletetaan, että erään bensiinin lyijypitoisuus X voi vaihdella välillä 0.1 0.5 g/l ja sen jakauman tiheysfunktio on { 12.5x 1.25 kun 0.1 x 0.5 f (x) = 0 muualla a) Mikä on jakauman kertymäfunktio? P(X x) = x f (t)dt 0 kun x < 0 x 0.1 (12.5x 1.25)dt kun 0.1 x 0.5 F (x) = = x 0.1 (6.25t2 1.25t) = 6.25x 2 1.25x + 0.0625 1 kun x > 0.5 b) Millä todennäköisyydellä satunnaisen bensiinilitran lyijypitoisuus on välillä 0.2 0.3g? P(0.2 X 0.3) = 0.3 0.2 (12.5 1.25)dt =... = 0.1875

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Odotusarvo ja varianssi 51 Odotusarvo on satunnaismuuttujan jakauman keskiarvo. Merkitään µ, E(X ) tai EX Varianssi ja sen neliöjuuri, (keski)hajonta, kuvaavat satunnaismuuttujan arvojen vaihtelua ja levinneisyyttä odotusarvojen ympärillä. Merkintä σ 2, D 2 (X ), D 2 X tai Var(X )

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Diskreetti satunnaismuuttuja 52 Olkoon X diskreetti satunnaismuuttuja, jonka mahdolliset arvot ovat x 1, x 2,... todennäköisyyksin p(x 1 ), p(x 2 ),... Odotusarvo: µ = EX = i x i p(x i ) Varianssi σ 2, = D 2 X = E(X µ) 2 = i (x i µ) 2 p(x i ) Hajonta σ = DX = σ 2

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Jatkuva satunnaismuuttuja 53 Olkoon X diskreetti satunnaismuuttuja, jonka tiheysfunktio on f (x) Odotusarvo: µ = EX = xf (x)dx Varianssi σ 2, = D 2 X = E(X µ) 2 = Hajonta σ = DX = σ 2 (x µ) 2 f (x)dx Koska E(X µ) 2 = E(X 2 ) µ 2, saadaa varianssille käsin laskettaessa kätevämpi kaava: σ 2 = i σ 2 = x 2 i p(x i ) µ 2, kun X diskreetti x 2 f (x)dx µ 2, kun X jatkuva

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Ominaisuuksia satunnaismuuttujalle 54 1. E(X + Y ) = EX + EY 2. E(aX ) = aex, E(a) = a kun a on vakio 3. Kun X ja Y ovat riippumattomia satunnaismuuttujia, niin D 2 (X + Y ) = D 2 X + D 2 Y D 2 (X Y ) = D 2 X + D 2 Y 4. D 2 (ax ) = ad 2 X, D 2 (a) = 0 kun a on vakio 5. Jos g(x ) on satunnaismuuttujan X funktio, niin g(x ) on myös satunnaismuuttuja, jonka jakauma määräytyy X :n jakaumasta ja E(g(X )) = g(x i )p(x i ), kun X on diskreetti E(g(X )) = g(x)f (x)dx, kun X on jatkuva

Olkoon X koneen käyttökatkojen määrä vuorokaudessa, jakaumana p(0) = 0.45 p(1) = 0.30 p(2) = 0.15 p(3) = 0.06 p(4) = 0.04 4 Odotusarvo: µ = EX = xp(x) = x=0 0 0.45 + 1 0.3 + 2 0.15 + 3 0.06 + 4 0.04 = 0.94 4 Varianssi: σ 2 = D 2 X = x 2 p(x) µ 2 = x=0 0 0.45 + 1 0.3 + 2 2 0.15 + 3 2 0.06 + 4 2 0.04 0.94 2 = 1.1964 Hajonta: σ = 1.0938 Jos yhdestä käyttökatkosta aiheutuu kiinteä kustannus, esim. 50e niin kustannusten C = 50X, odotusarvo on E(C) = E(50X ) = 50E(X ) = 47e vuorokaudessa.

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Binomijakauma 56 Satunnaiskoe, jossa tapahtuman A todennäköisyys on p, toistetaan n kertaa siten, että toistot ovat riippumattomia. Tapahtuman A esiintymiskertojen lukumäärä n:n kokeen joukossa noudattaa tällöin binomijakaumaa parametrein n ja p. Jakauman pistetodennäköisyysfunktio on ( ) n P(X = k) = p k (1 p) n k, k = 0, 1,..., n k Merkintä: X Bin(n, p) Odotusarvo: EX = np Varianssi: D 2 X = np(1 p)

Olkoon X viallisten lamppujen määrä 4 kappaleen rasiassa. Oletetaan, että tuotantoprosessissa syntyy viallisia lamppuja keskimäärin 10%. Kyseessä on tällöin toistokoe, missä n = 4 ja viallisen lampun todennäköisyys p = 0.1. Kokeita voidaan pitää riippumattomina, olettaen että lamput on poimittu sattumanvaraisesti. Viallisten määrä noudattaa siis binomijakaumaa Bin(4, 0.1). Perustelu todennäköisyydelle: Alkeistapahtumat ovat {kkkk, kkkv, kkvk, kvkk, vkkk, kkvv, kvkv, kvvk, vkkv, vkvk, vvkk, kvvv, vkvv, vvkv, vvvk, vvvv} (2 4 = 16 alkeistapausta) Koska lamput toisistaan riippumattomia saadaan alkeistapahtumien todennäköisyydet tuloina. P(kkkk) = (1 p) 4 = 0.9 4 P(kkkv) = p(1 p) 3 = 0.1 0.9 3 (sama kaikille tapauksille joissa 1 viallinen, 3 kunnollista) P(kkvv) = p 2 (1 p) 2 = 0.1 2 0.9 2 (sama kaikille tapauksille joissa 2 viallista, 2 kunnollista)

jne. Esim. P(X = ( 2) ) = P({kkvv, kvkv, kvvk, vkkv, vkvk, vvkk}) = 4 6 0.1 2 0.9 2 = 0.1 2 0.9 2 = 0.0486.) 2 Yleinen tapaus: Kunkin alkeistapauksen, jossa tapahtuma sattuu x kertaa, todennäköisyys on p x (1 p) n x. Tällaisia alkeistapauksia on kpl, josta seuraa binomitodennäköisyyden kaava.. ( ) n x

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Poisson-jakauma 59 Kun binomijakaumassa n ja np pysyy vakiona (eli p 0), niin ( n P(X = k) = )p k (1 p) n k (np)k e np, k = 0, 1,... k k! Merkitään λ = np. Satunnaismuuttuja X noudattaa Poisson-jakaumaa parametrillä λ, jos sen pistetodennäköisyysfunktio on P(X = k) = λk k! e λ, k = 0, 1,... Merkintä: X Poisson(λ) tai X P(λ) Odotusarvo: EX = λ Varianssi: D 2 X = λ

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Poisson-jakauma 60 Yhteenlaskuominaisuus: Jos X Poisson(λ 1 ) ja Y Poisson(λ 2 ) ja X ja Y ovat riippumattomat, niin X + Y Poisson(λ 1 + λ 2 ) Yleistys: Olkoon satunnaismuuttuja X tiettyjen tapausten A määrä aikayksikössä ja X Poisson(λ). Jos satunnaismuuttuja X t = tapausten A määrä t aikayksikössä (t > 0) ja aikavälit ovat toisistaan riippumattomat, niin X t Poisson(λt)

Ydinvoimalassa sattuu havaittavissa oleva radioaktiivinen päästö satunnaisesti, keskimäärin kaksi kertaa kuussa. Päästöjen lukumäärän aikayksikössä voidaan katsoa noudattavan Poisson-jakaumaa. (Miksi?) a) Millä todennäköisyydellä kuukauden aikana sattuu vähintään neljä päästöä? b) Millä todennäköisyydellä ensimmäinen päästö havaitaan aikaisintaan kolmen kuukauden kuluttua? c) Johda ensimmäiseen päästöhavaintoon kuluvan ajan jakauma (jatkuva jakauma!). Koska päästöt tapahtuvat sattumanvaraisesti, toisistaan riippumatta ja keskimääräisellä vakiotiheydellä, lukumäärän jakaumaksi sopii Poisson. a) Päästöjen lukumäärä kuussa X (2), λ = 2 P(X 4) = 1 P(X 3) = 1 0, 857 = 0, 143

b) P( ensimmäinen päästö aikaisintaan 3kk kuluttua ) = P( ei yhtään päästöä 3kk:n aikana ) = P(X 3 = 0), missä X 3 on päästöjen lukumäärä 3kk aikana X 3 Poisson(3λ) = Poisson(6) P(X 3 = k) = 6k k! e 6, joten kysytty todennäköisyys on = P(X 3 = 0) = 60 0! e 6 = e 6 = 0, 0025 c) Olkoon T ensimmäiseen päästöhavaintoon kuluva aika lähtötilanteesta (kk). Johdetaan kertymäfunktio: F (t) = P(T t) = 1 P(T > t) = 1 P( ensimmäinen päästö aikaisintaan t kk:n kuluttua ) = 1 P( ei yhtään päästöä t kk:ssa )

Olkoon X t päästöjen lukumäärä t kk:ssa X t Poisson(λ t) = Poisson(2t) P(X t = k) = (2t)k k! P(X t = 0) = e 2t e 2t F (t) = 1 P(X t = 0) = 1 e 2t, kun t>0 T:n jakauman tiheysfunktio on: f (t) = F (t) = 2e 2t, kun t>0 Tämä on eksponentiaalijakauman Exp(2) tiheysfunktio, joten T Exp(2)

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Tasajakauma 64 Satunnaismuuttuja X, jonka arvot ovat välillä (a, b) siten, että kaikilla välin pisteillä on yhtäläinen mahdollisuus tulla valituksi, noudattaa tasajakaumaa välillä (a, b), merk. X U(a, b). f (x) = { 1 b a kun a < x < b 0 muualla. Jakauma kertymäfunktio on 0 kun x a x a F (x) = b a kun a < x < b 1 kun x b Odotusarvo: EX = a+b 2 Varianssi: D 2 X = (b a)2 12

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Eksponentiaalijakauma 65 Satunnaismuuttuja X noudattaa eksponentiaalijakaumaa parametrilla λ, merk. X Exp(λ), jos sen tiheysfunktio on muotoa { λe λx kun x > 0 f (x) = 0 kun x 0 Kertymäfunktio on 1 e λx, kun x > 0 Odotusarvo: EX = 1 λ Varianssi: D 2 X = 1 λ 2

Suurkaupungin eräs paloasema saa hälytyksen keskimäärin 7 tunnin välein. a) Mikä voisi olla hälytysten välisen ajan jakauma ja miksi? Koska hälytykset sattuvat toisistaan riippumatta, sattumanvaraisesti keskimääräisellä vakiotiheydellä, niiden lukumäärän voi katsoa noudattavan Poisson-jakaumaa ja hälytysten välinen aika T noudattaa eksponentiaalijakaumaa, odotusarvona ET = 1/λ = 7 λ = 1/7. Jakauman kertymäfunktio on F (t) = P(T t) = 1 e t/7, kun t > 0. b) Millä todennäköisyydellä hälytyksen jälkeen kuluu alle 3 tuntia seuraavaan? P(T < 3) = P(T 3) = F (3) = 1 e 3/7 0.35 c) Jos edellisestä hälytyksestä on kulunut jo 3 tuntia, millä todennäköisyydellä seuraavaan kuluu vielä ainakin 2 tuntia? P(T 3 + 2 T 3) = P(T 2) = 1 F (2) = e 2/7 0.75

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Normaalijakauma 67 Satunnaismuuttuja X noudattaa normaalijakaumaa parametrein µ ja σ 2, merk. X N(µ, σ 2 ), jos X :n tiheysfunktio on muotoa f (x) = 1 e (x µ)2 2σ 2 2πσ Odotusarvo: EX = µ (määrää jakauman sijainnin) Varianssi: D 2 X = σ 2 (määrä jakauman leveyden) Tiheysfunktion kuvaaja on ns. Gaussin kellokäyrä:

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Normaalijakauma 68 Standardoitu normaalijakauma: µ = 0, σ 2 = 1 X N(0, 1) Standardointi eli normeeraus: Jos X N(µ, σ 2 ), niin Z = X µ σ N(0, 1)-jakauman kertymäfunktio: N(0, 1) Φ = P(Z z) = z 1 2π e x2 2 Tiheysfunktio on symmetrinen origon suhteen, joten Φ( z) = 1 Φ(z).

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Normaalijakauma 69 Todennäköisyyksien laskeminen: Olkoon X N(µ, σ 2 ) ja Z = (X µ)/σ, jolloin Z N(0, 1). Olkoon a ja b reaaliluuja. Silloin P(X a) = P( X µ σ a µ σ ) = P(Z a µ σ ) = Φ(a µ σ ) P(a X b) = P( a µ σ = P( a µ σ X µ σ b µ σ ) Z b µ σ ) = Φ(b µ σ ) Φ(a µ σ )

Erään ammattiryhmän vuositulot ovat normaalisti jakautuneet, keskiansiona µ = 30264e ja hajontana = 2437 e. a) Kuinka suuri osuus ammattikunnasta jää vuositulorajan 25 000 e alapuolelle? Merkitään ko. ammatin harjoittajan vuosituloa satunnaismuuttujalla X. ( X µ P(X 25000) = P σ 25000 µ ) ( = P Z σ ) 25000 30264 2437 = P(Z 2.16) = Φ( 2.16) = 1 Φ(2.16) = 1 0.9846 = 0.0154 1.5%

b) Määritä tuloraja, jonka alapuolelle jää 25 % ammattikunnasta. Kysytty tuloraja q toteuttaa ehdon P(X q) = 0.25, josta ( X µ P(X q) = P q 30264 ) ( ) q 30264 = Φ = 0.25 σ 2437 2437 Koska Φ( z) = 1 Φ(z), saadaan ( ) 30264 q Φ = 0.75 2437 Normaalijakauman taulukon perusteella Φ(0.6745) = 0.75, joten 30264 q 2437 = 0.6745, josta saadaan tulorajaksi q = 28 620 e

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Normaalijakauma 72 Ominaisuuksia: 1. Jos X N(µ 1, σ 2 1 ) ja Y N(µ 2, σ 2 2 ) toisistaan riippumattomia, niin X + Y N(µ 1 + µ 2, σ 2 1 + σ2 2 ) X Y N(µ 1 µ 2, σ 2 1 + σ2 2 ) 2. Jos X N(µ 1, σ1 2 ) ja a ja b ovat vakioita, niin ax N(aµ, a 2 σ 2 ) ax + b N(aµ + b, a 2 σ 2 )

Kappaleen uran leveys on normaalijakautunut satunnaismuuttuja, odotusarvona 6.0 cm ja hajontana 0.07 cm. Akselin leveys on myös normaalijakautunut satunnaismuuttuja, hajontana 0.03 cm. Leveyden odotusarvoa voidaan säätää. Kuinka suuri odotusarvo saa olla, jotta mahtumistodennäköisyys olisi 95%? Uran leveys X 1 N(6, 0.07 2 ) Akselin leveys X 2 N(µ, 0.03 2 ) Mahtumistodennäköisyys: P(X 1 > X 2 ) = P(X 1 X 2 > 0) Erotusmuuttuja Y = X 1 X 2 N(µ y, σy 2 ), missä µ y = E(Y ) = E(X 1 ) E(X 2 ) = 6 µ σy 2 = D 2 (Y ) = D 2 (X 1 ) + D 2 (X 2 ) = 0.07 2 + 0.03 2 = 0.0058 ( ) 0 (6 µ) P(X 1 X 2 > 0) = P(Y > 0) = P z > 0.0058 = P ( z > µ 6 0.0058 ) = 0.95

Jotta voidaan käyttää taulukoita, tämä on lausuttava kertymäfunktion (z) = P(Z z) avulla ( P z < 6 µ ) ( ) 6 µ = 0.95 Φ = 0.95 0.0058 0.0058 Normaalijakauman taulukon perusteella Φ(1.6449) = 0.95, joten 6 µ 0.0058 = 1.6449 µ = 6 1.6449 0.0058 = 5.87 cm

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia χ 2 - jakauma 75 jos X 1, X 2,..., X ν ovat riippumattomia, N(0, 1)-jakautuneita satunnaismuuttujia, niin satunnaismuutuja U = X 2 1 + X 2 2 +... + X 2 ν noudattaa χ 2 -jakaumaa vapausastein ν, merk. U χ 2 (ν) Odotusarvo: EU = ν Varianssi: D 2 U = 2ν

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia t - jakauma 76 jos X 1, X 2,..., X ν ovat riippumattomia, N(0, 1)-jakautuneita satunnaismuuttujia, niin satunnaismuutuja X T = X 2 1 + X2 2 +... + X ν 2 ν noudattaa t-jakaumaa vapausastein ν, merk. T t(ν) Odotusarvo: ET = 0 Varianssi: D 2 T = ν ν 2, kun ν > 2

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia F - jakauma 77 jos X 1, X 2,..., X n ja Y 1, Y 2,..., Y m ovat riippumattomia, N(0, 1)-jakautuneita satunnaismuuttujia, niin satunnaismuutuja F = X 2 1 +...+Xn n Y 2 1 +...+Ym m noudattaa F -jakaumaa vapausastein ν 1 = n, ν 2 = m, merk. F F (ν 1, ν 2 )

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Jakauman p-pisteet 78 Jakauman p-piste eli p-fraktiili, p-kvantiili on se lukuarvo x p, jolla kertymäfunktio saa arvon p: F (x p ) = p jolla tiheysfunktion ja x-akselin väliin jäävä pinta-ala välillä (, x p ) on p jota pienempiä tai yhtäsuuria arvoja esiintyy 100p%.

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Keskeinen raja-arvolause 79 Kun X 1, X 2,..., X n ovat riippumattomia, samaa jakaumaa noudattavia satunnaismuuttujia, joilla on äärellinen odotusarvo EX i = µ ja varianssi D 2 X i = σ 2, i = 1, 2,..., n, niin suurilla n:n arvoilla niiden summamuuttuja S n = X 1 + X 2 +... + X n noudattaa likimain normaalijakaumaa, merkitään X 1 + X 2 +... + X n a N(nµ, nσ 2 ) Silloin: X = 1 n (X 1 + X 2 +... + X n ) a N(µ, σ 2 /n). Summamuuttujaa koskevia todennäköisyyksiä voidaan approksimoida normaalijakauman kertymäfunktion avulla.

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Keskeisen raja-arvolauseen yleinen muoto 80 Kun X 1, X 2,..., X n ovat riippumattomia satunnaismuuttujia, odotusarvoina EX i = µ i ja variansseina D 2 X i = σi 2 niin suurilla n:n arvoilla X 1 + X 2 +... + X n a N(µ, σ 2 ) missä µ = µ 1 + µ 2 +... + µ n ja σ 2 = σ1 2 + σ2 2 +... + σn 2

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Milloin keskeistä raja-arvolausetta voi soveltaa? 81 Summattavien lukumäärä n 30 on yleensä riittävä. Periaatteessa approksimaatio on sitä tarkempi, mitä symmetrisempi X i :den jakauma on. Approksimaation virhe on sitä pienempi, mitä suurempi n ja mitä symmetrisempi summattavien jakauma. Useille summamuuttujille normaalijakauma-approksimaatio on käytännössä ainoa keino todennäköisyyksien laskemiseksi. Yleisesti summa ei noudata samaa jakaumaa kuin summattavat ja summamuuttujan tarkka jakauma saattaa olla varsin hankala määrittää.

Kun satunnaisia reaalilukuja pyöristetään kokonaisluvuiksi, niin yhden luvun pyöristysvirhe noudattaa tasajakaumaa välillä ( 0.5, 0.5). On laskettava yhteen 60 reaalilukua, jotka pyöristetään ennen yhteenlaskua kokonaisluvuiksi. Millä todennäköisyydellä summan virhe on itseisarvoltaan korkeintaan 2.0? Summattavat luvut A i = B i + X i, i = 1,..., n missä B i = tarkka arvo, A i = pyöristetty arvo, X i = pyöristysvirhe n n n Summa: A i = B i + i=1 i=1 Summan virhe: X = n i=1 X i i=1 X i

Missä X i U( 0.5, 0.5), i = 1,..., n, n = 60 µ = EX i = a + b 2 σ 2 = D 2 (b a)2 X i = 12 = 0.5 + 0.5 2 = 0 (0.5 ( 0.5))2 = = 1 12 12 Koska n suuri ja X i :den jakauma symmetrinen, niin summamuuttuja X noudattaa likimain normaalijakaumaa parametrein EX = D 2 X = n EX i = nµ = 60 0 = 0 i=1 n i=1 D 2 X i = nσ 2 = 60 12 = 5 P( X 2) = P( 2 X 2) = P( 2 5 Z 2 5 ) = P( 0.8944 Z 0.8944) Φ(0.89) Φ( 0.89) = Φ(0.89) (1 Φ(0.89)) = 2Φ(0.89) 1 = 2 0.8133 1 = 0.6266

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Binomijakauman normaalijakauma-approksimaatio 84 Olkoon X Bin(n, p). X voidaan esittää muodossa X = X 1 + X 2 +... + X n, missä X i on Bernoullin kokeen tulos: P(X i = 1) = p ja P(X i = 0) = 1 p. X on tutkittavan tuloksen esiintymisten lukumäärä n:n kokeen joukossa, odotusarvona EX = np ja varianssina D 2 X = np(1 p) Kun n on tarpeeksi suuri, niin keskeisen raja-arvolauseen perusteella X a N(np, np(1 p)) joten binomijakauman kertymäfunktiota voidaan tarvittaessa approksimoida normaalijakauman avulla.

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Binomijakauman normaalijakauma-approksimaatio 85 Suhteellista osuutta p koskevassa tilastollisessa päättelyssä käytetään satunnaismuuttujaa P = X /n, joka on myös asymptoottisesti normaalinen: P a N(p, p(1 p)/n). Standardoimalla saadaan tulos X np np(1 p) = P p p(1 p) n a N(0, 1)

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Binomijakauman normaalijakauma-approksimaatio 86 Milloin voidaan käyttää Poisson- milloin normaalijakaumaapproksimaatiota? Poisson-jakauma-approksimaatio sopii, kun n on suuri ja p pieni. Normaalijakauma-approksimaatio sopii, kun p on lähellä arvoa 0.5, jolloin jakauma lähellä symmetristä. Käytännössä riittää, että n on niin suuri, että np(1 p) > 9.

Diskreetti satunnaismuuttuja Jatkuva satunnaismuuttuja Odotusarvo ja varianssi Diskreettejä jakaumia Jatkuvia jakaumia Jatkuvuuskorjaus 87 Kun normaalijakaumalla approksimoidaan diskreettiä jakaumaa, kuten Bin(n, p), voidaan approksimaatiota tarkentaa seuraavasti: Olkoon X satunnaismuuttuja, joka saa vain kokonaislukuarvoja. Jos a on kokonaisluku, niin P(X a) = P(X a + 0.5) = P( X µ σ a + 0.5 µ ) σ = P(Z a + 0.5 µ σ kun X on likimain normaalinen. ) = Φ( a + 0.5 µ ) σ

Tehtaan tuottamista vempaimista on 2% viallisia. Kauppiaalle lähetetään 500 satunnaista vempainta tarkastamatta. Viallisten määrä X noudattaa silloin jakaumaa Bin(500, 0.02). Todennäköisyys, että kauppias saa 10 20 viallista, on binomijakauman mukaan 0.541928. Laske todennäköisyys käyttäen a) Poisson-approksimaatiota P a Poisson(λ), missä λ = np = 500 0.02 = 10 P(10 X 20) = P(X = 10)+P(X = 11)+...+P(X = 20) ( 1010 10! + 1011 11! +... + 1020 20! )e 10 = 0.5405 b) normaalijakauma-approksimaatiota. X a N(µ, σ 2 ), missä µ = np = 10, σ 2 = np(1 p) = 9.8 Z = X 10 9.8 a N(0, 1)

Jatkuvuuskorjausta käyttäen: = P P(10 X 20) = P(9.5 X 20.5) ( ) 9.5 10 20.5 10 Z = P(0.16 Z 3.35) 9.8 9.8 Φ(3.35) Φ( 0.16) = Φ(3.35) (1 Φ(0.16)) = 0.9996 (1 0.5636) = 0.5632