Stokastiikka ja tilastollinen ajattelu
|
|
|
- Saija Hovinen
- 8 vuotta sitten
- Katselukertoja:
Transkriptio
1 Stokastiikka ja tilastollinen ajattelu Versio 0.9 Lasse Leskelä Aalto-yliopisto 3. tammikuuta 208
2 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite Satunnaisilmiön toteumat ja tapahtumat Todennäköisyyden laskusäännöt Ehdollinen todennäköisyys Tapahtumien riippuvuus ja riippumattomuus Osituskaava Bayesin kaava Todennäköisyys ja kombinatoriikka Kommentteja Satunnaismuuttujat ja jakaumat 9 2. Satunnaismuuttujan käsite Jakauma ja kertymäfunktio Jakauman tiheysfunktio Monen satunnaismuuttujan yhteisjakauma Ehdolliset jakaumat Stokastinen riippuvuus ja riippumattomuus Yhteenveto Kommentteja Satunnaismuuttujan odotusarvo ja laskusäännöt Odotusarvon käsite ja suurten lukujen laki Todennäköisyyden frekvenssitulkinta Satunnaismuuttujan muunnos Odotusarvon laskusäännöt Yhteenveto Kommentteja Keskihajonta ja korrelaatio Jakauman varianssi ja keskihajonta Keskihajonta ja satunnaisvaihtelu Yhteisjakauman kovarianssi ja korrelaatio Korrelaatio ja stokastinen riippuvuus Korrelaatio ja lineaarinen riippuvuus
3 4.6 Yhteenveto Satunnaismuuttujien summa ja keskiarvo Satunnaismuuttujien summa Summan keskihajonta Satunnaismuuttujien keskiarvo ja suurten lukujen laki Summan normaaliapproksimaatio Normaalijakauma Poisson-approksimaatio Yhteenveto Datajoukkojen jakaumat, tunnusluvut ja kuvaajat Datajoukko ja datakehikko Empiirinen jakauma Ristitaulukko ja empiirinen yhteisjakauma Datajoukon keskiarvo ja keskihajonta Kvantiilit Kaksiulotteisen datajoukon tunnusluvut Histogrammi Yhteenveto Kommentteja Parametrien estimointi Parametriset jakaumat Suurimman uskottavuuden estimointi Binaarimallin estimointi Normaalimallin estimointi Kaksiulotteisen lineaarisen mallin estimointi Tarkentuvat ja harhattomat estimaattorit Tilastolliset luottamusvälit Luottamusvälin käsite Odotusarvoparametrin luottamusväli Binaarimallin parametrin luottamusväli Kommentteja Bayesläiset tilastolliset mallit Priorijakauma ja posteriorijakauma Usean datapisteen posteriorijakauma Uskomuksen vaiheittainen päivittäminen Bayesläinen binaarimalli Bayesläinen normaalimalli Kommentteja
4 0 Bayes-estimaattorit 5 0. Bayesläiset piste-estimaatit Bayesläiset väliestimaatit Binaarimallin Bayes-estimointi Tilastolliset testit 2. Nollahypoteesi, vastahypoteesi ja p-arvo Yhdistetty nollahypoteesi Testausvirheet Odotusarvon testi suurelle datajoukolle Hylkäysvirheen todennäköisyyden analyysi A Todennäköisyysjakaumia 3 A. Yksiulotteisia diskreettejä jakaumia A.. Dirac-jakauma A..2 Bernoullijakauma A..3 Multinoullijakauma A..4 Diskreetti tasajakauma A..5 Binomijakauma A..6 Geometrinen jakauma A..7 Hypergeometrinen jakauma A..8 Poisson-jakauma A.2 Moniulotteisia diskreettejä jakaumia A.2. Multinomijakauma A.2.2 Hypergeometrinen jakauma A.3 Yksiulotteisia jatkuvia jakaumia A.3. Jatkuva tasajakauma A.3.2 Eksponenttijakauma A.3.3 Normaalijakauma B Normaalijakauman lukuarvoja C Merkintöjä 37 D Suomi englanti-sanasto 38 3
5 Alkusanat Suurin osa meitä ympäröivistä asioista sisältää epävarmuutta. Tämä johtuu yleensä siitä, että tietomme asiaa kuvaavista muuttujista ja parametreista ovat puutteelliset tai siitä, ettemme voi varmuudella ennakoida luonnon ja muiden ihmisten käyttäytymistä. Monet tärkeät päätökset joudumme silti tekemään puutteellisen tai epävarman datan perusteella. Tällöin olemme pakotettuja tekemään arvauksia. Arvaamisen ei kuitenkaan tarvitse olla puhdasta hakuammuntaa, jos asiaan liittyvä epävarmuus on jollakin tapaa säännönmukaista. Esimerkiksi on luontevaa olettaa, että maailma huomenna näyttää jossain määrin samalta kuin tänäänkin. Tilastotiede on tieteenala, jonka tavoitteena on kehittää menetelmiä valistuneiden arvausten ja päätösten tekemiseen saatavilla olevan datan pohjalta. Tilastotieteessä epävarmuutta mitataan ja mallinnetaan todennäköisyyksillä. Sattuman ja todennäköisyyden lakeja käsittelevää matemaattista teoriaa kutsutaan stokastiikaksi. Siinä missä yksittäisen datajoukon ominaisuuksien tutkimiseen riittää työkaluiksi laskennan ja visualisoinnin tietokonealgoritmit, ovat stokastiikan matemaattiset mallit välttämättömiä silloin, kun havaitun datan pohjalta halutaan laatia ennusteita ja yleistyksiä laajempaan kontekstiin. Tämän monisteen tavoitteena on tutustuttaa lukija tilastolliseen ajattelutapaan sekä stokastiikan ja tilastotieteen tärkeimpiin periaatteisiin ja käsitteisiin. Alkuosassa tutustutaan todennäköisyyden laskusääntöihin ja opitaan mallintamaan satunnaisvaihtelua stokastisten mallien avulla. Monisteen toinen osa käsittelee tilastollisia menetelmiä, joiden avulla voi laatia estimaatteja ja ennusteita sekä analysoida tilastollista merkitsevyyttä havaitun datan ja prioritiedon valossa. Lisäksi tärkeänä tavoitteena antaa lukijalle mielikuva tilastollisten menetelmien mahdollisuuksista ja rajoituksista ja opettaa lukija kriittisesti arvioimaan tilastollisten menetelmien pohja-oletuksia. Korjauksia ja parannusehdotuksia tekstiin ovat esittäneet Pauliina Ilmonen, Kalle Kytölä, Aki Vehtari, Alex Karrila, Hoa Ngo, Joni Virta ja Eric Hyyppä. Heille suuret kiitokset. 4
6 Luku Todennäköisyyden käsite ja laskusäännöt. Todennäköisyyden käsite Todennäköisyys on tapa kuvailla kvantitatiivisesti jonkin tapahtuman uskottavuutta, esimerkiksi: Kolikkoa heittämällä saadaan kruuna todennäköisyydellä 2. Ensi maanantaina Otaniemessä sataa todennäköisyydellä 4% (Ilmatieteen laitos) tai todennäköisyydellä 9% (Foreca). Ylläolevista ilmauksista ensimmäinen kiteyttää objektiivisen kokemuksemme kolikoista: pitkissä heittosarjoissa noin puolet heitoista tuottaa kruunan. Sen sijaan sateen todennäköisyyttä koskevat ilmaisut ovat subjektiivisia: sateen uskottavuus on Ilmatieteen laitoksen säämallien mukaan 4% ja Forecan säämallien mukaan 9%. Todennäköisyyden käsite esiintyy monenlaisissa arkielämän yhteyksissä ja sen oikeaoppisesta tulkitsemisesta on ollut kiistaa eri koulukuntien kesken. Todennäköisyyden matemaattiset laskusäännöt ovat samat tulkinnasta riippumatta..2 Satunnaisilmiön toteumat ja tapahtumat Satunnaisilmiön stokastisen mallin pohjana on perusjoukko S, joka sisältää tarkasteltavan ilmiön mahdolliset toteumat. Satunnaisilmiön tapahtumia ovat toteumien joukot. Satunnaisilmiön toteuma on siis jokin perusjoukon alkio x ja tapahtuma jokin perusjoukon osajoukko A. Malli voidaan tulkita niin, että sattuma valitsee jonkin perusjoukon pisteen x, ja tapahtuma A toteutuu mikäli x kuuluu joukkoon A. David Aldous: Annotated list of contexts where we perceive chance 5
7 Esimerkki. (Kolikko). Kolikonheiton mahdolliset toteumat voidaan numeroida muodossa 0 = klaava ja = kruuna. Satunnaisilmiön perusjoukko on tällöin S = {0, } ja sen tapahtumat on listattu allaolevassa taulukossa. Tapahtuma Tulkinta {} Mahdoton tapahtuma {0} Saadaan klaava {} Saadaan kruuna {0, } Varma tapahtuma Esimerkki.2 (Sademäärä). Ennustettaessa ensi maanantain sademäärä (mm) Otaniemessä valitaan perusjoukoksi S = [0, ). Satunnaisilmiön toteumia ovat ei-negatiiviset reaaliluvut ja esimerkkejä tapahtumista on taulukoitu alla. Tapahtuma Tulkinta (0, ) Otaniemessä sataa ensi ma yli 0 mm {0} Otaniemessä ei sada ensi ma Arkikielessä monet tapahtumat ilmaistaan muiden tapahtumien loogisina yhdistelminä, esimerkiksi: Ensimmäisellä nopalla saadaan vähintään 3 ja toisella vähintään 4. Otaniemessä joko ei sada ollenkaan tai sataa vähintään 5 mm. Koska stokastiikassa tapahtumat vastaavat joukkoja, tulee tapahtumien loogiset yhdistelmät ilmaista joukko-opin kielellä. Joukko-opissa merkitään x A kun x kuuluu joukkoon A. Lisäksi merkitään A B kun A on B:n osajoukko eli jokainen A:n alkio kuuluu joukkoon B. Joukko-opin perusoperaatiot ja niitä havainnollistavat Venn-kaaviot ja tulkinnat on esitetty taulukossa.. Lisäksi sanotaan, että tapahtumat A, A 2,... poissulkevat toisensa, jos vain yksi niistä voi toteutua, eli A i A j = aina kun i j, tapahtuman B ositus on kokoelma toisensa poissulkevia tapahtumia, joiden yhdiste on B. Esimerkki.3 (Noppa). Yhtä nopanheittoa mallintavan perusjoukon S = {, 2,..., 6} tapahtumista A = Tulos on suurempi kuin 3 = {4, 5, 6}, B = Tulos on parillinen = {2, 4, 6} 6
8 Termi Merkintä Määritelmä Venn-kaavio Tulkinta Perusjoukko S {x S : x S} Varma tapahtuma Osajoukko A {x S : x A} A toteutuu Osajoukko B {x S : x B} B toteutuu Leikkaus A B {x S : x A ja x B} A ja B toteutuvat Yhdiste A B {x S : x A tai x B} A tai B toteutuu Erotus A \ B {x S : x A ja x B} A toteutuu mutta B ei Erotus B \ A {x S : x B ja x A} B toteutuu mutta A ei Komplementti A c {x S : x A} A ei toteudu Komplementti B c {x S : x B} B ei toteudu Tyhjä joukko {x S : x S} Mahdoton tapahtuma Taulukko.: Joukko-opin perusoperaatiot ja niiden stokastiikan tulkinnat. muodostettuja yhdistelmiä ovat esimerkiksi A B = Tulos on suurempi kuin 3 ja parillinen = {4, 6}, A B = Tulos on suurempi kuin 3 tai parillinen = {2, 4, 5, 6}, B \ A = Tulos on parillinen ja enintään 3 = {2}. Yksittäisiä tuloksia vastaavat tapahtumat A i = Tulos on i poissulkevat toisensa. Ne myös muodostavat perusjoukon S osituksen. Stokastiikan mallit määritellään usein tulojoukkojen avulla. Joukkojen A ja B tulojoukko A B = {(x, y) : x A, y B} on joukko, jonka alkioita ovat joukon A ja B alkioista muodostetut järjestetyt parit. Vastaavasti määritellään joukkojen A,, A n tulojoukko A A n = {(x,..., x n ) : x A,..., x n A n }, jonka alkioita ovat joukkojen A,..., A n alkioista muodostetut järjestetyt listat. Yhdestä joukosta A muodostettuja tulojoukkoja merkitään A 2 = A A, A 3 = A A A, ja niin edelleen. Esimerkki.4 (Kaksi noppaa). Kahden nopanheiton tulokset voidaan kirjata listaan (x, y), jossa x on ensimmäisen ja y toisen heiton tulos. Satunnaisilmiön perusjoukko on tällöin tulojoukko S = {,..., 6} 2, joka voidaan kirjoittaa muo- 7
9 dossa S = {(, ), (, 2), (, 3), (, 4), (, 5), (, 6), (2, ), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), (3, ), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), (4, ), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), (5, ), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), (6, ), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)}. Muutamia tapahtumia on listattu allaolevaan taulukkoon. Tapahtuma Tulkinta {(4, ), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6)} Ensimmäinen heitto = 4 {(5, ), (5, 2), (5, 3)} Ensimmäinen heitto = 5 ja toinen 3 {(6, 6)} Molemmilla heitoilla saadaan 6 Kaikkien tapahtumien listaa ei ole tähän monisteeseen sisällytetty, sillä tapahtumia on kappaletta ja niiden taulukoiminen ylläolevalla esitystavalla vaatisi yli miljardi sivua..3 Todennäköisyyden laskusäännöt Perusjoukon S todennäköisyysjakauma eli todennäköisyysmitta on kuvaus, joka liittää jokaiseen tapahtumaan A S luvun P(A) ja toteuttaa ehdot: (i) 0 P(A). (ii) P(S) =. (iii) Mille tahansa äärelliselle tai äärettömälle jonolle toisensa poissulkevia tapahtumia A, A 2,... pätee P(A A 2 ) = P(A ) + P(A 2 ) + Ylläolevia ominaisuuksia kutsutaan todennäköisyyden aksioomiksi, koska niistä voidaan johtaa kaikki todennäköisyyden laskusäännöt. Tärkeimmät laskusäännöt on listattu alla. Lause.5. Jokainen todennäköisyysjakauma toteuttaa seuraavat laskusäännöt. Yleinen summasääntö: Poissulkevien summasääntö: P(A B) = P(A) + P(B) P(A B). (.) P(A B) = P(A) + P(B), kun A B =. (.2) 8
10 Erotuksen todennäköisyys: P(B \ A) = P(B) P(A B). (.3) Vastakohdan todennäköisyys: P(A c ) = P(A). (.4) Monotonisuus: P(A) P(B), kun A B. (.5) Todistus. Poissulkevien tapahtumien summasääntö (.2) on erikoistapaus aksioomasta (ii). Erotuksen laskusäännön todistamiseksi kirjoitetaan tapahtuma B kahden toisensa poissulkevan tapahtuman yhdisteenä B = (A B) (B \ A). Tällöin kaavasta (.2) seuraa P(B) = P(A B) + P(B \ A). Tästä kun ratkaistaan P(B \ A), saadaan kaava (.3). Vastakohdan laskusääntö (.4) seuraa erotuksen laskusäännön (.3) avulla aksioomasta (i), sillä P(A c ) = P(S \ A) = P(S) P(A S) = P(A). Monotonisuuden (.5) todistamiseksi todetaan ensiksi, että A B = A kun A B. Tällöin erotuksen laskusäännön (.3) avulla havaitaan, että P(A) = P(A B) = P(B) P(B \ A) P(B). Todistetaan viimeiseksi yleinen summasääntö. Kirjoitetaan tapahtuma A B yhdisteenä muodossa A B = A (B\A). Tällöin soveltamalla laskusääntöjä (.2) ja (.3) havaitaan, että P(A B) = P(A) + P(B \ A) = P(A) + P(B) P(A B). Esimerkki.6. Paneelitutkimuksen mukaan erään kaupungin aikuisväestöstä 8% seuraa Salattuja elämiä ja % seuraa Emmerdalea. Lisäksi todettiin, että 5% aikuisista seuraa molempia tv-sarjoja. Mikä osuus kaupungin aikuisväestöstä ei seuraa kumpaakaan tv-sarjaa? Määritellään tapahtumat A = satunnaisesti valittu aikuinen seuraa Salattuja elämiä, B = satunnaisesti valittu aikuinen seuraa Emmerdalea. Tällöin P(A) = 0.8, P(B) = 0. ja P(A B) = Yleisen summasäännön (.) mukaan P(A B) = P(A) + P(B) P(A B) = 0.24, joten vastakohdan laskusäännön (.4) mukaan P((A B) c ) = P(A B) = Näin ollen 76% kaupungin aikuisväestöstä ei seuraa kumpaakaan tv-sarjaa. 9
11 .4 Ehdollinen todennäköisyys Ehdollinen todennäköisyys kertoo, miten tapahtuman todennäköisyys muuttuu, kun satunnaisilmiöstä saadaan lisätietoa. Esimerkki.7 (3 kolikonheittoa). Reilua kolikkoa heitetään kolme kertaa peräkkäin. Mikä on todennäköisyys saada kolme kruunaa, kun ensimmäisen heiton tuloksen on havaittu olevan kruuna? Kun 0 = klaava ja = kruuna, voidaan kolmen heiton tulossarjoja vastaava perusjoukko kirjoittaa muodossa S = {000, 00, 00, 0, 00, 0, 0, }. Merkitään A = saadaan kolme kruunaa, B = ensimmäisellä heitolla saadaan kruuna. Ilman mitään taustatietoa kolikonheitoista ovat kaikki tulossarjat yhtä todennäköisiä, joten lähtökohtaisesti tapahtuman A todennäköisyys on. Satunnaisilmiön luonne muuttuu, jos ensimmäisen heiton tiedetään olevan kruuna. Täl- 8 löin mahdolliset toteumat rajoittuvat joukon B = {00, 0, 0, } alkioihin. Koska kaikki B:n toteumat ovat yhtä todennäköisiä, on tapahtuman A todennäköisyys tapahtuman B toteutuessa näin ollen. 4 Tapahtuman A ehdollinen todennäköisyys tapahtuman B toteutuessa määritellään kaavalla P(A B) = Mikäli P(B) = 0, jätetään P(A B) määrittelemättä. P(A B), kun P(B) 0. (.6) P(B) Esimerkki.8 (3 kolikonheittoa). Lasketaan esimerkin.7 ehdollinen todennäköisyys ylläolevan yleisen määritelmän avulla. Koska tapahtuma A sisältyy tapahtumaan B, pätee A B = A. Näin ollen P(A B) = P(A B) P(B) = P(A) P(B) = /8 /2 = 4. Ehdollisen todennäköisyyden määritelmästä (.6) seuraa suoraan allaoleva laskusääntö. Lause.9 (Tulosääntö). Aina kun P(A) > 0, pätee P(A B) = P(A)P(B A). Esimerkki.0 (2 korttia). Sekoitetusta korttipakasta 2 nostetaan palauttamatta kaksi korttia. Millä todennäköisyydellä molemmat ovat patoja? 2 Tavallinen länsimainen 52 kortin pakka, jossa on 3 numeroitua korttia kutakin maata (pata, risti, hertta, ruutu ), jotka on numeroitu luvuin,2,...,3. 0
12 Tarkasteltava tapahtuma voidaan kirjoittaa muodossa A = A A 2, jossa A i = i:s kortti on pata. Ensimmäistä korttia nostettaessa pakan 52 kortista 3 on patoja, joten P(A ) = 3. Kun tiedetään tapahtuman A 52 toteutuneen, on toista korttia nostettaessa pakassa jäljellä olevista 5 kortista 2 patoja. Näin ollen P(A 2 A ) = 2. Tulosäännön mukaan molemmat kortit ovat patoja 5 todennäköisyydellä P(A) = P(A )P(A 2 A ) = = 7..5 Tapahtumien riippuvuus ja riippumattomuus Kaksi satunnaisilmiöön liittyvää tapahtumaa ovat riippumattomat, jos tieto toisen toteutumisesta ei vaikuta toisen todennäköisyyteen. Matemaattisesti ilmaistuna tapahtumat A ja B ovat riippumattomat, jos P(A B) = P(A)P(B). Silloin kun A:n ja B:n todennäköisyydet ovat nollasta poikkeavia, on ylläoleva ehto yhtäpitävä yhtälöiden P(A B) = P(A), P(B A) = P(B), kanssa. Nämä voidaan tulkita niin, että tapahtuman B toteutumisesta saadusta informaatiosta ei ole hyötyä tapahtuman A ennustamiseen eikä päinvastoin. Useamman tapahtuman kokoelma on riippumaton, jos mille tahansa siitä valituille tapahtumille A,..., A k pätee P(A A k ) = P(A ) P(A k ). (.7) Esimerkki. ( kortti). Sekoitetusta korttipakasta nostetaan yksi kortti. Ovatko tapahtumat A = kortti on pata B = kortti on ässä toisistaan riippuvat vai riippumattomat? Yksi tapa ratkaista tehtävä on tutkia laskemalla, päteekö P(A B) = P(A)P(B). Koska pakassa on täsmälleen yksi pataässä, P(A B) = P( kortti on pataässä ) = 52. Koska pakassa on yhteensä 3 pataa ja 4 ässää, havaitaan että P(A) = 3 ja 52 P(B) = 4. Näin ollen P(A B) = P(A)P(B), joten tapahtumat A ja B ovat 52 toisistaan riippumattomat.
13 Esimerkki.2 (Palvelin). Palvelin on varmennettu kolmella rinnakkaisella komponentilla niin, että palvelin toimii mikäli vähintään yksi komponenteista toimii. Komponentti i toimii muista komponenteista riippumattomasti todennäköisyydellä p i, missä p = 0.999, p 2 = 0.99 ja p 3 = Määritä todennäköisyys p, jolla palvelin toimii? Tapahtuma A = palvelin toimii voidaan esittää yhdisteenä A = A A 2 A 3, jossa A i = komponentti i toimii. Yhdistetapahtuman sijaan on helpompaa laskea sen vastakohdan todennäköisyys, sillä A c = palvelin ei toimi = komponentti ei toimi, komponentti 2 ei toimi, komponentti 3 ei toimi = A c A c 2 A c 3, ja tapahtumat A c, A c 2, A c 3 ovat toisistaan riippumattomat. Riippumattomien tapahtumien tulokaavan (.7) mukaan P(A c ) = P(A c )P(A c 2)P(A c 3) = ( p )( p 2 )( p 3 ), joten kysytty todennäköisyys on.6 Osituskaava p = ( p )( p 2 )( p 3 ) = Hyödyllinen tapa laskea tapahtumien todennäköisyyksiä on pilkkoa perusjoukko osatapahtumiin, joiden toteutuessa satunnaisilmiötä on helpompi analysoida. Perusjoukon ositus on kokoelma toisensa poissulkevia tapahtumia A,..., A n, jotka kattavat perusjoukon kaikki toteumat eli A A n = S. Lause.3 (Osituskaava). Jos tapahtumat A,..., A n muodostavat perusjoukon osituksen ja P(A i ) > 0 kaikilla i, niin P(B) = n P(A i )P(B A i ). i= Todistus. Tapahtuman C i = A i B todennäköisyys on yleisen tulosäännön mukaan P(C i ) = P(A i )P(B A i ). Lisäksi tapahtumat C,..., C n poissulkevat toisensa ja niiden yhdiste on B. Poissulkevien tapahtumien summasäännöstä seuraa näin ollen P(B) = P (C C n ) = n P(C i ) = i= n P(A i )P(B A i ). i= 2
14 Kuva.: Tapahtuman T + todennäköisyys P(T + ) = voidaan määrittää summana T + :lla merkittyihin solmuihin johtavien polkujen todennäköisyyksien tuloista. Esimerkki.4 (Harvinainen tauti). Erästä tautia esiintyy yhdellä kymmenestuhannesosalla väestöstä. Taudin toteamiseen on kehitetty kohtuullisen luotettava testi, joka tuottaa vääriä positiivisia 3 ja vääriä negatiivisia 4 todennäköisyydellä %. Millä todennäköisyydellä satunnaisesti valitun henkilön testitulos on positiivinen? Merkitään H = henkilö ei sairasta tautia, T = testitulos on negatiivinen, H + = henkilö sairastaa tautia, T + = testitulos on positiivinen. Tällöin P(H + ) = 0.000, P(T + H ) = 0.0 ja P(T H + ) = 0.0. Toistensa vastakohtina tapahtumat H and H + muodostavat perusjoukon osituksen, joten osituskaavan avulla P(T + ) = P(H )P(T + H ) + P(H + )P(T + H + ) = = Osituskaavan käyttöä voidaan havainnollistaa allaolevan kuvan. puuverkolla, jossa juurisolmusta lähteviin linkkeihin on merkitty osittavien tapahtumien H ja H + todennäköisyydet ja toisen vaiheen linkkeihin testitulosten T ja T + ehdolliset todennäköisyydet osittavien tapahtumien toteutuessa..7 Bayesin kaava Monissa tilanteissa tunnetaan P(A B) ja halutaan määrittää käänteinen ehdollinen todennäköisyys P(B A). Englannissa 700-luvulla vaikuttaneen Thomas Bayesin nimeä kantava kuuluisa kaava soveltuu tähän. 3 indikoi terveen ihmisen tautia sairastavaksi 4 indikoi tautia sairastavan ihmisen terveeksi 3
15 Lause.5 (Bayesin kaava). Aina kun P(A) > 0 ja P(B) > 0, pätee P(B A) = P(B)P(A B). P(A) Todistus. Ehdollisen todennäköisyyden määritelmästä P(B A) = P(A B) P(A) = P(B) P(A B) P(A) P(B) = P(B) P(A B). P(A) Esimerkki.6 (Harvinainen tauti). Erästä tautia esiintyy yhdellä kymmenestuhannesosalla väestöstä. Taudin toteamiseen on kehitetty kohtuullisen luotettava testi, joka tuottaa vääriä positiivisia ja vääriä negatiivisia todennäköisyydellä %. Millä todennäköisyydellä positiivisen testituloksen saanut henkilö sairastaa tautia? Käytetään samoja merkintöjä kuin esimerkissä.4, jossa positiivisen testituloksen todennäköisyydeksi saatiin P(T + ) = Bayesin kaavan mukaan positiivisen testituloksen saanut henkilö sairastaa tautia todennäköisyydellä P(H + T + ) = P(H +)P(T + H + ) P(T + ) = Näin pieni todennäköisyys vaikuttaa paradoksaaliselta, koska 99% testituloksista tiedetään olevan oikeita. Tämä on esimerkki esiintyvyysharhasta: vaikka kaikista testituloksista 99% on oikeita, on positiivisista testituloksista yli 99% vääriä. Esimerkki.7 (Laadunvalvonta). Samaa tuotetta valmistetaan tehtaassa kolmella eri tuotantolinjalla. Valmiit tuotteet sekoitetaan ja pakataan laatikoihin. Tuotantolinjojen suorituskykyä kuvaa allaoleva taulukko. Linja Tuotantomäärä Viallisten osuus 3./min 2% 2 5.0/min 9% 3 4.5/min 8% Satunnaisesti valitusta laatikosta poimitaan tuote tarkastettavaksi. Millä todennäköisyydellä vialliseksi havaittu tuote on linjalta? Merkitään L i V = tarkastettava tuote on linjalta i, = tarkastettava tuote on viallinen. Linjalta peräisin oleva tuote on viallinen todennäköisyydellä P(V L ) = Käänteisen todennäköisyyden P(L V ) määrittämiseksi Bayesin kaavalla tulee ensin laskea todennäköisyydet P(L ) ja P(V ). Ensimmäinen näistä (kolmen numeron tarkkuudella) saadaan normittamalla tuotantomäärät: P(L ) = =
16 Vastaavasti voidaan laskea P(L 2 ) = ja P(L 3 ) = Tapahtuman V todennäköisyyden laskemiseksi sovelletaan osituskaavaa tapahtumien L, L 2, L 3 muodostamaan ositukseen, jolloin P(V ) = P(L )P(V L ) + P(L 2 )P(V L 2 ) + P(L 3 )P(V L 3 ) = = Bayesin kaavan mukaan vialliseksi havaittu tuote on peräisin linjalta todennäköisyydellä P(L V ) = P(L )P(V L ) = = P(V ) Todennäköisyys ja kombinatoriikka Jos äärellisen perusjoukon S jokainen toteuma on yhtä todennäköinen, saadaan tapahtuman A S todennäköisyys kaavasta P(A) = #A #S = tapahtuman A toteumien lkm kaikkien toteumien lkm. Tällöin siis todennäköisyyksien laskeminen palautuu joukkojen kokojen laskemiseksi. Suuressa perusjoukossa voi lukumäärien #A ja #S laskeminen kuitenkin olla vaikeaa, ellei jopa mahdotonta. Kombinatoriikka on tämäntyyppisiin ongelmiin keskittynyt matematiikan osa-alue. Toimiva tapa joukon alkioiden lukumäärän laskemiseksi on kirjoittaa kuvaus, jonka avulla joukon alkiot voidaan listata vaihe vaiheelta, ja tämän jälkeen laskea mahdollisten tapojen lukumäärä kunkin vaiheen toteuttamiseksi. Tarkastellaan muutamaa konkreettista esimerkkiä. Esimerkki.8 (PIN-koodit). Montako nelinumeroista eri PIN-koodia voidaan muodostaa numeroista {0,, 2,..., 9}? Kaikkien PIN-koodien lista 0000, 000, 0002, 0003, 0004, 0005, 0006, 0007, 0008, 0009, 000, 00, 002, 003, 004, 005, 006, 007, 008, 009, 0020, 002, 0022, 0023, 0024, 0025, 0026, 0027, 0028, 0029, 0030, 003, 0032, 0033, 0034, 0035, 00, 0037, 0038, 0039, 0040,..., 9997, 9998, 9999 on liian pitkä käsin kirjoitettavaksi. Alla on mahdollinen tapa tuottaa PIN-koodi neljässä vaiheessa on.. Valitaan PIN-koodin ensimmäinen numero 2. Valitaan PIN-koodin seuraava numero 3. Valitaan PIN-koodin seuraava numero 4. Valitaan PIN-koodin seuraava numero 5
17 Koska jokaisen vaiheen suorittamiseen on 0 mahdollista tapaa ja jokainen vaihe voidaan suorittaa muista vaiheista riippumattomasti, on mahdollisia tapoja PIN-koodin tuottamiseksi yhteensä = Esimerkki.9 (Mitalisijat). Monellako tapaa on mahdollista jakaa mitalisijat jääkiekon SM-liigassa pelaavien 5 joukkueen HPK, IFK, ILV, JUK, JYP, KAL, KÄR, KOO, LUK, PEL, SAI, SPO, TAP, TPS ja ÄSS kesken? Kaikkien mitalisijakombinaatioiden lista (HPK,IFK,ILV), (HPK,IFK,JUK), (HPK,IFK,JYP), (HPK,IFK,KAL), (HPK,IFK,KÄR), (HPK,IFK,KOO), (HPK,IFK,LUK), (HPK,IFK,PEL), (HPK,IFK,SAI), (HPK,IFK,SPO), (HPK,IFK,TAP), (HPK,IFK,TPS), (HPK,IFK,ÄSS), (HPK,ILV,IFK), (HPK,ILV,JUK), (HPK,ILV,JYP), (HPK,ILV,KAL), (HPK,ILV,KÄR), (HPK,ILV,KOO), (HPK,ILV,LUK), (HPK,ILV,PEL), (HPK,ILV,SAI), (HPK,ILV,SPO), (HPK,ILV,TAP), (HPK,ILV,TPS), (HPK,ILV,ÄSS),... (ÄSS,TPS,SAI), (ÄSS,TPS,SPO), (ÄSS,TPS,TAP) on selvästi liian pitkä käsin kirjoitettavaksi. Muodostetaan kaikki mitalisijakombinaatiot kolmessa vaiheessa:. Valitaan sijalle jokin joukkue 2. Valitaan sijalle 2 jokin vielä sijoittamaton joukkue 3. Valitaan sijalle 3 jokin vielä sijoittamaton joukkue Toisin kuin esimerkissä.8, mitalisijoja jaettaessa vaiheet riippuvat toisistaan niin, että sama joukkue voi sijoittua korkeintaan yhdelle mitalisijalle. Vaiheessa voidaan kultamitalin saava joukkue valita 5 eri tavalla. Tämän jälkeen vaiheessa 2 voidaan hopeamitalin saajaksi valita jokin vielä sijoittamaton joukkue 4 eri tavalla. Vastaavasti vaiheessa 3 on jäljellä 3 eri tapaa valita pronssijoukkue. Näin ollen tapoja valita 3 joukkuetta mitalisijoille on yhteensä = 2730 kappaletta. Seuraava tulos kiteyttää esimerkeissä.8 ja.9 tehdyt laskelmat yleiseen muotoon. Lause.20 (Listojen lukumäärä). Järjestettyjä k:n alkion listoja voidaan n:n alkion joukosta muodostaa: toistojen kanssa n k kappaletta, ilman toistoja n(n ) (n k + ) kappaletta. Positiivisen kokonaisluvun kertoma määritellään kaavalla n! = n(n ) 2. Sijoittamalla lauseen.20 jälkimmäiseen kaavaan k = n havaitaan, että n:n alkion joukon kaikki alkiot voidaan järjestää listaan n! tavalla. Esimerkki.2 (Pelaajaviisikot). Kuinka monta eri viisikkoa voidaan jääkiekkojoukkueen 20 kenttäpelaajan joukosta muodostaa? Lauseen.20 mukaan n = 20 kenttäpelaajan joukosta voidaan muodostaa k = 5 eri pelaajan järjestettyjä listoja = kappaletta. Tämä luku yliarvioi viisikkojen lukumäärän, sillä pelaajaviisikko 6
18 on sama huolimatta siitä, missä järjestyksessä sen pelaajat listataan. Koska jokainen viisikko voidaan listata 5! = 20 eri tavalla, on kysytty viisikkojen lukumäärä ! = = Ylläolevan esimerkin laskelma yleistyy seuraavaan muotoon. Lause.22 (Osajoukkojen lukumäärä). Järjestämättömiä k:n alkion joukkoja voidaan n:n alkion joukosta muodostaa binomikertoimen ( ) n n(n ) (n k + ) = k k(k ) ilmaisema lukumäärä. Esimerkki.23 (Lotto). Mikä on todennäköisyys saada yhdellä lottorivillä 7 oikein Veikkaus Oy:n lottoarvonnassa? Lottoarvonnan perusjoukko on S = 7:n alkion osajoukot joukosta {,..., 40} ja sen koko on lauseen.22 mukaan #S = ( 40 7 ). Tapahtuma A = valitulla lottorivillä 7 oikein sisältää täsmälleen yhden toteuman, joten #A =. Symmetrian perusteella lottoarvonnan jokainen toteuma on yhtä todennäköinen, joten P(A) = #A #S = ( 40 7 ) = Esimerkki.24 (Johtoryhmä). Yrityksen uuteen viiden hengen johtoryhmään oli hakijoina 6 miestä 0 naista. Jos johtoryhmä jäsenet valittaisiin arpomalla, niin millä todennäköisyydellä johtoryhmään tulisi valituksi 3 miestä ja 2 naista? Kun arvonta tehdään täysin satunnaisesti, on jokainen arvonnan tulos yhtä todennäköinen. Perusjoukko S sisältää kaikki 5 henkilön osajoukot 6 henkilön hakijajoukosta, joten sen koko on #S = ( ) 6 5. Tapahtumaa A = valitaan 3 miestä ja 2 naista vastaavat henkilökombinaatiot voidaan muodostaa seuraavasti: valitaan ensin 3 miestä 6 miehen joukosta ja sen jälkeen 2 naista 0 naisen joukosta. Näin ollen #A = ( 6 0 ) 3)( 2 ja kysytty todennäköisyys on P(A) = ( 6 3( 6 5 )( 0 ) 2 ) = %. 7
19 Esimerkki.25 (Pokeri). Viiden kortin vetopokerissa pelaaja saa käteensä 5 korttia sekoitetusta 52 kortin pakasta. Laske todennäköisyys saada kolmoset eli kolme samanarvoista korttia, esim. 4, 7, 4, 4, A. Matemaattisesti kolmoset = viiden kortin joukko, jossa esiintyy kolme eri arvoa niin, että yksi arvo esiintyy kolmesti ja muut arvot kerran. Tällaisten joukkojen lukumäärä voidaan laskea monella eri tapaa. Yksi niistä on seuraava:. Valitaan kolmen arvon joukko, joita pokerikädessä esiintyy: ( 3 3 ) = 286 tapaa. 2. Valitaan kolmesta arvosta yksi, joka esiintyy kolmesti: ( 3 ) = 3 tapaa. (Muut edellisessä kohtaa valituista arvoista esiintyvät kerran.) 3. Valitaan kolmesti esiintyvälle arvolle kolmen maan joukko: ( 4 3) = 4 tapaa. 4. Valitaan pienemmälle kerran esiintyvälle arvolle maa: ( 4 ) = 4 tapaa. 5. Valitaan suuremmalle kerran esiintyvälle arvolle maa: ( 4 ) = 4 tapaa. Kertomalla eri vaiheiden vaihtoehtojen lukumäärät saadaan kolmosten lukumääräksi ( )( )( )( )( ) = Koska viiden kortin joukkoja voidaan 52 kortin pakasta poimia ( ) 52 5 = eri tavalla, on kysytty todennäköisyys ( 3 )( 3 )( 4 )( 4 3 ( 52 5 )( 4 ) ) = %. Samaan tapaan voidaan laskea kaikkien pokerikäsien todennäköisyydet, ks. esim. Kommentteja Ylinumeroituvasti äärettömän perusjoukon kohdalla tapahtumien kokoelmaa pitää rajoittaa tiettyjen paradoksien poissulkemiseksi. Toimiva valinta on olettaa, että satunnaisilmiöön liittyvien tapahtumien kokoelma muodostaa sigmaalgebran. Perusjoukon osajoukkojen kokoelma on sigma-algebra, jos se on numeroituvien yhdisteiden ja leikkausten sekä komplementin suhteen suljettu. Sigma-algebran alkioita kutsutaan mitallisiksi joukoiksi. Syy rajoittua sigmaalgebroihin on se, että näillä määritellyille todennäköisyysmitoille on mahdollista rakentaa toimiva integroinnin ja stokastisen analyysin teoria, jonka esitteli venäläismatemaatikko Andrei Kolmogorov vuonna 933. Tästä syystä todennäköisyyden aksioomia kutsutaankin usein Kolmogorovin aksioomiksi. Stokastiikan yleisestä teoriasta kiinnostuneille lisätietoja löytyy oppikirjoista [Wil9, JP04] ja lähes kaikenkattavasta yleisteoksesta [Kal02]. 8
20 Luku 2 Satunnaismuuttujat ja jakaumat 2. Satunnaismuuttujan käsite Käytännön tilanteissa ei yleensä olla kiinnostuneita satunnaisilmiön kaikista yksityiskohdista, vaan ainostaan tietyn ilmiöön liittyvän suureen arvosta. Esimerkiksi kaupan varastonhallinnassa riittää yksittäisten myyntitapahtumien sijaan yleensä tietää päiväkohtaiset myyntimäärät. Satunnaismuuttuja X on suure, jonka arvo määräytyy satunnaisilmiön toteumasta. Sattuma siis määrää satunnaisilmiön toteuman s S ja toteuma satunnaismuuttujan arvon X(s). Tapahtuma X saa arvon a sisältää ne toteumat s, joille X(s) = a merkitään. Sitä merkitään {X = a} = {s S : X(s) = a}. Esimerkki 2. (Kaksi noppaa). Kahta nopanheittoa mallintavan satunnaisilmiön toteumia ovat lukuparit s = (s, s 2 ), jossa s i on heiton i tulos. Satunnaisilmiöön liittyviä satunnaismuuttujia ovat esimerkiksi heittotulosten summa N(s) = s + s 2, heittotulosten maksimi M(s) = max{s, s 2 }. Matemaattisesti satunnaismuuttuja on mitallinen funktio X : S S perusjoukosta S arvojoukkoon S. Tässä monisteessa käsitellään pääasiassa lukuarvoisia satunnaismuuttujia. Yleisemmistä satunnaismuuttujista saatetaan arvojoukon tyypin mukaan käyttää allaolevia nimityksiä: Mitallisuus on funktion tekninen ehto, joka sulkee pois tietyt ylinumeroituvien joukkojen väliset patologiset erikoistapaukset, ks. luku
21 Nimitys Arvojoukko Satunnaisluku S R Satunnaisvektori S R n Satunnaismatriisi S R m n Stokastinen prosessi S R T (aikavälin T funktiot) Satunnaiskenttä S R U (alueen U funktiot) Satunnaisverkko S {0, } V V (solmujoukon V verkot) 2.2 Jakauma ja kertymäfunktio Satunnaismuuttujan X jakauma on taulukko tai funktio, josta voidaan määrittää X:n mahdolliset arvot ja niiden todennäköisyydet. Esimerkki 2.2 (Kaksi nopanheittoa). Kahta nopanheittoa mallinnetaan perusjoukolla S = {,..., 6} 2, jonka alkioita ovat tulosparit s = (s, s 2 ). Satunnaismuuttujan N(s) = s +s 2 arvojoukko on {2,..., 2}. Tapahtuma N saa arvon 3 on joukko {N = 3} = {(, 2), (2, )}. Koska jokainen tulospari on yhtä todennäköinen, on P(N = 3) = 2. Samalla tapaa voidaan määrittää muidenkin arvojen todennäköisyydet ja satunnaismuuttujan N jakauma voidaan esittää alla olevana taulukkona. 0.5 x P(N = x) f x Heittotulosten maksimi on satunnaismuuttuja M(s) = max{s, s 2 }, jonka arvojoukko on {,..., 6}. Tapahtuma M saa arvon 3 on joukko {M = 3} = {(, 3), (2, 3), (3, 3), (3, 2), (3, )}. Koska jokainen tulospari on yhtä todennäköinen, on P(M = 3) = 5. Vastaavaan tapaan voidaan määrittää muidenkin arvojen todennäköisyydet ja satunnaismuuttujan M jakauma voidaan esittää alla olevana taulukkona. 0.3 x P(M = x) f x 20
22 Kaikkien satunnaismuuttujien jakaumia ei voi esittää taulukon avulla. Tarkastellaan seuraavaa esimerkkiä. Esimerkki 2.3 (Metron odotusaika). Asemalle saapuu metroja 0 minuutin väliajoin. Asemalle saapuu matkustaja tasaisen satunnaisella ajanhetkellä. Millä todennäköisyydellä seuraavan metron odotusaika on 3 minuuttia? Satunnaismuuttujan X mahdollisia arvoja ovat kaikki reaaliluvut jatkuvalta väliltä [0, 0], kun aikayksikkönä on minuutti. Intuitiivisesti on selvää, että X:n todennäköisyys osua lukuvälille [a, b] [0, 0] on kyseisen välin pituus b a jaettuna koko aikavälin pituudella 0. Näin ollen esimerkiksi Vastaavasti päätelleen havaitaan, että P(2.9 X 3) = 0. 0 = 00. P(2.99 X 3) = 0.00, P(2.999 X 3) = 0.000, P( X 3) = Koska tapahtuma X = 3 sisältyy jokaiseen ylläolevaa muotoa olevaan tapahtumaan, seuraa todennäköisyyden monotonisuuden (.5) perusteella P(X = 3) = 0. Tehty havainto yleistyy muotoon P(X = t) = 0 kaikilla reaaliluvuilla t. Tämä silminnähden paradoksaalinen tulos selittyy sillä, että jatkuvan arvojoukon satunnaismuuttujalle X = t tarkoittaa, että X:n arvo on t äärettömän monen desimaalin tarkkuudella. Odotusajan jakaumaa ei selvästikään voi esittää yksittäisten arvojen todennäköisyyksiä taulukoimalla, vaan tarvitaan jokin muu tapa. Lukuarvoisen satunnaismuuttujan kertymäfunktio määritellään kaavalla F X (t) = P(X t). Esimerkin 2.3 odotusajan kertymäfunktiolle voidaan johtaa kaava F X (t) = 0, t < 0, t 0, 0 t 0,, t >. F x Kertymäfunktion avulla voi laskea tapahtumien todennäköisyyksiä hyödyntämällä todennäköisyyden yleisiä laskusääntöjä. Esimerkiksi erotuksen laskusäännön (.3) mukaan P(s < X t) = P(X t) P(X s) = F X (t) F X (s). Vastakohdan (.4) laskusäännöstä seuraa puolestaan P(X > t) = P(X t) = F X (t). 2
23 Itse asiassa on mahdollista todistaa, että kertymäfunktio määrää lukuarvoisen satunnaismuuttujan jakauman yksikäsitteisesti (ks. liite). Useimmat käytännön laskut on kuitenkin hankala toteuttaa kertymäfunktion avulla. Paremman tavan tarjoavat tiheysfunktiot, joita käsitellään seuraavaksi. 2.3 Jakauman tiheysfunktio Satunnaismuuttuja X on diskreetti, jos sen todennäköisyydet voidaan esittää funktion f X (x) 0 avulla muodossa P(X A) = f X (x), (2.) x A S X missä joukko S X on numeroituva 2, ja jatkuva, jos sen todennäköisyydet voidaan esittää funktion f X (x) 0 avulla muodossa P(X A) = f X (x) dx. (2.2) Kaavassa (2.) joukko S X sisältää ne arvot, joita X voi saada positiivisella todennäköisyydellä. Funktio f X (x) on X:n jakauman tiheysfunktio. Kuvassa 2. on esitetty todennäköisyyden laskeminen diskreetin ja jatkuvan jakauman tiheysfunktion avulla. A f cond FALSE TRUE x Kuva 2.: Tapahtuman 3 X 5 todennäköisyys lasketaan diskreetille jakaumalle punaisten pylväiden korkeuksien summana (vasen) ja jatkuvalle jakaumalle punaisen alueen pinta-alana (oikea). Diskreetin satunnaismuuttujan tiheysfunktio tunnetaan myös termeillä pistemassafunktio, pistetodennäköisyysfunktio ja todennäköisyysfunktio. Jatkuvan jakauman tiheysfunktio ei välttämättä ole jatkuva; tässä yhteydessä jatkuva tarkoittaa, että satunnaismuuttujan arvojoukko on jatkumo. 2 Joukko on numeroituva, jos sen alkiot voidaan numeroida äärellisenä tai äärettömänä listana. Numeroituvia joukkoja: äärelliset joukot, kokonaisluvut, rationaaliluvut. 22
24 Diskreetin satunnaismuuttujan tiheysfunktio voidaan kirjoittaa muodossa ja se toteuttaa ehdot f X (x) 0 f X (x) = P(X = x) (2.3) ja x S X f X (x) =. (2.4) Vastaavasti mikä tahansa ehdot toteuttava (2.4) toteuttava funktio on jonkin diskreetin jakauman tiheysfunktio. 0.2 Esimerkki 2.4 (Noppa). Yksittäisen nopanheiton tulos X on diskreetti satunnaismuuttuja, jonka tiheysfunktio on f X (x) = 0., x {, 2,..., 6}. Kyseinen jakauma on lukujoukon {,..., 6} diskreetti tasajakauma f x Esimerkki 2.5 (Poisson-jakauma). Lukujoukossa Z + = 3 3x {0,, 2,... } on määritelty funktio f(x) = e. Eksponenttifunktion sarjaesityksen perusteella f(x) toteuttaa eh x! dot (2.4), joten se on erään diskreetin jakauman tiheysfunktio. Kyseinen jakauma on Poisson-jakauma paramet rina 3. x Jatkuvan jakauman tiheysfunktiota ei voi kirjoittaa muodossa (2.3), sillä P(X = x) = x x f X (t) dt = 0. Tämä tarkoittaa sitä, että jatkuvalle satunnaismuuttujalle todennäköisyys saada arvo x äärettömän monen desimaalin tarkkuudella on nolla (vrt. esimerkki 2.3). Oikea tapa tulkita jatkuvan satunnaismuuttujan tiheysfunktio on todennäköisyys suhteessa reaalilukujen esitystarkkuuteen, nimittäin tiheysfunktion jatkuvuuspisteissä pätee pienillä 3 h > 0 arvoilla f X (x) f P(X = x ± h/2), (2.5) h missä merkintä X = x ± h/2 tarkoittaa tapahtumaa x h/2 X x + h/2. Jatkuvan jakauman tiheysfunktio toteuttaa ehdot f X (x) 0 ja f X (x) dx =, (2.6) ja vastaavasti mikä tahansa ehdot (2.6) toteuttava funktio on jonkin jatkuvan jakauman tiheysfunktio. Jatkuvan jakauman kertymäfunktio määrittyy tiheysfunktiosta kaavalla F X (t) = t f X (s) ds. Vastaavasti F X (t) = f X(t) niissä pisteissä, joissa F X (t) on derivoituva. 3 ao. lausekkeen vasen puoli = lim h 0 oikea puoli 23
25 Esimerkki 2.6. Valitaan vakiot a < b ja tarkastellaan funktiota { b a f(t) =, a < t < b, /(b a) 0, muuten. Tämä funktio toteuttaa ehdot (2.6), joten se on erään jatkuvan jakauman tiheysfunktio. Kyseinen jakauma on lukuvälin [a, b] jatkuva tasajakauma. Sitä vastaava kertymäfunktio saadaan integraalina t 0, t < a, t F (t) = f(s) ds = b a, a t b, 0 a b, t > b. Sijoittamalla tähän a = 0 ja b = 0 havaitaan, että esimerkissä 2.3 tarkasteltu jakauma on välin [0, 0] jatkuva tasajakauma. Esimerkki 2.7 (Eksponenttijakauma). Valitaan vakio λ > 0 ja tarkastellaan funktiota { 0, t < 0, f(t) = λe λt, t 0. 0 Tämä funktio toteuttaa ehdot (2.6), joten se on erään jatkuvan jakauman tiheysfunktio. Kyseinen jakauma on eksponenttijakauma parametrina λ. 0 a b F (t) = t f(s) ds = { 0, t < 0, e λt, t Monen satunnaismuuttujan yhteisjakauma Samaan satunnaisilmiöön liittyvien satunnaismuuttujien X ja Y yhteisjakauma on taulukko tai funktio, josta voidaan määrittää parin (X, Y ) mahdolliset arvot ja niiden todennäköisyydet. Esimerkki 2.8 (Kaksi noppaa). Mallinnetaan kahta nopanheittoa kuten esimerkissä 2.2. Merkitään X = ensimmäisen heiton tulos, Y = toisen heiton tulos ja M = heittotulosten maksimi. Määritä satunnaismuuttujien X ja Y yhteisjakauma. Määritä myös satunnaismuuttujien X ja M yhteisjakauma. Parin (X, Y ) mahdolliset arvot ovat tulojoukon {,..., 6} 2 lukuparit (x, y), jossa x, y {,..., 6}. Koska jokainen tulospari on yhtä todennäköinen, pätee kaikille tulojoukon lukupareille P(X = x, Y = y) =. 24
26 Satunnaismuuttujien X ja Y yhteisjakauma voidaan esittää myös ao. taulukkona. X Myös parin (X, M) mahdolliset arvot sisältyvät tulojoukkoon {,..., 6} 2, mutta kaikki tulojoukon lukuparit eivät ole yhtä todennäköisiä. Esimerkiksi tapahtumaa {X = 3, M = 3} vastaa perusjoukon alkiot {(3, ), (3, 2), (3, 3)}, joten P(X = 3, M = 3) = 3. Samalla tapaa kohta kohdalta päätellen voidaan todeta, että kaikille tulojoukon lukupareille (x, m) pätee, x < m, x P(X = x, M = m) =, x = m, 0, x > m. Satunnaismuuttujien X ja M yhteisjakauma voidaan myös esittää ao. taulukkona. Y M X Usean muuttujan tiheysfunktiot on helpointa kirjoittaa indikaattorifunktioiden avulla. Joukon A indikaattorifunktio määritellään kaavalla {, x A, A (x) = 0, muuten, 25
27 ja sen avulla voidaan yhden muuttujan jakaumien esityskaavat (2.) ja (2.2) kirjoittaa muodossa P(X A) = A (x)f X (x) x S X ja P(X A) = A (x)f X (x) dx. Yhteisjakaumien tiheysfunktiot määritellään ylläolevien kaavojen yleistyksinä. Satunnaismuuttujilla X ja Y on diskreetti yhteisjakauma, jos niiden todennäköisyydet voidaan esittää funktion f X,Y (x, y) 0 avulla muodossa P((X, Y ) A) = A (x, y)f X,Y (x, y), (2.7) y S Y x S X missä joukot S X ja S Y ovat numeroituvia, ja jatkuva yhteisjakauma, jos niiden todennäköisyydet voidaan esittää funktion f X,Y (x, y) 0 avulla muodossa P((X, Y ) A) = A (x, y)f X,Y (x, y) dx dy. (2.8) Ylläolevissa yhtälöissä A tarkoittaa mielivaltaista 4 lukuparien joukkoa. Kaavassa (2.7) joukot S X ja S Y sisältävät ne arvot, joita X ja Y voivat saada positiivisella todennäköisyydellä. Kaavoissa esiintyvä funktio f X,Y (x, y) on yhteisjakauman tiheysfunktio. Samanlaiset määritelmät ovat voimassa myös kolmelle ja useammalle satunnaismuuttujalle. Diskreetin yhteisjakauman tiheysfunktio voidaan kirjoittaa muodossa f X,Y (x, y) = P(X = x, Y = y) (2.9) ja se toteuttaa ehdot f X,Y (x, y) 0 ja x S X y S Y f X,Y (x, y) =. (2.0) Vastaavasti mikä tahansa ehdot (2.0) toteuttava funktio on jonkin diskreetin yhteisjakauman tiheysfunktio. Satunnaismuuttujien X ja Y tiheysfunktiot saadaan yhteisjakauman tiheysfunktiosta kaavoilla f X (x) = f X,Y (x, y) (2.) y S Y ja f Y (y) = x S X f X,Y (x, y). (2.2) 4 mitallista 26
28 Y X Yht Yht Taulukko 2.: Kahden nopanheiton tuloksen X ja Y yhteisjakauma. M X Yht Yht Taulukko 2.2: Ensimmäisen nopanheiton X ja nopanheittojen maksimin M yhteisjakauma. Kun diskreetti yhteisjakauma esitetään taulukkona, jonka rivejä ovat X:n arvot ja sarakkeita Y :n arvot, vastaavat f X (x):n arvot taulukon rivisummia ja f Y (y):n arvot taulukon sarakesummina. Esimerkissä 2.8 tarkasteltuja yhteisjakaumia f X,Y (x, y) =, x < m,, f x X,M(x, m) =, x = m, 0, x > m, kuvaavien taulukoiden rivi- ja sarakesummat on esitetty taulukoissa 2. ja 2.2. Taulukon 2.2 rivisummat vastaavat joukon {,..., 6} tasajakaumaa eli yksittäisen nopanheiton tuloksia. Sarakesummat puolestaan vastaavat esimerkissä 2.2 johdettua kahden nopanheiton maksimin jakaumaa. Tästä syystä X:n ja Y :n jakaumia kutsutaan satunnaisvektorin (X, Y ) reunajakaumiksi ja kaavojen (2.) ja (2.2) määrittämiä funktioita funktion f X,Y (x, y) reunatiheysfunktioiksi. Jatkuvaa yhteisjakaumaa noudattavien satunnaismuuttujien X ja Y jakaumat ovat jatkuvia, mutta käänteinen tulos ei yleisesti pidä paikkaansa. Jatkuvan yhteisjakauman tiheysfunktiota ei voi kirjoittaa muodossa (2.9). Oikea tapa on tulkita f X,Y (x, y) todennäköisyytenä suhteessa reaalilukujen esitystarkkuuteen. Jatkuvan yhteisjakauman tiheysfunktion jatkuvuuspisteissä pätee lausekkeen 27
29 (2.5) merkinnöin pienillä h > 0 arvoilla f X,Y (x, y) P(X = x ± h/2, Y = y ± h/2) h 2. (2.3) Jatkuvan yhteisjakauman tiheysfunktio toteuttaa ehdot f X,Y (x, y) 0 ja f X,Y (x, y) dx dy =, (2.4) ja vastaavasti jokainen ehdot toteuttava (2.6) toteuttava funktio on jonkin jatkuvan yhteisjakauman tiheysfunktio. Satunnaismuuttujien X ja Y tiheysfunktiot saadaan yhteisjakauman tiheysfunktiosta kaavoilla f X (x) = f X,Y (x, y) dy (2.5) ja f Y (y) = f X,Y (x, y) dx. (2.6) Myös jatkuvassa tapauksessa X:n ja Y :n jakaumia kutsutaan satunnaisvektorin (X, Y ) reunajakaumiksi ja kaavojen (2.5) ja (2.6) määrittämiä funktioita funktion f X,Y (x, y) reunatiheysfunktioiksi. Esimerkki 2.9 (Yksikköneliön tasajakauma). Valitaan vakiot a < b ja määritellään kahden muuttujan funktio f X,Y (x, y) = {, (b a) 2 0, muuten. kun x (a, b) ja y (a, b), Tämä funktio toteuttaa ehdot (2.6), joten se on joidenkin satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio. Integroimalla muuttujan y:n suhteen havaitaan, että f X (x) = f X,Y (x, y) dy = {, b a kun x (a, b), 0, muuten. Vastaavasti integroimalla muuttujan x suhteen, f Y (y) = f X,Y (x, y) dx = {, b a kun y (a, b), 0, muuten. Tiheysfunktiot f X (x) ja f Y (y) ovat molemmat samoja kuin esimerkissä 2.6, joten sekä X että Y noudattavat välin [a, b] jatkuvaa tasajakaumaa. 28
30 2.5 Ehdolliset jakaumat Satunnaismuuttujan X ehdollinen jakauma tietyn tapahtuman suhteen on funktio tai taulukko, josta voidaan määrittää tapahtumien X A todennäköisyydet kyseisen tapahtuman toteutuessa. Yleensä ehdollistava tapahtuma määrittyy jonkin toisen satunnaismuuttujan Y kautta ja ehdollisia jakaumia voi käsitellä ehdollisten tiheysfunktioiden avulla. Jos satunnaismuuttujien X ja Y diskreetillä tai jatkuvalla yhteisjakaumalla on tiheysfunktio f X,Y (x, y), niin satunnaismuuttujan Y ehdollinen tiheysfunktio satunnaismuuttujan X suhteen määritellään kaavalla f Y X (y x) = f X,Y (x, y). f X (x) Kun f X (x) = 0, ei ylläolevan kaavan oikea puoli ole määritelty; tällöin myös f Y X (y x) jätetään määrittelemättä. Kun f X (x) > 0, havaitaan diskreetissä tapauksessa kaavan (2.) avulla, että f Y X (y x) 0 ja f Y X (y x) =, y S Y ja jatkuvassa tapauksessa kaavan (2.5) avulla, että f Y X (y x) 0 ja f Y X (y x) dy =. Yhden muuttujan funktio y f Y X (y x) on näin ollen jonkin jakauman tiheysfunktio. Kyseinen jakauma on satunnaismuuttujan Y ehdollinen jakauma tapahtuman X = x suhteen. Ehdollisen jakauman tiheysfunktiolla voi laskea samaan tapaan kuin tavallisillakin tiheysfunktioilla, joissa muuttujaksi valitaan y. Diskreetissä tapauksessa havaitaan ehdollisen todennäköisyyden määritelmää sekä kaavoja (2.3) ja (2.9) käyttämällä, että f Y X (y x) = P(Y = y X = x). Jatkuville jakaumille ei ylläoleva tulkinta ole mahdollinen, sillä tapahtumien X = x ja Y = y todennäköisyydet ovat nollia. Yhdistämällä kaavat (2.5) ja (2.3) havaitaan, että yhteisjakauman tiheysfunktion jatkuvuuspisteissä pienillä h > 0 arvoilla pätee f Y X (y x) P(Y = y ± h/2 X = x ± h/2). h 2.6 Stokastinen riippuvuus ja riippumattomuus Kaksi satunnaismuuttujaa ovat riippumattomat, jos informaatio toisen muuttujan arvosta ei vaikuta toisen muuttujan todennäköisyyksiin. Matemaattisesti 29
31 ilmaistuna satunnaismuuttujat X ja Y ovat riippumattomat, jos kaikilla A ja B pätee P(X A, Y B) = P(X A)P(Y B). (2.7) Silloin kun tapahtumien X A ja Y B todennäköisyydet poikkeavat nollasta, voidaan ylläoleva yhtälö ilmaista myös muodossa tai P(Y B X A) = P(Y B) P(X A Y B) = P(X A). Useamman satunnaismuuttujan kokoelma puolestaan on riippumaton, jos mille tahansa siitä valituille satunnaismuuttujille X,..., X k ja kaikille A,..., A k pätee P(X A,..., X k A k ) = P(X A ) P(X k A k ). (2.8) Lause 2.0. Diskreettiä tai jatkuvaa yhteisjakaumaa noudattavat satunnaismuuttujat X ja Y ovat riippumattomat jos ja vain niiden yhteisjakauman tiheysfunktio voidaan esittää muodossa f X,Y (x, y) = f X (x)f Y (y) (2.9) Todistus. Todistetaan ensiksi diskreetti tapaus. (i) Ehdon (2.9) riittävyyden perustelemiseksi palautetaan mieleen tulojoukon määritelmä: joukko A B sisältää ne lukuparit (x, y), joille x A ja y B. Tästä syystä tulojoukon indikaattorifunktio voidaan kirjoittaa muodossa A B (x, y) = A (x) B (y) ja tapahtuma X A ja Y B toteutuu täsmälleen silloin kun, satunnaismuuttujien pari (X, Y ) kuuluu tulojoukkoon A B. Mikäli X:n ja Y :n yhteisjakauman tiheysfunktio voidaan esittää muodossa (2.9), voidaan näin ollen päätellä, että P(X A, Y B) = P((X, Y ) A B) = A B (x, y)f X,Y (x, y) x S X y S Y = A (x) B (y)f X (x)f Y (y) x S X y S ( Y ) ( ) = A (x)f X (x) B (y)f Y (y) x S X y S Y = P(X A)P(Y B). Koska ylläoleva yhtälö pätee kaikille A ja B, ovat X ja Y riippumattomat. 30
32 (ii) Käänteisen seuraussuhteen todistamiseksi tehdään oletus, että X ja Y ovat riippumattomat. Tällöin soveltamalla kaavaa (2.7) yhden alkion joukkoihin A = {x} ja B = {y} havaitaan, että f X,Y (x, y) = P(X = x, Y = y) = P(X A, Y B) = P(X A)P(Y B) = P(X = x)p(y = y) = f X (x)f Y (y). Jatkuvan yhteisjakauman tapauksessa ehdon (2.9) riittävyys voidaan perustella vaihtamalla summat integraaleiksi kohdassa (i). Käänteisen seuraussuhteen perustelemiseksi voidaan todeta, että jos X ja Y ovat riippumattomat, niin lausekkeen (2.3) merkinnöin kaikilla h > 0 pätee P(X = x ± h/2, Y = y ± h/2) = P(X = x ± h/2)p(y = y ± h/2). Jakamalla ylläolevan yhtälön molemmat puolet luvulla h 2 ja ottamalla rajaarvot kun h 0, voidaan tästä päätellä että (2.9) on voimassa funktion f X,Y (x, y) jatkuvuuspisteissä. Esityksen (2.9) perustelu funktion f X,Y (x, y) epäjatkuvuuspisteille vaatii syvällisempiä mittateorian menetelmiä ja se sivuutetaan. Esimerkki 2. (Kaksi noppaa). Merkitään kahden nopanheiton tuloksia satunnaismuuttujilla X ja Y sekä tulosten maksimia satunnaismuuttujalla M = max{x, Y }. Ovatko satunnaismuuttujat X ja Y toisistaan riippuvat vai riippumattomat? Entä X ja M? Intuitiivisesti on selvää, että X ja Y ovat toisistaan riippumattomat. Matemaattisesti tämän voi vahvistaa toteamalla, että yhtälö f X,Y (x, y) = f X (x)f Y (y) pitää paikkansa, sillä yhteisjakauman taulukon 2. alkiot vastaavat rivi- ja sarakesummien alkioiden tuloja. Satunnaismuuttujat X ja M puolestaan ovat riippuvat, sillä esimerkiksi P(X = 2 M = ) = 0 poikkeaa arvosta P(X = 2) = 6, joten f X,M (2, ) f X (2)f M (). Tämän voi havaita myös tarkastelemalla yhteisjakauman taulukosta 2.2 rivin 2 ja sarakkeen alkioita. Esimerkki 2.2 (Satunnaisotanta). Korissa on 3 punaista ja 7 valkoista palloa. Korista poimitaan umpimähkään yksi pallo ja selvitetään sen väri. Sama toimenpide suoritetaan kaksi kertaa peräkkäin ja poimintojen tuloksia merkitään {, jos. pallo on punainen, X = 0, muuten, 3
33 ja X 2 = {, jos 2. pallo on punainen 0, muuten. Määritä satunnaismuuttujien X ja X 2 yhteisjakauma. Ylläoleva kysymys on huonosti asetettu, sillä vastaus riippuu siitä, palautetaanko poimittu pallo koriin ennen seuraavan poiminnan suorittamista. Satunnaismuuttujan X todennäköisyydet ovat kuitenkin poimintatavasta huolimatta f X (0) = 7 ja f 0 X () = 3. Jos poiminnat suoritetaan palauttaen, niin eri poimintakierrosten tulokset ovat toisistaan riippumattomat ja samoin jakautuneet, 0 joten yhteisjakauma voidaan kirjoittaa muodossa f X,X 2 (x, y) = f X (x)f X (y). Jos taas poiminnat suoritetaan palauttamatta, niin tulokset X ja X 2 riippuvat stokastisesti toisistaan eikä ylläolevaa kaavaa voi käyttää. Yleisen tulosäännön mukaan yhteisjakauma voidaan kuitenkin aina kirjoittaa muodossa f X,X 2 (x, y) = f X (x)f X2 X (y x). Riittää siis laskea ehdollisen jakauman f X2 X (y x) arvot. Tapahtuman X = 0 toteutuessa korissa on toisen poimintakierroksen alussa 6 valkoista ja 3 punaista palloa, jolloin todennäköisyys saada valkoinen pallo on P(X 2 = 0 X = 0) = 6. Muut ehdolliset todennäköisyydet päätellään vastaavasti, ja ne on merkitty 9 kuvan 2.2 puukaaviossa lehtisolmuihin johtavien linkkien yhteyteen. Kuva 2.2: Satunnaisotanta palauttamatta. Tapahtuman {X = 0, X 2 = 0} todennäköisyydeksi voidaan kaaviosta lukea f X,X 2 (0, 0) = 7/0 6/9 = 42/90. Satunnaismuuttujien yhteisjakaumat voidaan esittää ao. taulukkoina. 32
34 Palauttaen Palauttamatta X 2 X 0 Yht Yht X 2 X 0 Yht Yht Kummankin taulukon reunajakaumat ovat samat, mikä tarkoittaa että molemmat satunnaismuuttujat X ja X 2 noudattavat jakaumaa f Xi (0) = 7/0 ja f Xi () = 3/0 poimintatavasta huolimatta. Muuttujien yhteisjakauma sen sijaan riippuu siitä, suoritetaanko poiminnat palauttaen vai palauttamatta. Tämä esimerkki osoittaa, että satunnaismuuttujien jakaumista f X ja f X2 ei voi päätellä niiden yhteisjakaumaa. 2.7 Yhteenveto Allaolevassa taulukossa on tiivistelmä tämän luvun tärkeimmistä käsitteistä. Diskreetti jakauma X:n arvot sisältyvät äärelliseen tai numeroituvasti äärettömään arvojoukkoon S X P(X = x) = f X (x) kaikilla x S X Jakauma määräytyy tiheysfunktiosta kaavalla P(X A) = A (x)f X (x) x S X Jatkuva jakauma X:n arvot sisältyvät ylinumeroituvasti äärettömään reaalilukujen joukkoon P(X = x) = 0 kaikilla reaaliluvuilla x Jakauma määräytyy tiheysfunktiosta kaavalla P(X A) = A (x)f X (x) dx Tiheysfunktion arvot ovat tarkkoja todennäköisyyksiä f X (x) = P(X = x) Tiheysfunktion arvot ovat suhteellisia likiarvoisia todennäköisyyksiä f X (x) h P(X = x ± h/2) Esim. joukon {,..., 6} tasajakauma Esim. välin [0, 0] tasajakauma 2.8 Kommentteja Yleinen satunnaismuuttuja on mitallinen funktio X : S S, mikä tarkoittaa että B X (B) = {s : X(s) B} kuvaa maalijoukon sigma-algebran mi- 33
35 talliset joukot lähtöjoukon sigma-algebran mitallisiksi joukoiksi (ks. luku.9). Mitallisuus siis määritellään suhteessa lähtö- ja maalijoukon sigma-algebroihin, jotka yleensä oletetaan kontekstin pohjalta tunnetuiksi. Kaikki stokastiikan ja tilastotieteen sovelluksiin liittyvät funktiot ovat mitallisia, kunhan pohjalla olevat sigma-algebrat on valittu järkevästi. Niinpä mitallisuutta ei tässä monisteessa tarkastella sen tarkemmin, vaan jatkossa kaikki joukot ja funktiot oletetaan mitallisiksi ilman erillistä mainintaa. Tämän luvun lopuksi vielä yksi esimerkkitapaus satunnaismuuttujan jakaumasta, joka ei ole diskreetti eikä jatkuva, vaan niiden sekoite. Esimerkki 2.3. Merkitään X = satunnaisesti saapuvan matkustajan odotusaika (min) asemalla, jonne metroja saapuu tasaisin 0 min välein, ja jossa metrot pysähtyvät min ajan. Määritä X:n jakauma. Todennäköisyys että matkustaja asemalle saapuessaan näkee häntä odottavan metron on symmetrian perusteella /0, ja tämän tapahtuman toteutuessa odotusaika on 0. Muussa tapauksessa odotusaika noudattaa jatkuvan välin [0, 9] tasajakaumaa. Satunnaismuuttujan X jakauma ei ole diskreetti, sillä välin [0, 9] lukuja ei voi numeroida listaan, eikä se ole jatkuva, sillä P(X = 0) = poikkeaa nollasta. Jakauman kertymäfunktiolle voidaan kuitenkin johtaa lauseke 0 F X (t) = 0 F X 0 (t) F X (t), missä F X0 (t) = { 0, t < 0,, t 0, F X (t) = 0, t 0, t 9, 0 < t < 9,, t 9, Tästä nähdään, että X:n jakauma on diskreetin ja jatkuvan jakauman sekoitus: X 0 on diskreetti satunnaismuuttuja, joka varmuudella saa arvon 0 (X:n jakauma ehdolla, että metro on odottamassa asemalla). X on jatkuva satunnaismuuttuja, joka noudattaa välin [0, 9] tasajakaumaa (X:n jakauma ehdolla, että metroa joudutaan odottamaan). Näin ollen X:llä ei ole olemassa tiheysfunktiota tavanomaisessa mielessä. Yleistetyssä mielessä tiheysfunktion voi kuitenkin kirjoittaa viitemitan λ(dx) = δ 0 (dx) + dx suhteen muodossa, x = 0, 0 f(x) = 9, 0 < x < 9, 0, muuten, missä δ 0 on pisteen 0 Diracin mitta. Tällaisia yleisempiä mittoja ei tässä monisteessa käsitellä. Niistä voi lukea lisää esim. kirjoista [Kal02] tai [Wil9]. 34
36 Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt 3. Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään tiheysfunktion f X (x) avulla diskreetille jakaumalle kaavalla E(X) = x S X xf X (x), missä S X R sisältää X:n mahdolliset arvot, ja jatkuvalle jakaumalle kaavalla 2 E(X) = xf X (x) dx. Esimerkki 3. (Noppa). Nopanheiton tuloksen X mahdolliset arvot sisältyvät joukkoon S X = {,..., 6} ja jokainen arvo on yhtä todennäköinen. Näin ollen X:n odotusarvo on E(X) = = 3.5. Esimerkki 3.2 (Jatkuva tasajakauma). Välin [a, b] jatkuvaa tasajakaumaa noudattavalla satunnaismuuttujalla X on tiheysfunktio f X (x) = (b a) [a,b] (x), joten integroimalla saadaan X:n odotusarvoksi E(X) = (b a) b a x dx = (b a) 2 (b2 a 2 ) = a + b 2. silloin kun oikean puolen summa suppenee (ks. luku 3.6) 2 silloin kun oikean puolen integraali suppenee (ks. luku 3.6) 35
37 Odotusarvo voidaan tulkita X:n jakauman massakeskipisteenä: jos äärettömän pitkään ohueen palkkiin kohdistetaan massa f X (x) kohdassa x, niin silloin odotusarvo on se piste, johon tuettuna palkki pysyy tasapainossa. Fysikaalisen tulkinnan sijaan on kuitenkin tärkeämpää muodostaa mielikuva siitä, mitä odotusarvo kertoo satunnaismuuttujasta X. Odotusarvo ei tarkoita satunnaismuuttujan tyypillistä arvoa, koska esimerkiksi noppa ei milloinkaan voi saada arvoa 3.5. Kelvollisen tulkinnan odotusarvon käsitteelle tarjoaa seuraava tulos, joka tunnetaan nimellä suurten lukujen laki 3. Lause 3.3 (Suurten lukujen laki). Jos X, X 2,... ovat riippumattomia ja samoin jakautuneita satunnaislukuja, joilla on odotusarvona µ = E(X k ), niin mielivaltaisen pienellä ɛ > 0, tapahtuman n n X k = µ ± ɛ (3.) k= todennäköisyys lähestyy ykköstä suurilla n:n arvoilla 4. Todistus. Tulos seuraa erikoistapauksena lauseesta 5.8, joka esitetään luvussa 5, jossa pohjatiedoksi ensin tutustutaan keskihajonnan käsitteeseen. Ylläolevassa tuloksessa merkillepantavaa on se, että lausekkeen (3.) vasen puoli on satunnaismuuttuja, mutta oikea puoli on tavallinen, ei-satunnainen luku. Keskiarvoon n n k= X k liittyvä satunnaisuus ja epävarmuus siis katoavat, kun summattavien määrä kasvaa suureksi. Tulosta merkitään usein n n X P k µ k= ja sanotaan että n n k= X k suppenee stokastisesti kohti lukua µ. Suurten lukujen laki on yksi stokastiikan tärkeimmistä tuloksista, sillä siihen kiteytyy esim. rahoitus- ja vakuutusyhtiöiden toimintaperiaate: riskiä voidaan pienentää hajauttamalla varat useisiin toisistaan riippumattomiin kohteisiin. Suurten lukujen lain avulla saadaan odotusarvolle tulkinta: Satunnaismuuttujan odotusarvo E(X) on likiarvo keskiarvolle, joka lasketaan suuresta määrästä X:n tavoin jakautuneita riippumattomia satunnaislukuja. Esimerkki 3.4 (Noppapelin tuotto). Noppapelissä voittaa kierroksella k silmäluvun X k verran euroja. Yhden kierroksen tuoton odotusarvo on E(X k ) = 3.5 EUR. Kertynyt tuotto suurelta määrältä kierroksia on suurten lukujen lain mukaan suurella todennäköisyydellä ( ) n n X k = X k n 3.5n. n k= 3 suurten lukujen laista on myös vahva versio (ks. luku 3.6) 4 Tarkemmin ilmaistuna lim n P( n n k= X k µ ɛ) =. i=k
38 Kuvassa 3. on esitetty kolme simuloitua pelin toteumaa. Sadan pelikierroksen tuottokertymät ovat lähellä odotusarvoa 350 EUR, mutta poikkeavat siitä kuitenkin jonkun verran Kuva 3.: Noppapelin tuottokertymän odotusarvo (punainen) ja kolme simuloitua toteumaa (sininen) pelikierrosten lukumäärän funktiona. Mitä odotusarvo kertoo sellaisista satunnaismuuttujista, joista riippumattomia toistoja ei ole saatavilla, esim. X = startup-yrityksen seuraavan vuoden liikevaihto, Y = taloyhtiön materiaalivahingot ensi vuonna tapahtuvista tulipaloista? Yksittäisen yrityksen perustajan näkökulmasta E(X) ei välttämättä ole erityisen tärkeä luku, mutta useaan toisistaan riippumattomasti toimivaan startupyritykseen sijoittavan rahoittajan näkökulmasta tilanne on toinen. Vastaavasti E(Y ) ei välttämättä ole yksittäisen taloyhtiön kannalta oleellinen luku, mutta samankaltaisia taloyhtiöitä vakuuttavan vakuutusyhtiön kannalta kylläkin. Esimerkki 3.5 (Yksi miljoonasta). Arvonnassa voittaa miljoona euroa todennäköisyydellä yksi miljoonasta. Yksittäisen arvan tuottoa kuvaavan satunnaismuuttujan X jakauma on ao. taulukossa ja sen odotusarvo on k P(X = k) E(X) = =. Tämä odotusarvo ei kerro kyseisen satunnaisilmiön luonteesta paljoakaan. Esimerkiksi jos X:n tavoin jakautuneita satunnaislukuja generoidaan toisistaan riippumattomasti, niin 0000 ensimmäistä satunnaislukua ovat kaikki nollia todennäköisyydellä %. 37
39 3.2 Todennäköisyyden frekvenssitulkinta Kolikonheitosta puhuttaessa on tapana sanoa, että kruunan todennäköisyys on. Intuitiivisesti tämä tarkoittaa sitä, että pitkässä heittosarjassa odotetaan kruunien osuuden olevan lähellä puolikasta, mutta onko tälle intuitiolle 2 matemaattisia takeita? Merkitään {, jos heitolla k saadaan kruuna, I k = 0, muuten, jolloin n:llä heitolla saatujen kruunien lukumäärä on satunnaismuuttuja S n = n k= I k ja kruunien suhteellinen esiintyvyys satunnaismuuttuja S n /n. Kun kolikkoa heitetään tasaisen satunnaisesti, ovat satunnaismuuttujat I, I 2,... toisistaan riippumattomia ja samoin jakautuneita, odotusarvona E(I k ) = 0 P(I k = 0) + P(I k = ) = 2. Näin ollen suurten lukujen lain mukaan kruunan suhteellinen esiintyvyys n heiton sarjassa toteuttaa S n /n = n I k P n 2. k= Vastaava päättely voidaan yleistää mielivaltaisille jakaumille, ja saatua tulosta kutsutaan todennäköisyyden frekvenssitulkinnaksi. Lause 3.6. Jos X, X 2,... ovat riippumattomia ja X:n tavoin jakautuneita satunnaislukuja, niin mielivaltaisen arvojoukon B suhteellinen esiintyvyys tulossarjassa (X,..., X n ) toteuttaa suurilla n arvoilla. #{k n : X k B} n P P(X B) Todistus. Tulos perustellaan samalla argumentilla kuin yllä tehty kruunan suhteellisen esiintyvyyden analyysi, jossa vaihdetaan satunnaismuuttujan I k paikalle tapahtuman {X k B} indikaattori, eli {, jos X k B, I k = 0, muuten, Tällöin satunnaismuuttujat I, I 2,... ovat toisistaan riippumattomia ja samoin jakautuneita {0, }-arvoisia satunnaismuuttujia, odotusarvona E(I k ) = 0 P(I k = 0) + P(I k = ) = P(X B). Tulos siis seuraa soveltamalla heikkoa suurten lukujen lakia keskiarvoon n n k= I k. 38
40 Esimerkki 3.7 (Kruunien lukumäärä). Suurten lukujen lain perusteella kruunan suhteellinen esiintyvyys pitkässä heittosarjassa (X,..., X n ) on suurella todennäköisyydellä #{k n : X k = kruuna } n 2. Allaolevassa taulukossa on esitetty toteutunut kruunien lukumäärä, kun on simuloitu 8 kappaletta n = 000 kolikonheiton sarjaa. Toteutuneet kruunien osuudet ovat kohtuullisen lähellä arvoa 0.5, mutta vaihtelevat silti jonkun verran kyseisen arvon molemmin puolin. Simulaatio Kruunien lkm Kruunien osuus Satunnaismuuttujan muunnos Jos X on perusjoukolla S määritelty satunnaismuuttuja ja g(x) jokin X:n arvojoukolla määritelty funktio, niin Y = g(x). on samalla perusjoukolla S määritelty satunnaismuuttuja, joka voidaan tulkita yhdistettynä funktiona Y (s) = g(x(s)). Satunnaismuuttuja Y saa arvon g(x) silloin kun X saa arvon x. Tarkastellaan seuraavaksi kahden esimerkin näkökulmasta, miten satunnaismuuttujan muunnoksen odotusarvon voi laskea. Esimerkki 3.8 (Diskreetin satunnaisluvun neliö). Laske E(X 2 ), kun X:n jakauma on esitetty muodossa 0.5 k 0 2 P(X = k) Satunnaismuuttuja Y = X 2 on diskreetti satunnaisluku, jonka arvojoukko on {0,, 4} ja jakauma on 0.5 k 0 4 P(Y = k)
41 Näin ollen kysytty odotusarvo saadaan kaavasta E(Y ) = =.7. Esimerkki 3.9 (Jatkuvan satunnaisluvun kuutio). Laske E(X 3 ), kun X noudattaa välin [0, 2] tasajakaumaa tiheysfunktiona.5 f X (t) = { 2 0 < t < 2, 0, muuten. f x Satunnaisluvun Y = X 3 mahdolliset arvot sisältyvät joukkoon [0, 8]. Tiheysfunktion määrittämiseksi on ensiksi helpointa määrittää kertymäfunktio. Koska funktio g(x) = x 3 on kasvava, pätee X 3 t täsmälleen silloin kun X t /3. Näin ollen kertymäfunktion arvot pisteissä t [0, 8] saadaan laskettua kaavasta t /3 F Y (t) = P(X 3 t) = P(X t /3 ) = 0 2 ds = 2 t/3. Derivoimalla havaitaan, että Y :n tiheysfunktio voidaan esittää muodossa.5 f Y (t) = { 6 t 2/3, 0 < t < 8, 0, muuten. f x Kysytty odotusarvo saadaan integroimalla E(Y ) = t f Y (t)dt = t /3 dt = 6 ( /3 3 ) 4 04/3 = 2. Satunnaismuuttujan X 3 odotusarvon laskeminen esimerkissä 3.9 osoittautui melko työlääksi, koska laskutehtävän yhteydessä samalla määritettiin kertymäfunktio ja tiheysfunktio. Usein ollaan kiinnostuneita pelkästään satunnaismuuttujan muunnoksen odotusarvosta, jolloin alla esitetty yleinen odotusarvon laskukaava on hyödyllinen. Lause 3.0. Mille tahansa satunnaismuuttujan X arvojoukolla määritellylle reaalifunktiolle g pätee diskreetissä tapauksessa E(g(X)) = g(x) f X (x) (3.2) x S X ja jatkuvan jakauman tapauksessa E(g(X)) = 40 g(x) f X (x)dx. (3.3)
42 Todistus. Kun X:n jakauma on diskreetti ja sen arvot sisältyvät joukkoon S X, on myös Y = g(x) jakaumaltaan diskreetti ja sen arvot sisältyvät joukkoon S Y = {g(x) : x S X }. Lisäksi havaitaan, että Y saa arvon y täsmälleen silloin, kun X:n arvo osuu joukkoon B y = {x S X : g(x) = y}. Näin ollen Y :n tiheysfunktio määräytyy kaavalla f Y (y) = P(Y = y) = P(X B y ) = x B y f X (x) ja odotusarvo kaavalla E(Y ) = y f Y (y) = y S Y y S Y y x B y f X (x) = y S Y x B y yf X (x). Koska g(x) = y kaikilla x B y ja koska joukot B y, y S Y muodostavat joukon S X osituksen, voidaan oikeanpuolimmainen summa kirjoittaa muodossa yf X (x) = g(x)f X (x) = g(x)f X (x), x B y x B y x S X y S Y y S Y ja näin ollen yhtälö (3.2) pitää paikkansa. Jatkuva tapaus voidaan perustella samaan tapaan. Seuraavaksi nähdään, miten esimerkkien 3.8 ja 3.9 odotusarvot voidaan laskea helposti odotusarvon muunnoskaavojen (3.2) ja (3.3) avulla. Esimerkki 3. (Diskreetin satunnaisluvun neliö). Laske E(X 2 ), kun X:n jakauma on esitetty muodossa 0.5 x 0 2 f X (x) Soveltamalla odotusarvon muunnoskaavaa (3.2) funktioon g(x) = x 2 saadaan tulokseksi 2 E(X 2 ) = x 2 f X (x) = =.7. x=0 Esimerkki 3.2 (Jatkuvan satunnaisluvun kuutio). Laske E(X 3 ), kun X noudattaa välin [0, 2] tasajakaumaa tiheysfunktiona.5 f X (t) = { 2 0 < t < 2, 0, muuten. f x 4
43 Soveltamalla odotusarvon muunnoskaavaa (3.3) funktioon g(x) = x 3 saadaan tulokseksi 2 E(X 3 ) = x 3 f X (x)dx = x dx = ( ) 4 04 = 2. Odotusarvo E(X) tunnetaan myös nimellä X:n ensimmäinen momentti. Vastaavasti luku E(X 2 ) on X:n toinen momentti ja luku E(X 3 ) sen kolmas momentti. Samaan tapaan määritellään myös korkeamman kertaluvun momentit. Kuten yllä nähtiin, momentit voidaan laskea muunnoskaavoilla E(X n ) = x n f X (x) x S X ja E(X n ) = x n f X (x) dx. Esimerkki 3.3 (Entropia). Miten paljon informaatiota sisältyy viestiin, jossa paljastetaan että satunnaismuuttujan X arvo on x? On luontevaa ajatella, että viestissä on sitä enemmän informaatiota, mitä epätodennäköisemmästä tapahtumasta on kyse. Merkitään symbolilla I(p) informaatiota, joka sisältyy viestiin tapahtumasta, jonka todennäköisyys on p. Tällöin I(p):n tulee olla vähenevä p:n funktio. On myös luonteva olettaa, että jos tapahtumat X = x ja Y = y toteutuvat toisistaan riippumatta todennäköisyyksillä p ja q, niin tällöin näiden toteutumisen paljastava viesti sisältää informaatiota I(p) + I(q) yksikköä. Koska tapahtuma {X = x, Y = y} toteutuu todennäköisyydellä pq, on sitä vastaava informaatio I(pq), joten I(pq) = I(p) + I(q). Voidaan näyttää, että kaikki ei-negatiiviset, vähenevät ja ylläolevan yhtälön toteuttavat funktiot ovat muotoa I(p) = c log 2 (p), missä c on positiivinen vakio. Yleensä valitaan c =, jolloin informaation yksikkönä on bitti. Jos X on diskreetti satunnaismuuttuja arvojoukkona S X ja tiheysfunktiona f(x), niin silloin viesti {X = x} sisältää log 2 f(x) bittiä informaatiota. Vastaavasti viesti, joka sisältää satunnaismuuttujan X tuntemattoman arvon, sisältää odotusarvoisesti H(X) = x S X f(x) log 2 f(x) bittiä informaatiota. Ylläoleva luku on satunnaismuuttujan X Shannonin entropia ja se voidaan tulkita X:n muunnoksen odotusarvona Eg(X), missä g(x) = log 2 f(x). Minkä tahansa n:n alkion joukossa tasajakaumaa noudattavan satunnaismuuttujan entropia on ylläolevan kaavan mukaan H(X) = log 2 n. Näin ollen yhden kolikonheiton entropia on bitti ja yhden nopanheiton entropia log bittiä. 42
44 3.4 Odotusarvon laskusäännöt Tärkeimmät odotusarvon laskusäännöt voidaan johtaa seuraavan tuloksen avulla, joka yleistää yhden muuttujan muunnoskaavat (lause 3.0) kahden muuttujan tapaukseen. Lause 3.4. Mille tahansa X:n ja Y :n arvojoukkojen tulojoukolla määritellylle reaalifunktiolle g pätee diskreetin yhteisjakauman tapauksessa E(g(X, Y )) = g(x, y) f X,Y (x, y) (3.4) y S Y x S X ja jatkuvan yhteisjakauman tapauksessa E(g(X, Y )) = g(x, y) f X,Y (x, y) dx dy. (3.5) Todistus. Kaava (3.4) seuraa yhden muuttujan muunnoskaavasta (3.2), kun tulkitaan pari Z = (X, Y ) diskreetiksi satunnaismuuttujaksi, joka saa arvonsa tulojoukossa S Z = S X S Y ja jonka tiheysfunktio on X:n ja Y :n yhteisjakauman tiheysfunktio. Kaavan (3.5) perustelu vaatii teknisempiä mittateorian taustatietoja ja se sivuutetaan tässä yhteydessä. Lause 3.5. Kaikille satunnaismuuttujille X, Y ja kaikille reaaliluvuille a pätee E() =, (3.6) E(aX) = ae(x), (3.7) E(X + Y ) = E(X) + E(Y ). (3.8) Todistus. Kaava (3.6) on selvä, kun sen vasemmalla puolella esiintyvä ykkönen tulkitaan diskreettinä satunnaismuuttujana, joka saa arvon yksi todennäköisyydellä yksi. Oletetaan seuraavaksi, että X ja Y ovat diskreettejä, jolloin myös niiden yhteisjakauma on diskreetti. Tällöin soveltamalla odotusarvon muunnoskaavaa (3.4) funktioon g(x, y) = ax + by, ja yhteisjakauman reunatiheyksien laskentakaavoja (2.) (2.2) havaitaan, että 5 E(aX + by ) = (ax + by) f X,Y (x, y) x y = a ( ) x f X,Y (x, y) + b ( ) y f X,Y (x, y) x y y x = a x x f X (x) + b y = ae(x) + be(y ). y f Y (y) Kaava (3.7) seuraa sijoittamalla ylläolevaan yhtälöön b = 0. Kaava (3.8) puolestaan seuraa sijoittamalla a = ja b =. Kaavojen todistaminen ei-diskreeteille satunnaismuuttujille sivuutetaan. 5 mukavuussyistä merkitään summia x S X ja y S Y lyhyesti x ja y 43
45 3.5 Yhteenveto Odotusarvo E(X) ei ole satunnaismuuttujan tyypillinen arvo, vaan se kertoo likiarvon keskiarvolle, joka lasketaan suuresta määrästä X:n kanssa samoin jakautuneita riippumattomia satunnaismuuttujia. Odotusarvo on lineaarinen operaatio eli aina pätee E(aX) = ae(x), E(X + Y ) = E(X) + E(Y ), huolimatta siitä ovatko X ja Y riippuvia vai riippumattomia. Diskreetin ja jatkuvan jakauman odotusarvot ja muunnosten odotusarvot voidaan laskea seuraavan taulukon mukaisilla kaavoilla. Diskreetti jakauma Esim. joukon {,..., 6} tasajakauma Jakauma määräytyy tiheysfunktiosta kaavalla P(X A) = A (x)f X (x) x S X Jatkuva jakauma Esim. välin [0, 0] tasajakauma Jakauma määräytyy tiheysfunktiosta kaavalla P(X A) = A (x)f X (x) dx E(X) = x f X (x) E(X) = x S X x f X (x)dx Eg(X) = g(x) f X (x) Eg(X) = x S X g(x) f X (x)dx 3.6 Kommentteja Diskreettiä jakaumaa noudattavan satunnaismuuttujan odotusarvo on olemassa silloin, kun summa x S X xf X (x) suppenee, eli silloin kun vähintään toinen summista max{x, 0}f X (x) ja max{ x, 0}f X (x) x S X x S X on äärellinen. Vastaavasti jatkuvaa jakaumaa noudattavan satunnaismuuttujan odotusarvo on olemassa silloin, kun vähintään toinen integraaleista max{x, 0}f X (x) dx ja max{ x, 0}f X (x) dx 44
46 on äärellinen. Odotusarvojen muunnoskaavoissa (lause (3.0) ja lause (3.4)) tulee myös olettaa, että odotusarvot ovat olemassa. Käytännössä kaikilla stokastiikan ja tilastotieteen sovelluksiin liittyvillä satunnaismuuttujille on olemassa odotusarvo, ja lähes aina odotusarvo on äärellinen reaaliluku. Tietyissä sovelluksissa kuitenkin toisinaan kohdataan satunnaismuuttujia, joilla on olemassa odotusarvo, mutta odotusarvo on ääretön. Alla yksi sellainen. Esimerkki 3.6 (Pietarin paradoksi). Kasinolla on uhkapeli, jossa kolikkoa heitetään kunnes saadaan klaava. Pelin tuotto on 2 EUR, jos ensimmäinen klaava ilmestyy. heitolla 4 EUR, jos ensimmäinen klaava ilmestyy 2. heitolla 8 EUR, jos ensimmäinen klaava ilmestyy 3. heitolla... Paljonko olisit valmis maksamaan oikeudesta osallistua peliin? Pelin tuotto on g(t ) = 2 T, missä pelin kesto T on diskreetti satunnaisluku, jonka tiheysfunktio on f T (k) = (/2) k, k =, 2, 3,... Pelin tuoton odotusarvo on E(g(T )) = 2 (/2) (/2) (/2) 3 + =. Näin ollen pelistä ansaittava nettotuotto on positiivinen (ja vieläpä äärettömän suuri) huolimatta siitä, kuinka suuren summan joutuisi maksamaan oikeudesta osallistua peliin. Luvussa 3. esitettyä suurten lukujen lakia (lause 3.3) vahvempi tulos on vahva suurten lukujen laki, jonka mukaan samojen oletusten vallitessa keskiarvo n n k= X k lähestyy odotusarvoa µ todennäköisyydellä yksi. Suurten lukujen lakeja voidaan myös yleistää tapauksiin, joissa summattavat ovat riippuvia toisistaan. Suurten lukujen lain toteuttavaa satunnaisjonoa X, X 2,... kutsutaan ergodiseksi. 45
47 Luku 4 Keskihajonta ja korrelaatio 4. Jakauman varianssi ja keskihajonta Edellisessä luvussa opittiin, että satunnaismuuttujan odotusarvo on X:n jakauman massakeskipiste eli X:n mahdollisten arvojen todennäköisyyksillä painotettu keskiarvo. Odotusarvo ei kuitenkaan kerro mitään jakauman leveydestä, kuten seuraava esimerkki vahvistaa. Esimerkki 4. (Odotusarvon satunnaismuuttujia). Alla on kuvattu neljä diskreettiä jakaumaa, joilla kaikilla on sama odotusarvo, mutta ovat silti luonteeltaan hyvin erilaisia. Esimerkiksi X saa aina arvon, mutta Z ei milloinkaan. Satunnaismuuttuja W puolestaan saa lähes aina arvon 0. x x 0 2 P(X = x) P(Y = x) x 0 2 P(Z = x) x P(W = x) Koska odotusarvo yksinään antaa varsin puutteellisen kuvan jakauman luonteesta, tarvitaan jokin toinen tunnusluku kuvaamaan jakauman leveyttä. Satunnaisluvun toteutunut poikkeama odotusarvosta µ = E(X) on itsessään satunnaisluku X µ. Poikkeaman odotusarvo E( X µ ) on luonteva jakauman leveyden mittari, sillä suurten lukujen lain perusteella se voidaan tulkita likiarvoksi keskiarvolle n n k= X k µ, joka saadaan suuresta määrästä riippumattomia X:n tavoin jakautuneita satunnaislukuja. Näin määritelty jakauman itseinen keskipoikkeama on kuitenkin laskennan kannalta hankala suure, koska funktio x x ei ole derivoituva nollassa. 46
48 Käyttökelpoinen jakauman leveyttä kuvaava tunnusluku saadaan mittaamalla itseisen poikkeaman sijaan neliöllistä poikkeamaa odotusarvosta. Satunnaismuuttujan X jakauman varianssi eli keskineliöpoikkeama määritellään kaavalla Var(X) = E[(X µ) 2 ], missä µ = E(X) on jakauman odotusarvo. Suurten lukujen lain (lause 3.3) avulla voidaan varianssi tulkita likiarvona keskiarvolle n n k= (X k µ) 2, joka lasketaan suuresta määrästä riippumattomia X:n tavoin jakautuneita satunnaislukuja. Varianssi on optimoinnin ja numeerisen laskennan kannalta mukava tunnusluku, sillä funktiota x x 2 on helppo derivoida ja se saavuttaa ainoan miniminsä nollassa. Varianssia on kuitenkin hankala tulkita intuitiivisesti, sillä se mittaa poikkeamien suuruutta neliöllisissä yksiköissä, esim. euroarvoisen osakekurssin varianssin mittayksikkö on neliöeuro. Tulkinnan helpottamiseksi varianssin ilmaisema tunnusluku normitetaan alkuperäisiin yksiköihin ottamalla neliöjuuri. Satunnaismuuttujan X jakauman keskihajonta eli normitettu keskineliöpoikkeama määritellään kaavalla SD(X) = Var(X) eli SD(X) = ( E[(X µ) 2 ]) /2. Odotusarvo ja keskihajonta ovat kaksi tärkeintä jakaumaa kuvaavaa tunnuslukua. Niitä on tapana merkitä kreikkalaisilla kirjaimilla µ = E(X) ja σ = SD(X) silloin kun kontekstin pohjalta on selvää, minkä satunnaismuuttujan jakaumasta on kyse. Luvun 3.3 muunnoskaavojen (3.2) (3.3) mukaan keskihajonta saadaan tiheysfunktion f(x) avulla laskettua diskreetin jakauman tapauksessa ( ) /2 σ = (x µ) 2 f(x) (4.) x S X ja jatkuvan jakauman tapauksessa ( /2 σ = (x µ) 2 f(x) dx). (4.2) Esimerkki 4.2 (Odotusarvon satunnaismuuttujia). Laske esimerkin 4. satunnaismuuttujien X, Y, Z, W jakaumien keskihajonnat. Koska jokaisen satunnaismuuttujan odotusarvo on, niin soveltamalla ylläolevaa diskreetin jakauman keskihajonnan laskentakaavaa, saadaan esimerkiksi satunnaismuuttujan Y keskihajonnaksi SD(Y ) = ( (0 ) ( )2 3 + (2 )2 3) /2 = Muut keskihajonnat voidaan laskea samaan tapaan, jolloin saadaan ao. taulukon mukaiset tulokset (kahden desimaalin tarkkuudella). lyhenne SD tulee termin keskihajonta englanninkielisestä muodosta standard deviation 47
49 Satunnaismuuttuja Odotusarvo Keskihajonta X 0 Y 0.82 Z.00 W Lause 4.3. Satunnaismuuttujan X jakauman keskihajonta saadaan kaavasta ( ) /2. SD(X) = E(X 2 ) µ 2 (4.3) Todistus. Kirjoittamalla poikkeaman neliö muodossa (X µ) 2 = X 2 2µX +µ 2 ja soveltamalla odotusarvon lineaarisuutta havaitaan, että E[(X µ) 2 ] = E[X 2 2µX + µ 2 ] = E[X 2 ] E[2µX] + E[µ 2 ] = E[X 2 ] 2µE[X] + µ 2 E[] = E[X 2 ] µ 2. Näin ollen Var(X) = E[X 2 ] µ 2 ja väite seuraa ottamalla neliöjuuret. Esimerkki 4.4 (Metron odotusaika). Jos seuraavan metron saapumiseen kuluva aika noudattaa välin [0, 0] tasajakaumaa, niin saapumisajan odotusarvo on µ = 5. Laske keskihajonta. Merkitään odotusaikaa satunnaismuuttujana X, jolloin odotusajan toinen momentti on 0 E(X 2 ) = x 2 f(x)dx = x 2 0 dx = ( ) Näin ollen kaavan (4.3) mukaan 0 SD(X) = E(X 2 ) µ Seuraava tulos kertoo, että keskihajonta on jakauman tunnuslukuna siirtoinvariantti: se ei muutu jos satunnaismuuttujaan lisätään tai vähennetään jokin vakio. Lisäksi se kertoo, että keskihajonta on nolla sellaisille satunnaismuuttujille, joissa ei ole lainkaan satunnaisvaihtelua. On myös mahdollista myös osoittaa, että jokaisen satunnaismuuttujan, jonka keskihajonta on nolla, täytyy olla vakio todennäköisyydellä yksi. Lause 4.5. Kaikilla reaaliluvuilla a ja b pätee SD() = 0, (4.4) SD(aX) = a SD(X), (4.5) SD(aX + b) = a SD(X). (4.6) 48
50 Todistus. Normitetulle ja siirretylle satunnaismuuttujalle Y = ax + b pätee odotusarvon lineaarisuuden nojalla E(Y ) = aµ + b, missä µ = E(X). Näin ollen Y :n neliöity poikkeama odotusarvostaan voidaan kirjoittaa muodossa (Y E(Y )) 2 = (ax + b (aµ + b)) 2 = a 2 (X µ) 2. Näin ollen ) E ((Y E(Y )) 2 ) = E (a 2 (X µ) 2 ) = a 2 E ((X µ) 2, mikä voidaan kirjoittaa myös muodossa Var(Y ) = a 2 Var(X). Kaava (4.6) seuraa tästä ottamalla molemmilta puolilta neliöjuuret. Kaava (4.4) saadaan sijoittamalla a = 0 ja b = kaavaan (4.6). Kaava (4.5) saadaan vastaavasti sijoittamalla b = Keskihajonta ja satunnaisvaihtelu Seuraava venäläismatemaatikko Pafnuty Chebyshevin (82 894) mukaan nimetty epäyhtälö kiteyttää, mitä jakauman keskihajonta kertoo satunnaismuuttujan arvoista. Lause 4.6 (Chebyshevin epäyhtälö). Satunnaismuuttujan X arvo osuu kahden keskihajonnan σ sisälle odotusarvostaan µ vähintään todennäköisyydellä 3 4, ja yleisemmin P(X = µ ± kσ) k 2 kaikilla k. Todistus. Tehdään todistus ensiksi jatkuvalle jakaumalle, jolla on tiheysfunktio f(x). Koska (x µ) 2 > k 2 σ 2 joukossa A = {x : x µ > kσ}, saadaan kaavan (4.2) avulla jakauman varianssille alaraja σ 2 = (x µ) 2 f(x) dx (x µ) 2 f(x) dx A k 2 σ 2 f(x) dx = k 2 σ 2 P(X A). A Jakamalla ylläolevat termit luvulla k 2 σ 2, havaitaan että P(X A) k 2, joten P(X = µ ± kσ) = P(X A) k 2. Erityisesti yo. epäyhtälöstä seuraa, että X osuu k = 2 keskihajonnan sisälle odotusarvostaan vähintään todennäköisyydellä 3. Diskreetin jakauman tapaus 4 saadaan vaihtamalla ylläolevassa argumentissa integraalit summiksi. 49
51 Esimerkki 4.7 (Tiedostopalvelin). Palvelimelta ladatun satunnaisen tiedoston koko on odotusarvoltaan 000 kb ja keskihajonnaltaan 200 kb. Onko todennäköistä vai epätodennäköistä, että satunnaisen tiedoston koko osuu (a) välille kb, (b) välille kb? Chebyshevin epäyhtälön mukaan P(X [600, 400]) = P(X = µ ± 2σ) 3 4, joten tiedoston koko osuu välille kb melko suurella (yli 75%) todennäköisyydellä. Jälkimmäiseen (b)-kohdan kysymykseen on pelkän odotusarvon ja keskihajonnan pohjalta vaikea sanoa mitään, sillä tässä yhteydessä Chebyshevin epäyhtälö kertoo vain itsestään selvän tosiasian P(X [800, 200]) = P(X = µ ± σ) 2 = 0. Allaolevilla diskreeteillä jakaumilla on kaikilla sama odotusarvo µ = 000 ja sama keskihajonta σ = 200. x f (x) x f 2 (x) x f 3 (x) Näiden jakaumien tapauksessa voidaan satunnaisen tiedoston koon todennäköisyys osua välille kb ja kb suoraan lukea kyseisen jakauman taulukosta. Saadut arvot (yhden prosenttiyksikön tarkkuudella) on tiivistetty allaolevaan taulukkoon: Jakauma P(800 X 200) P(600 X 400) f (x) % 00% f 2 (x) 75% 75% f 3 (x) 99% 99% Taulukosta nähdään, että tiedoston koon todennäköisyys osua välille yhden keskihajonnan sisälle odotusarvosta voi olla hyvin pieni (noin %) tai hyvin suuri (noin 99%). Todennäköisyys osua välille kahden keskihajonnan sisälle odotusarvosta on kuitenkin kaikissa tapauksissa vähintään 75%, kuten Chebyshevin epäyhtälö vahvistaa. 4.3 Yhteisjakauman kovarianssi ja korrelaatio Keskihajonta on jakauman tunnusluku, joka mittaa yhden muuttujan satunnaisvaihtelua, mutta ei kerro mitään useamman satunnaismuuttujan yhteisvaihtelusta. Yhteisvaihtelun suuntaa ja voimakkuutta voidaan kuvata yhteisjakauman kovarianssilla ja korrelaatiolla. Satunnaismuuttujien X ja Y yhteisjakauman kovarianssi määritellään kaavalla [ ] Cov(X, Y ) = E (X µ X )(Y µ Y ), (4.7) 50
52 missä µ X = E[X] ja µ Y = E[Y ]. Varianssin tavoin myös kovarianssi mittaa vaihtelua neliöidyissä yksiköissä. Kovarianssia ei normiteta ottamalla neliöjuurta, sillä toisin kuin varianssi, kovarianssi voi olla negatiivinen. Luonteva tapa normittaa kovarianssi on jakaa se X:n ja Y :n keskihajonnoilla. Näin saatu yksikötön tunnusluku Cor(X, Y ) = Cov(X, Y ) (4.8) SD(X) SD(Y ) on X:n ja Y :n yhteisjakauman korrelaatio. Se mittaa X:n ja Y :n yhteisvaihtelun suuntaa ja voimakkuutta normitetuissa yksiköissä. Luvun 3 muunnoskaavojen (3.4) (3.5) mukaan kovarianssi saadaan tiheysfunktion f(x, y) avulla laskettua diskreetin yhteisjakauman tapauksessa kaavalla Cov(X, Y ) = (x µ X )(y µ Y )f(x, y) (4.9) y S Y x S X ja jatkuvan yhteisjakauman tapauksessa kaavalla Cov(X, Y ) = (x µ X )(y µ Y )f(x, y) dx dy. (4.0) Seuraava laskukaava helpottaa kovarianssin laskemista käytännön tilanteissa. Lause 4.8. Kovarianssi voidaan laskea kaavasta Cov(X, Y ) = E(XY ) E(X)E(Y ). (4.) Todistus. Kirjoittamalla (X µ X )(Y µ Y ) = XY µ X Y µ Y X + µ X µ Y soveltamalla odotusarvon lineaarisuutta havaitaan, että Cov(X, Y ) = E[(X µ X )(Y µ Y )] = E[XY ] µ X E[Y ] µ Y E[X] + µ X µ Y = E[XY ] µ X µ Y µ Y µ X + µ X µ Y = E[XY ] µ X µ Y. ja Kovarianssi tarvitaan satunnaismuuttujien summien ja lineaarikombinaatioiden keskihajontojen laskemiseen. Laskemista helpottavat kovarianssin hyvät algebralliset ominaisuudet, jotka on listattu alla. Lause 4.9. Kovarianssille pätee ja yleisesti Cov(Y, X) = Cov(X, Y ), (4.2) Cov(aX, Y ) = a Cov(X, Y ), (4.3) Cov(X + Y, Z) = Cov(X, Z) + Cov(Y, Z), (4.4) ( m Cov a i X i, i= n ) b j Y j j= = 5 m i= n a i b j Cov(X i, Y j ). (4.5) j=
53 Todistus. Symmetrisyys (4.2) seuraa suoraan kovarianssin määritelmästä (4.7). Kovarianssin laskentakaavan (4.) ja odotusarvon lineaarisuuden perusteella puolestaan havaitaan, että Cov(aX + by, Z) = E[(aX + by )Z] E[aX + by ]E[Z] = ae[xz] + be[y Z] (ae[x] + be[y ])E[Z] = ae[xz] ae[x]e[z] + be[y Z] be[y ]E[Z] = a Cov(X, Z) + b Cov(Y, Z). Sijoittamalla tähän b = 0 ja Z = Y saadaan kaava (4.3). Sijoittamalla tähän a = ja b = saadaan kaava (4.4). Yleinen summakaava (4.5) seuraa soveltamalla kaavoja (4.2) (4.4) sopivasti peräkkäin. 4.4 Korrelaatio ja stokastinen riippuvuus Lause 4.0. Stokastisesti riippumattomille satunnaismuuttujille X ja Y pätee Cov(X, Y ) = 0 ja Cor(X, Y ) = 0. Todistus. Tarkastellaan satunnaismuuttujia X ja Y, joiden yhteisjakauma on diskreetti ja tiheysfunktio f X,Y (x, y). Kun X ja Y ovat stokastisesti riippumattomat, pätee lauseen 2.0 mukaan f X,Y (x, y) = f X (x)f Y (y). Soveltamalla muunnoksen odotusarvon laskukaavaa (3.4) funktioon g(x, y) = xy, saadaan E(XY ) = xy f X,Y (x, y) x y = xy f X (x)f Y (y) x y ( ) ( ) = xf X (x) yf Y (y) = E(X)E(Y ). x Yhdistämällä ylläoleva tulos kovarianssin laskukaavaan (4.), nähdään että Näin ollen myös Cor(X, Y ) = 0. Cov(X, Y ) = E(XY ) E(X)E(Y ) y = E(X)E(Y ) E(X)E(Y ) = 0. Lauseen 4.0 mukaan stokastinen riippumattomuus takaa korreloimattomuuden, mutta sama ei päde kääntäen. Seuraava esimerkki osoittaa, että korrelaatio voi olla nolla tilanteessa, jossa muuttujat X ja Y ovat stokastisesti riippuvat jopa niin vahvasti, että ne määräytyvät tarkasti toisistaan epälineaarisen funktion välityksellä. 52
54 Esimerkki 4. (Satunnaismuuttuja ja sen neliö). Laske satunnaismuuttujien X ja Y korrelaatio, kun X noudattaa joukon {, 0, } tasajakaumaa ja Y = X 2. Lasketaan ensiksi yhteisjakauman kovarianssi ja sen pohjustukseksi odotusarvot E(X), E(Y ) ja E(XY ). Odotusarvon määritelmästä ja muunnoskaavan (3.2) mukaan E(X) = 3 ( ) = 0, E(Y ) = E(X 2 ) = 3 ( ) = 2 3, E(XY ) = E(X 3 ) = 3 ( ) = 0. Näin ollen laskukaavan (4.) avulla Cov(X, Y ) = E(XY ) E(X)E(Y ) = = 0, joten myös Cor(X, Y ) = Korrelaatio ja lineaarinen riippuvuus Korrelaation olemusta parhaiten kuvaa seuraava tulos, jonka mukaan korrelaation ääriarvot + ja - vastaavat determinististä lineaarista riippuvuutta. Lause 4.2. Satunnaismuuttujien X ja Y korrelaatiolle pätee aina Cor(X, Y ). Lisäksi Cor(X, Y ) = { +, jos ja vain jos Y = ax + b jollain a > 0,, jos ja vain jos Y = ax + b jollain a < 0. Todistus. Merkitään X:n ja Y :n odotusarvoja µ X, µ Y ja keskihajontoja σ X, σ Y, sekä yhteisjakauman korrelaatiota ρ = Cor(X, Y ). Tarkastellaan funktiota ] p(x) = E [(xu + V ) 2, (4.6) missä U = X µ X ja V = Y µ Y. Kun huomataan, että E(U 2 ) = σx 2, E(V 2 ) = σy 2 ja E(UV ) = Cov(X, Y ) = ρσ Xσ Y, voidaan ylläoleva funktio myös kirjoittaa muodossa p(x) = σxx ρσ X σ Y x + σy 2. 53
55 Funktio p(x) on siis polynomi, jonka nollakohdat määräytyvät toisen asteen yhtälön ratkaisukaavasta jonka diskriminantti on x = 2ρσ Xσ Y ± D, 2σX 2 D = (2ρσ X σ Y ) 2 4σ 2 Xσ 2 Y = 4σ 2 Xσ 2 Y ( ρ 2 ). Koska yhtälön (4.6) mukaan p(x) 0 kaikilla x, havaitaan että diskriminantti toteuttaa D 0. Tämä puolestaan on mahdollista vain silloin kun ρ. Oletetaan seuraavaksi, että ρ =. Tällöin D = 0, ja polynomilla p(x) on yksikäsitteinen nollakohta pisteessä x = 2ρσ Xσ Y 2σ 2 X = ρ σ Y σ X. Tässä pisteessä yhtälön (4.6) mukaan pätee E[(xU +V ) 2 ] = 0. Ei-negatiiviselle satunnaismuuttujalle (xu + V ) 2 tämä on mahdollista vain, jos (xu + V ) 2 = 0 todennäköisyydellä yksi. Varmuudella siis pätee ρ σ Y σ X U + V = 0, eli Y µ Y = ρ σ Y σ X (X µ X ). Ylläolevan yhtälön voi kirjoittaa muodossa Y = ax +b, kun valitaan a = ρ σ Y σ X b = µ Y aµ X. Tällöin vakion a merkki määräytyy korrelaation ρ merkistä. ja Esimerkki 4.3 (Kaksi lineaarikombinaatiota). Merkitään X = a U + a 2 U 2, Y = b U + b 2 U 2, missä U ja U 2 ovat stokastisesti riippumattomat ja keskihajonnaltaan yksi. Määritä X:n ja Y :n korrelaatio. Lasketaan ensiksi X:n ja Y :n kovarianssi. Koska U ja U 2 ovat stokastisesti riippumattomat, pätee lauseen 4.0 mukaan Cov(U, U 2 ) = Cov(U 2, U ) = 0. Näin ollen kovarianssin lineaarisuudesta (4.5) seuraa Cov(X, Y ) = Cov(a U + a 2 U 2, b U + b 2 U 2 ) = a b Cov(U, U ) + (a b 2 + a 2 b ) Cov(U, U 2 ) + a 2 b 2 Cov(U 2, U 2 ) = a b Cov(U, U ) + a 2 b 2 Cov(U 2, U 2 ) = a b Var(U ) + a 2 b 2 Var(U 2 ). 54
56 Koska U ja U 2 ovat keskihajonnoiltaan ja näin myös variansseiltaan yksi, päätellään että Cov(X, Y ) = a b + a 2 b 2. Korrelaation määrittämiseksi tulee vielä laskea X:n ja Y :n keskihajonnat. Samaan tapaan kuin yllä, voidaan päätellä että Cov(X, X) = a 2 + a 2 2, Cov(Y, Y ) = b 2 + b 2 2, joten SD(X) = Cov(X, X) /2 = (a 2 + a 2 2) /2 ja SD(Y ) = (b 2 + b 2 2) /2. Näin ollen kysytty korrelaatio on Cor(X, Y ) = a b + a 2 b 2 (a 2 + a 2 2) /2 (b 2 + b 2 2) /2. Jos kertoimet a = (a, a 2 ) ja b = (b, b 2 ) tulkitaan 2-ulotteisiksi vektoreiksi, voidaan korrelaatio kirjoittaa vektoreiden pistetulon ja pituuksien avulla myös muodossa a b Cor(X, Y ) = a b. Alla on simuloitu 00 lukuparia X:n ja Y :n yhteisjakaumasta kolmessa eri tapauksessa, kun U ja U 2 arvottu välin [ 3, 3] jatkuvasta tasajakaumasta. Vasemmalla, kun korrelaatio on reilusti negatiivinen (ρ = 0.60), X:n suuret arvot toteutuvat usein käsi kädessä Y :n pienten arvojen kanssa. Oikealla, kun korrelaatio on reilusti positiivinen (ρ = 0.80), X:n suuret arvot voidaan usein rinnastaa Y :n suuriin arvoihin ρ = 0.60 ρ = 0.28 ρ = 0.80 a = (, 7), b = (5, 5) a = (, 7), b = (7, ) a = (, 7), b = (5, 5) 4.6 Yhteenveto Odotusarvo ja keskihajonta ovat kaksi tärkeintä yhden muuttujan jakaumaa kuvaavaa tunnuslukua, joita usein merkitään µ X = E(X) ja σ X = SD(X). Odo- 55
57 tusarvo kuvastaa jakaumasta tuotettujen satunnaislukujen keskiarvoista sijaintia ja keskihajonta niiden normitettua keskiarvoista poikkeamaa odotusarvosta. Odotusarvo ja keskihajonta voidaan laskea ao. kaavojen avulla. Diskreetti jakauma Jatkuva jakauma µ = x f(x) µ = x f(x)dx x ( /2 ( ) /2 σ = (x µ) f(x)) 2 σ = (x µ) 2 f(x) dx x Satunnaismuuttujan arvo osuu kahden keskihajonnan sisälle odotusarvostaan vähintään todennäköisyydellä 75%. Satunnaismuuttujien yhteisjakauman korrelaatio kuvaa yhteisjakaumasta tuotettujen satunnaisten lukuparien keskiarvoista lineaarista riippuvuutta. Korrelaatiota merkitään usein symbolilla ρ X,Y = Cor(X, Y ) ja se voidaan laskea kovarianssin normitettuna versiona Cor(X, Y ) = Cov(X, Y ) SD(X) SD(Y ). Korrelaatio kuuluu aina välille [, ] ja saa arvon nolla silloin, kun X ja Y ovat stokastisesti riippumattomat. Korrelaatio voi olla nolla myös toisistaan stokastisesti riippuville satunnaismuuttujille. Satunnaismuuttujien yhteisjakauman kovarianssin voi laskea diskreetissä tapauksessa kaavalla Cov(X, Y ) = (x µ X )(y µ Y ) f(x, y) x y ja jatkuvassa tapauksessa kaavalla Cov(X, Y ) = (x µ X )(y µ Y ) f(x, y) dxdy. Kovarianssi on operaattorina symmetrinen ja molempien argumenttiensa suhteen lineaarinen: Cov(Y, X) = Cov(X, Y ), ( m n ) m n Cov a i X i, b j Y j = a i b j Cov(X i, Y j ) i= j= i= j= 56
58 Luku 5 Satunnaismuuttujien summa ja keskiarvo 5. Satunnaismuuttujien summa Kahden satunnaismuuttujan summa X + Y on satunnaismuuttuja, jonka jakauma voidaan määrittää X:n ja Y :n yhteisjakaumasta f X,Y (x, y). Summan tiheysfunktioksi saadaan f X+Y (s) = { x f X,Y (x, s x) (diskreetti yhteisjakauma), f X,Y (x, s x) dx (jatkuva yhteisjakauma). Jos summan termit ovat stokastisesti riippumattomat, voidaan ylläolevat kaavat kirjoittaa tiheysfunktioiden f X (x) ja f Y (y) avulla muodossa f X+Y (s) = { x f X(x)f Y (s x) (diskreetti yhteisjakauma), f X(x)f Y (s x) dx (jatkuva yhteisjakauma). (5.) Esimerkki 5. (Kahden satunnaismuuttujan summa). Satunnaismuuttujat X ja X 2 ovat toisistaan riippumattomat ja noudattavat lukujoukon {0,, 2,... } geometrista jakaumaa parametrina a = 4/5 ja tiheysfunktiona 0.2 f(x) = ( a)a x Määritä satunnaismuuttujan X + X 2 jakauma. Kaavan (5.) yhtälöt voidaan tulkita tiheysfunktioiden f X ja f Y konvoluutioina. Yleisesti funktioiden f ja g konvoluutio h = f g määritellään diskreetissä tilanteessa kaavalla h(z) = x f(x)g(z x) ja jatkuvassa tilanteessa kaavalla h(z) = f(x)g(z x) dx. 57
59 Satunnaismuuttujan X + X 2 arvojoukko on {0,, 2,... } ja tiheysfunktio saadaan määritettyä summakaavasta (5.). Koska f(x) = 0 pisteissä x < 0, f X +X 2 (s) = x f(x)f(s x) = s ( a)a x ( a)a s x. x=0 Näin ollen summan jakauma voidaan esittää tiheysfunktiona 0.2 f X +X 2 (s) = ( a) 2 (s + )a s Monen satunnaismuuttujien summa S n = X + + X n ja keskiarvo n S n ovat satunnaismuuttujia, joiden avulla mallinnetaan satunnaisotannan havaintojen esiintyvyyksiä, kohinaisten mittausten keskiarvoja sekä talouden tuottoja kustannuskertymiä. Silloin kun summan termit ovat stokastisesti riippumattomia ja satunnaismuuttujan X kanssa samoin jakautuneita, voidaan summan S n jakauma määrittää X:n jakaumasta. Yksinkertaisimmassa tilanteessa summan termit ovat {0, }-arvoisia ja jakautuneet tiheysfunktion { f(x) = ( p) x p x p, x = 0, = p, x =, mukaan. Tämä on Bernoulli-jakauma parametrina p [0, ], missä parametri p kertoo tapahtuman X = todennäköisyyden. Tällöin summa S n saa arvon x täsmälleen silloin, kun summattavista x saavat arvon ja loput n x saavat arvon 0. Koska n:stä summattavasta voidaan valita ( n x) tavalla x arvon saavaa termiä, havaitaan että summan S n jakauma noudattaa tiheysfunktiota ( ) n f(x) = p x ( p) n x, x = 0,,..., n. x Tämä on binomijakauma parametreina n ja p [0, ]. Stokastisesti riippumattomien ja samoin jakautuneiden {0, }-arvoisten satunnaismuuttujien summan jakauma on siis aina binomijakauma. Esimerkki 5.2. Monivalintakokeessa on 20 kysymystä, joista jokaisessa pitää valita yksi oikea vastaus kolmen vaihtoehdon joukosta. Mikä on todennäköisyys saada kokeesta umpimähkään arvaamalla vähintään 9 oikein? Oikeiden vastausten lukumäärä voidaan esittää summana S n = X + +X n, jossa n = 20 ja {, jos kysymyksen i vastaus on oikein, X i = 0, muuten. 58
60 Umpimähkään arvatessa ovat yksittäisten kysymysten vastaukset toisistaan riippumattomat, ja yksittäinen vastaus on oikein todennäköisyydellä. Näin ollen 3 termit X,..., X 20 ovat toisistaan riippumattomat ja Bernoulli-jakautuneet parametrina p =. Tämän seurauksena summa S 3 n noudattaa binomijakaumaa parametreina n = 20 ja p = ja tiheysfunktiona f(x) = ( ) 20 (/3) x ( /3) 20 x. x 0. Todennäköisyys saada vähintään 9 oikein on siis 0.0 P(S n 9) = f(9) + f(20) Tiheysfunktion arvot pisteissä x 7 ovat niin pieniä, että ne eivät näy ylläolevassa tiheysfunktion kuvaajassa. Yleisessä tapauksessa, jossa summattavat eivät ole binaariarvoisia, ovat summan jakauman määrittämiseen tarvittavat konvoluutiokaavat ovat yleensä niin monimutkaisia, että summan jakauman lauseketta ei voi kirjoittaa siistissä suljetussa muodossa. Silloin kun summattavien määrä on suuri, voidaan summan jakaumaa kuitenkin arvioida hyvin tarkasti normaali- tai Poisson-jakauman avulla. Tässä luvussa opitaan soveltamaan normaali- ja Poisson-jakaumia käytännön tilanteissa esiintyvien summien ja keskiarvojen analysoimiseen. 5.2 Summan keskihajonta Luvussa 3 esitetty suurten lukujen laki (lause 3.3) kertoo, että keskiarvo suuresta määrästä riippumattomia X:n tavoin jakautuneita satunnaislukuja (odotusarvo µ, keskihajonta σ) on suurella todennäköisyydellä likimain n n X i µ. i= Suurten lukujen laki ei kuitenkaan kerro sitä, miten tarkka kyseinen arvio on, eikä sitä, miten summattavien lukumäärä n ja summattavien keskihajonta σ vaikuttavat approksimaation tarkkuuteen. Approksimaation tarkkuutta voidaan mitata laskemalla summan keskihajonta ( ) ( n n ) SD X i = n n SD X i. i= i= 59
61 Tämän auki laskemiseksi tarvitaan laskentakaava summan keskihajonnalle. Tarkastellaan ensiksi kahden muuttujan tapausta seuraavassa esimerkissä. Esimerkki 5.3 (Kahden satunnaismuuttujan summa). Mitä voidaan sanoa summan X + Y keskihajonnasta, kun tunnetaan odotusarvot µ X = ja µ Y = sekä keskihajonnat σ X = 2 ja σ Y = 3? Kovarianssin lineaarisuuden ja symmetrisyyden perusteella Var(X + Y ) = Cov(X + Y, X + Y ) = Cov(X, X) + Cov(Y, X) + Cov(X, Y ) + Cov(Y, Y ) = Var(X) + 2 Cov(X, Y ) + Var(Y ). Ottamalla ylläolevan yhtälön molemmilta puolilta neliöjuuret ja kirjoittamalla oikean puolen kovarianssitermi muodossa Cov(X, Y ) = ρσ X σ Y, missä ρ = Cor(X, Y ) on X:n ja Y :n korrelaatio, saadaan summan keskihajonnalle kaava σ X+Y = ( σ 2 X + 2ρσ X σ Y + σ 2 Y ) /2. (5.2) Summan keskihajontaa ei siis voi laskea tuntematta korrelaatiota. Soveltamalla kaavaan (5.2) korrelaation rajoja ρ, saadaan summan keskihajonnalle kuitenkin estimaatit σ X σ Y σ X+Y σ X + σ Y, jotka kysymyksenasettelun lukuarvoilla vastaavat tapausta σ X+Y 5. Jos X ja Y voidaan olettaa stokastisesti riippumattomiksi, voidaan kaavaan (5.2) sijoittaa ρ = 0, jolloin σ X+Y = ( ) σx 2 + σy 2 /2, mikä kysymyksenasettelun lukuarvoilla tuottaa σ X+Y 3.6. Ylläolevassa esimerkissä johdettu summan keskihajonnan lauseke (5.2) yleistyy melko pienellä vaivalla myös kahta useamman satunnaismuuttujan summille. Lause 5.4. Satunnaismuuttujien X,..., X n summan keskihajonta saadaan kaavasta ( ) ( SD X i = σi 2 + ) /2, σ i σ j ρ i,j (5.3) i i i missä σ i = SD(X i ) ja ρ i,j = Cor(X i, X j ). j:j i Todistus. Kovarianssin lineaarisuudesta ( ) ( Var X i = Cov X i, ) X j i i j = Cov(X i, X j ) i j = Cov(X i, X i ) + Cov(X i, X j ) i i j:j i = σi 2 + σ i σ j ρ i,j, i i j:j i 60
62 joten väite seuraa ottamalla ylläolevasta yhtälöstä neliöjuuret. Tärkeä erityistapaus ylläolevasta tuloksesta on tilanne, missä X,..., X n ovat korreloimattomia (ρ i,j = 0) ja samoin jakautuneita (σ i = σ), jolloin kaava (5.3) pelkistyy muotoon ( n ) SD X i = σ n. (5.4) i= Ylläoleva kaava on yksi stokastiikan tärkeimpiä tuloksia, sillä se kertoo tarkasti, miten riippumattomien ja samoin jakautuneiden satunnaismuuttujien summan keskihajonta käyttäytyy suhteessa summattavien lukumäärään. Erityisen merkillepantavaa on se, että suurilla n:n arvoilla on summan keskihajonta mitättömän pieni suhteessa summan odotusarvoon ( n ) E X i i= = µn. Esimerkki 5.5 (Noppapeli). Pelataan n kierrosta noppapeliä, jossa yksittäisellä kierroksella voittaa nopan silmäluvun mukaisen määrän euroja. Laske kertyneen tuoton S = X + + X n odotusarvo ja keskihajonta tapauksissa n = 0, 00, 000. Yhden kierroksen tuoton odotusarvo on µ X = = 3.5 ja keskihajonta on kahden desimaalin tarkkuudella σ X = ( 6 ( µ X) (2 µ X) ) /2 6 (6 µ X) 2 =.7. Koska pelikierrokset ovat stokastisesti riippumattomat ja samoin jakautuneet, saadaan kertyneen tuoton odotusarvoksi µ S = µ X n ja keskihajonnaksi σ S = σ X n. Tulokset eri n:n arvoilla ovat alla. n µ S σ S Allaolevassa kuvassa on simuloimalla tuotettuja kertyneen tuoton S n jakaumia. Jokaisessa kuvassa havaitaan, että käytännössä kaikki simuloidut arvot sisältyvät neljän keskihajonnan sisään odotusarvosta. Chebyshevin epäyhtälön (lause 4.6) mukaan tiedetään, että näin tapahtuu vähintään todennäköisyydellä 5 = 93.75%. 6 6
63 n = 0 n = 00 n = 000 Esimerkki 5.6 (Lentoyhtiö). 300 lentolippua myydään lennolle, jossa on 290 matkustajapaikkaa. Arviolta 5% lipun ostaneista jää saapumatta lennolle, toisistaan riippumattomasti. Millä todennäköisyydellä kaikki saapujat mahtuvat lennolle? Lennolle saapuvien matkustajien lukumäärä voidaan kirjoittaa satunnaismuuttujien summana T = X + + X 300, missä {, jos lentolipun i ostaja saapuu lennolle, X i = 0, muuten. Indikaattorimuuttujan X i odotusarvo on µ X = = 0.95 ja keskihajonta σ X = ( 0.05 (0 µ X ) ( µ X ) 2 ) /2 = Koska satunnaismuuttujat X, X 2,... ovat stokastisesti riippumattomat ja samoin jakautuneet, saadaan saadaan satunnaismuuttujan T odotusarvoksi µ T = µ X 300 = 285 ja keskihajonnaksi σ T = σ X 300 = Kaikki saapujat mahtuvat lennolle silloin, kun N 290. Tämän tapahtuman todennäköisyyttä voidaan Chebyshevin epäyhtälön avulla arvioida muodossa P(T 290) P(T [280, 290]) = P(T = µ T ±.32σ T ) %. Näin ollen kaikki saapujat mahtuvat lennolle vähintään todennäköisyydellä 42.6%. Tämä alaraja kuulostaa hyvin pessimistiseltä arviolta. Koska T on riippumattomien ja samoin jakautuneiden {0, }-arvoisten satunnaismuuttujien summa, tunnetaan sen jakauma itse asiassa tarkasti. Kuten kappaleessa 5. todettiin, noudattaa T binomijakaumaa parametreina n = 300 ja p = Tietokoneella voidaan laskea tarkka todennäköisyys P(T 290) = 93.5%. 62
64 Binomijakaumalle Chebyshevin epäyhtälö antaa siis ylipessimistisiä arvioita 2 Alla on kuva satunnaismuuttujan T jakauman tiheysfunktiosta. Tiheysfunktion arvot ovat aidosti positiivisia kaikilla x {0,,..., 300}, mutta tähtitieteellisen pieniä kun x 250, joten ne eivät näy kuvassa Satunnaismuuttujien keskiarvo ja suurten lukujen laki Summan keskihajonnan avulla voidaan todistaa vahvempi versio aiemmasta suurten lukujen laista (lause 3.3). Summattavien ei tarvitse olla stokastisesti riippumattomia, vaan riittää että ne ovat korreloimattomia. Lasketaan ensiksi satunnaismuuttujien keskiarvon n n i= X i odotusarvo ja keskihajonta. Lause 5.7. Jos satunnaismuuttujat X,..., X n ovat korreloimattomia ja kaikilla on sama odotusarvo µ ja keskihajonta σ, niin tällöin satunnaismuuttujan n i= X i odotusarvo on µ ja keskihajonta σ n Todistus. Odotusarvon lineaarisuuden (lause 3.5) perusteella voidaan satunnaismuuttujan M n = n n i= X i odotusarvoksi laskea E(M n ) = E ( n ) n X i i= = n n. n E(X i ) = i= n n µ = µ. Koska korrelaatiot ρ i,j = Cor(X i, X j ) ovat nollia, saadaan kaavan (5.3) avulla ( n ) SD X i i= = ( ) /2 SD(X i ) 2 i = i= ( ) /2 σ 2 i = σ n. 2 riippumattomien satunnaismuuttujien summille saadaan tarkempia estimaatteja ns. Chernoffin epäyhtälön avulla 63
65 Keskihajonnan perusominaisuuksien (lause 4.5) mukaan ( ) ( n n ) SD(M n ) = SD X i = n n SD X i = n σ n = σ. i= i= n Lause 5.8 (Suurten lukujen laki). Jos satunnaismuuttujat X, X 2,... ovat korreloimattomia, ja kaikilla on sama odotusarvo µ ja keskihajonta σ, niin mielivaltaisen pienellä ɛ > 0, tapahtuman n n X k = µ ± ɛ (5.5) k= todennäköisyys lähestyy ykköstä suurilla n:n arvoilla 3. Todistus. Lauseen 5.7 mukaan satunnaismuuttujan M n = n n i= X i odotusarvo on µ Mn = µ ja keskihajonta σ Mn = σn /2. Kun merkitään k = ɛn/2, voidaan σ tapahtuma (5.5) lausua muodossa M n = µ Mn ± kσ Mn, ja Chebyshevin epäyhtälön tämän tapahtuman todennäköisyys on vähintään P(M n = µ Mn ± kσ Mn ) k 2 = σ2 ɛ 2 n. Väite seuraa, koska ylläolevan epäyhtälön oikea puoli lähestyy ykköstä, kun n kasvaa. 5.4 Summan normaaliapproksimaatio Esimerkissä 5.5 simuloitu sadan nopanheiton summan S = S 00 ja esimerkissä 5.6 simuloitu kolmensadan indikaattorimuuttujan summa T ovat muodoltaan samankaltaiset, kuten allaoleva kuva osoittaa. 3 Tarkemmin ilmaistuna lim n P( n n k= X k µ ɛ) =. 64
66 S = S 00 (esimerkki 5.5) T (esimerkki 5.6) Jakaumat ovat jopa yllättävän samankaltaiset, sillä noppapelin tuottokertymä S = S 00 ja lennolle saapuvien lukumäärä T liittyvät täysin erilaisiin konteksteihin. Ainoa kyseisiä satunnaismuuttujia yhdistävä tekijä on se, että molemmat voidaan tulkita stokastisesti riippumattomien satunnaismuuttujien summana. Jakaumien muotoa voi tarkemmin vertailla piirtämällä normitettujen satunnaismuuttujien S = S µ S T µ T ja T = σ S σ T jakaumat. Ne on esitetty kuvassa 5.. Punaisella piirretty jakaumien muotoa tarkasti approksimoiva funktio on f(t) = 2π e t2 /2. (5.6) Kyseinen Gaussin kellokäyränä tunnettu funktio on positiivinen ja integroituu ykköseksi, joten se on erään jatkuvan jakauman tiheysfunktio. Tiheysfunktion (5.6) määrittämä jatkuva jakauma on nimeltään normitettu normaalijakauma. Normitettujen jakaumien samankaltaisuus on universaali matematiikan laki, joka koskee kaikkia stokastisesti riippumattomia satunnaismuuttujien summia. Tämä tärkeä tulos tunnetaan nimellä keskeinen raja-arvolause. Lause 5.9 (Keskeinen raja-arvolause). Jos summan S n = X + X n termit ovat stokastisesti riippumattomia ja samoin jakautuneita satunnaismuuttujia, joilla on odotusarvo µ X ja keskihajonta 0 < σ X <, niin normitettu summa S n = S n µ Sn σ Sn, missä µ Sn = µ X n ja σ Sn = σ X n, noudattaa suurilla n arvoilla likimain normitettua normaalijakaumaa. Todistus sivuutetaan tässä yhteydessä. 65
67 S (esimerkki 5.5) T (esimerkki 5.6) Kuva 5.: Normitettujen satunnaismuuttujien S ja T simuloidut jakaumat. 5.5 Normaalijakauma Yleinen normaalijakauma parametreina µ (, ) ja σ (0, ) on yhden muuttujan jatkuva jakauma, jonka tiheysfunktio on f(x) = (x µ)2 e 2σ 2. 2πσ 2 Tiheysfunktiota sopivasti osittain integroimalla voidaan vahvistaa, että µ = xf(x) dx ja σ = ( /2 (x µ) 2 f(x) dx), joten parametri µ on normaalijakauman odotusarvo ja parametri σ sen keskihajonta. Normaalijakauman kertymäfunktiota tarkastelemalla havaitaan myös, että jos X on normaalijakautunut parametrein µ X ja σ X, niin tällöin Y = a+bx on normaalijakautunut parametrein µ Y = a + bµ X ja σ Y = b σ X. Tästä seuraa, että normitettu satunnaismuuttuja Z = X µ X σ X (5.7) 66
68 noudattaa normitettua normaalijakaumaa odotusarvona 0 ja keskihajontana. Vastaavasti mikä tahansa parametrin µ ja σ normaalijakautunut satunnaismuuttuja voidaan esittää muodossa X = µ + σz, (5.8) missä Z noudattaa normitettua normaalijakaumaa. Normaalijakauman kertymäfunktiota ei voi esittää siistissä suljetussa muodossa, joten siihen liittyvät todennäköisyydet lasketaan kertymäfunktion taulukoiden (liite B) tai numeeristen ohjelmistojen (R: pnorm(), Excel: NORM.DIST()) avulla. Normaalijakauman taulukoissa yleensä raportoidaan vain normitetun normaalijakauman kertymäfunktion arvot, sillä muut normaalijakaumat voidaan palauttaa normitettuun tapaukseen kaavojen (5.7) (5.8) avulla. Esimerkki 5.0 (Älykkyysosamäärä). Yhdeksäsluokkalaisten älykkyysosamäärä noudattaa likimain normaalijakaumaa (µ = 00, σ = 5). Millä todennäköisyydellä satunnaisesti valitun yhdeksäsluokkalaisen älykkyysosamäärä on (a) yli 30? (b) välillä 85 5? 2% 4% 68% 4% 2% σ σ Normitettu satunnaismuuttuja Z = X µ noudattaa normitettua normaalijakaumaa, joten σ ( ) X µ P(X > 30) = P > = P(Z > 2). σ 5 Normitetun normaalijakauman symmetrian ja jatkuvuuden perusteella pätee P(Z > 2) = P(Z < 2) = P(Z 2). Vastaukseksi (a)-kohtaan saadaan normaalijakauman taulukoista P(Z 2) Samaan tapaan ( P(85 X 5) = P 5 = P( Z ) = P( < Z ) X µ σ = P(Z ) P(Z ), )
69 joten (b)-kohdan vastaukseksi saadaan normaalijakauman taulukoista P(Z ) P(Z ) Esimerkki 5. (Noppapeli). Arvioi normaalijakauman avulla, millä todennäköisyydellä esimerkin 5.5 noppapelissä 00 pelikierrokselta kertynyt tuotto on (a) välillä 384 EUR? (b) yli 500 EUR? Merkitään kertynyttä tuottoa S 00 = X + + X 00. Koska yhden kierroksen tuoton odotusarvo ja keskihajonta (yhden desimaalin tarkkuudella) ovat µ X = 3.5 ja σ X =.7, ja tuotot ovat stokastisesti riippumattomat, on 00 pelikierroksen tuoton odotusarvo ja keskihajonta µ S00 = = 350 σ S00 =.7 00 = 7. Kun normitetun tuottokertymän S jakaumaa arvioidaan normitettua normaalijakaumaa noudattavalla satunnaismuuttujalla Z, saadaan tulokseksi 7 ( P( S ) = P 2 S ) P( 2 Z 2) = 2P(Z 2) 95.4%. ja ( S P(S 00 > 500) = P 7 P(Z > 8.82) = P(Z 8.82) ) > 8.82 Esimerkki 5.2 (Lentoyhtiö). Arvioi normaalijakauman avulla, millä todennäköisyydellä esimerkissä 5.6 kaikki lennolle saapuvat matkustajat mahtuvat lennolle. Esimerkissä 5.6 johdettiin lennolle saapuvien matkustajien lukumäärän T odotusarvoksi µ T = 285 ja keskihajonnaksi σ T = Lennolle saapuvien matkustajien normitettu lukumäärä on satunnaismuuttuja T µ T σ T = T
70 Kun satunnaismuuttujan T 285 jakaumaa arvioidaan normitettua normaalijakaumaa noudattavalla satunnaismuuttujalla Z, havaitaan että kaikki matkus tajat mahtuvat lennolle todennäköisyydellä ( ) T P(T 290) = P ( ) T 285 = P P(Z.33) = 90.8%. Hieman tarkemman arvion saa huomaamalla, kokonaislukuarvoiselle satunnaismuuttujalle T pätee P(T 290) = P(T 290.5), jolloin P(T 290) = P(T 290.5) ( ) T = P ( ) T 285 = P P(Z.46) = 92.8%. Näin saatu ns. jatkuvuuskorjaus tuottaa hieman tarkemman arvion, sillä tapahtuman tarkka todennäköisyys on binomijakauman mukaan P(T 290) = 93.5%. 5.6 Poisson-approksimaatio Keskeinen raja-arvolause kertoo, että stokastisesti riippumattomien ja samoin jakautuneiden satunnaismuuttujien summa S n = X + X n noudattaa suurilla n:n arvoilla likimain normaalijakaumaa parametrein µ X n ja σ X n, kunhan summattavien keskihajonta σ X on aidosti positiivinen ja äärellinen. Tietyissä tilanteissa tarvitaan arvioita satunnaismuuttujien summalle, jossa σ X on hyvin lähellä nollaa. Tällöin normaaliapproksimaation tarkkuus on heikko. Esimerkki 5.3. Suositun uutissivuston www-palvelimelle saapuu keskimäärin λ = 2.6 sivupyyntöä sekunnissa. Arvioi todennäköisyys, jolla seuraavan sekunnin aikana palvelimelle saapuu yli 0 sivupyyntöä. Luonnollinen malli sekunnin aikana saapuville sivupyynnöille on satunnaismuuttujien summa S n = n i= X i, missä n on uutissivustoa seuraavien käyttäjien lukumäärä ja {, jos käyttäjältä i saapuu sivupyyntö, X i = 0, muuten. 69
71 Summattavien indikaattorimuuttujien odotusarvo on µ X = p ja keskihajonta σ X = (p( p)) /2, missä p = P(X i = ). Näin ollen saapuvien sivupyyntöjen odotusarvo voidaan kirjoittaa muodossa E(S n ) = np. Parametreja n ja p ei tehtävänannon pohjalta tunneta, mutta tunnetun odotusarvon λ pohjalta voidaan ratkaista p = λ. Kun uutissivustoa seuraavien käyttäjien lukumäärä n on suuri, n on summattavien keskihajonta likimain σ X = (p( p)) /2 λ /2 n /2. Koska σ X on hyvin lähellä nollaa, ei normaaliapproksimaation tarkkuudelle ole takeita. Ylläolevan esimerkin tilanteeseen sopiva approksimoiva jakauma on lukujoukon {0,, 2,... } diskreetti jakauma tiheysfunktiona f(x) = e λ λx, x = 0,, 2,... x! Tämä jakauma on Poisson-jakauma parametrina λ > 0. Jakauma on nimetty ranskalaismatemaatikko Siméon Denis Poissonin (78 840) mukaan. Seuraava tulos tunnetaan nimellä pienten lukujen laki. Lause 5.4. Jos summan S n = X + X n termit ovat stokastisesti riippumattomia ja samoin jakautuneita {0, }-arvoisia satunnaismuuttujia odotusarvona µ X λ/n, niin S n noudattaa suurilla n likimain Poisson-jakaumaa parametrina λ. Todistus. Ylläolevien oletusten vallitessa S n noudattaa binomijakaumaa parametreina n ja p = µ X, joten ( ) n P(S n = x) = p x ( p) n x. x Kun n on suuri, yllä esiintyvä binomikerroin on likimain ( ) n x = x (n k) = nx x ( k ) x! x! n k=0 k=0 nx x!. Lisäksi kun p λ, pätee px n ( p) n x ( λ n ( λ n) n x = Yhdistämällä nämä kolme arviota havaitaan, että ) x (, ja kaavan limn + x n n) = e x avulla ( λ ) x ( λ n e n n) λ. P(S n = x) = ( n )p x ( p) n x nx x x! ( λ n ) x e λ λ λx = e x!. 70
72 Binomijakaumaa parametreina n ja p voidaan siis arvioida kahdella eri jakaumalla: (i) normaalijakauma parametrein µ = np ja σ = (np( p)) /2, tarkka silloin kun n on suuri ja p ei kovin lähellä nollaa eikä ykköstä (ii) Poisson-jakauma parametrina λ = np, tarkka silloin kun n on suuri ja p lähellä nollaa. Esimerkki 5.5. Suositun uutissivuston www-palvelimelle saapuu keskimäärin λ = 2.6 sivupyyntöä sekunnissa. Arvioi todennäköisyys, jolla seuraavan sekunnin aikana palvelimelle saapuu yli 0 sivupyyntöä. Saapuvien sivupyyntöjen lukumäärää on luonnollista arvioida binomijakaumalla parametreina n ja p λ. Lauseen 5.4 mukaan suurella n kyseinen binomijakauma on likimain Poisson-jakauma parametrina λ. Kysytty todennäköi- n syys on siis arviolta P(S n > 0) = P(S n 0) 5.7 Yhteenveto 0 x=0 λ λx e x! Satunnaismuuttujien summan S n = n i= X i odotusarvo ja keskihajonta määräytyvät ao. taulukon kaavoista. Summan termit E( i X i) SD( i X i) Yleiset i µ i ( i σ2 i + ) /2 i j:j i σ iσ j ρ i,j Korreloimattomat i µ i ( i σ2 i ) /2 Korreloimattomat ja samoin jakautuneet µn σ n Jos satunnaismuuttujien summan S n = X + X n termit ovat stokastisesti riippumattomia ja samoin jakautuneita, odotusarvona µ X ja keskihajontana σ X, niin summan odotusarvo on µ Sn = µ X n ja keskihajonta σ Sn = σ X n. Silloin kun σ X on aidosti positiivinen ja äärellinen, noudattaa normitettu summa Sn µ Sn σ Sn suurilla n likimain normitettua normaalijakaumaa, joten jakauman näkökulmasta S n µ Sn + σ Sn Z, 7
73 missä Z noudattaa normitettua normaalijakaumaa. Jos summattavat ovat {0, }- arvoisia, on summan tarkka jakauma binomijakauma parametreina n ja p = µ X. Kun p ei ole liian lähellä nollaa tai ykköstä, voidaan kyseistä binomijakaumaa arvioida yo. normaalijakaumaa käyttäen. Pienillä p λ/n arvioilla parempi arvio saadaan Poisson-jakaumasta parametrina λ > 0. 72
74 Luku 6 Datajoukkojen jakaumat, tunnusluvut ja kuvaajat 6. Datajoukko ja datakehikko Tässä monisteessa datajoukko tarkoittaa järjestettyä listaa keskenään samantyyppisiä alkioita, esimerkiksi lukuja, merkkijonoja tai näistä muodostettuja listoja. Moniulotteinen datajoukko on datajoukko, jonka alkiot ovat järjestettyjä listoja. Moniulotteinen datajoukko esitetään yleensä datakehikkona (engl. data frame) eli taulukkona, jonka jokainen rivi vastaa yhtä moniulotteisen datajoukon alkiota, ja jonka sarakkeita kutsutaan datajoukon muuttujiksi. Esimerkki 6.. Allaoleva datakehikko kuvastaa fiktiivisen kurssin kurssipalautteesta koostettua neliulotteista datajoukkoa ((2345A, 5,, 5), (98759K,, 5, 2), (3332K, 4, 4, 3), (23453B, 4, 4, 3), (2453U, 3, 3, 3)), jossa on yksi merkkijonoarvoinen muuttuja (opiskelijanumero) ja kolme lukuarvoista muuttujaa (yleisarvio, työläys, hyödyllisyys). Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 2345A K K B U Tämä datajoukko voidaan myös tulkita neljän yksiulotteisen datajoukon listana, esimerkiksi muuttujaa Yleisarvio vastaa datajoukko (5,, 4, 4, 3). 6.2 Empiirinen jakauma Suuresta datajoukosta (x,..., x n ) on hankala muodostaa mielikuvaa pelkästään tarkastelemalla sitä vastaavaa datakehikkoa. Silloin kannattaa tutkia eri Datajoukko ei ole tarkassa matemaattisessa mielessä joukko, sillä datajoukossa sama alkio voi esiintyä monta kertaa. 73
75 arvojen esiintyvyyksiä. Arvon x esiintyvyys eli frekvenssi n(x) = #{i : x i = x} on datajoukossa arvoltaan x olevien alkioiden lukumäärä. Yksiulotteiselle datajoukolle eri arvojen esiintyvyydet on tapana raportoida esiintyvyystaulukkona tai vaakasuuntaisena palkkikaaviona. Esimerkin 6. datakehikon muuttujaa Yleisarvio vastaavan datajoukon (5,, 4, 4, 3) esiintyvyystaulukko on esitetty alla. 5 x n(x) Taulukko 6.: Datajoukon (5,, 4, 4, 3) esiintyvyydet. Kun halutaan vertailla arvojen esiintyvyyksiä monessa erikokoisissa datajoukoissa, on absoluuttisten lukumäärien sijaan suositeltavaa vertailla suhteellisia esiintyvyyksiä. Arvon x suhteellinen esiintyvyys f(x) = n(x) (6.) n kertoo, mikä osuus datajoukon alkioista on arvoltaan x. Suhteelliset esiintyvyydet on tapana raportoida taulukkona tai pylväskaaviona. Taulukossa 6. esitetyn datajoukon suhteelliset esiintyvyydet on esitetty alla x f(x) Taulukko 6.2: Datajoukon (5,, 4, 4, 3) suhteelliset esiintyvyydet. Ylläolevan taulukon suhteelliset esiintyvyydet ovat ei-negatiivisia ja summautuvat ykköseksi. Tästä seuraa, että kaavan (6.) määrittämä funktio f(x) on jonkin diskreetin jakauman tiheysfunktio. Kyseinen diskreetti jakauma on datajoukon (x,..., x n ) empiirinen jakauma, ja funktio f(x) sitä vastaava empiirinen tiheysfunktio. Seuraava tulos antaa intuitiivisen tulkinnan datajoukon empiiriselle jakaumalle. Sen mukaan empiirinen jakauma voidaan tulkita todennäköisyysjakaumana satunnaismuuttujalle, joka saadaan valitsemalla datajoukosta yksi alkio 74
76 tasaisen satunnaisesti. Datajoukon empiirinen tiheysfunktio f(x) kertoo siis todennäköisyyden, jolla datajoukosta tasaisen satunnaisesti valittu alkio on arvoltaan x. Lause 6.2. Datajoukosta (x,..., x n ) satunnaisotannalla valitun alkion arvo X noudattaa datajoukon empiiristä jakaumaa tiheysfunktiona f(x). Lisäksi pätee E[X] = n x i (6.2) n ja yleisemmin E[g(X)] = n i= n g(x i ). (6.3) Todistus. Datajoukosta tasaisen satunnaisesti poimittu alkio voidaan kirjoittaa satunnaismuuttujana X = x I, missä satunnaismuuttuja I noudattaa indeksijoukon {,..., n} tasajakaumaa. Satunnaismuuttuja X saa arvon x täsmälleen silloin, kun satunnaismuuttuja I kuuluu joukkoon A = {i : x i = x}, jonka koko on #A = n(x). Koska I noudattaa lukujoukon {,..., n} tasajakaumaa, pätee i= P(X = x) = P(I A) = #A n = n(x) n = f(x). Perustellaan seuraavaksi kaava (6.3). Todetaan ensiksi, että n g(x i ) = x i= g(x)n(x), sillä n(x) kertoo lukumäärän, kuinka monta kertaa arvo x esiintyy yllä vasemman puolen summassa. Odotusarvon yleistä laskukaavaa (3.2) ja empiirisen tiheysfunktion määritelmää (6.) soveltamalla nähdään, että mielivaltaiselle funktiolle g pätee E[g(X)] = x g(x)f(x) = x g(x) n(x) n = g(x)n(x) = n x n n g(x i ). Kaava (6.2) saadaan erikoistapauksena kaavasta (6.3), kun valitaan g(x) = x. i= 6.3 Ristitaulukko ja empiirinen yhteisjakauma Kahden muuttujan datajoukko on järjestetty lista pareja ((x, y ),..., (x n, y n )). Arvoparin (x, y) esiintyvyys n(x, y) = #{i : x i = x ja y i = y} 75
77 on datajoukossa arvoltaan (x, y) olevien alkioiden lukumäärä. Esimerkin 6. muuttujat Yleisarvio ja Hyödyllisyys voidaan koostaa datajoukoksi ((5,5), (,2), (4,3), (4,3), (3,3)). Sen arvoparien esiintyvyydet voidaan taulukoida muodossa y x Yht Yht Ylläoleva esitys on muuttujien x ja y esiintyvyyksien ristitaulukko (engl. contingency table) ja tällaista esitysmenetelmää kutsutaan ristiintaulukoimiseksi (engl. cross tabulation). Ristitaulukon rivisummista saadaan muuttujan x esiintyvyydet (vrt. taulukko 6.) ja sarakesummista muuttujan y esiintyvyydet. Arvoparin (x, y) suhteellinen esiintyvyys määritellään kaavalla. f(x, y) = n(x, y). (6.4) n Datajoukon ((5,5), (,2), (4,3), (4,3), (3,3)) suhteelliset esiintyvyydet voidaan taulukoida muodossa y x Yht Yht Aivan kuin yksiulotteisillekin datajoukoille, myös kaksiulotteisen datajoukon suhteelliset esiintyvyydet f(x, y) ovat ei-negatiivisia ja summautuvat ykköseksi. Näin ollen ylläoleva taulukko vastaa erään diskreetin yhteisjakauman tiheysfunktiota. Kyseinen diskreetti jakauma on datajoukon ((x, y ),..., (x n, y n )) empiirinen yhteisjakauma, ja kaavan (6.4) määrittämä funktio f(x, y) sitä vastaava tiheysfunktio. Empiirisen yhteisjakauman rivisummista saadaan datajoukon (x,..., x n ) empiirinen jakauma (vrt. taulukko 6.2) ja sarakesummista datajoukon (y,..., y n ) empiirinen jakauma. Seuraava tulos tarjoaa todennäköisyystulkinnan empiiriselle yhteisjakaumalle. Sen mukaan empiirinen jakauma voidaan tulkita datajoukosta satunnaisotannalla valitun parin yhteisjakaumana, jolloin empiirinen tiheysfunktio f(x, y) kertoo todennäköisyyden, jolla datajoukosta satunnaisesti valitun parin arvot ovat x ja y. Tuloksen todistus on rakenteeltaan sama kuin lauseenan 6.2 todistus. 5 76
78 Lause 6.3. Datajoukosta ((x, y ),..., (x n, y n )) satunnaisotannalla valitun parin (X, Y ) yhteisjakauma on datajoukon empiirinen yhteisjakauma tiheysfunktiona f(x, y). Lisäksi pätee E[X] = n n x i, E[Y ] = n i= n y i, (6.5) i= ja yleisemmin E[g(X, Y )] = n n g(x i, y i ). (6.6) Todistus. Tarkastelun kohteena oleva datajoukko voidaan tulkita yksiulotteisena datajoukkona (z,..., z n ), jonka alkiot koostuvat lukupareista z i = (x i, y i ). Satunnaisesti valittu lukupari puolestaan voidaan esittää satunnaismuuttujana Z = (X, Y ). Tällöin lauseen 6.2 mukaan i= P(Z = z) = ˆf(z), missä ˆf(z) on arvon z suhteellinen esiintyvyys datajoukossa (z,..., z n ). Koska lukuparin z = (x, y) suhteelliselle esiintyvyydelle pätee ˆf(z) = f(x, y), havaitaan tästä että P(X = x, Y = y) = P(Z = z) = ˆf(z) = f(x, y). Satunnaisen lukuparin (X, Y ) jakauma on siis datajoukon empiirinen yhteisjakauma. Kaavan (6.6) perustelemiseksi tulkitaan g(x, y) yhden muuttujan funktiona g(z) = g(x, y), jonka syötteenä ovat lukuparit z = (x, y). Soveltamalla kaavaa (6.3) datajoukosta (z,..., z n ) satunnaisesti poimittuun alkioon Z havaitaan, että E[g(X, Y )] = E[ g(z)] = n g(z i ) = n g(x i, y i ). n n Näin ollen kaava (6.6) on tosi. Kaavat (6.5) seuraavat erikoistapauksina sijoittamalla kaavaan (6.6) g(x, y) = x ja g(x, y) = y. 6.4 Datajoukon keskiarvo ja keskihajonta Yksiulotteisen datajoukon empiirinen jakauma f(x) antaa hyvän kuvan datajoukon eri arvojen esiintyvyyksistä. Kokonaisen funktion sijaan halutaan kuitenkin usein raportoida yksittäisiä lukuja, jotka kuvaavat datajoukkoa. Tällaisia lukuja kutsutaan tunnusluvuiksi. Lukuarvoisen datajoukon x = (x,..., x n ) sijaintia kuvaavista tunnusluvuista yleisin on keskiarvo i= i= m( x) = n n x i. i= 77
79 Lauseen 6.2 mukaan voidaan keskiarvo m( x) tulkita odotusarvona E(X) datajoukosta satunnaisotannalla poimitulle alkiolle X. Datajoukon moodi on arvo, jonka esiintyvyys on suurin mahdollinen. Toisin kuin keskiarvo, moodi ei välttämättä ole yksikäsitteinen. Datajoukon hajontaa kuvaavia tunnuslukuja ovat empiirinen keskihajonta ( ) /2 n sd( x) = (x i m( x)) 2, (6.7) n ja otoskeskihajonta sd s ( x) = i= ( n ) /2 n (x i m( x)) 2. (6.8) i= Empiirinen keskihajonta on luonteva tapa mitata datajoukon (x,..., x n ) normitettua neliöllistä vaihtelua, joka lauseen 6.2 mukaan voidaan myös tulkita keskihajontana SD(X) datajoukosta satunnaisotannalla poimitulle alkiolle X. Otoskeskihajontaa puolestaan käytetään usein tilanteissa, joissa tuntemattoman datalähteen satunnaisvaihtelun voimakkuutta pyritään estimoimaan siitä saadun rajallisen havainnon perusteella (tästä lisää luvussa 7). Empiirinen keskihajonta ja otoskeskihajonta saadaan muunnettua toisikseen kaavan sd s ( x) = ( ) /2 n sd( x) (6.9) n avulla, josta nähdään että sd s ( x) sd( x) suurille datajoukoille. Datajoukon empiirinen varianssi ja otosvarianssi määritellään kaavoilla var( x) = sd( x) 2 ja var s ( x) = sd s ( x) 2. (Yhteenveto tunnusluvuista on kappaleessa 6.8.) 6.5 Kvantiilit Lukuarvoisen datajoukon kvantiili tasolla p (0, ) on tunnusluku Q(p), jonka avulla pilkotaan datajoukko kahtia niin, että alkioista suurin piirtein osuus p sijaitsee luvun Q(p) alapuolella ja loput alkioista luvun Q(p) yläpuolella. Tasojen 0.25, 0.5 ja 0.75 kvantiileja kutsutaan kvartiileiksi ja ne tunnetaan nimillä alakvartiili, mediaani ja yläkvartiili. Tasojen 0.0, 0.02,... kvantiileja puolestaan kutsutaan prosentiileiksi. Yleisesti ottaen kvantiilit määritellään järjestämällä datajoukon (x,..., x n ) alkiot suuruusjärjestykseen muodossa x () x (2) x (n). Luku x (k) on datajoukon k:nnes järjestystunnusluku. Tason p (0, ) kvantiili määritellään R-ohjelmistossa oletusarvoisesti peräkkäisten järjestystunnuslukujen painotettuna keskiarvona Q(p) = ( γ)x (j) + γx (j+), 78
80 missä 2 j = np + ( p) ja γ = np + ( p) j. Ylläoleva kuvaus tulkittuna p:n funktioksi on datajoukon kvantiilifunktio 3. Kvantiilifunktion voi tulkita helpoiten piirtämällä sen kuvaaja seuraavasti: Jaetaan vaaka-akselin yksikköväli n tasapituiseen väliin päätepisteinä luvut p k = (k )/(n ), k =,..., n. Piirretään tasoon pisteet (p k, x (k) ) ja yhdistetään ne viivoilla. Esimerkki 6.4. Pienessä yrityksessä työskentelee neljä henkilöä, joiden bruttopalkat ovat 2500, 3500, 2500, 9500 (eur/kk). Laske bruttopalkkojen järjestystunnusluvut, piirrä kvantiilifunktio, ja määritä kvantiilifunktion avulla palkkajakauman alakvartiili, mediaani ja yläkvartiili. Datajoukon (2500, 3500, 2500, 9500) järjestystunnusluvut ovat x () = 2500, x (2) = 2500, x (3) = 3500 ja x (4) = Jaetaan vaaka-akselin yksikköväli kolmeen yhtäpitkään osaväliin päätepisteinä p = 0, p 2 = 3, p 3 = 2 3 ja p 4 =. Kvantiilifunktion kuvaaja saadaan piirtämällä tasoon pisteet (p, x () ),... (p 4, x (4) ) ja yhdistämällä ne viivoilla Kvantiilifunktion kuvaajasta luetaan: alakvartiili Q(0.25) = 2500, mediaani Q(0.5) = 3000 ja yläkvartiili Q(0.75) = Tässä datajoukossa mediaani 3000 on reilusti pienempi kuin keskiarvo Kaksiulotteisen datajoukon tunnusluvut Kahden muuttujan datajoukon ((x, y ),..., (x n, y n )) yhteisvaihtelun suuntaa ja voimakkuutta mitataan yleensä laskemalla empiirinen kovarianssi cov( x, y) = n n (x i m( x))(y i m( y)) i= 2 x on luku x pyöristettynä alaspäin kokonaisluvuksi. 3 Kvantiilifunktio määritellään eri yhteyksissä hieman eri tavoin, esim. R-ohjelmisto tarjoaa kahdeksan vaihtoehtoista tapaa kvantiilifunktion laskemiseen. 79
81 tai otoskovarianssi cov s ( x, y) = n n (x i m( x))(y i m( y)). i= Empiirinen kovarianssi ja otoskovarianssi saadaan muunnettua toisikseen kaavan ( ) n cov s ( x) = cov( x) n avulla, josta nähdään että cov s ( x) cov( x) suurille datajoukoille. Kahden muuttujan datajoukon korrelaatio määritellään normittamalla empiirinen kovarianssi datajoukkojen x ja y empiirisillä keskihajonnoilla cor( x, y) = cov( x, y) sd( x) sd( y). (6.0) Lauseen 6.3 perusteella havaitaan, että empiirinen kovarianssi voidaan tulkita kovarianssina Cov(X, Y ) satunnaismuuttujien parille (X, Y ), joka saadaan poimimalla datajoukosta satunnainen lukupari. Koska lisäksi pätee sd(x) = SD(X) ja sd(y) = SD(Y ), saadaan datajoukon korrelaatiolle todennäköisyystulkinta cor(x, y) = Cor(X, Y ). Soveltamalla lausetta (4.2) havaitaan, että mielivaltaisen datajoukon korrelaatio toteuttaa cor(x, y) +. Kaksiulotteinen datajoukko voidaan visualisoida hajontakuviona piirtämällä datajoukon lukuparit (x, y)-tasoon. Alla on esitetty hajontakaaviot kolmelle kaksiulotteiselle sadan alkion datajoukolle sekä niiden korrelaatiot cor( x, y) = cor( x, y) = 0.44 cor( x, y) = 0.75 Koska määritelmässä (6.0) muotoa /n olevat termit osoittajassa ja nimittäjässä kumoavat toisensa, voidaan datajoukon korrelaatio laskea myös muodossa n i= cor( x, y) = (x i m( x))(y i m( y)) ( n i= (x i m( x)) 2 ) /2 ( n i= (y i m( y)) 2 ) /2 80
82 tai otoskovarianssin ja otoskeskihajontojen avulla muodossa cor( x, y) = cov s( x, y) sd s ( x) sd s ( y). Datajoukon korrelaatiota kutsutaan myös nimellä Pearsonin korrelaatiokerroin erotuksena muista, järjestyslukuihin perustuvista korrelaatiokertoimista. 6.7 Histogrammi Silloin kun datajoukko sisältää suuren määrän arvoja, saattaa tarkka esiintyvyystaulukko tai empiirinen jakauma olla liian yksityiskohtainen, jotta sen voisi selkeästi hahmottaa. Tällöin on tapana karkeistaa dataa osittamalla arvojoukko pienempään määrään lukuvälejä. Näin saadaan datajoukon luokiteltu esiintyvyystaulukko. Luokitellun esiintyvyystaulukon suhteellisia osuuksia esittävä kuvaaja on datajoukon histogrammi. Histogrammi piirretään yleensä näin: Yksi pylväs per luokka Pylvään leveys = luokkavälin leveys (yksikkönä vuosi) Pylvään korkeus = datapisteiden suhteellinen osuus jaettuna palkin leveydellä (yksikkönä % per vuosi) Seuraava esimerkki valaisee asiaa. Esimerkki 6.5 (Suomalaisten ikärakenne). Suomalaisten ikärakenne sisältää n = miljoonaa datapistettä 4. Ei ole järkeä piirtää jokaista pistettä kuvaajaan, vaan jaetaan datapisteet luokkiin. Ikä (v) Lukumäärä Esim: Suomalaiset. pylväs käsittää suomalaiset, joiden ikä on 0 4 vuotta. pylvään leveys = 5 v Datapisteiden lkm luokassa on ja suhteellinen osuus / % 4 Lähde: Tilastokeskus 8
83 Pylvään korkeus = 6.3/5.09 (yksikkönä % per vuosi). prosenttia per v %.7% 24.8% 26.7%.7% 8.8% v 6.8 Yhteenveto Taulukossa C. on lista datajoukkojen ja satunnaismuuttujien tunnuslukuihin liittyvistä merkinnöistä sekä niitä vastaavat R- ja Excel-komennot. 6.9 Kommentteja Alla on todistettu tulos, josta käy ilmi, miksi otoskovarianssi ja otosvarianssi ovat harhattomia estimaattoreita yleisen jakauman kovarianssille ja varianssille. Lause 6.6. Jos (X, Y ),..., (X n, Y n ) ovat stokastisesti riippumattomia ja satunnaisen lukuparin (X, Y ) kanssa samoin jakautuneita satunnaislukupareja, niin empiirisen jakauman kovarianssille pätee [ E cov( X, Y ] ) ja otoskovarianssille pätee [ E cov s ( X, Y ] ) = n n Cov(X, Y ) 82 = Cov(X, Y ).
84 Vastaavasti ja [ E var( X) ] [ E var s ( X) ] = n n Var(X) = Var(X). Todistus. Symmetrian nojalla Kirjoittamalla E cov( X, Y ) = E [ n n ] n (X i m( X))(Y i m( Y )) i= = [ E (X i m( X))(Y n i m( ] Y )) i= [ = E (X m( X))(Y m( Y ] )). X m( X) = X n n X i = n i= n (X X i ) = n i= n (X X i ) i=2 ja vastaavasti Y m(y ), havaitaan että [ E (X m( X))(Y m( Y ] )) [ = E ( n n (X X i ))( n i=2 = n 2 n i=2 n j=2 n ] (Y Y j )) j=2 [ ] E (X X i )(Y Y j ) Kun i, j 2, saadaan stokastisen riippumattomuuden avulla [ ] E (X X i )(Y Y j ) = E(X Y ) E(X Y j ) E(X i Y ) + E(X i Y j ) = E(X Y ) E(X )E(Y ) E(X )E(Y ) + E(X i Y j ) = E(X Y ) + E(X i Y j ) 2E(X )E(Y ), joten [ ] E (X X i )(Y Y j ) = { 2 Cov(X, Y ), i = j, Cov(X, Y ), i j. 83
85 Näin ollen [ E cov( X, Y ] ) [ = E (X m( X))(Y m( Y ] )) = n n ( + (i = j)) Cov(X, Y ) n 2 i=2 = n 2 n i=2 j=2 n ( + (i = j)) Cov(X, Y ) j=2 = Cov(X, Y ) ((n )(n 2 + 2)) n2 = n Cov(X, Y ). n Empiiristä varianssia ja otosvarianssia koskevat väitteet seuraavat tuloksesta var( x) = cov( x, x). 84
86 Luku 7 Parametrien estimointi 7. Parametriset jakaumat Tarkastellaan tuntematonta datalähdettä, joka tuottaa toisistaan stokastisesti riippumattomia ja tiheysfunktion f(x) mukaan jakautuneita satunnaislukuja. Yleensä tiheysfunktiota ei tunneta, mutta toisinaan tiheysfunktion rakenteellinen muoto voidaan kuitenkin päätellä kontekstista. Esimerkiksi binaarisen datalähteen tiheysfunktio tunnetaan yhtä parametria vaille, kuten allaoleva esimerkki vahvistaa. Esimerkki 7. (Binaarinen datalähde). Binaariselle {0, }-arvoisia satunnaislukuja tuottavalle datalähteelle pätee f(x) = 0 aina kun x 0 tai x. Koska diskreetin jakauman tiheysfunktion arvot summautuvat ykköseksi, voidaan tästä päätellä että f(0) = f(). Tiheysfunktio voidaan siis kirjoittaa muodossa p, x = 0, f(x) = p, x =, 0, muuten, missä p = f() on arvon todennäköisyys. Ylläolevan tiheysfunktion määrittämä jakauma on Bernoulli-jakauma parametrina p. Yllä tehdyn päättelyn mukaan siis jokainen {0, }-arvoinen datalähde noudattaa Bernoulli-jakaumaa. Bernoulli-jakaumaa parametrina p noudattavan satunnaisluvun X odotusarvo on E(X) = xf(x) = 0 ( p) + p = p. (7.) x Koska myös E(X 2 ) = x x2 f(x) = p, saadaan keskihajonnaksi kaavan (4.3) avulla SD(X) = ( E(X 2 ) (E(X)) 2) /2 = (p( p)) /2. (7.2) Taulukkoon 7. on listattu tärkeimpiä yhden muuttujan jakaumia, joissa parametrien lukumäärä on yksi tai kaksi. Kun datalähteen tiheysfunktio tunnetaan tiettyjä parametreja vaille ja datalähteestä on havaittu arvot x, x 2,..., x n, 85
87 Malli Parametrit Arvojoukko Tiheysfunktio Bernoullijakauma p {0, } f p (x) = ( p) x p x Binomijakauma n, p {0,,..., n} f n,p (x) = ( ) n x ( p) n x p x Eksponenttijakauma λ (0, ) f λ (x) = λe λx Jatkuva tasajakauma a, b [a, b] f a,b (x) = b a Normaalijakauma µ, σ (, ) f µ,σ (x) = (x µ)2 e 2σ 2 2πσ 2 Taulukko 7.: Yhden muuttujan parametrisia jakaumia. jää tehtäväksi määrittää tuntemattomien parametrien arvot. Kun havaittuja arvoja on rajallinen määrä, on parametrien tarkka määrittäminen mahdotonta. Tällöin paras, mitä voidaan tehdä, on muodostaa tuntemattomille parametriarvoille valistunut arvaus. Systemaattisia menetelmiä valistuneiden arvausten muodostamiseksi kutsutaan parametrien estimoinniksi. 7.2 Suurimman uskottavuuden estimointi Tarkastellaan datalähdettä, josta on havaittu lukuarvot x,..., x n, ja jonka jakauman tiheysfunktio oletetaan parametria θ vaille tunnetuksi. Kun halutaan muodostaa valistunut arvaus tuntemattoman parametrin θ arvolle, voidaan vertailla miten tiheysfunktio f(x,..., x n θ) käyttäytyy parametrin eri arvoilla. Tässä kohtaa on muodostettu uusi näkökulma tiheysfunktion olemukseen. Nimittäin lukuarvot x,..., x n ovat nyt tunnettuja ja parametri θ on tuntematon. Näin tulkittua tiheysfunktiota kutsutaan parametrin θ uskottavuusfunktioksi (engl. likelihood function) ja sitä merkitään L(θ) = f(x,..., x n θ). Mitä suurempi ylläolevan uskottavuusfunktion arvo on, sitä enemmän on aihetta uskoa, että havaitut lukuarvot x,..., x n ovat peräisin parametrin θ mukaisesta datalähteestä. Silloin kun datalähteen tuottamat satunnaismuuttujat voidaan olettaa toisistaan riippumattomiksi, voidaan uskottavuusfunktio kirjoittaa muodossa L(θ) = f(x θ) f(x n θ). (7.3) Luonnollinen tapa tuntemattoman parametrin estimoimiseksi on etsiä parametri, jolle uskottavuusfunktion arvo on suurin mahdollinen. Näin saatu luku θ on parametrin θ suurimman uskottavuuden estimaatti havaitun datajoukon (x,..., x n ) suhteen. 86
88 Esimerkki 7.2 (Jatkuva tasajakauma). Datalähteen satunnaisluvut noudattavat jatkuvan välin [0, θ] tasajakaumaa, jonka parametri θ on tuntematon. On havaittu arvot x,..., x n. Määritä suurimman uskottavuuden estimaatti parametrille θ. Yksittäinen satunnaisluku noudattaa jatkuvan välin [0, θ] tasajakaumaa tiheysfunktiona { θ, x [0, θ], f(x θ) = 0, muuten, joten parametrin θ uskottavuusfunktion havaitun datajoukon (x,..., x n ) suhteen on { n θ n, x,..., x n [0, θ], L(θ) = f(x i θ) = 0, muuten. i= Tämä voidaan myös kirjoittaa muodossa { θ n, θ max{x,..., x n }, L(θ) = 0, muuten. Luonnostelemalla funktion kuvaajan havaitaan, että L(θ) saa suurimman arvonsa pisteessä θ = max{x,..., x n }. Tämä on parametrin θ suurimman uskottavuuden estimaatti. Uskottavuusfunktion L(θ) maksimointi on usein helpompaa logaritmisen muunnoksen avulla. Parametrin θ logaritminen uskottavuusfunktio määritellään kaavalla l(θ) = log L(θ), missä log tarkoittaa luonnollista logaritmia. Koska logaritmi on aidosti kasvava funktio, saavuttaa L(θ) maksiminsa samoissa pisteissä, joissa l(θ) saavuttaa oman maksiminsa. Esimerkki 7.3 (Hirmumyrskyt). Eräälle trooppiselle saarelle on 2000-luvulla iskenyt hirmumyrsky vuosina 2000, 2009, 20 ja 207. Saarelle saapuvien hirmumyrskyjen väliaikoja (vuosina) mallinnetaan käyttämällä lukujoukon {, 2,... } geometrista jakaumaa tiheysfunktiona f(x θ) = ( θ) x θ. Määritä parametrin θ suurimman uskottavuuden estimaatti ja ennusta sen avulla, millä todennäköisyydellä saarelle iskee seuraava hirmumyrsky viimeistään vuonna Parametrin θ uskottavuusfunktio havaittujen väliaikojen x = 9, x 2 = 2 ja x 3 = 6 suhteen on L(θ) = f(9 θ)f(2 θ)f(6 θ) = ( θ) 9 θ ( θ) 2 θ ( θ) 6 θ = ( θ) 4 θ 3. 87
89 Vastaava logaritminen uskottavuusfunktio l(θ) = log L(θ) on näin ollen jonka derivaatta on l(θ) = 4 log( θ) + 3 log θ, l (θ) = 4 θ + 3 θ. Derivaatan nollakohta löytyy pisteestä θ = 3. Tämä on logaritminen uskottavuusfunktion ja näin ollen myös uskottavuusfunktion maksimikohta, sillä l (θ) 7 0. Näin ollen suurimman uskottavuuden estimaatti on suurimman uskottavuuden estimaatti on θ = 3. 7 Kun seuraavan hirmumyrskyn saapumisaikaa merkitään satunnaismuuttujalla X, on todennäköisyys että seuraava hirmumyrsky iskee viimeistään vuonna P(X 3) = f(x θ) = θ + ( θ)θ + ( θ) 2 θ. Sijoittamalla tähän θ = 3 7 x= 7.3 Binaarimallin estimointi saadaan ennusteeksi P(X 3) Tarkastellaan datalähdettä, joka tuottaa toisistaan riippumattomia {0, }-arvoisia satunnaislukuja. Esimerkin 7. mukaan satunnaisluvut noudattavat Bernoullijakaumaa parametrina p = f() ja tiheysfunktiona p, x = 0, f(x p) = p, x =, 0, muuten. Seuraava tulos kertoo, miten suurimman uskottavuuden estimaatti lasketaan binaarimallille. Suurimman uskottavuuden estimoinnin näkökulmasta ei ole väliä, miten nollat ja ykköset ovat sijoittuneet datajoukossa (x,..., x n ), vaan riittää tietää ykkösten suhteellinen osuus. Lause 7.4. Binaariselle {0, }-arvoiselle datalähteelle parametrin p = f() suurimman uskottavuuden estimaatti datajoukon x = (x,..., x n ) suhteen on ykkösten osuus datajoukossa eli p = n n x i. i= Todistus. Bernoullijakauman tiheysfunktio voidaan kirjoittaa kompaktissa muodossa f(x p) = ( p) x p x, 88
90 jonka avulla binaarimallin uskottavuusfunktio havaitun datajoukon (x,..., x n ) suhteen saadaan muotoon n L(p) = f(x p) f(x n p) = ( p) x i p x i. Tätä vastaava logaritminen uskottavuusfunktio voidaan sieventää muotoon n l(p) = (( x i ) log( p) + x i log(p)) i= i= = n( m( x)) log( p) + nm( x) log(p), missä m( x) = n n i= x i on ykkösten suhteellinen osuus havaitussa datajoukossa ja samalla kyseisen datajoukon keskiarvo. Derivoimalla l (p) = n( m( x))( p) ( ) + nm( x)p ja ratkaisemalla yhtälö l (p) = 0 havaitaan että derivaatan nollakohta on p = m( x). Derivoimalla toisen kerran voidaan tarkistaa, että l (p) 0. Näin ollen p = m( x) on suurimman uskottavuuden estimaatti. Esimerkki 7.5 (Vialliset komponentit). Tuotantolinjalla valmistetaan komponentteja menetelmällä, jonka seurauksena yksittäinen komponentti on viallinen todennäköisyydellä p, muista riippumattomasti. Kun tarkastettiin 200 komponentin erä, havaittiin 22 viallista. Määritä suurimman uskottavuuden estimaatti tuntemattoman parametrin p arvolle. Koska komponentit ovat viallisia toisistaan riippumattomasti, vastaa datalähde binaarimallia, jossa 0= ehjä ja = viallinen. Lauseen 7.4 mukaan parametrin p = f() suurimman uskottavuuden estimaatti on ykkösten osuus havaitussa datajoukossa eli p = 22 = %. Suurimman uskottavuuden estimaatti 200 viallisten komponenttien osuudelle koko tuotannossa on siis sama kuin viallisten komponenttien osuus tarkastetussa erässä. Esimerkki 7.6 (Mielipidekysely). Erään valtion äänioikeutetuista valittiin satunnaisotannalla n = 2000 henkilöä ja heiltä kysyttiin, aikovatko äänestää nykyistä presidenttiä seuraavissa presidentinvaaleissa (0= ei, = kyllä ). Vastanneista 774 vastasi kyllä. Estimoi kannatusosuus p koko populaatiossa soveltamalla binaarimallin suurimman uskottavuuden menetelmää. Mikäli 2000 henkilön satunnaisotanta tehdään ilman palautusta N äänioikeutetun populaatiosta, jossa nykyisen presidentin kannatusosuus on p (tuntematon), on todennäköisyys havaita 774 kyllä -ääntä L(p) = ( Np 774 ) )( N Np ( N 2000 ). Ylläolevaa ylläolevaa uskottavuusfunktiota on mahdotonta maksimoida p:n suhteen tuntematta N:n arvoa. Koska tässä tilanteessa populaation koko N on kuitenkin paljon suurempi kuin satunnaisotoksen koko 2000, noudattaa mielipidemittausta vastaava datalähde likimain binaarimallia parametrina p. Tällöin 89
91 lauseen 7.4 mukaan saadaan parametrin p suurimman uskottavuuden estimaatiksi p = = 38.7%. Suurimman uskottavuuden estimaatti kannatusosuudelle kaikkien äänioikeutettujen populaatiossa on siis sama kuin kannatusosuus mielipidemittauksessa. 7.4 Normaalimallin estimointi Normaalijakauman tiheysfunktio f µ,σ (x) = (x µ)2 e 2σ 2 2πσ 2 on parametreja µ ja σ vaille tunnettu. Kun parametreja on kaksi, voidaan parametrit koodata vektoriksi θ = (θ, θ 2 ), jolloin uskottavuusfunktiosta tulee kahden muuttujan funktio L(θ) = L(θ, θ 2 ). Lause 7.7. Normaalijakauman parametrien µ ja σ suurimman uskottavuuden estimaatit datajoukolle (x,..., x n ) ovat datajoukon keskiarvo ja empiirinen keskihajonta ( ) µ = /2 n x i ja σ n = (x i µ ) 2. (7.4) n n i= Todistus. Havaittua datajoukkoa (x,..., x n ) vastaava uskottavuusfunktio on kahden muuttujan funktio n L(µ, σ) = (x 2πσ 2 e i µ) 2 ni= 2σ 2 = (2π) n/2 σ n e (x i µ) 2 2σ 2. i= Ottamalla ylläolevan yhtälön molemmilta puolilta logaritmit saadaan logaritmiseksi uskottavuusfunktioksi l(µ, σ) = n n 2 log(2π) n log σ i= (x i µ) 2. 2σ 2 Logaritmisen uskottavuusfunktion derivaatat parametrien µ ja σ suhteen ovat d dµ l(µ, σ) = σ 2 i= n (x i µ), i= d dσ l(µ, σ) = n σ + σ 3 n (x i µ) 2. Asettamalla ylläolevat derivaatat nolliksi ja ratkaisemalla näistä yhtälöistä parametrit µ ja σ, saadaan derivaattojen nollakohdiksi yhtälön (7.4) mukaiset µ ja σ. Lukupari (µ, σ ) on ainoa parametrikombinaatio, jolle uskottavuusfunktion molemmat derivaatat ovat nollia. Toisen kertaluvun derivaattoja tarkastelemalla voidaan varmistaa, että L(µ, σ ) on uskottavuusfunktion globaali maksimi. 90 i=
92 7.5 Kaksiulotteisen lineaarisen mallin estimointi Lineaarinen regressio on yleinen tilastollinen lähestymistapa, jossa moniulotteisen datajoukon tietyn muuttujan käyttäytymistä pyritään ennustamaan tai selittämään lineaarisella mallilla muista datajoukon muuttujista. Keskeinen perustapaus on kaksiulotteinen datajoukko (x, y ),..., (x n, y n ). Näihin havaintoihin halutaan sovittaa suora y = αx + β, jonka avulla on tarkoitus ennustaa y-muuttujan arvoja x-muuttujan funktiona. Yksi tapa mitata suoran sovituksen hyvyyttä on keskineliövirhe (engl. mean squared error) MSE = n n (y i αx i β) 2. (7.5) i= Keskineliövirhe voidaan myös kirjoittaa muodossa n n i= (y i ŷ i ) 2, missä ŷ i = αx i + β on suoran avulla laskettu y-muuttujan ennuste pisteessä x i. Tällöin paras sovitus saadaan valitsemalla suora, jonka kulmakerroin α ja vakiotermi β ovat sellaiset, että ylläoleva keskineliövirhe on pienin mahdollinen. Tätä sovitustapaa kutsutaan pienimmän neliösumman menetelmäksi ja määritettyä suoraa regressiosuoraksi. Lause 7.8. Keskineliövirheen näkökulmasta paras suora saadaan valitsemalla suoran kulmakerroin α ja vakiotermi β kaavoilla α = sd( x) cor( x, y), sd( y) β = m( y) α m( x), missä m( x), m( y) ja sd( x), sd( y) ovat datajoukon x- ja y-muuttujien keskiarvot ja keskihajonnat, ja cor( x, y) niiden välinen korrelaatio. Alla on esitetty kolme kaksiulotteista sadan alkion datajoukkoa sekä niihin sovitetut regressiosuorat. Varoitus: Pienimmän neliösumman menetelmä sovittaa suoran sellaisiinkin kaksiulotteisiin datajoukkoihin, joissa minkäänlaista lineaarista riippuvuutta ei ole havaittavissa Kulmakertoimen α kaavassa ei ole väliä, käyttääkö empiiristä keskihajontaa vai otoskeskihajontaa, sillä n-kertoimet kumoavat toisensa osamäärässä sd( x) sd( y) = sds( x) sd. s( y) 9
93 Lauseen 7.8 todistus. Keskineliövirhettä on kätevä analysoida soveltamalla kaksiulotteisen datajoukon empiirisen jakauman todennäköisyystulkintaa. Jos (X, Y ) on satunnainen lukupari, joka on arvottu tasaisen satunnaisesti havaitusta datajoukosta, niin kaavan (6.6) mukaan Avaamalla neliölauseke muotoon MSE = E(Y αx β) 2. (Y αx β) 2 = Y 2 + α 2 X 2 + β 2 2αXY 2βY + 2αβX ja käyttämällä odotusarvon lineaarisuutta nähdään, että MSE = EY 2 + α 2 E(X 2 ) + β 2 2αE(XY ) 2βE(Y ) + 2αβE(X). Ylläolevan lausekkeen derivaatta parametrin β suhteen on Ratkaisemalla d MSE = 0 saadaan dβ d MSE = 2β 2E(Y ) + 2αE(X). dβ β = E(Y ) αe(x). Tätä yhtälöä soveltamalla saadaan keskineliövirheen derivaataksi parametrin α suhteen d dα MSE = αe(x2 ) E(XY ) + βe(x) = αe(x 2 ) E(XY ) + (E(Y ) αe(x))e(x) = α Var(X) Cov(X, Y ). Ratkaisemalla d MSE = 0 saadaan tästä korrelaation määritelmän mukaan dα α = Cov(X, Y ) Var(X) = Cor(X, Y ) SD(X) SD(Y ) = SD(Y ) Cor(X, Y ). SD(X) 2 SD(X) Väite seuraa tästä, sillä lauseen 6.2 mukaan E(X) = m( x), E(Y ) = m( y), SD(X) = sd( x) ja SD(Y ) = sd( y) sekä lauseen 6.2 mukaan Cor(X, Y ) = cor( x, y). Yllä esitetty lineaarisen mallin sovitusmenetelmä voidaan tulkita myös suurimman uskottavuuden estimaattorina stokastiselle mallille, jossa datalähde tuottaa satunnaisluvut (Y,..., Y n ) muotoa Y i = αx i + β + σz i, (7.6) missä toisistaan riippumattomat satunnaismuuttujat Z,..., Z n noudattavat normitettua normaalijakaumaa ja luvut x,..., x n sekä parametri σ > 0 ovat 92
94 tunnettuja. Tämä on kahden muuttujan lineaarinen normaalimalli. Näillä oletuksilla satunnaismuuttujien Y,..., Y n yhteisjakauman tiheysfunktio on f(y,..., y n x,..., x n, α, β, σ) = n (2πσ) /2 e (y i α βx i ) i= 2 2σ 2. Kun lukuarvot x,..., x n ja parametri σ sekä havainnot y,..., y n oletetaan tunnetuiksi, voidaan ylläoleva tiheysfunktio tulkita tuntemattomien parametrien α ja β uskottavuusfunktiona L(α, β), jonka logaritminen uskottavuusfunktio muodossa l(α, β) = n 2 log(2πσ) 2σ 2 n (y i α βx i ) 2. Ylläoleva lauseke voidaan kirjoittaa keskineliövirheen (7.5) avulla muodossa i= l(α, β) = n 2 log(2πσ) n 2σ 2 MSE, josta nähdään että uskottavuusfunktio maksimoituu täsmälleen silloin, kun keskineliövirhe minimoituu. Näin ollen lineaarisen normaalimallin (7.6) parametrien α ja β suurimman uskottavuuden estimaattorit ovat samat kuin lauseessa Tarkentuvat ja harhattomat estimaattorit Tarkastellaan datalähdettä, jonka tuottamat satunnaismuuttujat X, X 2,... noudattavat jakaumaa f(x θ), missä parametri θ on tuntematon. Parametrin θ: estimaatti on havaitun datajoukon x = (x,..., x n ) pohjalta laskettu arvaus ˆθ = g( x) parametrin θ arvoksi. estimaattori on funktio (x,..., x n ) g(x,..., x n ), joka kuvaa datajoukon estimaatiksi 2. Tuntemattoman parametrin estimaattoriksi voidaan periaatteessa valita mikä tahansa funktio g( x). Intuitiivisesti on kuitenkin selvää, että jotkut estimaattorit ovat parempia kuin toiset. Stokastisen mallin estimaattorin hyvyyttä voidaan luonnehtia analysoimalla, miten se käyttäytyisi saadessaan syötteekseen riippumattomia satunnaislukuja X, X 2,... mallin mukaisesta jakaumasta f(x θ). Estimaattori g(x,..., x n ) on tarkentuva (engl. consistent), jos tapahtuman g(x,..., X n ) = θ ± ɛ 2 Estimaattoriksi kutsutaan usein myös satunnaismuuttujaa g(x) = g(x,..., X n ), joka on laskettu jakaumasta f(x θ) generoitujen satunnaislukujen (X,..., X n ) muunnoksena. 93
95 todennäköisyys lähestyy ykköstä suurilla n:n arvoilla, oli ɛ > 0 miten pieni hyvänsä. Tarkentuvuus siis tarkoittaa, estimaattori tuottaa suurella todennäköisyydellä lähellä todellista parametria olevia arvoja, silloin kun käytössä on paljon dataa. Estimaattori g(x,..., x n ) on harhaton (engl. unbiased), jos Eg(X,..., X n ) = θ. Harhattomuus tarkoittaa, että jos samasta datalähteestä laskettaisiin suuri määrä estimaatteja g(x,..., X n ), niin estimaattien keskiarvo olisi lähellä oikeaa parametria. Esimerkki 7.9 (Binaarimalli). Binaarimallin satunnaismuuttujat noudattavat Bernoulli-jakaumaa parametrina p = f() ja suurimman uskottavuuden estimaattori on (lause 7.4) havaitun datajoukon keskiarvo m(x,..., x n ) = n n x i. i= Jos X, X 2,... ovat binaarimallin mukaisia toisistaan riippumattomia satunnaislukuja, niin E(X i ) = p ja odotusarvon lineaarisuuden perusteella ( ) n Em(X,..., X n ) = E X i = n E(X i ) = p. n n Lisäksi suurten lukujen lain perusteella (lause 3.3) tapahtuman i= i= n n i= X i = p ± ɛ todennäköisyys on lähellä ykköstä suurilla n:n arvoilla. Näin ollen m(x,..., x n ) on tarkentuva ja harhaton estimaattori binaarimallin parametrille p. Esimerkki 7.0 (Normaalimallin odotusarvo). Normaalimallin odotusarvoparametrin µ suurimman uskottavuuden estimaattori (lause 7.7) on havaitun datajoukon keskiarvo m(x,..., x n ) = n x i. n Samoin perustein kuin esimerkissä 7.9 nähdään, että m(x,..., x n ) on tarkentuva ja harhaton estimaattori normaalimallin odotusarvoparametrille µ. Esimerkki 7. (Normaalimallin keskihajonta ja varianssi). Normaalimallin keskihajontaparametrin σ suurimman uskottavuuden estimaattori (lause 7.7) on datajoukon empiirinen keskihajonta sd( x) = ( n i= ) /2 n (x i m( x)) 2. i= 94
96 Suurten lukujen lain (lause 3.3) avulla voidaan perustella, että empiirinen keskihajonta sd( x) on tarkentuva estimaattori normaalimallin keskihajontaparametrille σ. Myös otoskeskihajonta sd s ( x) on tarkentuva, sillä empiirisen keskihajonnan ja otoskeskihajonnan välinen muuntokerroin (6.9) lähestyy ykköstä suurilla n:n arvoilla. Keskihajontojen laskukaavoissa esiintyvän epälineaarisen neliöjuurioperaation johdosta sd( x) ja sd s ( x) eivät kuitenkaan ole parametrin σ estimaattoreina harhattomia. Tästä syystä varsinkin klassisessa frekventistisessä tilastotieteessä on ollut tapana etsiä harhatonta estimaattoria varianssiparametrille σ 2. Varianssiparametrin suurimman uskottavuuden estimaattori havaitun datajoukon empiirinen varianssi var( x) = sd( x) 2. Tämäkin estimaattori on lievästi harhainen, sillä avaamalla allaoleva neliölauseke on mahdollista päätellä, että E sd 2 (X,..., X n ) = E ( n ) n (X i m(x,..., X n )) 2 i= = = n n σ2. Datajoukon otosvarianssi var s ( x) = sd s ( x) 2 on sen sijaan harhaton, sillä muuntokaavan (6.9) mukaan E sd 2 s(x,..., X n ) = n n E sd2 (X,..., X n ) = n n n n σ2 = σ 2. 95
97 Luku 8 Tilastolliset luottamusvälit 8. Luottamusvälin käsite Edellisessä luvussa lasketut parametriestimaatit olivat yksittäisiä reaalilukuja eli piste-estimaatteja. Koska käytännössä piste-estimaatti lähes aina poikkeaa jonkin verran parametrin todellisesta arvosta, tarvitaan tapa kuvailla pisteestimaatin tarkkuutta. Parametrin θ väliestimaatti on havaitusta datajoukosta x = (x,..., x n ) laskettu lukuväli [a( x), b( x)], johon parametrin θ toivotaan sisältyvän. Väliestimaatin laskentamenetelmä eli väliestimaattori puolestaan on funktio, joka kuvaa datajoukon x väliestimaatiksi [a( x), b( x)]. Luonnollinen tapa analysoida väliestimaattorin hyvyyttä olisi laskea tapahtuman θ [a( x), b( x)] todennäköisyys. Tämä on kuitenkin mahdotonta, sillä kyseiseen tapahtumaan ei liity ainuttakaan satunnaismuuttujaa. Sen sijaan voidaan miettiä mitä tapahtuisi, jos väliestimaatti laskettaisiin havaitun datajoukon sijasta käyttäen mallin mukaisesta datalähteestä tuotettuja satunnaislukuja X = (X,..., X n ). Näin muodostetun lukuvälin [a( X), b( X)] päätepisteet ovat satunnaismuuttujia, joille voidaan laskea todennäköisyys ( P θ [a( X), b( X)] ) ( = P a( X) θ ja b( X) ) θ. Mitä suurempi ylläoleva todennäköisyys on, sitä paremmat takeet väliestimaattorin hyvyydelle saadaan. Stokastisen mallin parametrin θ luottamusväli luottamustasolla α on lukuväli [a( x), b( x)], jonka päätepisteet on laskettu havaitusta datajoukosta x = (x,..., x n ) käyttämällä väliestimaattoria, jolle ( P θ [a( X), b( X)] ) α kaikilla parametrin θ arvoilla. Esimerkki 8. (Jatkuva tasajakauma). Datalähteen satunnaisluvut noudattavat jatkuvan välin [0, θ] tasajakaumaa, missä θ on tuntematon. Datalähteestä on havaittu arvot x = 8., x 2 = 2.6 ja x 3 = 8.8. Määritä parametrille θ luottamusväli luottamustasolla 95%. Tämä on mahdollista silloin, kun θ tulkitaan satunnaismuuttujaksi, ks. luku 0. 96
98 Esimerkissä 7.2 johdettiin parametrin θ suurimman uskottavuuden estimaattoriksi ˆθ( x) = max{x,..., x n }. Luottamusvälin määrittämiseksi voidaan tarkastella, millaisia arvoja estimaattori tuottaisi uusintamittauksesta saataville satunnaismuuttujille X = (X,..., X n ). Yksittäisen satunnaismuuttujan X i kertymäfunktio pisteessä t [0, θ] on P(X i t) = t 0 f(x θ) dx = t 0 θ dt = t θ, joten satunnaismuuttujan ˆθ( X) = max{x,..., X n } kertymäfunktio on P(ˆθ( X) t) = P(X t,..., X n t) = P(X t) P(X n t) = ( ) n t. θ Näin ollen luvuille 0 s t pätee P(sθ ˆθ( X) tθ) = P(ˆθ( X) tθ) P(ˆθ( X) sθ) = t n s n, joka voidaan myös kirjoittaa muodossa ( ˆθ( X) P θ ˆθ( ) X) t s = t n s n. Luottamustason α väliestimaattori saadaan siis kaavasta [ ˆθ( x), ˆθ( x) ], t s kun s ja t on valittu niin, että t n s n = α. Tästä nähdään, että valitun luottamustason luottamusväli voidaan määrittää monella eri tapaa. Eräs luonteva tapa on valita s = ( α) /n ja t =. Tällöin datajoukolle (8., 2.6, 8.8) saadaan luottamustason α = 0.95 luottamusväliksi [ ˆθ( x), ˆθ( x) ( α) /n ] = [ 8.8, ] 8.8 ( 0.95) /3 = [8.8, 23.9]. Kuvassa 8. on esitetty sata ylläolevalla väliestimaattorilla laskettua luottamusväliä. Jokainen luottamusväli on laskettu datajoukosta, jonka kolme alkiota on generoitu R:n pseudosatunnaislukugeneraattorilla välin [0, 0] jatkuvasta tasajakaumasta. Luottamusväleistä osuus 94 peittää estimoitavan parametrin 00 todellisen arvon θ = 0. Edellämainittu osuus lähestyisi arvoa 0.95, mikäli luottamusvälien estimoimista jatkettaisiin rajattoman monta kertaa. 97
99 Kuva 8.: Simuloimalla ] tuotetuista n = 3 alkion datajoukoista väliestimaattorilla ˆθ( x) [ˆθ( x), laskettuja luottamusvälejä tasajakauman parametrille θ. ( 0.95) /3 8.2 Odotusarvoparametrin luottamusväli Tarkastellaan yleistä stokastista datalähdettä, joka tuottaa riippumattomia ja samoin jakautuneita satunnaislukuja, joiden jakaumasta ei tiedetä mitään muuta kuin että jakaumalla on olemassa äärellinen odotusarvo ja keskihajonta. Havaitun datajoukon x = (x,..., x n ) keskiarvo m( x) = on tarkentuva ja harhaton piste-estimaatti jakauman odotusarvoparametrille µ. Sitä vastaavan luottamusvälin määrittäminen vaikuttaa mahdottomalta tehtävältä ilman tarkempia tietoja datalähteen jakaumasta. Silloin kun havaittu datajoukko on suuri, luottamusväli kuitenkin voidaan likiarvoisesti määrittää keskeisen raja-arvolauseen avulla. Allaolevan symmetrisen luottamusvälin sädettä z sd( x) n n n i= kutsutaan luottamusvälin virhemarginaaliksi. Lause 8.2. Suurelle datajoukolle likiarvoinen luottamustason α luottamusväli odotusarvoparametrille µ saadaan kaavasta x i m( x) ± z sd( x) n, (8.) missä m( x) ja sd( x) ovat havaitun datajoukon keskiarvo ja empiirinen keskihajonta 2, ja z on luku, jolle normitettua normaalijakaumaa noudattava satunnaismuuttuja Z toteuttaa P( z Z z) = α. Todistus. Todetaan ensiksi, että µ = m( x) ± z sd( x) n pätee täsmälleen silloin, kun z m( x) µ sd( x)/ n z. 2 Kaavassa (8.) voi käyttää myös otoskeskihajontaa, sillä sd s ( x) sd( x) suurilla n. 98
100 Tarkastellaan seuraavaksi, millä todennäköisyydellä ylläoleva lauseke pitää paikkansa, kun havaittu datajoukko x = (x,..., x n ) korvataan mallin mukaisesta datalähteestä generoidulla satunnaismuuttujien listalla X = (X,..., X n ). Koska suurten lukujen lain (lause 3.3) perusteella sd( X) on lähellä mallin keskihajontaa σ, niin keskeisen raja-arvolauseen (lause 5.9) perusteella suurilla n pätee m( X) µ sd( X)/ n m( X) µ σ/ n Z, missä satunnaismuuttuja Z noudattaa normitettua normaalijakaumaa. Näin ollen ( P µ = m( X)±z sd( X) ) ( = P z m( ) X) µ n sd( x)/ n z P( z Z z) = α. Likiarvoisen luottamusvälin lausekkeessa (8.) tarvitaan luku z, jolle normitettua normaalijakaumaa noudattava Z toteuttaa P( z Z z) = α. Todennäköisyyden peruslaskusääntöjen ja normaalijakauman symmetrian perusteella P( z Z z) = P(Z z) P(Z < z) = P(Z z) P(Z > z) = P(Z z) ( P(Z z)) = 2F Z (z), missä F Z (z) = P(Z z) on normitetun normaalijakauman kertymäfunktio. Tarvittu luku z saadaan siis yhtälön 2F Z (z) = α ratkaisuna muodossa ( ) + α z = F Z. (8.2) 2 Kertymäfunktion käänteisfunktiolle F Z (z) ei tunneta siistiä matemaattista lauseketta, mutta sen arvot voidaan katsoa taulukoista tai laskea numeerisilla ohjelmistoilla (R: qnorm, Excel: NORM.S.INV). Esimerkki 8.3 (Kahviautomaatti). Kahviautomaatin toimintaa testattiin valuttamalla automaatista 30 kupillista ja mittaamalla kahvin määrät kupeissa (yksikkönä cl). Mittauksesta kerättiin datajoukko x = (0.24, 9.94, 0.55, 9.28, 0.57, 9.77, 9.50, 0.03, 0.5, 0.29, 0.92, 0.06, 9.63, 0.83, 0., 9.7, 0.29, 0.24, 9.73, 0.56, 9.8, 9.84, 9.9, 0.74, 9.57, 0.76, 0.53, 0.52, 0.42, 0.), jonka keskiarvo on m( x) = 0.4 ja keskihajonta sd( x) = Määritä likiarvoinen luottamustason 95% luottamusväli kahviautomaatin valuttamien kahvimäärien pitkän aikavälin keskiarvolle µ. 99
101 Likiarvoiseksi luottamusväliksi saadaan kaavan (8.) avulla m( x) ± z sd( x) n = 0.4 ± = 0.4 ± 0.09, missä kaavan (8.2) mukaan z = F Z (0.975) =.96. Kuvassa 8.2 on esitetty sata ylläolevalla väliestimaattorilla laskettua luottamusväliä. Jokainen luottamusväli on laskettu datajoukosta, jonka 30 alkiota on generoitu R:n pseudosatunnaislukugeneraattorilla normaalijakaumasta odotusarvona µ = 0 ja keskihajontana σ = 0.5. Luottamusväleistä osuus 92 peittää estimoitavan parametrin todellisen arvon µ = 0. Edellämainittu osuus 00 lähestyisi arvoa 0.95, mikäli luottamusvälien estimoimista toistettaisiin rajattoman monta kertaa Kuva 8.2: Simuloimalla tuotetuista n = 30 alkion datajoukoista väliestimaattorilla m( x) ±.96 sd( x) n laskettuja luottamusvälejä yleisen mallin odotusarvoparametrille µ. 8.3 Binaarimallin parametrin luottamusväli Esimerkissä 7. havaittiin, että binaarisen datalähteen tuottamat satunnaisluvut noudattavat Bernoulli-jakaumaa parametrina p = f(). Binaarimallin parametrin estimointi on hieman helpompaa kuin yleisen mallin, sillä {0, }-arvoiset satunnaismuuttujat eivät koskaan voi poiketa odotusarvostaan kovin paljon, ja tämän avulla binaarimallin keskihajonnalle saadaan yleispätevä yläraja. Lause 8.4. Suurelle datajoukolle likiarvoinen luottamustason α luottamusväli binaarimallin parametrille p = f() saadaan kaavasta ˆp( x) ± z 0.5 n, (8.3) missä ˆp( x) on ykkösten suhteellinen osuus havaitussa datajoukossa ja z on luku, jolle normitettua normaalijakaumaa noudattava satunnaismuuttuja Z toteuttaa P( z Z z) = α. 00
102 Todistus. Tarkastellaan, millä todennäköisyydellä lauseke (8.3) pitää paikkansa, kun havaittu datajoukko x = (x,..., x n ) korvataan mallin mukaisesta datalähteestä generoidulla satunnaismuuttujien listalla X = (X,..., X n ). Esimerkissä 7. johdettiin näiden satunnaislukujen jakaumaksi Bernoulli-jakauma parametrina p, odotusarvona µ = p ja keskihajontana σ = p( p). Tarkastelemalla polynomin p( p) derivaattoja havaitaan, että σ = p( p) 0.5( 0.5) = 0.5. (8.4) Todetaan seuraavaksi, että ykkösten lukumäärä datajoukossa x = (x,..., x n ) voidaan kirjoittaa summana n i= x i, joten ykkösten suhteellinen osuus on samalla datajoukon keskiarvo ˆp( x) = n x i = m( x). n i= Näin ollen keskeisen raja-arvolauseen (lause 5.9) perusteella suurilla n pätee ˆp( X) p σ/ n = m( X) µ σ/ n Z, (8.5) missä satunnaismuuttuja Z noudattaa normitettua normaalijakaumaa. Yhdistämällä päätelmät (8.4) ja (8.5) todetaan, että ( ) ) P p = ˆp( X) ± z 0.5 P (p = ˆp( X) ± z n σ n = P ( z ˆp( X) ) p σ/ n z P( z Z z) = α. Esimerkki 8.5 (Mielipidekysely). Erään valtion äänioikeutetuista valittiin satunnaisotannalla n = 2000 henkilöä ja heiltä kysyttiin, aikovatko äänestää nykyistä presidenttiä seuraavissa presidentinvaaleissa (0=Ei, =Kyllä). Vastanneista 774 vastasi kyllä. Määritä piste-estimaatti ja luottamustason 95% luottamusväli presidentin kannatusosuudelle p kaikkien äänioikeutettujen keskuudessa. Koska satunnaisotoksen koko on pieni suhteessa koko tutkittavaan populaatioon, ovat yksittäisten henkilöiden vastaukset toisistaan likimain riippumattomat, jolloin mielipidekyselyn tulokset noudattavat likimain binaarimallia parametrina p. Kannatusosuuden suurimman uskottavuuden piste-estimaatti on (esimerkki 7.6) on ˆp( x) = = 0.387, ja luottamustason 95% luottamusväli saadaan kaavasta (8.3) ˆp( x) ± z 0.5 n = ± = ± 0.022, 0
103 jossa on käytetty kaavan (8.2) mukaista z-arvoa F Z (0.975) =.96. Kuvassa 8.3 on esitetty sata binaarimallin väliestimaattorilla laskettua luottamusväliä. Jokainen luottamusväli on laskettu datajoukosta, jonka 2000 alkiota on generoitu R:n pseudosatunnaislukugeneraattorilla Bernoulli-jakaumasta parametrina p = 0.4. Luottamusväleistä täsmälleen osuus 95 peittää estimoitavan parametrin todellisen arvon p = 0.4. Näin ei välttämättä käy aina, mutta 00 edellämainittu osuus lähestyisi arvoa 0.95, mikäli luottamusvälien estimoimista toistettaisiin rajattoman monta kertaa Kuva 8.3: Simuloimalla tuotetuista n = 2000 alkion datajoukoista väliestimaattorilla ˆp( x) ± n laskettuja luottamusvälejä binaarimallin parametrille p. Hyvä puoli kaavassa (8.3) on se, että luottamusvälin leveys riippuu ainoastaan luottamustasosta α ja datajoukon koosta n. Tällöin voidaan ennalta määrittää haluttu luottamusvälin leveys ja sen jälkeen laskea, miten suuri n tarvitaan valitun luottamustason saavuttamiseksi. Taulukossa 8. on muutamia esimerkkejä luottamusvälien leveyksistä. Melko vakiintunut tapa on käyttää 95% luottamustasoa, mutta tälle valinnalle ei ole sen syvällisempiä matemaattisia perusteita. n 95%-luottamusväli 99%-luottamusväli 000 ˆp ± 3.% ˆp ± 4.% 2000 ˆp ± 2.2% ˆp ± 2.9% 0000 ˆp ±.0% ˆp ±.3% Taulukko 8.: Binaarimallin luottamusvälejä. 02
104 8.4 Kommentteja Esimerkissä johdettiin välin [0, θ] jatkuvan tasajakauman parametrille θ luottamustason α = 95% luottamusväli [ ] ˆθ( x) ˆθ( x), = [8.8, 23.9] ( α) /n havaitusta datajoukosta x = (8.2, 2.6, 8.8). Hieman intuition vastaisesti on kuitenkin väärin sanoa, että näin saatu lukuväli [8.8, 23.9] peittää tuntemattoman parametriarvon θ vähintään 95% todennäköisyydellä. Luottamusvälien analysoimisessa nimittäin todennäköisyydet liittyvät tuleviin, vielä havaitsemattomiin väliestimaattorin arvoihin. Oikea tulkinnan mukaan suuresta määrästä ylläolevalla väliestimaattorilla laskettuja lukuvälejä vähintään 95% peittää tuntemattoman parametriarvon. Yksittäisestä luottamusvälistä ei luku α = 95% kerro mitään. Tämä on syy, miksi lukua α kutsutaan luottamustasoksi, ei todennäköisyydeksi. Kuvassa 8.2 esitettiin simuloimalla tuotetuista datajoukoista väliestimaattorilla m( x) ±.96 sd( x) n laskettuja luottamusvälejä yleisen mallin odotusarvoparametrille µ. Luottamusväleistä osuus 92 peitti estimoitavan parametrin todellisen arvon, mikä on aika paljon alle väitetyn luottamustason 95%. Tämä epä- 00 tarkkuus johtuu siitä, että laskuissa käytetty n = 30 ei ole erityisen suuri luku suuren datajoukon likiarvoisen luottamusväliestimaattorin (8.) näkökulmasta. Pienille datajoukoille on johdettu kehittyneempiä menetelmiä luottamusvälien estimoimiseen. Esimerkiksi normaalimallin odotusarvoparametrille voidaan johtaa pienillekin datajoukoille tarkka luottamusväliestimaattori kaavalla m( x) ± z sd s( x) n, jossa z lasketaan normaalijakaumaa hieman paksuhäntäisemmästä t-jakaumasta. Kyseisen jakauman teki tunnetuksi vuonna 908 englantilainen William S. Gosset ( ), joka Guinnesin panimolla työskennellessään käytti julkaisuissaan salanimeä Student. Luottamusvälejä voidaan odotusarvojen lisäksi laskea muillekin tunnusluvuille, esimerkiksi keskihajonnalle ja korrelaatiolle. Näiden matemaattinen analyysi on melko monimutkaista, ja normaalijakauman lisäksi tarvitaan normaalijakauman muunnosten jakaumia, esim. t-jakauma, χ 2 -jakauma 3 ja F -jakauma. Luottamusvälien yleisen teorian perustukset luonnosteli puolalaislähtöinen Jerzy Neyman (894 98) vuonna 937 artikkelissa Outline of a theory of statistical estimation based on the classical theory of probability. Monimutkaisten mallien likiarvoisia luottamusvälejä voidaan laskea tietokonesimulointiin perustuvalla bootstrap-menetelmällä, jonka esitteli amerikkalainen Bradley Efron (938 ) vuonna 979 artikkelissa Bootstrap methods: Another look at the jackknife. 3 lausutaan khii toiseen 03
105 Luku 9 Bayesläiset tilastolliset mallit 9. Priorijakauma ja posteriorijakauma Bayesläisen tilastollisen päättelyn lähtökohtana on päivittää satunnaisilmiöön liittyvien tapahtumien todennäköisyyksiä sitä mukaa kuin ilmiöstä saadaan uutta dataa. Tämä edellyttää todennäköisyyden käsitteen subjektiivista tulkintaa. Bayesläisessä ajattelussa datalähteen käyttäytymistä kuvaava tuntematon parametri mielletään satunnaismuuttujaksi, jonka jakauma kuvaa havainnoijan uskomusta parametrin arvosta. Uskomusta päivitetään, kun havaitaan uutta dataa. Havainnoijan uskomusta parametrin arvosta kuvaa priorijakauma p(θ), joka kertoo millä todennäköisyydellä havainnoija uskoo parametrin arvon olevan θ. Kun datalähteestä havaitaan uusi datapiste x, uskomus päivitetään uudeksi jakaumaksi. Päivitetty jakauma p(θ x) on parametrin posteriorijakauma. Uskomuksen päivittäminen perustuu uskottavuusfunktioon f(x θ), joka määrittää parametrin θ mukaan käyttäytyvän datalähteen tuottamien arvojen jakauman. 2 Diskreetti priorijakauma p(θ) päivitetään posteriorijakaumaksi soveltamalla Bayesin päivityskaavaa p(θ x) = p(θ)f(x θ) θ p(θ )f(x θ ). (9.) Posteriorijakauma saadaan siis priorijakauman ja uskottavuusfunktion normitettuna tulona. Päivityskaava jatkuville priorijakaumille saadaan vaihtamalla summa integraaliksi ylläolevassa kaavassa. Päivityskaava voidaan johtaa luvun.7 tuloksista ja siinä esiintyvät funktiot voidaan tulkita satunnaismuuttujien yhteisjakauman reunajakaumina (luku 9.6). lat. prior = edeltävä, posterior = seuraava 2 Funktiota f(x θ) kutsutaan tiheysfunktioksi silloin, kun se tulkitaan x:n funktiona, ja uskottavuusfunktioksi silloin, kun se tulkitaan θ:n funktiona. 04
106 Esimerkki 9. (Tuntematon kolikko). Laatikossa tiedetään olevan kolme tasaista (kruunan tn θ = 0.5), yksi lievästi vino (θ = 0.6) ja yksi vahvasti vino (θ = 0.9) kolikko. Satunnaisesti valittua kolikkoa heitettäessä havaitaan klaava. Millä todennäköisyydellä heitetty kolikko oli tasainen? Ennen datan havaitsemista laatikosta satunnaisesti valittu kolikko on tasainen todennäköisyydellä 3, lievästi vino todennäköisyydellä ja vahvasti vino 5 5 todennäköisyydellä. Kun tuntematonta parametria θ mallinnetaan satunnaismuuttujana Θ, on parametrin jakauma ennen datan havaitsemista ao. taulukon 5 mukainen θ p(θ) Koska θ edustaa kruunan todennäköisyyttä, on parametrin θ uskottavuusfunktio havainnon klaava suhteen f(klaava θ) = θ. Näin ollen p(θ)f(klaava θ) = 0.6 ( 0.5) ( 0.6) ( 0.9) θ = 0.4, joten kaavan (9.) mukaan parametriarvon 0.5 posterioritodennäköisyys on p(0.5 klaava) = p(0.5)f(klaava 0.5) 0.6 ( 0.5) = p(θ)f(klaava θ) 0.4 θ = Klaavan havaitseminen siis kasvatti kolikon tasaisuuden todennäköisyyttä arvosta 0.5 arvoon 0.75, mutta kolikolle itselleen ei heiton aikana tapahtunut mitään. Satunnaismuuttuja Θ ei siis kuvasta heitettyä kolikkoa, vaan kolikon heittäjän subjektiivista uskomusta heitetyn kolikon tyypistä. Kaavan (9.) avulla voidaan laskea posterioritodennäköisyydet myös parametriarvoille 0.6 ja 0.9. Tuloksena saadaan allaolevassa taulukossa esitetty posteriorijakauma θ p(θ klaava)
107 Käytännössä posteriorijakauman kannattaa laskea vaiheittain sarake sarakkeelta allaolevan taulukon avulla. Kolme ensimmäistä saraketta saadaan suoraan tehtävänannosta. Sarake 4 eli normittamaton posterioritiheys saadaan kertomalla pareittain sarakkeiden 2 ja 3 alkiot. Päivityskaavassa (9.) esiintyvä normitusvakio saadaan summaamalla sarakkeen 4 alkiot, eli tässä tapauksessa 0.4. Sarake 5 saadaan jakamalla sarakkeen 4 alkiot normitusvakiolla 0.4. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(klaava θ) p(θ)f(klaava θ) p(θ klaava) Lasketaan samalla tapaa vielä posteriorijakauma havainnon x = kruuna suhteen. Laskelman välivaiheet on esitetty allaolevassa taulukossa. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(kruuna θ) p(θ)f(kruuna θ) p(θ kruuna) Alkuperäinen priorijakauma ja tuloksena saadut kaksi posteriorijakaumaa on esitetty alla Priorijakauma p(θ) Posteriorijakauma p(θ klaava) Posteriorijakauma p(θ kruuna) 9.2 Usean datapisteen posteriorijakauma Bayesin päivityskaavaa (9.) voidaan soveltaa myös silloin, kun havaitaan monta datapistettä. Tällöin kaavan muuttuja x tulkitaan datapisteiden listaksi x = 06
108 (x,..., x n ). Tarkastellaan esimerkiksi saman kolikon heittämistä monta kertaa peräkkäin. Kun havaitaan kaksi klaavaa, uskottavuusfunktio datajoukolle (x, x 2 ) = (0, 0) on f(0, 0 θ) = f(0 θ)f(0 θ) = ( θ) 2. Parametrin θ posteriorijakauma kahden klaavan suhteen saadaan allaolevan taulukon mukaisilla laskuilla. Parametri Prioritiheys Uskottavuus Normittamaton posterioritiheys Posterioritiheys θ p(θ) f(0, 0 θ) p(θ)f(0, 0 θ) p(θ 0, 0) Samaan tapaan voidaan laskea posteriorijakauma useampienkin klaavojen sarjoille. Alla muutama posteriorijakauma Posteriorijakauma p(θ 0) Posteriorijakauma p(θ 0, 0) Posteriorijakauma p(θ 0, 0, 0, 0, 0) Sadan klaavan havaitsemisen jälkeen posteriorijakauman massa keskittyy tähtitieteellisen pientä poikkeamaa vaille arvoon 0.5. Tämä tuntuu paradoksaaliselta, sillä tn saada 00 klaavaa peräkkäin tasaisella kolikolla on Paradoksi selittyy priorin valinnalla: Ylläoleva priorijakauma p(θ) kuvastaa absoluuttista 00% varmuutta siitä, että kolikko ei puolla klaavan suuntaan. 9.3 Uskomuksen vaiheittainen päivittäminen Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia satunnaismuuttujia. Havainnoijan uskomusta tuntemattoman parametrin arvosta kuvastaa priorijakauma p(θ). Havaittuaan datapisteen x hän päivittää uskomuksensa posteriorijakaumaksi p(θ x ). Miten uskomus tulee päivittää, kun sen jälkeen havaitaan vielä toinen uusi datapiste x 2? Havaittuja datapisteitä x ja x 2 vastaava posteriorijakauma voidaan laskea soveltamalla Bayesin päivityskaavaa (9.) muodossa p(θ x, x 2 ) = p(θ)f(x, x 2 θ) θ p(θ )f(x, x 2 θ ), (9.2) 07
109 missä f(x, x 2 θ) on todennäköisyys havaita pistepari (x, x 2 ) parametrin θ mukaan käyttäytyvästä datalähteestä. Toinen tapa päivittää uskomusta on ensin laskea posteriorijakauma ˆp(θ) = p(θ x ) datapisteen x suhteen ja sen jälkeen laskea uusi posteriorijakauma priorijakaumasta ˆp(θ) datapisteen x 2 suhteen. Seuraava tärkeä tulos osoittaa, että vaiheittainen päivitys saman tuloksen kuin suorakin tapa. Tästä seuraa, että sarjamuotoista dataa havainnoivan henkilön tai tietokoneohjelman ei tarvitse pitää kirjaa menneistä datapisteitä: nykyinen uskomus jakaumaksi koodattuna sisältää ennustamisen kannalta kaiken oleellisen informaation menneestä. Lause 9.2. Kaavan (9.2) määrittämä posteriorijakauma voidaan laskea vaiheittain muodossa p(θ x, x 2 ) = ˆp(θ)f(x 2 θ) θ ˆp(θ )f(x 2 θ ), missä ˆp(θ) = p(θ x ). Todistus. Bayesin päivityskaavan (9.) mukaan ˆp(θ) = p(θ x ) = c p(θ)f(x θ), missä normitusvakio c = θ p(θ)f(x θ). Koska datalähde tuottaa riippumattomia satunnaismuuttujia, pätee lisäksi Näin ollen f(x, x 2 θ) = f(x θ)f(x 2 θ). ˆp(θ)f(x 2 θ) θ ˆp(θ )f(x 2 θ ) = c p(θ)f(x θ)f(x 2 θ) θ c p(θ )f(x θ )f(x 2 θ ) p(θ)f(x, x 2 θ) = θ p(θ )f(x, x 2 θ ) = p(θ x, x 2 ). 9.4 Bayesläinen binaarimalli Binaarinen datalähde tuottaa riippumattomia {0, }-arvoisia satunnaislukuja siten, että arvon todennäköisyys on θ. Lähtökohtaisesti parametrista θ ei tiedetä mitään, joten sen uskotaan noudattavan jatkuvan välin [0, ] tasajakaumaa tiheysfunktiona {, x (0, ), p(θ) = 0, muuten. 08
110 Kun datalähteestä havaitaan arvot x = (x,..., x n ), halutaan priorijakauma päivittää posteriorijakaumaksi. Bayesläisen binaarisen mallin kannalta keskeisiä jatkuvia jakaumia ovat betajakaumat. Yleinen betajakauma parametreina a > 0 ja b > 0 on jatkuva jakauma, jonka tiheysfunktio on { c a,b f(θ) = θa ( θ) b, kun θ [0, ], 0, muuten, missä normitusvakio 3 c a,b = (a )!(b )!. Betajakaumien tiheysfunktioita on piirretty kuvaan 9.. Yksikkövälin [0, ] tasajakauma on erikoistapaus betajakau- (a+b )! masta parametreina a = ja b = a =, b = a = 3, b = 9 Kuva 9.: Betajakaumien tiheysfunktioita a = 9, b = 3 Bayesläisen binaarimallin erityispiirre on, että päivityskaavassa datajoukosta x riittää tietää ykkösten lukumäärä x ja nollien lukumäärä n x. Betajakauma parametreina a ja b päivittyy betajakaumaksi parametreina a + x ja b + n x. Erityistapauksessa a = ja b = allaolevasta tuloksesta saadaan päivityskaava tasaiselle priorijakaumalle. Lause 9.3. Jos binaarisen datalähteen parametrin priorijakauma on betajakauma parametreina a ja b, niin posteriorijakauma havainnon x = (x,..., x n ) suhteen on betajakauma parametreina a + x ja b + n x, missä x = n i= x i on ykkösten lukumäärä datajoukossa x. Todistus. Yksittäisen datapisteen x i uskottavuusfunktio on { θ, x i = 0, f(x i θ) = θ, x i =, joten riippumattomuuden perusteella koko datajoukon uskottavuusfunktioksi saadaan n f(x θ) = f(x i θ) = θ x ( θ) n x. i= 3 Betajakauma voidaan määritellä myös silloin, kun a ja b eivät ole kokonaislukuja. Tällöin normitusvakiossa esiintyvät kertomat korvataan gammafunktiolla. 09
111 Normittamaton posteriorijakauma saadaan priorijakauman ja uskottavuusfunktion tulona muotoon p(θ)f(x θ) = ( c a,b θa ( θ) b ) θ x ( θ) n x = c a,b θa+ x ( θ) b+n x. Bayesin päivityskaavan (9.) mukaan posteriorijakauma on näin ollen p(θ x) = p(θ)f(x θ) p(η)f(x η)dη = θ a ( θ) b η a ( η) b dη, missä a = a + x ja b = b + x. Ylläoleva lauseke on betajakauman tiheysfunktio parametreina a ja b. Esimerkki 9.4 (Tuntematon kolikko). Tuntematonta kolikkoa heitettäessä havaittiin 2 kruunaa ja 8 klaavaa. Kolikosta ei ole ennalta mitään taustatietoja. Määritä kruunan todennäköisyyttä kuvaavan parametrin posteriorijakauma. Kuvaile posteriorijakauma myös tapauksessa, kun havaitaan 20 kruunaa ja 80 klaavaa. Koska kolikosta ei ennalta tiedetä mitään, valitaan kruunan todennäköisyyttä kuvaavan parametrin θ priorijakaumaksi yksikkövälin [0, ] tasajakauma, joka on erityistapaus betajakaumasta parametreina a = ja b =. Posteriorijakauma on lauseen 9.3 mukaan betajakauma parametreina a + 2 = 3 ja b + 8 = 9. Jos havaittaisiinkin 20 kruunaa ja 80 klaavaa, saataisiin posteriorijakaumaksi betajakauma parametreina a + 20 = 2 ja b + 80 = 8. Molempien tapauksien posteriorijakaumat on esitetty alla Kuva 9.2: Binaarimallin posteriorijakauma havainnon 2 kruunaa ja 8 klaavaa suhteen (punainen) sekä havainnon 20 kruunaa ja 80 klaavaa suhteen (pinkki). Priorijakauma on esitetty sinisellä. 0
112 9.5 Bayesläinen normaalimalli Tarkastellaan datalähdettä, joka tuottaa riippumattomia normaalijakautuneita satunnaislukuja X, X 2,..., joiden odotusarvo θ on tuntematon ja keskihajonta σ tunnettu. Mallin tuntematon odotusarvoparametri tulkitaan satunnaismuuttujaksi, joka noudattaa normaalijakaumaa odotusarvona µ 0 ja keskihajontana σ 0. Priorijakauman parametreja µ 0 ja σ 0 kutsutaan hyperparametreiksi erotuksena datalähteen käyttäytymistä suoraan kuvaaville parametreille. Datalähteen varsinaiset parametrit (θ, σ) kuvaavat siis datalähteen toimintaa, ja hyperparametrit (µ 0, σ 0 ) havainnoijan uskomusta mallin tuntemattomasta parametrista θ. Normaalimallissa datalähteen odotusarvoparametrin priorijakauma on normaalijakauma tiheysfunktiona p(θ) = (2πσ0) 2 /2 e (θ µ 2 0) 2σ 0 2 (9.3) ja uskottavuusfunktio havaitun datajoukon (x,..., x n ) suhteen on f(x,..., x n θ) = n i= n f(x i θ) = (2πσ 2 ) n/2 e i= (x i θ) 2 2σ 2. (9.4) Normaalimallin tekee erityisen käyttökelpoiseksi se, että normaalijakautunutta prioria vastaa normaalijakautunut posteriori. Lisäksi posteriorijakauman odotusarvon ja keskihajonnan laskemiseksi riittää tietää havaitun datajoukon keskiarvo m(x) ja koko n. Allaolevassa normaalimallin päivityskaavassa posteriorijakauman odotusarvo on painotettu keskiarvo priorijakauman odotusarvosta ja havaitun datajoukon keskiarvosta. Lause 9.5. Bayesläisen normaalimallin posteriorijakauma on normaalijakauma, jonka odotusarvo ja keskihajonta saadaan kaavoista µ = µ σ n m(x) σ 2 σ n σ 2 ja σ = σ0 2 + n σ 2, (9.5) missä m(x) = n n i= x i on havaitun datajoukon keskiarvo. Todistus. Posterijakauman normittamaton tiheysfunktio saadaan lausekkeiden (9.3) ja (9.4) tulona kirjoitettua muotoon p(θ)f(x θ) = c 0 e h(θ), missä h(θ) = (θ µ 0) 2 2σ i (x i θ) 2 2σ 2. ja c 0 = (2πσ 2 0) /2 (2πσ 2 ) n/2. Ylläoleva toisen asteen polynomi voidaan sieventää muotoon h(θ) = aθ 2 + bθ + c,
113 missä a = 2 (σ 2 0 +nσ 2 ), b = ( σ0 2 µ 0 + σ 2 i x ) i ja c = Yleistä neliöksi täydentämisen kaavaa ( aθ 2 + bθ + c = a θ + b ) 2 + c b2 2a 4a soveltamalla saadaan funktiolle h(θ) esitys 2 (σ 2 0 µ 2 0+σ 2 i x2 i ). h(θ) = (θ µ ) 2 2σ 2 + c b2 4a, missä ja µ = b 2a = σ 2 0 µ 0 + nσ 2 m(x) σ nσ 2 σ = (2a) /2 = (σ nσ 2 ) /2. Posterijakauman normittamaton tiheysfunktio saadaan siis muotoon p(θ)f(x θ) = c 0 e h(θ) = c 0 e (θ µ ) 2σ 2 Posterijakauman tiheysfunktio on siis 2 +c b2 4a. p(θ x) = p(θ)f(x θ) p(θ )f(x θ )dθ = e (θ µ 2 ) 2σ 2 = (θ µ ) 2 e 2σ 2 dθ e (θ µ ) 2πσ 2 2 2σ 2, missä viimeinen yhtälö on seurausta siitä, että normaalijakauman tiheysfunktio integroituu ykköseksi. Esimerkki 9.6 (Kohinainen kanava). Lukuarvoisia signaaleja lähetetään kohinaisen tiedonsiirtokanavan välityksellä. Kohinan seurauksena pisteestä A lähetetyn signaalin arvo θ vastaanotetaan pisteessä B satunnaismuuttujana, joka noudattaa normaalijakaumaa odotusarvona θ ja keskihajontana σ = 2. Tiedonsiirtovirheiden kompensoimiseksi sama signaali lähetetään kolme kertaa peräkkäin. Vastaanottaja arvelee ennalta, että lähetetyn signaalin arvo on peräisin normaalijakaumasta, jonka odotusarvo on µ 0 = 5 ja keskihajonta σ 0 =. Mikä on lähetetyn signaalin posteriorijakauma vastaanotettujen signaaliarvojen x = (3., 7.9, 7.0) suhteen? Lähetetyn signaalin posteriorijakauma on normaalijakauma, jonka parametrit saadaan sijoittamalla normaalimallin päivityskaavoihin (9.5) havaitun datajoukon keskiarvo m(x) = 6.0 ja koko n = 3. Posteriorijakauman odotusarvo on µ = µ σ n m(x) σ 2 σ n σ 2 =
114 ja keskihajonta σ = σ0 2 + n σ 2 = Vastaanotettu datajoukko x = (3., 7.9, 7.0) päivittää vastaanottajan uskomusta lähetetyn signaalin arvosta niin, että odotusarvo siirtyy tasolta 5 tasolle 5.43 ja keskihajonta pienenee tasolta tasolle Priori- ja posterijakauma on esitetty kuvassa Kuva 9.3: Lähetetyn signaalin priorijakauma (sininen) ja posteriorijakauma (punainen). 9.6 Kommentteja Diskreetti bayesläinen malli voidaan tulkita satunnaismuuttujien parina (Θ, X), jonka yhteisjakaumalla on tiheysfunktio f Θ,X (θ, x) = p(θ)f(x θ). Satunnaismuuttujien Θ ja X jakaumien tiheysfunktiot voidaan kirjoittaa yhteisjakauman reunajakaumina (luku 2.4) muodossa f Θ (θ) = x p(θ)f(x θ) = p(θ) ja f X (x) = θ p(θ)f(x θ) = f(x). 3
115 Lisäksi uskottavuusfunktio f(x θ) = f X Θ (x θ) voidaan mieltää satunnaismuuttujan X ehdolliseksi tiheysfunktioksi satunnaismuuttujan Θ suhteen (luku 2.5). Vastaavat kaavat ovat voimassa jatkuville jakaumille, kun summat vaihdetaan integraaleiksi. Jos havaintoa x vastaava Bayesin päivityskaava (9.) tulkitaan todennäköisyysjakaumien avaruudessa operoivana kuvauksena U x : priorijakauma posteriorijakauma, voidaan lause 9.2 ilmaista ytimekkäästi muodossa U x2 (U x (p)) = U (x,x 2 )(p). Tai vielä ytimekkäämmin muodossa U x2 U x = U x,x 2. Tämä kaava yleistyy induktiolla muotoon U xn U x = U x,x 2,,x n, josta saadaan rekursiokaavat U x,x 2,,x n = U xn U x,x 2,,x n, U x,x 2,,x n = U x2,x 3,...,x n U x. Bayesläinen binaarimalli oli Thomas Bayesin 763 artikkelin keskeinen tutkimuskohde. 4
116 Luku 0 Bayes-estimaattorit 0. Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia satunnaismuuttujia. Havainnoijan uskomusta tuntemattoman parametrin arvosta kuvastaa priorijakauma p(θ). Havaittuaan datajoukon x hän päivittää uskomuksensa posteriorijakaumaksi p(θ x). Mikä on havainnoijan paras estimaatti tuntemattoman parametrin arvolle? Koska posteriorijakauma p(θ x) sisältää kaiken oleellisen informaation havainnoijan uskomuksesta ja havaitusta datajoukosta x, voidaan sitä pitää estimointitehtävän täydellisenä ratkaisuna. Käytännön tilanteissa on kuitenkin usein tarpeen raportoida yksi luku, joka edustaa jossain mielessä havainnoijan parasta arvausta tuntemattoman parametrin θ arvosta. Parametrin pisteestimaatiksi voidaan valita jokin posteriorijakauman tunnusluku. Yksi vaihtoehto on posteriorijakauman odotusarvo θ E (x) = θ p(θ x) dθ, joka kuvaa millaisia arvoja posteriorijakaumasta keskimäärin saadaan simuloimalla suuri määrä otoksia. Toinen luonteva vaihtoehto on posteriorijakauman moodi eli sellainen parametrin arvo θ M (x), jossa posteriorijakauman tiheysfunktio p(θ x) saavuttaa suurimman arvonsa. Esimerkki 0. (Tuntematon kolikko). Kolikkoa, josta ei ennalta tiedetä mitään, heittämällä havaitaan 4 kruunaa ja klaava. Määritä kruunan todennäköisyyttä mallintavan parametrin θ piste-estimaatti käyttäen (a) posteriorijakauman odotusarvoa (b) posteriorijakauman moodia. Koska kolikon luonteesta ei ennalta tiedetä mitään, valitaan parametrin priorijakaumaksi yksikkövälin tasajakauma. Parametrin posterijakauma on tällöin diskreetin jakauman tapauksessa integraali korvataan summalla 5
117 lauseen 9.3 mukaan betajakauma parametreina a = 5 ja b = 2. Posteriorijakauman tiheysfunktio voidaan kirjoittaa muodossa { 30 θ 4 ( θ), θ (0, ), p(θ x) = 0, muuten. (a) Posteriorijakauman odotusarvo saadaan integraalina θ E (x) = θ p(θ x) dθ = θ 30 θ 4 ( θ) dθ 0 ( ) = 30 θ 5 dθ θ 6 dθ 0 0 ( = 30 6 ) = (b) Posteriorijakauman moodin määrittämiseksi etsitään funktion p(θ x) maksimikohta. Posteriotiheyden derivaatta pisteessä θ (0, ) on p (θ x) = 30 d dθ (θ4 θ 5 ) = 30(4θ 3 5θ 4 ) = 30 θ 3 (4 5θ), joten piste θ = 4 on derivaatan ainoa nollakohta välillä (0, ). Derivoimalla 5 toisen kerran voidaan tarkistaa, että p ( 4 ) < 0, joten kyseinen piste on funktion 5 p(θ x) globaali maksimikohta. Näin ollen posterijakauman moodi on θ M (x) =. Lasketut piste-estimaatit on esitetty kuvassa Kuva 0.: Havaintoa {4 kruunaa ja klaava} vastaavasta posteriorijakaumasta lasketut piste-estimaatit: odotusarvo θ E (x) 0.74 ja moodi θ E (x) = 0.8. Esimerkki 0.2 (Kohinainen kanava). Esimerkissä 9.6 lähetetyn signaalin priorijakauma oli normaalijakauma odotusarvona µ 0 = 5 ja keskihajontana σ 0 =. Posterijakaumaksi vastaanotettujen signaaliarvojen x = (3., 7.9, 7.0) suhteen saatiin normaalijakauma odotusarvona µ = 5.43 ja keskihajontana σ Määritä lähetetyn signaalin piste-estimaatti käyttäen (a) posteriorijakauman odotusarvoa (b) posteriorijakauman moodia. 6
118 Normaalijakauman tiheysfunktio on symmetrinen odotusarvonsa suhteen ja saavuttaa maksiminsa odotusarvon kohdalla (kuva 0.2). Näin ollen molempien piste-estimaattien arvoiksi saadaan θ E (x) = θ M (x) = Kuva 0.2: Lähetetyn signaalin posteriorijakaumasta lasketut piste-estimaatit: odotusarvo = moodi = Esimerkki 0.3 (Tasajakauman ylärajan estimointi). Tuntemattoman välin {, 2,..., θ} tasajakaumaa noudattavasta datalähteestä on havaittu x = 2, x 2 = 7 ja x 3 = 22. Ennakkoon on aihetta uskoa, että tuntemattoman parametrin arvo on todennäköisesti lähellä arvoa 30 ja uskomukseen liittyvä epävarmuus noudattaa Poisson-jakaumaa. Määritä posterijakauman moodia vastaava pisteestimaatti tuntemattoman parametrin arvolle. Poisson-jakauman parametrina λ = 30 tiheysfunktio on p(θ) = e λ λθ, θ = 0,, 2,... θ! Yksittäisen datapisteen x i uskottavuusfunktio on f(x i θ) = { θ x i θ, 0, muuten, joten datajoukon x = (x, x 2, x 3 ) uskottavuusfunktio on { 3, x θ f(x, x 2, x 3 θ) = f(x i θ) = 3, x 2, x 3 θ, 0, muuten. i= Posteriorijakauma lasketaan päivityskaavasta p(θ x) = p(θ)f(x θ) θ p(θ )f(x θ ) = 7 {c 30 30θ e, θ! θ 3 θ 22, 0, muuten,
119 missä normitusvakio on c = θ p(θ )f(x θ ). Normitusvakion tarkka laskeminen on hieman hankalaa, mutta posteriorijakauman moodin määrittämiseksi normitusvakion arvoa ei tarvitse tietää. Riittää etsiä normittamattoman posterioritiheysfunktion θ 30θ maksimi joukossa θ 22. Kokeilemalla eri θ! θ 3 lukuarvoja havaitaan, että maksimi saavutetaan pisteessä θ = 26, joten posteriorijakauman moodi on θ M (x) = Kuva 0.3: Lukumäärän priorijakauma (sininen) ja posteriorijakauma (punainen). 0.2 Bayesläiset väliestimaatit Todennäköisyysvälit ovat käyttökelpoinen tapa kuvailla ja raportoida subjektiivisia uskomuksia, sillä priori- tai posteriorijakaumaa on yleensä melko vaikea kuvailla sanallisesti. Satunnaiselle vastaantulijalle on luultavasti ymmärrettävämpää kertoa, että kuin parametri sisältyy 50% todennäköisyydellä välille [0.48, 0.66] parametri noudattaa betajakaumaa parametreina 8 ja 6. Jakauman todennäköisyysväli tasolla α on lukuväli [a, b], jolle kyseistä jakaumaa noudattava satunnaismuuttuja X toteuttaa P(a X b) = α. Todennäköisyysväli on symmetrinen, mikäli lisäksi pätee P(X < a) = P(X > b). 8
120 Jatkuvien jakaumien todennäköisyysvälejä on käytännössä helpointa määrittää kvantiilien avulla. Jos q s ja q t ovat jakauman kvantiileja tasoilla s ja t, niin tällöin qt q s f(x) dx = qt f(x) dx qs f(x) dx = t s, joten väli [q s, q t ] on jakauman todennäköisyysväli tasolla t s. Tason 50% todennäköisyysvälejä ovat siis esimerkiksi [q 0.25, q 0.75 ] ja [q 0.05, q 0.50 ]. Näistä [q 0.25, q 0.75 ] on symmetrinen. Bayesläisessä tilastollisessa päättelyssä väliestimaatteja voidaan laatia posteriorijakauman todennäköisyysvälejä käyttämällä. Luonnollinen vaihtoehto on määrittää symmetrinen todennäköisyysväli jollain riittävän suurella tasolla, esimerkiksi α = Esimerkki 0.4 (Tuntematon kolikko). Kolikkoa, josta ei ennalta tiedetä mitään, heittämällä havaitaan 4 kruunaa ja klaava. Määritä 95% todennäköisyysväli kruunan todennäköisyyttä mallintavalle parametrille θ. Kun priorijakaumaksi valitaan yksikkövälin tasajakauma, saadaan posteriorijakaumaksi (esimerkki 0.) betajakauma parametreina a = 5 ja b = 2, tiheysfunktiona { 30 θ 4 ( θ), θ (0, ), p(θ x) = 0, muuten. Posteriorijakauman odotusarvoksi saatiin kolmen desimaalin tarkkuudella θ E (x) = 0.74 ja moodiksi θ M (x) = Posteriorijakauman symmetrinen 95% todennäköisyysväli on väli [q 0.025, q ], jonka päätepisteet ovat tasojen ja kvantiilit betajakaumalle parametreina a = 5 ja b = 2. Betajakauman taulukoista tai numeerisilla ohjelmistoilla kvantiileiksi saadaan q = ja q = Binaarimallin Bayes-estimointi Aiempien mielipidemittausten perusteella uskotaan, että nykyisen presidentin kannatusosuus tulevissa vaaleissa on noin 0.4 ja sisältyy välille [0.3, 0.5] noin 95% todennäköisyydellä. Uudessa 200 henkilön satunnaisotokseen pohjautuvassa mielipidemittauksessa havaittiin ehdokkaan kannatusosuudeksi Määritä kannatusosuuden piste-estimaatti, joka ottaa huomioon ennakkouskomuksen ja havaitun mielipidemittauksen. Bayesläisen piste-estimaatin laskemiseksi tulee määrittää tehtävässä kuvattua ennakkouskomusta kuvaava priorijakauma p(θ), jonka odotusarvo on θ p(θ)dθ 0.4, (0.) 9
121 ja välin [0.3, 0.5] todennäköisyys on p(θ)dθ 0.95 (0.2) Ylläolevat ehdot eivät määrää priorijakaumaa yksikäsitteisesti. Esimerkiksi seuraavat jakaumat toteuttavat yo. ehdot:. Lukuvälin [0.295, 0.505] tasajakauma. 2. Normaalijakauma odotusarvona µ = 0.4 ja keskihajontana σ = Betajakauma parametreina a = 27 ja b = Tasajakauma (a = 0.295, b = 0.505) Normaalijakauma (µ = 0.4, σ = 0.05) Betajakauma (a = 27 ja b = 40) Ylläolevista jakaumista tasajakauman käyttö on arveluttavaa, sillä siinä priorijakauma antaa todennäköisyyden nolla välin [0.295, 0.505] ulkopuolelle, mikä vastaa absoluuttista ennakkouskomusta, että parametri 00% varmuudella sisältyy välille [0.295, 0.505]. Normaalijakauma periaatteessa sallii parametrin arvoksi lukuja välin [0, ] ulkopuolelta, mutta käytännössä tällaiset kokoluokkaa 8σ tai suuremmat poikkeamat ovat hyvin epätodennäköisiä. Betajakauma on ylläolevista jakaumista luontevin valinta priorijakaumaksi, sillä sen arvojoukko on lukuväli [0, ] ja se antaa positiivisen todennäköisyyden kaikille yksikkövälin avoimille epätyhjille osaväleille. Betajakauma on myös käytännön laskennan kannalta mukava, sillä binaarimallissa se päivittyy betajakaumaksi (lause 9.3). Kun havaitaan n = 200 alkion datajoukko, jossa 70 ykköstä ja 30 nollaa (ykkösten osuus = 35%), tällöin betajakauma (a = 27 ja b = 40) päivittyy betajakaumaksi parametreina a + 70 = 97 ja b + 30 = 70. Posteriorijakauman odotusarvoksi saadaan θ E (x) = Bayes-väliestimaatti. Etsitään piste-estimaatin 0.3 ympäriltä väli, johon posteriorijakaumaa noudattava parametri sisältyy tn:llä 95%. Voidaan valita esimerkiksi symmetrinen väli [q 0.025, q ]. Betajakauman taulukoista q = ja q = Johtopäätöksenä voidaan ilmoittaa, että ennakkouskomuksen ja havaitun datan valossa sisältyy kannatusosuus välille [0.307, 0.422] todennäköisyydellä 95%. 20
122 Luku Tilastolliset testit. Nollahypoteesi, vastahypoteesi ja p-arvo Aiemmissa luvuissa opittiin määrittämään piste-estimaatteja ja väliestimaatteja tilastollisen mallin tuntemattomalle parametrille. Monissa käytännön tilanteissa pelkkä estimaatin määrittäminen ei riitä, vaan havaintojen pohjalta täytyy tehdä johtopäätös, pitääkö jokin mallia tai sen parametria koskeva oletus paikkaansa vai ei. Tilastollinen testi on systemaattinen menetelmä laatia tällaisia johtopäätöksiä. Tilastollisen testin lähtökohtana on nollahypoteesi H 0, joka kuvastaa datalähteen oletusarvoista käyttäytymistä. Mikäli datalähteestä havaitut arvot poikkeavat paljon nollahypoteesin mukaisesta ennusteesta, antaa tämä aihetta nollahypoteesin hylkäämiseen. Tilastollisessa testissä on myös tapana määritellä vastahypoteesi H, joka yleensä vastaa nollahypoteesin vastakohtaa. Havaintojen poikkeuksellisuutta analysoidaan laskemalla havaitusta datajoukosta x = (x,..., x n ) tunnusluku t( x) = t(x,..., x n ) ja määrittämällä sitä vastaava p-arvo. Tilastollisen testin p-arvo on todennäköisyys, jolla nollahypoteesin mukaisen datalähteen generoimat satunnaisluvut X = (X,..., X n ) tuottavat havaittua tunnuslukua t( x) poikkeavamman tai yhtä poikkeavan arvon t( X). Mikäli p-arvo on lähellä nollaa, johtuu havaittu poikkeama hyvin epätodennäköisesti satunnaisvaihtelusta ja antaa aiheen hylätä nollahypoteesi. Tällaista poikkeamaa kutsutaan tilastollisesti merkitseväksi. Useimmissa sovelluskonteksteissa on p-arvojen kokoa tapana luonnehtia allaolevan taulukon nyrkkisääntöjen avulla. p-arvo Tulkinta > 0.0 Havainto ei ole ristiriidassa H 0 :n kanssa 0.05 Havainto todistaa jonkun verran H 0 :aa vastaan < 0.0 Havainto todistaa vahvasti H 0 :aa vastaan 2
123 Esimerkki. (Kolikko). Tasaiseksi väitettyä kolikkoa 50 kertaa heitettäessä saadaan heittosarja, joka sisältää 42 kruunaa ja 8 klaavaa. Kuuluuko havaittu tulos tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä kolikon tasaisuutta? Heittotulosten (0=klaava, =kruuna) datalähde vastaa binaarimallia, jonka parametri p on kruunan todennäköisyys. Ylläoleva kysymyksenasettelu vastaa tilastollista testiä, jonka nollahypoteesi ja vastahypoteesi ovat H 0 : θ = 0.5, H : θ 0.5. Kun testin tunnusluvuksi valitaan kruunien lukumäärä t( x) = 50 i= x i, noudattaa mallin mukaisista satunnaisluvuista X = (X,..., X n ) laskettu tunnusluvun arvo T = t( X) binomijakaumaa tiheysfunktiona 0. f θ (x) = ( ) 50 θ x ( θ) 50 x. x H 0 : θ = 0.5 Nollahypoteesin vallitessa tunnusluvun T odotusarvo on 25, josta havaittu tunnusluvun arvo t( x) = 42 poikkeaa 7 yksikköä. Testin p-arvo eli näin suuren tai vielä suuremman poikkeaman todennäköisyys nollahypoteesin vallitessa on p-arvo = P H0 ( T 25 7) = 8 f 0.5 (x) + x=0 50 x=42 f 0.5 (x) = Näin lähellä nollaa oleva p-arvo antaa vahvan perusteen epäillä kolikon tasaisuutta ja hylätä nollahypoteesi. Esimerkki.2 (Tiedonsiirtokanava). Tiedonsiirtokanavan kohinan takia lähetetty lukuarvoinen signaali µ vastaanotetaan normaalijakautuneena satunnaismuuttujana, jonka odotusarvo on µ ja keskihajonta σ = 3. Eräänä päivänä lähettäjän uskotaan lähettävän arvon µ = 8. Kun vastaanotettu arvo on x = 2.8, onko syytä epäillä, että lähetetyn signaalin arvo ei ollutkaan 8? Kysymyksenasettelua vastaa tilastollinen testi, jonka nollahypoteesi ja vastahypoteesi ovat H 0 : µ = 8, H : µ 8. Valitaan testisuureeksi keskihajonnalla normitettu poikkeama t( x) = x 8 3 =.6. 22
124 Tällöin testisuureen arvoja mallintava satunnaismuuttuja T = t( X) noudattaa nollahypoteesin vallitessa normitettua normaalijakaumaa kertymäfunktiona F Z (x). Testin p-arvo eli todennäköisyys, että nollahypoteesin vallitessa T poikkeaa odotusarvostaan.6 yksikköä tai enemmän, saadaan symmetrian perusteella normitetun normaalijakauman taulukoista p-arvo = P H0 ( T.6) = 2P H0 (T.6) = 2( F Z (.6)) = 0.. Koska p-arvo > 0%, on havaittu poikkeama selitettävissä melkon hyvin tavanomaisella satunnaisvaihtelulla. Vastaanotettu signaalin arvo ei tarjoa syytä epäillä H 0 :n paikkansapitävyyttä..2 Yhdistetty nollahypoteesi Seuraava esimerkki edustaa yhdistettyä nollahypoteesia, joka vaatii huolellisempaa analyysiä, sillä siinä nollahypoteesi ei yksiselitteisesti määritä datalähteen stokastisen mallin jakaumaa. Lisäksi poikkeavien arvojen määrittämisessä pitää ottaa huomioon, poikkeaako havaittu testisuureen arvo ylöspäin vai alaspäin tyypillisestä arvosta. Esimerkki.3 (Laadunvalvonta). Tukkukauppias väittää, että sen toimittamista tomaateista enintään 5% on huonolaatuisia. Suuresta tilauserästä poimittiin satunnaisesti 50 tomaattia ja niistä 4 todettiin huonolaatuisiksi. Kuuluuko tehty havainto tyypillisen satunnaisvaihtelun piiriin vai onko syytä epäillä tukkukauppiaan väitettä? Tarkastettujen tomaattien laatuarvioita (0=Hyvä, =Huono) voidaan mallintaa Bernolli-jakaumalla, jonka (tuntematon) parametri θ vastaa huonolaatuisten tomaattien osuutta koko tilauserässä. Kysymyksenasettelua vastaa tilastollinen testi, jonka nollahypoteesi ja vastahypoteesi ovat H 0 : θ 0.05, H : θ > Valitaan testin tunnusluvuksi huonolaatuisten tomaattien lukumäärä t( x) = 50 i= x i. Koska tarkastetut 50 tomaattia on poimittu satunnaisotannalla suuresta populaatiosta, noudattaa tunnusluvun arvoja mallintava satunnaismuuttuja T = t( X) suurella tarkkuudella binomijakaumaa tiheysfunktiona f θ (x) = ( 50 x ) θ x ( θ) 50 x, x = 0,,..., 50. Ylläolevan yksisuuntaisen nollahypoteesin näkökulmasta poikkeavat havainnot ovat niitä, joiden tunnusluku on suuri. Todennäköisyys, että nollahypoteesin mukaiset satunnaisluvut X = (X,..., X n ) tuottavat havaittua tunnusluvun arvoa t( x) = 4 poikkeavampia tai yhtä poikkeavia testisuureen arvoja on siis P θ (T t( x)) = 50 x=4 f θ (x). 23
125 Ongelmana on, että tässä tapauksessa nollahypoteesi ei suoraan määritä datalähteen satunnaislukujen eikä niitä vastaavan tunnusluvun jakaumaa. Tällaisessa tilanteessa p-arvo määritellään kaavalla p-arvo = max P θ(t t( x)). θ 0.05 Koska ylläoleva todennäköisyys maksimoituu arvolla θ = 0.05, saadaan p- arvoksi p-arvo = 50 x=4 f 0.05 (x) = 50 x=4 ( ) x ( 0.50) 50 x = 0.24, x mikä ei anna aihetta hylätä nollahypoteesiä..3 Testausvirheet Tietyissä tilanteissa vaaditaan testaajalta yksiselitteistä johtopäätöstä: testin pohjalta H 0 joko hyväksytään tai hylätään. Johtopäätöksen pohjaksi valitaan testin merkitsevyystaso α (0, ) ja johtopäätös muodostetaan seuraavasti: Jos p-arvo α, nollahypoteesi hyväksytään (jätetään voimaan), Jos p-arvo < α, nollahypoteesi hylätään. Näin menetellessä mikään ei takaa, että tehty johtopäätös olisi oikea. Esimerkin. kolikonheitossa havaittiin 42 kruunaa p-arvona 0 6, joten nollahypoteesi (tasainen kolikko) hylätään merkitsevyystasolla α = 0.0. On kuitenkin periaatteessa mahdollista, että tasaisella kolikolla satuttiin tekemään äärimmäisen epätodennäköinen 42 kruunan heittosarja. Tällöin tehdään hylkäysvirhe. Esimerkin.2 tiedonsiirtokanavassa saatiin p-arvoksi %, joten nollahypoteesi (lähetetty signaalin arvo on 8) hyväksytään merkitsevyystasolla α = 0.0. On kuitenkin täysin mahdollista, että havaittu virhe onkin mitattu kanavasta, jossa kohinan aiheuttamat virheet noudattavat normaalijakaumaa esim. odotusarvona 2 ja keskihajontana 3. Tällöin tehdään hyväksymisvirhe. Eri tavat tehdä oikea tai virheellinen johtopäätös voidaan taulukoida seuraavasti: Yläraja voidaan perustella niin, että tulkitaan T kruunien lukumääräksi 50 kolikon heittosarjassa, jossa kruunan todennäköisyys on θ. Kun kruunan todennäköisyys kasvaa, kasvaa myös todennäköisyys että havaittujen kruunien lukumäärä ylittää kynnysarvon 4. 24
126 Johtopäätös Totuus H 0 hyväksytään H 0 hylätään H 0 tosi Oikea päätös Hylkäysvirhe H 0 epätosi Hyväksymisvirhe Oikea päätös Seuraava keskeinen tulos (lause.4) takaa, että hylkäysvirheen todennäköisyys voidaan säätää pieneksi asettamalla riittävän pieni merkitsevyystaso. Lause.4. Tilastollisen testin hylkäysvirheen todennäköisyys on korkeintaan testin merkitsevyystaso α. Todistus. Tuloksen todistus (luku.5) yleisessä muodossa sisältää reaalianalyysin yksityiskohtia, jotka eivät ole tilastollisen päättelyn kannalta keskeisiä. Hyväksymisvirheen todennäköisyyttä sen sijaan on yleisesti vaikea kontrolloida. Tästä syystä nollahypoteesi on syytä muotoilla niin, että se vastaa yleistä vallalla olevaa käsitystä tutkittavasta asiasta, tai niin että virheellisen nollahypoteesin hyväksymisellä ei ole vakavia seuraamuksia. Esimerkki.5 (Rikosoikeus). Yksityishenkilön epäiltyä rikosta koskevassa oikeudenkäynnissä tulee päättää, onko syytetty henkilö syytön vai syyllinen saatavilla olevan datan perusteella. Yleensä nollahypoteesi asetetaan muodossa H 0 : Epäilty henkilö on syytön. Nollahypoteesiä H 0 vastaava hyväksymisvirhe vastaa syyllisen henkilön tuomitsematta jättämistä ja hylkäysvirhe syyttömän henkilön tuomitsemista. Hylkäysvirheen todennäköisyys saadaan lauseen.4 perusteella pieneksi valitsemalla testille riittävän pieni merkitsevyystaso. Hyväksymisvirheen todennäköisyyttä on sen sijaan vaikeampi kontrolloida. Toinen tapa valita nollahypoteesi olisi asettaa H 0: Epäilty henkilö on syyllinen. Tällöin tilastollisessa testissä ei syyttömien henkilöiden tuomitsemisen riskiä (H 0:n hyväksymisvirhe) voisi kunnolla kontrolloida, mikä olisi ristiriidassa yleisen oikeusperiaatteen kanssa, jonka mukaan epäilty on syytön kunnes toisin todistetaan. Esimerkki.6 (Tupakkatuote). Jos halutaan tutkia uudentyyppisen tupakkatuotteen vaikutusta terveyteen, voidaan nollahypoteesi esittää joko muodossa H 0 : Uudella tupakkatuotteella ei ole terveyttä edistäviä vaikutuksia tai muodossa H 0: Uudella tupakkatuotteella on terveyttä edistäviä vaikutuksia 25
127 Nollahypoteesiä H 0 vastaavan hyväksymisvirheen tekeminen olisi tupakkatuotteen valmistajan kannalta haitallista, mutta yhteiskunnalliset vaikutukset eivät luultavasti olisi suuria. Nollahypoteesin H 0 hylkäysvirheellä saattaisi olla yhteiskunnalle hyvinkin haitalliset seuraukset. Hylkäysvirheen todennäköisyys saadaan lauseen.4 perusteella pieneksi valitsemalla testille riittävän pieni merkitsevyystaso. Jos nollahypoteesiksi valittaisiinkin H 0, niin merkitsevyystasoa pieneksi säätämällä voitaisiin kontrolloida tupakkavalmistajan epäreilun kohtelun (H 0:n hylkäysvirhe) riskiä, mutta ei yhteiskunnallisten terveyshaittojen (H 0:n hyväksymisvirhe) riskiä. Merkitsevyystason valinta vaikuttaa testausvirheiden todennäköisyyteen seuraavasti: Henkilö A, joka elämänsä aikana tekee suuren määrän hypoteesitestejä merkitsevyystasolla α = 5% on henkisesti varautunut siihen, että tietty osuus testien johtopäätöksistä on virheellisiä. Hän myös tietää, että pitkällä tähtäyksellä hänen hylkäämistään nollahypoteeseista enintään 5% on virheellisesti hylätty. (Hän ei kuitenkaan tiedä mitkä niistä.) Henkilö B, joka tekee elämänsä aikana suuren määrän hypoteesitestejä merkitsevyystasolla α = % on myös varautunut siihen, että tietty osuus testipäätelmistä on virheellisiä. Hän tietää, että hänen hylkäämistään nollahypoteeseista enintään % on virheellisesti hylätty. Lisäksi hän tietää, että hänen hyväksymistään nollahypoteeseista on suurempi osuus virheellisiä kuin henkilöllä A. Henkilö B on taipuvaisempi harvemmin hylkäämään nollahypoteeseja, minkä johdosta hän tekee pitkällä tähtäyksellä harvemmin hylkäysvirheitä mutta useammin hyväksymisvirheitä. Esimerkki.7 (Tuntematon kolikko). Tasaiseksi väitettyä kolikkoa 0 kertaa heitettäessä (0=klaava, =kruuna) havaitaan data x = (0, 0,, 0, 0, 0, 0, 0, 0, 0). Testaa väitteen paikkansapitävyyttä 5% merkitsevyystasolla ja analysoi hylkäysja hyväksymisvirheiden todennäköisyyksiä. Testin nollahypoteesi ja vastahypoteesi ovat H 0 : θ = 0.5, H : θ 0.5, missä θ on kruunan todennäköisyys. Valitaan testin tunnusluvuksi kruunien lukumäärä t( x) = x + + x 0. Datalähteen tuottamia tunnusluvun arvoja mallintava satunnaismuuttuja T = t( X) noudattaa binomijakaumaa tiheysfunktiona ( ) 0 f θ (x) = θ x ( θ) 0 x, x = 0,,..., 0. x Nollahypoteesin vallitessa havaittu tunnusluvun arvo t( x) = poikkeaa 4 yksikköä binomijakauman odotusarvosta 0θ = 5. Näin ollen p-arvoksi saadaan 0 p-arvo = P H0 ( T 5 4) = f 0.5 (x) + f 0.5 (x) 2.%. x=0 26 x=9
128 Koska p-arvo alittaa valitun merkitsevyystason 5%, nollahypoteesi hylätään. Testausvirheiden analysoimiseksi määritetään ensiksi testin hylkäysalue eli nollahypoteesin hylkäämiseen johtavien tunnusluvun arvojen joukko. Toistamalla ylläolevat laskelmat eri testisuureen arvoille voidaan testin mahdolliset p-arvot taulukoida seuraavasti: Kruunien lkm p-arvo (%) Taulukon mukaan testin hylkäysalue 5% merkitsevyystasolla on joukko {0,, 9, 0}. Hylkäysvirheen todennäköisyys on siis P H0 (T {0,, 9, 0}) = 0 f 0.5 (x) + f 0.5 (x) 2.%. x=0 x=9 Hyväksymisvirheen todennäköisyyttä on sen sijaan käytännössä mahdotonta analysoida, sillä vastahypoteesi θ 0.5 ei kerro juuri mitään datalähteen jakaumasta. Esimerkiksi jos parametrin todellinen arvo olisi θ = 0.499, saataisiin hyväksymisvirheen todennäköisyydeksi P H ( T {2,..., 8}) = 8 f (x) x=2 Jos taas parametrin todellinen arvo olisi θ = 0.00, saataisiin hyväksymisvirheen todennäköisyydeksi P H ( T {2,..., 8}) = 8 f 0.00 (x) x=2.4 Odotusarvon testi suurelle datajoukolle Tarkastellaan datalähdettä, jonka oletetaan tuottavan toisistaan riippumattomia ja samoin jakautuneita satunnaislukuja X, X 2,... odotusarvona µ ja keskihajontana σ. Satunnaislukujen jakauma on tuntematon, jolloin myös µ ja σ ovat tuntemattomia. Halutaan testata nollahypoteesia H 0 : µ = µ 0, missä µ 0 on oletettu odotusarvoparametrin µ arvo. Mikäli datalähteen arvojen jakaumasta ei tiedetä mitään, vaikuttaa mahdottomalta laatia toimivaa testiä ylläolevalle hypoteesille. Jos datalähteestä on saatu kerättyä suuri määrä dataa, voidaan toimiva testi kuitenkin muodostaa. 27
129 Havaitusta suuresta datajoukosta x = (x,..., x n ) lasketaan ensiksi keskiarvo ja empiirinen keskihajonta kaavoilla m( x) = n n x i ja sd( x) = i= ( n /2 n (x i m( x)) )) 2, ja sen jälkeen testisuureeksi määritellään datajoukon keskiarvon normitettu poikkeama väitetystä odotusarvosta t( x) = m( x) µ 0 sd( x)/ n. Allaolevan tuloksen perusteella testin p-arvo suurilla n:n arvoilla on likimain i= P H0 ( t( X) t( x) ) P(Z t( x) ), missä Z noudattaa normitettua normaalijakaumaa. Testisuureen likiarvoiseksi p-arvoksi saadaan siis p( x) = 2( F Z ( t( x) ), missä F Z (t) on normitetun normaalijakauman kertymäfunktio. Lause.8. Yllä kuvatun datalähteen tuottamia testisuureen arvoja mallintavan satunnaismuuttujan t( X) jakauma suppenee nollahypoteesin vallitessa kohti normitettua normaalijakaumaa, kun n. Todistus. Keskeisen raja-arvolauseen seurauksena todellisella keskihajontaparametrilla normitettu keskiarvon poikkeama m( X) µ 0 σ/ n on jakaumaltaan lähellä normitettua normaalijakaumaa. Suurten lukujen lakia soveltamalla satunnaislukuihin X 2, X 2 2,... voidaan lisäksi perustella, että nollahypoteesin vallitessa σ sd( X) suurella todennäköisyydellä, kun n. Väite seuraa näistä havainnosta käyttämällä nk. Slutskyn lemmaa [vdv00]. Esimerkki.9 (Kahviautomaatti). Kahviautomaatin on tarkoitus laskea jokaiseen kuppiin keskimäärin 0.0 cl kahvia. Laitteen toimintaa testattiin valuttamalla automaatista 30 kupillista ja mittaamalla kahvin määrät kupeissa. Mittauksessa havaittiin arvot (cl):
130 Onko kahviautomaatti oikein kalibroitu? Merkitään kahviautomaatin tuottamien kahvikupillisten keskiarvoa parametrilla µ (tuntematon) ja väitettyä keskiarvoa µ 0. Kysymys voidaan tulkita tilastollisena testinä, jossa nollahypoteesi ja vastahypoteesi ovat H 0 : µ = 0.0 H : µ 0.0 Mittausdatan x keskiarvo on m( x) = ja keskihajonta sd s ( x) = Havaitun datajoukon normitettu poikkeama on näin ollen t( x) = m( x) µ 0 sd s ( x)/ n = / 30 = Koska n = 30 on kohtalaisen suuri luku, sovelletaan suuren datajoukon likiarvoista testiä, jolloin p-arvoksi saadaan p-arvo P H0 ( t( X) t( x) ) P( Z 4.60) Näin pieni p-arvo puoltaa H 0 :n hylkäämistä, esim. yleisesti käytetyllä merkitsevyystasoilla % tai 5% voidaan todeta, että kahviautomaatti on väärin kalibroitu..5 Hylkäysvirheen todennäköisyyden analyysi Lauseen.4 todistuksen pohjaksi perustellaan ensiksi seuraava aputulos. Lemma.0. Jos S α = {s R : P(Z s) α} on niiden arvojen joukko, joita suurempia tai yhtä suuria arvoja reaaliarvoinen satunnaismuuttuja Z saa enintään todennäköisyydellä α (0, ), niin P(Z S α ) α. Todistus. Koska todennäköisyyden monotonisuuden perusteella funktio s P(Z s) on vähenevä, voidaan päätellä, että joukko S α on lukuväli muotoa [s α, ) tai (s α, ), missä luku s α on joukon S α suurin alaraja. (i) Tapauksessa S α = [s α, ) luku s α sisältyy joukkoon S α, joten joukon S α määritelmän mukaan P(Z S α ) = P(Z s α ) α. (ii) Tapauksessa S α = (s α, ) tehdään vastaoletus, että P(Z S α ) > α. Tällöin P(Z > s α ) > α. Todennäköisyyden jatkuvuuden perusteella tiedetään, että P(Z > s α ) = lim s sα P(Z s). Näin ollen P(Z s) > α jollain s > s α. Tästä seuraa että luku s ei kuulu joukkoon S α, joten s on kyseisen joukon alaraja. Tämä on looginen ristiriita, sillä s α määriteltiin joukon S α suurimmaksi alarajaksi. Vastaoletus on siis epätosi, ja pätee P(Z S α ) α. 29
131 Lauseen.4 todistus. Merkitään satunnaismuuttujalla T = t( X) nollahypoteesin mukaisen datalähteen tuottamasta datajoukosta laskettua testisuureen arvoa ennen datan havaitsemista. Olkoon t 0 = E H0 (T ) kyseisen testisuureen odotusarvo. Tällöin nollahypoteesi havaitulle datajoukolle x hylätään täsmälleen silloin, kun sitä vastaavan testisuureen poikkeama t( x) t 0 sisältyy joukkoon { } S α = s R : P H0 ( T t 0 s) < α. Merkitsemällä joukon S α sulkeumaa { } S α = s R : P H0 ( T t 0 s) α saadaan hylkäysvirheelle yläraja P H0 (H 0 hylätään) = P H0 ( T t 0 S α ) P H0 ( T t 0 S α ). Soveltamalla lemmaa.0 satunnaismuuttujaan T t 0 havaitaan, että ylläolevan epäyhtälön oikea puoli on enintään α. 30
132 Liite A Todennäköisyysjakaumia Tähän liitteeseen on koostettu lista tärkeimmistä todennäköisyysjakaumista. A. Yksiulotteisia diskreettejä jakaumia A.. Dirac-jakauma Dirac-jakauma on diskreetti jakauma, joka kuvaa satunnaismuuttujaa, jossa ei ole lainkaan satunnaisvaihtelua eli sen keskihajonta on nolla. Dirac-jakaumalla on yksi parametri θ (, ) ja sen tiheysfunktio on {, x = θ, f(x) = 0, muuten. Dirac-jakaumaa merkitään usein δ θ. A..2 Bernoullijakauma Tämä on joukon {0, } yleinen diskreetti jakauma. Sen parametrit voidaan kirjoittaa muodossa (p 0, p ), missä p 0 + p =. Käytännössä ilmoitetaan vain p = p. Kuvaa yksittäisen tapahtuman indikaattorimuuttujaa. Arvojoukko {0, }, parametrit p [0, ]. Tiheysfunktio on { f(x) = ( p) x p x p, x = 0, = p, x =. Jokainen {0, }-arvoinen satunnaismuuttuja X noudattaa Bernoulli-jakaumaa parametrina p = P(X = ). A..3 Multinoullijakauma Tämä on joukon {,..., k} yleinen diskreetti jakauma, sen parametrit ovat luvut p,..., p k 0, joille p + + p k =. Tiheysfunktio on f(x) = p x, x {,..., k}. 3
133 Erikoistapaus: k = vastaa pisteen Dirac-jakaumaa. Erikoistapaus: k = 2 vastaa Bernoullijakaumaa, kunhan arvojoukko numeroidaan sopivasti. A..4 Diskreetti tasajakauma Äärellisen joukon A tasajakauman tiheysfunktio on f(x) = #A, x A. Erikoistapaus: A = {,..., k} vastaa multinoullijakaumaa p j = k kaikilla j =,..., k. A..5 Binomijakauma Binomijakauma on diskreetti jakauma joukossa {0,,..., n}. Se kuvaa binaarisesta datalähteestä tuotettujen satunnaismuuttujien summan jakaumaa. Yleisesti se kuvaa kruunien lukumäärä n:llä kolikonheitolla, kun kruunan todennäköisyys on p. Jakauman parametrit ovat (n, p), missä n on kokonaisluku ja p [0, ] reaaliluku. Tiheysfunktio on ( ) n f(x) = p x ( p) n x, x {0,,..., n}. x Erikoistapaus: n = on Bernoullijakauma parametrina p. A..6 Geometrinen jakauma Geometrisia jakaumia on kahdenlaisia. Molemmat liittyvät sarjaan yrityksiä, joissa jokaisella yrityksellä muista riippumattomasti onnistutaan todennäköisyydellä p. Lukujoukon {0,,... } geometrinen jakauma kuvaa, kuinka monta epäonnistumista tapahtuu ennen ensimmäistä onnistumista. Tiheysfunktio f(x) = ( p) x p, x {0,,..., }. Lukujoukon {, 2,... } geometrinen jakauma kuvaa, kuinka monta yritystä tulee suorittaa, kunnes onnistutaan ensimmäisen kerran. Tiheysfunktio f(x) = ( p) x p, x {, 2,..., }. Yleistys on tilanne, jossa katsotaan yritysten tai epäonnistumisten lukumäärää, kunnes saadaan r onnistumista. Geometrisen jakauman yleistyksiä tähän tilanteeseen kutsutaan negatiivisiksi binomijakaumiksi, joista myös on useita eri versioita riippuen siitä, lasketaanko yrityksiä vai epäonnistumisia. 32
134 A..7 Hypergeometrinen jakauma Populaatiossa on N alkiota, joista K on positiivisia. Kun poimitaan palauttamatta n alkion otos tasaisen satunnaisesti, niin montako positiivista saadaan? Positiivisten lukumäärän jakauma on joukon {0,..., n} diskreetti jakauma, tiheysfunktiona ( K N K ) f(x) = x)( n x ( N, x {0,,..., n}. n) Tämä on hypergeometrinen jakauma parametreina (N, K, n). Jos sama satunnaisotanta suoritettaisiin palauttaen, niin positiivisten lukumäärän jakauma olisi binomijakauma parametreina n ja p = K/N. Silloin kun N on suuri suhteessa otoskokoon K, voidaan hypergeometrista jakaumaa arvioida edellä mainitulla binomijakaumalla. A..8 Poisson-jakauma Poisson-jakauma kertoo likiarvon onnistumisten lukumäärälle pitkässä sarjassa yrityksiä, joissa onnistumisia yhteensä sattuu odotusarvoisesti λ kappaletta. Sen voi myös tulkita kruunien lukumääräksi pitkässä n kolikonheiton sarjassa, jossa kruunan todennäköisyys on λn. Tiheysfunktio f(x) = e λ λx, x {0,,..., }. x! A.2 Moniulotteisia diskreettejä jakaumia A.2. Multinomijakauma Multinomijakauma on k-ulotteinen diskreetti jakauma, joka kuvaa diskreetistä datalähteestä tuotettujen satunnaismuuttujien esiintyvyyksien yhteisjakaumaa. Multinomijakaumalla on parametrina kokonaisluvut n, k ja reaaliluvut p,..., p k 0, joille p + + p k =. Tarkastellaan datalähdettä, joka tuottaa n riippumatonta satunnaislukua (X,..., X n ) jakaumasta (p,..., p k ). Merkitään arvon j esiintyvyyttä tulossarjassa symbolilla N j = n (X i = j). i= Tällöin esiintyvyyksien (N,..., N k ) yhteisjakauma on multinomijakauma tiheysfunktiona f(x,..., x k ) = n! x! x k! px p x k k, x + + x k = n. Erikoistapaus k = 2 vastaa binomijakaumaa parametreina n ja p. 33
135 Erikoistapaus n = vastaa multinoullijakaumaa eli yleistä joukon {,..., k} diskreettiä todennäköisyysjakaumaa. Tämä jakauma voidaan myös tulkita niin, että n palloa heitetään k:hon koriin. Jokainen pallo, muista riippumatta osuu koriin j todennäköisyydellä p j. Korien sisältämien pallojen lukumäärien yhteisjakauma on tällöin multinomijakauma. Voidaan myös tulkita niin, että populaatiossa on k:n eri tyypin alkioita ja tyypin j alkioiden suhteellinen osuus on p j. Tehdään n satunnaisotantaa palauttaen. Tällöin havaittujen tyyppien esiintyvyyksien (eri frekvenssien) yhteisjakauma on multinomijakauma. A.2.2 Hypergeometrinen jakauma Tämä on d-ulotteinen diskreetti jakauma, jonka parametrit ovat kokonaisluvut n ja K,..., K d. Jakauma kuvaa eri tyyppien esiintyvyyksien yhteisjakaumaa n:n alkion otoksessa, joka on poimittu satunnaisotannalla palauttamatta äärellisestä populaatiosta, jossa on K i tyypin i =,..., d alkiota. Merkitään tyypin i esiintyvyyttä n:n alkion otoksessa symbolilla N i. Tällöin satunnaisvektori (N,..., N d ) noudattaa hypergeometrista jakaumaa tiheysfunktiona f(x,..., x d ) = ( K ) ( x Kd ( K, x + + x d = n, n) x d ) missä K = K + + K d. Huom. Jos sama otanta tehtäisiin palauttaen, niin jakaumana olisi multinomijakauma parametreina n ja p,..., p d, missä p i = K i /K. A.3 Yksiulotteisia jatkuvia jakaumia A.3. Jatkuva tasajakauma Välin [a, b] jatkuvalla tasajakaumalla on tiheysfunktio f(x) = {, b a x [a, b], 0, muuten. A.3.2 Eksponenttijakauma Eksponenttijakauman parametrina λ > 0 tiheysfunktio on { λe λx, x > 0, f(x) = 0, muuten. 34
136 A.3.3 Normaalijakauma Normaalijakaumalla on kaksi parametria: odotusarvo µ (, ) ja keskihajonta σ (0, ). Normaalijakauman tiheysfunktio on f(x) = (x µ)2 e 2σ 2. 2πσ 2 Normitetun normaalijakauman odotusarvo on µ = 0 ja keskihajonta σ =. Sen kertymäfunktion lukuarvoja on taulukoitu liitteeseen B. 35
137 Liite B Normaalijakauman lukuarvoja Allaolevaan taulukkoon on koottu lukuarvoja normitetun normaalijakauman kertymäfunktiolle x F Z (x) = e t2 /2 dt. 2π x
138 Liite C Merkintöjä Merkintä Selitys R Excel m( x) Datajoukon (x,..., x n) keskiarvo mean() AVERAGE() sd( x) Datajoukon (x,..., x n) empiirinen keskihajonta sqrt(-/n)*sd() STDEV.P() sd s( x) Datajoukon (x,..., x n) otoskeskihajonta sd() STDEV.S() var( x) Datajoukon (x,..., x n) empiirinen varianssi (-/n)*var() VAR.P() var s( x) Datajoukon (x,..., x n) otosvarianssi var() VAR.S() cov( x, y) Datajoukon ((x, y ),..., (x n, y n)) empiirinen kovarianssi (-/n)*cov() COVARIANCE.P() cov s( x, y) Datajoukon ((x, y ),..., (x n, y n)) otoskovarianssi cov() COVARIANCE.S() cor( x, y) Datajoukon ((x, y ),..., (x n, y n)) korrelaatio cor() CORREL() E(X), µ X SD(X), σ X Cov(X, Y ), σ X,Y Cor(X, Y ), ρ X,Y Var(X), σx 2 Satunnaismuuttujan X jakauman odotusarvo Satunnaismuuttujan X jakauman keskihajonta Satunnaismuuttujien X ja Y jakauman kovarianssi Satunnaismuuttujien X ja Y jakauman korrelaatio Satunnaismuuttujan X jakauman varianssi Taulukko C.: Datajoukkojen ja todennäköisyysjakaumien tunnuslukuja. 37
139 Liite D Suomi englanti-sanasto Alla tässä monisteessa esiintynyttä sanastoa englanniksi käännettynä. Monet tähän aihepiiriin liittyvät termit eivät kuitenkaan ole täysin vakiintuneita kummassakaan kielessä. suomi aksiooma alakvartiili alkio Bayesin kaava bayesläinen malli Bernoulli-jakauma binaarimalli binomijakauma binomikerroin Chebyshevin epäyhtälö datajoukko datakehikko diskreetti jakauma diskreetti satunnaismuuttuja ehdollinen jakauma ehdollinen odotusarvo ehdollinen tiheysfunktio ehdollinen todennäköisyys eksponenttijakauma empiirinen jakauma empiirinen keskihajonta empiirinen kovarianssi empiirinen tiheysfunktio empiirinen yhteisjakauma entropia ergodinen esiintyvyys esiintyvyysharha englanti axiom lower quartile element Bayes formula Bayesian model Bernoulli distribution binary model binomial distribution binomial coefficient Chebyshev s inequality data set data frame discrete distribution discrete random variable conditional distribution conditional expectation conditional density function conditional probability exponential distribution empirical distribution empirical/population standard deviation empirical/population covariance empirical density function empirical joint distribution entropy ergodic frequency base rate fallacy 38
140 esiintyvyystaulukko estimaatti estimaattori harha harhaton havainto havaittu histogrammi hylkäysvirhe hyperparametri hyväksymisvirhe indikaattorifunktio jakauma jatkuva jakauma joukko järjestetty lista järjestystunnusluku järjestämätön joukko kertoma kertymäfunktio keskeinen raja-arvolause keskiarvo keskihajonta keskineliövirhe komplementti konvoluutio korrelaatio korreloimaton korreloitu kovarianssi kvartiili leikkaus lineaarinen regressio lineaarinen riippuvuus logaritminen uskottavuusfunktio luottamustaso luottamusväli mediaani merkitsevyystaso merkitsevä mielipidekysely mitallinen momentti moniulotteinen moodi muuttuja nollahypoteesi contingency table estimate estimator bias unbiased observation observed histogram rejection error, type I error, false positive hyperparameter acceptance error, type II error, false negative indicator function distribution continuous distribution set, space ordered list order statistic unordered set factorial cumulative distribution function, distribution function central limit theorem mean, average standard deviation mean squared error complement convolution correlation uncorrelated correlated covariance quartile intersection linear regression linear dependence logarithmic likelihood function confidence level confidence interval median significance level significant opinion poll measurable moment multidimensional, multivariate mode variable null hypothesis 39
141 normaaliapproksimaatio normaalijakauma normitettu normitettu normaalijakauma odotusarvo osajoukko ositus otanta palauttaen otanta palauttamatta otos otoskeskiarvo otoskeskihajonta otoskovarianssi otosvarianssi p-arvo parametrinen jakauma perusjoukko pienimmän neliösumman menetelmä piste-estimaatti Poisson-approksimaatio Poisson-jakauma posteriorijakauma posterioritiheys priorijakauma prioritiheys prosentiili puukaavio regressio regressiosuora reunajakauma reunatiheysfunktio riippumattomuus riippuvuus ristiintaulukointi ristitaulukko satunnaisilmiö satunnaiskenttä satunnaisluku satunnaismatriisi satunnaismuuttuja satunnaismuuttujan muunnos satunnaisotanta satunnaisotos satunnaisvektori satunnaisverkko stokastiikka stokastinen prosessi normal approximation normal distribution, Gaussian distribution normalised standard normal distribution expectation, mean subset partition sampling with replacement sampling without replacement sample sample mean/average sample standard deviation sample covariance sample variance p-value parametric distribution sample space least squares method point estimate Poisson approximation Poisson distribution posterior distribution posterior density prior distribution prior density percentile tree diagram regression regression line marginal distribution marginal density function independence dependence cross tabulation contingency table random phenomenon random field random number random matrix random variable transformation of a random variable random sampling random sample random vector random graph stochastics stochastic process 40
142 stokastinen riippuvuus suhteellinen esiintyvyys suhteellinen osuus supeta stokastisesti suurimman uskottavuuden estimaatti suurten lukujen laki tapahtuma tarkentuva tasajakauma taulukko testi testisuure tiheysfunktio (diskreetin jakauman) tiheysfunktio (jatkuvan jakauman) tilasto tilastotiede tilastollinen päättely todennäköinen todennäköisyys todennäköisyysjakauma todennäköisyyslaskenta todennäköisyysmitta todennäköisyysteoria todennäköisyysväli toteuma tulojoukko tunnusluku uskomus uskottavuus uskottavuusfunktio vaiheittainen päivittäminen varianssi vastahypoteesi virhemarginaali väliestimaatti väliestimaattori yhdiste yhdistetty hypoteesi yhteisjakauma yksinkertainen hypoteesi yksiulotteinen yläkvartiili stochastic dependence relative frequency relative proportion converge in probability maximum likelihood estimate law of large numbers event consistent uniform distribution table test test statistic density function, probability mass function density function, probability density function statistics statistics statistical inference probable, likely probability probability distribution probability probability measure probability theory probability interval, credible interval realisation, outcome product set, product space statistic belief likelihood likelihood function sequential updating variance alternative hypothesis margin of error interval estimate interval estimator union composite hypothesis joint distribution simple hypothesis one-dimensional, univariate upper quartile 4
143 Hakemisto alakvartiili, 78 Bayesin kaava, 4, 02 Bernoulli-jakauma, 58, 83 betajakauma, 07 binomijakauma, 58 binomikerroin, 7 bitti, 42 bootstrap-menetelmä, 0 Chebyshevin epäyhtälö, 49 datajoukko, 73 datakehikko, 73 eksponenttijakauma, 24, 32 empiirinen kovarianssi, 79 entropia, 42 ergodinen, 45 erotus, 7 esiintyvyysharha, 4 estimaattori, 9 harhaton estimaattori, 92 hylkäysalue, 25 hyperparametri, 09 indikaattorifunktio, 25 järjestystunnusluku, 78 jakauma, 20 diskreetti, 22 empiirinen, 74, 76 jatkuva, 22 kertoma, 6 kertymäfunktio, 2 keskiarvo, 77 keskihajonta jakauman, 47 satunnaismuuttujan, 47 keskineliövirhe, 89 kombinatoriikka, 5 komplementti, 7 korrelaatio yhteisjakauman, 5 kovarianssi yhteisjakauman, 50 kvantiilifunktio, 79 kvartiili, 78 leikkaus, 7 lineaarinen regressio, 89 lukumäärä listat, 6 osajoukot, 7 lukumäärä, järjestykset, 6 mediaani, 78 merkitsevyystaso, 22 mitallinen funktio, 33 joukko, 8 momentti, 42 moodi, 78 multinomijakauma, 3 muuttuja, 73 nollahypoteesi, 9 normaalijakauma, 33 normitettu, 65 osajoukko, 6 ositus, 6 osituskaava, 2 otoskovarianssi, 80 p-arvo, 9 perusjoukko, 5 42
144 pienimmän neliösumman menetelmä, 89 piste-estimaatti, 94 pistemassafunktio, 22 pistetodennäköisyysfunktio, 22 Poisson-jakauma, 23, 70 posteriorijakauma, 02 priorijakauma, 02 prosentiili, 78 regressio, 89 regressiosuora, 89 reunajakauma diskreetti, 27 jatkuva, 28 reunatiheysfunktio diskreetti, 27 jatkuva, 28 riippumattomat satunnaismuuttujat, 30 tapahtumat, satunnaismuuttuja, 9 diskreetti, 22 sigma-algebra, 8 suppeneminen stokastinen, suurimman uskottavuuden estimaatti, 84 suurten lukujen laki, vahva, 45 t-jakauma, 0 tapahtuma, 5 poissulkevat, 6 tasajakauma diskreetti, 23 jatkuva, 24, 32 tiheysfunktio, 22 empiirinen, 74 tilastollinen merkitsevyys, 9 tilastollinen testi, 9 todennäköisyys aksiooma, 8 ehdollinen, 0 frekvenssitulkinta, 38 jakauma, 8 43 mitta, 8 monotonisuus, 9 summasääntö, 8 tulosääntö, 0 todennäköisyysfunktio, 22 todennäköisyysväli, 6 toteuma, 5 tulojoukko, 7 tyhjä joukko, 7 uskottavuusfunktio, 84, 02 logaritminen, 85 väliestimaatti, 94 väliestimaattori, 94 varianssi jakauman, 47 satunnaismuuttujan, 47 vastahypoteesi, 9 virhemarginaali, 96 yhdiste, 7 yhteisjakauma, 24 diskreetti, 26 jatkuva, 26 tiheysfunktio, 26 yläkvartiili, 78
145 Kirjallisuutta [JP04] [Kal02] Jean Jacod and Philip Protter. Probability Essentials. Springer, second edition, Olav Kallenberg. Foundations of Modern Probability. Springer, second edition, [vdv00] Aad W. van der Vaart. Asymptotic Statistics. Cambridge University Press, [Wil9] David Williams. Probability with Martingales. Cambridge University Press,
Todennäköisyyden käsite ja laskusäännöt
Luku 1 Todennäköisyyden käsite ja laskusäännöt Lasse Leskelä Aalto-yliopisto 12. syyskuuta 2017 1.1 Todennäköisyyden käsite Todennäköisyys on tapa kuvailla kvantitatiivisesti jonkin tapahtuman uskottavuutta,
Satunnaismuuttujat ja jakaumat
Luku 2 Satunnaismuuttujat ja jakaumat Lasse Leskelä Aalto-yliopisto 2. syyskuuta 207 2. Satunnaismuuttujan käsite Käytännön tilanteissa ei yleensä olla kiinnostuneita satunnaisilmiön kaikista yksityiskohdista,
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Stokastiikka ja tilastollinen ajattelu
Stokastiikka ja tilastollinen ajattelu Versio 0.96 Lasse Leskelä Aalto-yliopisto 7. syyskuuta 208 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite...................... 5.2 Satunnaisilmiön
Stokastiikka ja tilastollinen ajattelu
Stokastiikka ja tilastollinen ajattelu Versio 0.990 Lasse Leskelä Aalto-yliopisto 8. maaliskuuta 209 Sisältö Todennäköisyyden käsite ja laskusäännöt 5. Todennäköisyyden käsite...................... 5.2
Todennäköisyyden käsite ja laskusäännöt
Luku 1 Todennäköisyyden käsite ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 1.1 Todennäköisyyden käsite Todennäköisyys on tapa kuvailla kvantitatiivisesti jonkin tapahtuman uskottavuutta,
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017
Luku 1 Bayesläiset estimaattorit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 217 1.1 Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia
30A02000 Tilastotieteen perusteet
30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi
Satunnaismuuttujan odotusarvo ja laskusäännöt
Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 16. syyskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään
Opiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3
Luku 6 Datajoukkojen jakaumat, tunnusluvut ja kuvaajat Lasse Leskelä Aalto-yliopisto. lokakuuta 207 6. Datajoukko ja datakehikko Tässä monisteessa datajoukko tarkoittaa järjestettyä listaa keskenään samantyyppisiä
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
Satunnaismuuttujan odotusarvo ja laskusäännöt
Luku 3 Satunnaismuuttujan odotusarvo ja laskusäännöt Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 3.1 Odotusarvon käsite ja suurten lukujen laki Lukuarvoisen satunnaismuuttujan X odotusarvo määritellään
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi
&idx=2&uilang=fi&lang=fi&lvv=2015
20.10.2015/1 MTTTP5, luento 20.10.2015 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa
https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015
12.1.2016/1 MTTTP5, luento 12.1.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa
Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto
Matemaattinen tilastotiede Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Alkusanat Tämä moniste perustuu vuosina 2002-2004 pitämiini matemaattisen tilastotieteen luentoihin
Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3
Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Aiheet: Satunnaisvektorit ja moniulotteiset jakaumat Tilastollinen riippuvuus ja lineaarinen korrelaatio Satunnaisvektorit ja moniulotteiset
Bayesläiset tilastolliset mallit
Luku 9 Bayesläiset tilastolliset mallit Lasse Leskelä Aalto-yliopisto 8. lokakuuta 07 9. Priorijakauma ja posteriorijakauma Bayesläisen tilastollisen päättelyn lähtökohtana on päivittää satunnaisilmiöön
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia
Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia KE (2014) 1 Hypergeometrinen jakauma Hypergeometrinen jakauma
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 1A Todennäköisyyden käsite ja laskusäännöt Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5A Bayeslainen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy
https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015
25.10.2016/1 MTTTP5, luento 25.10.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa
Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.
HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 8 Harjoitus Ratkaisuehdotuksia Tehtäväsarja I Tehtävät -5 perustuvat monisteen kappaleisiin..7 ja tehtävä 6 kappaleeseen.8..
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 20. syyskuuta 2007 Antti Rasila () TodB 20. syyskuuta 2007 1 / 17 1 Kolmogorovin aksioomat σ-algebra Tapahtuman todennäköisyys 2 Satunnaismuuttujat Todennäköisyysjakauma
Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.
Luku 1 Johdanto 1.1 Todennäköisyys ja tilastotiede Kurssi käsittelee todennäköisyyslaskentaa ja tilastotiedettä. Laaditaan satunnaisilmiöille todennäköisyysmalleja. Miten hyvin mallit kuvaavat todellisuutta?
Satunnaismuuttujien summa ja keskiarvo
Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 21. syyskuuta 2017 5.1 Satunnaismuuttujien summa Satunnaismuuttujien summa S n = X 1 + +X n ja keskiarvo n 1 S n ovat satunnaismuuttujia,
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Frekventistiset vs. bayeslaiset menetelmät Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin Yliopisto Harjoitus 1, ratkaisuehdotukset
Todennäköisyyslaskenta I, kesä 207 Helsingin yliopisto/avoin Yliopisto Harjoitus, ratkaisuehdotukset. Kokeet ja Ω:n hahmottaminen. Mitä tarkoittaa todennäköisyys on? Olkoon satunnaiskokeena yhden nopan
Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio TKK (c) Ilkka Mellin (2007) 1 Kertymäfunktio >> Kertymäfunktio: Määritelmä Diskreettien jakaumien
Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko
ÌÓÒÒĐĐÓ ÝÝ ÔÖÙ ØØ Naiiveja määritelmiä Suhteellinen frekvenssi kun ilmiö toistuu Jos tehdas on valmistanut 1000000 kpl erästä tuotetta, joista 5013 ovat viallisia, niin todennäköisyys, että tuote on viallinen
(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.
Todennäköisyyslaskenta I, kesä 7 Harjoitus 4 Ratkaisuehdotuksia. Satunnaismuuttujalla X on ns. kaksipuolinen eksponenttijakauma eli Laplacen jakauma: sen tiheysfunktio on fx = e x. a Piirrä tiheysfunktio.
Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset
Todennäköisyyslaskenta IIa, syyslokakuu 019 / Hytönen. laskuharjoitus, ratkaisuehdotukset 1. Kurssilla on 0 opiskelijaa, näiden joukossa Jutta, Jyrki, Ilkka ja Alex. Opettaja aikoo valita umpimähkään opiskelijan
Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1
Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Tilastollisen merkitsevyyden testaus Osa II Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2
HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 208 Harjoitus 4 Ratkaisuehdotuksia Tehtäväsarja I. Satunnaismuuttuja U Exp(2) ja V = U/(3 + U). Laske f V käyttämällä muuttujanvaihtotekniikkaa.
Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:
8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)
Keskihajonta ja korrelaatio
Luku 4 Keskihajonta ja korrelaatio Lasse Leskelä Aalto-yliopisto 19. syyskuuta 2017 4.1 Jakauman varianssi ja keskihajonta Edellisessä luvussa opittiin, että satunnaismuuttujan odotusarvo on X:n jakauman
Harjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Kertymäfunktio TKK (c) Ilkka Mellin (2005) 1 Kertymäfunktio Kertymäfunktio: Määritelmä Diskreettien jakaumien kertymäfunktiot Jatkuvien jakaumien kertymäfunktiot TKK (c)
TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä
J. Virtamo 38.3143 Jonoteoria / Todennäköisyyslaskenta 1 TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä Otosavaruus S S on satunnaiskokeen E kaikkien mahdollisten alkeistapahtumien e joukko. Esim. 1. Noppaa
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 4. lokakuuta 2007 Antti Rasila () TodB 4. lokakuuta 2007 1 / 17 1 Moniulotteiset todennäköisyysjakaumat Johdanto Kaksiulotteiset satunnaismuuttujat Kaksiulotteisen
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Satunnaismuuttujat ja todennäköisyysjakaumat Mitä tänään? Jos satunnaisilmiötä halutaan mallintaa matemaattisesti, on ilmiön tulosvaihtoehdot kuvattava numeerisessa muodossa. Tämä tapahtuu liittämällä
Todennäköisyyden ominaisuuksia
Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset
Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä
Todennäköisyys 1 Klassinen todennäköisyys: p = Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä Esimerkkejä: Nopan heitto, kolikon heitto Satunnaismuuttuja Tilastollisesti vaihtelevaa
11.1 Nollahypoteesi, vastahypoteesi ja p-arvo
Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 4. joulukuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja p-arvo Aiemmissa luvuissa opittiin määrittämään piste-estimaatteja ja väliestimaatteja
Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?
21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä
Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:
Mat-.9 Sovellettu todennäköisyyslasku A Mat-.9 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Moniulotteiset jakaumat Diskreetti jakauma, Ehdollinen jakauma, Ehdollinen odotusarvo, Jatkuva
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Satunnaismuuttujien summa ja keskihajonta Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
Moniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on
Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Otanta Poisson- Jakaumien tunnusluvut Diskreetit jakaumat Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 2 Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden
Todennäköisyys (englanniksi probability)
Todennäköisyys (englanniksi probability) Todennäköisyyslaskenta sai alkunsa 1600-luvulla uhkapeleistä Ranskassa (Pascal, Fermat). Nykyisin todennäköisyyslaskentaa käytetään hyväksi mm. vakuutustoiminnassa,
11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot
Luku 11 Tilastolliset testit Lasse Leskelä Aalto-yliopisto 17. lokakuuta 2017 11.1 Nollahypoteesi, vastahypoteesi ja poikkeavat havainnot Datalähteen tuottamia arvoja mallinnetaan jakaumaa f(x θ) noudattavina
Satunnaismuuttujien summa ja keskiarvo
Luku 5 Satunnaismuuttujien summa ja keskiarvo Lasse Leskelä Aalto-yliopisto 17. marraskuuta 2017 5.1 Satunnaismuuttujien summa Kahden satunnaismuuttujan summa X + Y on satunnaismuuttuja, jonka jakauma
Johdatus tn-laskentaan perjantai 17.2.2012
Johdatus tn-laskentaan perjantai 17.2.2012 Kahden diskreetin muuttujan yhteisjakauma On olemassa myös monen muuttujan yhteisjakauma, ja jatkuvien muuttujien yhteisjakauma (jota ei käsitellä tällä kurssilla;
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 6A Tilastolliset luottamusvälit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset
Todennäköisyyslaskenta IIa, syys lokakuu 2019 / Hytönen 3. laskuharjoitus, ratkaisuehdotukset 1. Olkoon X satunnaismuuttuja, ja olkoot a R \ {0}, b R ja Y = ax + b. (a) Olkoon X diskreetti ja f sen pistetodennäköisyysfunktio.
Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden aksioomat
Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Todennäköisyyden aksioomat TKK (c) Ilkka Mellin (2007) 1 Todennäköisyyden aksioomat >> Todennäköisyyden määritteleminen Todennäköisyyden
Jatkuvat satunnaismuuttujat
Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään
031021P Tilastomatematiikka (5 op)
031021P Tilastomatematiikka (5 op) Jukka Kemppainen Mathematics Division Yleinen todennäköisyys Kertausmateriaalissa esiteltiin koulusta tuttuja todennäköisyysmalleja. Tällä kurssilla todennäköisyys on
4. laskuharjoituskierros, vko 7, ratkaisut
4. laskuharjoituskierros, vko 7, ratkaisut D1. Kone valmistaa kuulalaakerin kuulia, joiden halkaisija vaihtelee satunnaisesti. Halkaisijan on oltava tiettyjen rajojen sisällä, jotta kuula olisi käyttökelpoinen.
Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,
Todennäköisyyslaskenta, 2. kurssikoe 7.2.22 Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu.. Satunnaismuuttujien X ja Y yhteistiheysfunktio on
Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat TKK (c) Ilkka Mellin (2005) 1 Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat Kaksiulotteiset todennäköisyysjakaumat
Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?
TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä
HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I
HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I Tehtävä 1 on klassikko. 1. Tässä tehtävässä tapahtumat A ja B eivät välttämättä
Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat
Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat TKK (c) Ilkka Mellin (2006) 1 Moniulotteiset satunnaismuuttujat ja
Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita
Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava TKK (c) Ilkka Mellin (2005) 1 Kokonaistodennäköisyys ja Bayesin kaava Kokonaistodennäköisyys ja Bayesin kaava: Johdanto Kokonaistodennäköisyyden
Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja
1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma
Liite B. Suomi englanti-sanasto
Liite B Suomi englanti-sanasto Alla tässä monisteessa esiintynyttä sanastoa englanniksi käännettynä. Monet tähän aihepiiriin liittyvät termit eivät kuitenkaan ole täysin vakiintuneita kummassakaan kielessä.
Todennäköisyyslaskenta. β versio. Todennäköisyyslaskenta. Ilkka Mellin. Teknillinen korkeakoulu, Matematiikan laboratorio. Ilkka Mellin (2006) I
β versio Todennäköisyyslaskenta Ilkka Mellin Teknillinen korkeakoulu, Matematiikan laboratorio TKK @ Ilkka Mellin (2006) I TKK @ Ilkka Mellin (2006) II Esipuhe Tämä moniste antaa perustiedot todennäköisyyslaskennasta.
Moniulotteiset satunnaismuuttujat ja jakaumat
Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Moniulotteiset satunnaismuuttujat ja jakaumat KE (2014) 1 Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat >> Kaksiulotteiset
Mat Sovellettu todennäköisyyslasku A
Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Klassinen todennäköisyys ja kombinatoriikka Todennäköisyyden aksioomat Kokonaistodennäköisyys ja Bayesin kaava Bayesin kaava,
(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?
6.10.2006 1. Keppi, jonka pituus on m, taitetaan kahtia täysin satunnaisesti valitusta kohdasta ja muodostetaan kolmio, jonka kateetteina ovat syntyneet palaset. Kolmion pinta-ala on satunnaismuuttuja.
D ( ) E( ) E( ) 2.917
Mat-2.091 Sovellettu todennäköisyyslasku 4. harjoitukset/ratkaisut Aiheet: Diskreetit jakaumat Avainsanat: Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen jakauma, Kertymäfunktio,
5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3
Mat-.9 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Verkot todennäköisyyslaskennassa Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut Kertymäfunktio, Momentit, Odotusarvo,
Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
M-0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 1: Todennäköisyyslaskennan peruskäsitteet; Todennäköisyyden aksioomat; Todennäköisyyslaskennan peruslaskusäännöt; Kokonaistodennäköisyyden
Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio
Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio
Poisson-prosessien ominaisuuksia ja esimerkkilaskuja
4B Poisson-prosessien ominaisuuksia ja esimerkkilaskuja Tuntitehtävät 4B1 Eksponentiaalisten odotusaikojen toistuva odottaminen. Satunnaisluvun X sanotaan noudattavan Gamma-jakaumaa parametrein k ja λ,
TODENNÄKÖISYYS JA TILASTOT MAA6 KERTAUS
TODENNÄKÖISYYS JA TILASTOT MAA6 KERTAUS Klassinen todennäköisyys P suotuisten alkeistapausten lkm kaikkien alkeistapausten lkm P( mahdoton tapahtuma ) = 0 P( varma tapahtuma ) = 1 0 P(A) 1 Todennäköisyys
Todennäköisyyslaskenta - tehtävät
Todennäköisyyslaskenta - tehtävät Todennäköisyyslaskentaa käsitellään Pitkän matematiikan kertauskirjan sivuilla 253 276. Klassinen todennäköisyys Kombinatoriikka Binomitodennäköisyys Satunnaismuuttuja,
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty
Juuri 0 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 9..08 Kertaus K. a) Alapaineiden pienin arvo on ja suurin arvo 74, joten vaihteluväli on [, 74]. b) Alapaineiden keskiarvo on 6676870774
MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen
MAT-25 Todennäköisyyslaskenta Tentti 12.4.216 / Kimmo Vattulainen Funktiolaskin sallittu. Palauta kaavakokoelma 1. a) Pelaajat A ja B heittävät noppaa vuorotellen ja pelin voittaa se, joka saa ensimmäiseksi
Joukot. Georg Cantor ( )
Joukot Matematiikassa on pyrkimys määritellä monimutkaiset asiat täsmällisesti yksinkertaisempien asioiden avulla. Tarvitaan jokin lähtökohta, muutama yleisesti hyväksytty ja ymmärretty käsite, joista
Sovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila Kalvoissa käytetään materiaalia P. Palon vuoden 2005 kurssista. 07.09.2007 Antti Rasila () SovTodB 07.09.2007 07.09.2007 1 / 24 1 Todennäköisyyslaskennan
Satunnaismuuttujien muunnokset ja niiden jakaumat
Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Satunnaismuuttujien muunnokset ja niiden jakaumat TKK (c) Ilkka Mellin (2007) 1 Satunnaismuuttujien muunnokset ja
ABHELSINKI UNIVERSITY OF TECHNOLOGY
Todennäköisyyslaskennan käsitteitä Satunnaisuus ja deterministisyys Deterministisessä ilmiössä alkutila määrää lopputilan yksikäsitteisesti. Satunnaisilmiö puolestaan arpoo - yhdestä alkutilasta voi päätyä
Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat TKK (c) Ilkka Mellin (2005) 1 Todennäköisyyden aksioomat Todennäköisyyden määritteleminen Todennäköisyyden aksioomat äärellisissä otosavaruuksissa
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3A Normaaliapproksimaatio Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin
Mat Sovellettu todennäköisyyslasku A
TKK / Systeemianalyysin laboratorio Nordlund Mat-2.090 Sovellettu todennäköisyyslasku A Harjoitus 4 (vko 41/2003) (Aihe: diskreettejä satunnaismuuttujia ja jakaumia, Laininen luvut 4.1 4.7) 1. Kone tekee
