LAAJA TILASTO- MATEMATIIKKA. Armo Pohjavirta Keijo Ruohonen

Koko: px
Aloita esitys sivulta:

Download "LAAJA TILASTO- MATEMATIIKKA. Armo Pohjavirta Keijo Ruohonen"

Transkriptio

1 LAAJA TILASTO- MATEMATIIKKA Armo Pohjavirta Keijo Ruohonen 2005

2 Sisältö ISATUNNAISUUS JA SEN MALLINTAMINEN. Kruunan ja klaavan satunnaisuus 4.2 Jatkuvan muuttujan satunnaisuus 5.3 Peruskäsitteitä 9 II TODENNÄKÖISYYS 9 2. Joukko-opillisia käsitteitä 2.2 Todennäköisyyslaskennan aksioomat Joukko-oppiin pohjautuvaa todennäköisyyslaskentaa Todennäköisyysmitasta Klassinen todennäköisyys Tiheysfunktio Tiheysfunktion tulkintaa Kertymäfunktio Muuttujan vaihto ja tiheysfunktio Diskreetti satunnaismuuttuja Mielikuva todennäköisyysmassasta 23 III EHDOLLINEN TODENNÄKÖISYYS. REUNAJAKAUMA Ehdollinen todennäköisyys. Bayesin kaava Tilastollinen riippumattomuus Satunnaismuuttujien tilastollinen riippumattomuus Reunajakaumat 34 IV JAKAUMIEN JA OTOSTEN TUNNUSLUKUJA Deskriptiivistä statistiikkaa Satunnaismuuttujan funktion odotusarvo Odotusarvon frekvenssitulkinta Odotusarvon ominaisuuksia Satunnaismuuttujan odotusarvo. Kovarianssi- ja korrelaatiomatriisit Kovarianssimatriisin ominaisuuksia Korrelaatiomatriisi Käsitteiden tulkintoja Ristikovarianssimatriisi Otossuureita Otossuureiden variansseista 52 VSATUNNAISMUUTTUJAN JAKAUMIA Suurten lukujen lakeja Yksidimensionaalinen normaalijakauma p-dimensionaalinen normaalijakauma Keskeinen raja-arvolause i

3 ii Normaalijakaumaan liittyviä muita jakaumia χ 2 -jakauma Vapausasteiden synty Otosvarianssin jakauma F-jakauma t-jakauma Binomijakauma Poissonin jakauma Tasajakauma 80 VI OTOKSET Datan käsittely tilastollisen ohjelmiston avulla Datamatriisi Affiinimuunnettu data 85 VII ESTIMOINTI, TESTAUS, PÄÄTTELY Parametrien estimointi Estimaattoreiden ominaisuuksia Estimaatin luotettavuusalue Tilastollinen evidenssi ja hypoteesien testaaminen MAP-estimointi Kontingenssitaulut 0 VIII PARAMETRIEN VERTAILU OTOKSIEN AVULLA 0 8. Normaalijakauman odotusarvon vertaaminen vakioon, kun varianssi tunnetaan t-testejä Odotusarvon vertaaminen vakioon Kahden odotusarvon vertailu Voidaanko varianssit olettaa samoiksi? Yksilöiden vertailu ennen ja jälkeen toimenpiteen Multinomijakaumatestit 8.4. Todennäköisyyksien vertaaminen vakioon Todennäköisyyksien vertaaminen keskenään: homogeenisuustesti Jakauman sopivuustestaus 6 IX REGRESSIO 6 9. Regressiomalli Regressiokertoimien estimointi Regressiokertoimien ja residuaalivektorin tilastollinen luonne Varianssin σ 2 estimointi Regressiokertoimien luotettavuusvälit ja testaus Epälineaarisuuden tuominen malliin Dikotomiamuuttujat Selitysaste ja ennustavuus Käytännön vinkkejä

4 iii 28 Liite: GAMMA- JA BETAJAKAUMAT 28 L. Gammajakauma 3 L.2 Betajakauma 34 Kirjallisuus 35 Hakemisto Esipuhe Tämä moniste on tarkoitettu TTY:n kurssin Laaja tilastomatematiikka luentomateriaaliksi. Monisteessa käydään läpi todennäköisyyslaskennan peruskäsitteet ja -jakaumat, tilastollinen hypoteesin testaus ja estimointi sekä regressiomallinnuksen alkeet. Tilastomatematiikka on eniten käytettyjä ja käyttökelpoisimpia matemaattisen mallinnuksen työkaluja, niin tekniikassa kuin biologiassa, psykologiassa, yhteiskunta-, talous- ja lääketieteissäkin. On huomattava, että tilastomatematiikka varsinaisesti on tilastodatan analyysiä matemaattisin keinoin ja luonnollisesti ohjelmistojen avustuksella. Datan käytännön keruu ja esitys ( tilastot ) on eri asia, vaikkakin datan keräämisen (otannan) suunnittelu ja optimointi luetaankin tilastomatematiikkaan kuuluvaksi (otantateoria). Mainittakoon, että teoreettisellakin puolella tilastomatematiikka on varsin vilkas alue: se on jatkuvasti hyvin suosittu ja paljon tutkittu matematiikan alue. Moderni monimuuttujainen tilastomatematiikka käyttää, paitsi tietysti todennäköisyyslaskentaa, runsaasti apuna matriisilaskentaa. Voikin sanoa, että ilman matriisitekniikkaa esitys olisi toivottoman raskasta ja vaikeaa ja jopa puutteellista. Aikanaan monimuuttujatilastomatematiikka kuuluikin yliopistollisen tilastotieteen laudaturmateriaaliin. Runsaasta matriisien käytöstä johtuen kurssi palveleekin sivutoimisesti myös eräänlaisena matriisilaskennan kertaus- ja harjoituskurssina. Monimuuttujamenetelmiä esitellään laajemmin kursseissa Tilastolliset monimuuttujamenetelmät sekä Tilastollinen kokeiden suunnittelu. Nykyään paljon korostettujen laadun sekä luotettavuuden hallintaan tarkoitettuja tilastollisia menetelmiä puolestaan käsitellään kursseilla Tilastollinen laadunvalvonta sekä Luotettavuusteoria. Monisteessa pyritään tuomaan esille tilastomallinnuksen erikoinen luonne verrattaessa muihin matemaattisiin mallinnuskoneistoihin, niin yleisesti kuin eri mallinnusmenetelmillekin. Ohjelmistojen avulla on varsin helppo tehdä tavallisimmat tilastodatan analyysit. Kuitenkin, jos tekijä ei ymmärrä ko. analyysin tavoitteita ja/tai rajoituksia tai edes koko tilastomallinnuksen ideaa, hän ei saa analyysistään konkreettisena tuloksena juuri muuta kuin joitain outoja numeroarvoja sekä manuaalista kopioidun valmistekstin. Tilastomatematiikka on mallinnuksen teräase: erittäin käyttökelpoinen, mutta taitamattoman käsissä melko hyödytön (tai suorastaan vaarallinen). Aivan olennainen osa tilastomatemaattisten menetelmien soveltamista on tilasto-ohjelmistojen käyttö. Näitä ohjelmistoja on saatavilla varsin monta, isompia ja pienempiä, ammattilaisille ja satunnaisille käyttäjille, eri sovellusalueisiin suunnattuja, jne. Yleisohjelmistoillakin (esimerkiksi Matlab ja Maple) pääsee jo pitkälle. Monisteen esimerkit on ajettu JMP-ohjelmistolla, joka on tavalliseen tilastoanalyysiin tarkoitettu mukavakäyttöinen ohjelmisto, ammattilaisille tarkoitetun ison SAS/STAT-ohjelmiston pikkuveli. Armo Pohjavirta Keijo Ruohonen JMP and SAS/STAT are registered trademarks of SAS Institute Inc.

5 Luku SATUNNAISUUS JA SEN MALLINTAMINEN Lähemmin tarkasteltaessa maailma osoittautuu perin epätäsmälliseksi. Kilon punnus ei ole kilon punnus vaan jotain sinne päin. Transistorin vahvistus ei ole manuaalin lupaama 50 vaan jotain sinne päin. Edes maapallon pyörimisnopeus ei ole vakio vaan muuttuu sen mukaan, miten joku jänis sattuu loikkimaan. Tähän kaikkeen olemme tottuneet. Asian tila voi kuitenkin saada myös kiusallisia muotoja. Neljä peräkkäin sattuvaa tavallista lyhyemmäksi lipsahtanutta rakennuselementtiä tietää yleensä rumaa jälkeä, liika satunnaisuus työtavoissa voi pysäyttää kuvaputkitehtaan ja niin edelleen. Mitä suurempaa tarkkuutta jokin työprosessi edellyttää, sitä tärkeämpää on saada siihen liittyvä satunnaisuus kuriin. Suuri tarkkuus tietää kuitenkin yleensä suuria kustannuksia, joten itsetarkoituksellinen pyrkiminen tähän on harvoin rationaalista. Tärkeintä on saada satunnaisuus pysymään kohtuullisissa ja hallituissa rajoissa. Myös erilaisten ilmiöiden mallintaminen vaatii rationaalista suhtautumista satunnaisuuteen. Käytännössä malli on aina jonkin asteinen todellisuuden idealisaatio. Tiedämme varsin hyvin, että ottamalla malliin mukaan yhä enemmän ja enemmän ilmiöön liittyviä periferisiä muuttujia saamme mallimme yhä tarkemmaksi ja tarkemmaksi, mutta käytön kätevyyden kustannuksella. Kaiken lisäksi jotkin ilmiöön vaikuttavat muuttujat ovat kannaltamme aidosti satunnaisia: emme voi niiden vaihtelulle mitään emmekä pysty ennustamaan niiden käyttäytymistä deterministisesti. Joskus onkin kätevää niputtaa mallin useat pikkutekijät yhteen satunnaissuureeseen. Satunnaisuuden vaivaamassa maailmassa on tullut tavaksi ottaa tietoisia riskejä. Lähdemme siitä, että lanka kutomakoneessa saa katketa koska hyvänsä kunhan ei katkeile liian usein. Komponenttitehdas ei yritäkään tehdä Täydellisiä Vastuksia vaan tietyn tarkkuusluokan tavaraa. Hyväksymme iloisesti sen, että mallimme ei ennusta valmistettavan teräserän lopullista lujuutta tarkasti vaan ainoastaan 5 %tarkkuudella. Joissakin tapauksissa olemme valmiit ottamaan jopa vakuutuksen oikein pahan päivän varalle. Tämä kaikki olisi kuitenkin hyvä tehdä hallitusti. Senpä vuoksi itse satunnaisuutta olisi pystyttävä mallintamaan.. Kruunan ja klaavan satunnaisuus Satunnaisuus esiintyy pelkistetyimmässä muodossaan lantin heitossa, joten siitä on hyvä lähteä liikkeelle. Voidaanko tuota holtittomalta vaikuttavaa tapahtumasarjaa millään tavoin hyödyllisesti mallintaa? Vastaus ei ole suinkaan itsestään selvä. Ranskalainen luonnontieteilijä Georges-Louis Leclerc (Comte de Buffon, ) heitti aikoinaan kolikkoa kertaa ja kirjasi klaavaa. Englantilainen tilastotieteilijä Karl

6 LUKU. SATUNNAISUUS JA SEN MALLINTAMINEN 2 Pearson ( ) jatkoi harjoituksia: ensimmäisellä kerralla heittoa tuotti 6 09 klaavaa, toisella kerralla heittoa puolestaan 2 02 klaavaa. Klaavojen suhteelliset osuudet eli frekvenssit olivat näissä historiallisissa sankarikokeissa 0.507, ja Seuraavassa olemme toistaneet kokeen satunnaislukugeneraattorin avulla, mikä ei ole tietenkään sama juttu, mutta palvelee tarkoituksiamme. Ensimmäisessä koesarjassa lanttia heitettiin sata kertaa ja joka heiton jälkeen laskettiin klaavojen osuus siihen mennessä saaduista tuloksista. Sadan heiton sarja toistettiin neljä kertaa. Kokeen tulokset olivat seuraavat (toteutettu Matlabilla): Lantin heitto Lantin heitto klaavojen osuus klaavojen osuus heittojen luku heittojen luku Lantin heitto Lantin heitto klaavojen osuus klaavojen osuus heittojen luku heittojen luku Koesarja toistettiin vielä tuhannen (simuloidun) heiton erinä: Lantin heitto Lantin heitto klaavojen osuus klaavojen osuus heittojen luku heittojen luku Lantin heitto Lantin heitto klaavojen osuus klaavojen osuus heittojen luku heittojen luku Jokainen koesarja omaa selvät yksilölliset piirteensä. Ainoa niitä yhdistävä ominaisuus tuntuu olevan se, että heittokertojen kasvaessa klaavojen suhteellinen osuus, frekvenssi, näyttää stabi-

7 LUKU. SATUNNAISUUS JA SEN MALLINTAMINEN 3 loituvan kohti tiettyä vakioarvoa. Tässä tapauksessa mainittu vakioarvo tuntuisi olevan jossakin 0.5:n kieppeillä. Tarkkaa arvoa emme pysty sanomaan tehtyjen kokeiden perusteella. Tilastomatemaattisessa mallissa oletamme, että mainitunlainen frekvenssin raja-arvo on olemassa, ja mallinnamme sitä kyseisen tapahtuman klaava yksittäisessä lantin heitossa todennäköisyydellä, joka on välillä [0, ] oleva reaaliluku (aivan kuten frekvenssikin). Asia ei ole kuitenkaan aivan näin yksinkertainen. Meidän on ensin tarkasteltava riippumattoman koetoiston käsitettä. Jos ajattelemme lantin heittoa toimituksena, tuntuu selvältä, että putoavan lantin kierähtäminen kruunaksi tai klaavaksi ei voi riippua aikaisempien heittokertojen tuloksista, puhumattakaan seuraavista. Vaikka partikulaarista heittoamme ennen olisimme heittäneet putkeen kymmenen klaavaa, lantilla on kaiken järjen mukaan samat noin fifty-fifty-mahdollisuudet tälläkin kertaa päätyä klaavaksi. Fysikaalisen intuitiomme mukaan yksittäisen lantin heiton, koetoiston, tulos on riippumaton kaikkien muiden koetoistojen tuloksista. Näissä asioissa intuitio kuitenkin erehtyy helposti, joten tarkastelemme tilannetta kokeen avulla. Lanttia heitettiin peräkkäin 000 kertaa (simuloimalla). Heittotulosten jonossa klaavaa seurasi klaava 262 kertaa (52 %) ja kruuna 238 kertaa (48 %). Jonossa kruunaa seurasi klaava 239 kertaa (48 %) ja kruuna 260 kertaa (52 %). Tuloksen perusteella voimme hyväksyä ajatuksen, että kokeen tulos voisi olla riippumaton edellisen kokeen tuloksesta. Tämä ei kuitenkaan vielä riitä. Se voisi olla riippuvainen edeltävästä pitemmästä koesarjasta. Vaikka tässä tapauksessa tämä tuntuukin epätodennäköiseltä, näin voisi mainiosti olla. Esimerkiksi satunnaislukugeneraattorit kärsivät tämän tyyppisistä puutteista. Teemmekin pari pistokoetta. Äskeisessä 000 heiton koesarjassa peräkkäisiä heittotuloksia klaava-klaava seurasi klaava 32 kertaa (50 %), kruuna 30 kertaa (50 %). Samaisessa jonossa peräkkäisiä heittotuloksia kruuna-klaava-kruuna seurasi klaava 43 kertaa (40 %) ja kruuna 65 kertaa (60 %). Ensimmäisessä tuloksessa ei ole moittimista, mutta jälkimmäinen osuu jo uskottavuuden rajoille. Vedämme kotiinpäin ja tulkitsemme epäsuhtaisen tuloksen sattuman tuottamaksi. Päättelemme, että suoritettujen koesarjojen valossa yksittäisen kokeen tulos voisi hyvinkin olla riippumaton muiden kokeiden tuloksista. Lopuksi esittelemme neljä koesarjaa, joissa kahta lanttia heitettiin 000 kertaa: Kahden lantin heitto Kahden lantin heitto kaksoisklaavojen osuus kaksoisklaavojen osuus heittojen luku heittojen luku Kahden lantin heitto Kahden lantin heitto kaksoisklaavojen osuus kaksoisklaavojen osuus heittojen luku heittojen luku Jokaisen heiton jälkeen tarkistettiin tuliko kaksi klaavaa vaiko ei. Kertyneiden myönteisten tu-

8 LUKU. SATUNNAISUUS JA SEN MALLINTAMINEN 4 losten suhteellinen osuus kaikista tuloksista kirjattiin kuten edellä. Kussakin pariheittojen sarjassa klaavaparien suhteellinen osuus näyttää stabiloituvan kohti arvoa = 0.25, jokaisessa sarjassa jälleen omalla tavallaan..2 Jatkuvan muuttujan satunnaisuus Oletamme, että erään tuotteen keskeiset ominaisuudet ovat kuvattavissa luvuilla x ja x 2.Komponenttien laatuvaihteluista johtuen näissä esiintyy väkisinkin hajontaa: luvut x ja x 2 vaihtelevat satunnaisesti tuotteesta toiseen. Kun edellisessä kohdassa yksityiseen kolikkoon liittyvä tulos voi saada vain toisen kahdesta arvosta (kruuna tai klaava), tällä kertaa kiinnostuksen kohteena olevat luvut x ja x 2 voivat saada periaatteessa mitä tahansa arvoja joillakin reaaliakselin alueilla. Kyse on niinsanotuista jatkuvista satunnaismuuttujista. Oletamme, että tuote on susi, jos x > 0 tai x 2 > 25 tai x +2x 2 < 52. Esimerkin vuoksi olemme keränneet tuotteista sadan kappaleen otoksen ja mitanneet kustakin näytteestä suureet x ja x 2.Koska yksityiseen näytteeseen liittyvät suureet x ja x 2 ovat esitettävissä pisteenä x R 2,voimme esittää tulokset oheisen kuvan mukaisesti. Kuvaan on merkitty susialue varjostettuna: kpl otos x x Silmämääräisesti arvioiden susia näyttää olevan vajaat puolet otoksesta. Ryhdymme seuraavaksi mittaamaan tuotteita järjestelmällisesti. Aina kun tuote osoittautuu sudeksi (mittaustulosta kuvaava vektori x R 2 osuu varjostettuun susialueeseen), kirjaamme tapahtuman susi. Kun piirrämme kertyneiden susien suhteellisen osuuden kaikista mitatuista kappaleista koerealisaatioiden lukumäärän funktiona, saamme alla olevan kuvaajan. Koetoistojen määrän kasvaessa susien suhteellinen osuus näyttää stabiloituvan jonnekin arvon 0.32 tienoille. Varmistusmittaus toisesta 000 tuotteen otoksesta antaa samantapaisen kuvaajan (alempi kuva). Susifrekvenssi näyttää todellakin stabiloituvan! Voisimmeko olettaa, että susia syntyy satunnaisesti? Suoritamme pistokokeen kuten rahanheiton yhteydessä. Tuhannen kappaleen koesarjassa suden jälkeen mitattiin susi 89 kertaa (28 %) ja hyväksyttävä 229 kertaa (72 %). Hyväksytyn jälkeen mitattiin susi 230 kertaa (34 %) ja hyväksyttävä 45 kertaa (66 %). Hajonnasta huolimatta emme pidä tuloksia ristiriitaisina sen oletuksen kanssa, että susien syntyminen olisi satunnaista. (Päättelyn perusteisiin tulemme vasta myöhemmin.)

9 LUKU. SATUNNAISUUS JA SEN MALLINTAMINEN 5 Viallisten osuus 000 tutkitusta viallisten suhteellinen osuus kappaleiden lkm Viallisten osuus 000 tutkitusta viallisten suhteellinen osuus kappaleiden lkm Tuloksen voimme mallintaa siten, että susia syntyy satunnaisesti todennäköisyydellä Olemme pystyneet kuvaamaan yhdellä luvulla koko jutun..3 Peruskäsitteitä Mallinnettavaa ilmiötä tarkasteltaessa keskeinen käsite on yksityinen koe (koetoisto, havainto, case). Kokeen tuloksena saamme yhden havainnon satunnaismuuttujalle x. Nykyaikaisessa valmisohjelmistojen tukemassa tilastomatematiikassa satunnaismuuttuja on useimmiten vektori, ts. x R p.voimme auttaa mielikuvitustamme ajattelemalla, että yksityisessä koetoistossa luemme p:llä ulostulolla varustetun mustan laatikon ulostulojen (numeeriset) arvot: x x 2 x 3 x 4 x p Edellisessä luvussa tuotteiden laatua kuvaava vektori x R 2 oli suoraan tätä muotoa. Myös lantin heiton tulokset ovat puettavissa mainittuun muotoon. Jos nimittäin merkitsemme klaava

10 LUKU. SATUNNAISUUS JA SEN MALLINTAMINEN 6 =ja kruuna =0, yhden lantin heiton tulos on kuvattavissa reaaliluvulla (yhden mittaisella vektorilla). Kahta kolikkoa heitettäessä yksittäisen kokeen mahdolliset tulokset ovat esitettävissä muodossa (x,x 2 ) T R 2, missä x ja x 2 saavat arvoja 0 ja. Tilastollisessa kokeessa meitä kiinnostaa, realisoituuko tietty tapahtuma vai ei: tuleeko klaava vai ei, ovatko kummatkin kolikot klaavoja vai ei, osuuko mittaustulos susialueeseen vai ei. Pelin henkeen kuuluu, että meidän tulee voida sanoa jokaisen kokeen jälkeen tuloksen x perusteella, realisoituiko kiinnostava tapahtuma vai ei. Satunnaismuuttujan x kaikkien mahdollisten arvojen joukkoa kutsutaan otosavaruudeksi eli perusjoukoksi Ω R p. Yhden kolikon heiton tapauksessa tämä on joukko Ω={0, } R, kahden kolikon tapauksessa joukko Ω= {( 0 0 ), ( ) 0, ( ), 0 ( )} R 2. Näissä tapauksissa kyse on ns. diskreeteistä muuttujista (erotuksena jatkuvalla skaalalla varioiviin muuttujiin). Otosavaruus koostuu avaruuden R p erillisistä pisteistä. Laaduntarkkailuesimerkin satunnaismuuttuja x =(x,x 2 ) T R 2 voi sen sijaan saada periaatteessa saada mitä tahansa arvoja avaruuden R 2 tietyssä osa-alueessa. Kyse on jatkuvasta satunnaismuuttujasta. Otosavaruuden määritelmästä johtuen yksittäinen koetulos x i kuuluu aina otosavaruuteen: x i Ω. Satunnaismuuttujaan x liittyvä tapahtuma on karakterisoitavissa otosavaruuden osajoukkona A Ω: jos kokeen tulos osuu alueeseen A, sanomme vastaavan tapahtuman realisoituneen. Esimerkeissämme on esiintynyt seuraavia tapahtumia: klaava : {} {0, } 0 x klaava & klaava : {( )} {( ) 0, 0 ( ) 0, ( ), 0 ( )} =Ω x 2 0 x susi : {x R 2 x > 0 tai x 2 > 25 tai x +2x 2 < 52} (varjostettu alue alla olevassa kuvassa)

11 LUKU. SATUNNAISUUS JA SEN MALLINTAMINEN 7 26 x x 2 Samaan satunnaismuuttujaan voidaan liittää useita tapahtumia, jotka voivat mainiosti realisoitua samassa kokeessa. Jos esimerkiksi susitehtävään liittyvä koetulos on vektori (, 23) T, kokeessa realisoituvat tapahtuman susi lisäksi mm. tapahtumat x > 0, x > 0.2, x 2 + x ja x 2 < 25. Sen sijaan esimerkiksi tapahtumat x 2 > 24 ja x < 0 tai x 3 2.6x x 2 < 500 eivät realisoidu. (Kuten huomaat, mainitut tapahtumat voidaan karakterisoida otosavaruuden osajoukkoina.) Satunnaismuuttujasta kerättyjen koetoistojen arvoja kutsutaan otokseksi (sample). Satunnaismuuttujan koetoistot ovat riippumattomia, mikäli mielivaltaisen tapahtuman realisoitumismahdollisuus kokeessa on täysin riippumaton muuttujan aikaisemmin (tai myöhemmin) saamista arvoista. Perinteisesti lantin heittoon liittyvien satunnaismuuttujien koetoistot mielletään riippumattomiksi. Riippumattomia koetoistoja pyritään saamaan aikaan myös lottoarvonnassa, rehellisessä korttien jaossa sekä satunnaislukugeneraattoreissa. Tilastomatemaattisessa mallintamisessa pyrimme tulkitsemaan tarkasteltavasta satunnaismuuttujasta kerätyn otoksen otokseksi ideaalisesta satunnaismuuttujasta, jonka ominaisuudet tunnemme. Oletamme tämän jälkeen, että tarkasteltava muuttuja käyttäytyy tulevaisuudessakin kuten mainittu ideaalinen satunnaismuuttuja. Tästä teemme sitten yleensä liiankin pitkälle meneviä johtopäätöksiä. Esimerkki. Mittaamme tietyn vuorokauden aikana Hämeensillan yli kulkeneiden aikuisten miesten pituudet, mittayksikkönä sentti. Dataa tarkasteltuamme päädymme tulokseen, että luvut voisivat olla vallan hyvin peräisin ideaalisesta normaalijakaumaan pohjautuvasta satunnaislukugeneraattorista, jakauman parametreina µ = 74 ja σ = 8.5. Mallinnamme toisin sanoen aikuisen satunnaismiehen pituutta normaalijakautuneella (ideaalisella) satunnaissuureella. Esimerkiksi vaatteiden valmistajat voivat tämän jälkeen tehdä omat arvionsa siitä, kuinka iso osa miehistä tarvitsee 56 numeron housut. Viimeksimainitussa on kyse frekvenssistä, eikö? Tilastollinen malli liittää tapahtumaan A tietyn todennäköisyyden P(A), joka on reaaliluku välillä [0, ]. Jos ideaalista satunnaismuuttujaa kuvitellaan realisoitavan (tai jos sitä simuloidaan hyvällä satunnaisgeneraattorilla), tapahtuman A esiintymisfrekvenssin mielletään lähestyvän koetoistoissa lukua P(A) toistojen määrän kasvaessa (ns. frekventistinen tulkinta). Mainitulla todennäköisyydellä mallinnetaan tietenkin lopulta myös reaalimaailman tapahtuman A esiintymisfrekvenssiä suurissa otoksissa. Huomautus. Ideaaliseen satunnaismuuttujaan liittyvän tapahtuman A esiintymisfrekvenssin ei voi olettaa stabiloituvan realisaatiokertojen kasvaessa kohti lukua P(A) yhtään sen siistim-

12 LUKU. SATUNNAISUUS JA SEN MALLINTAMINEN 8 min kuin klaavojen osuudenkaan todellisessa lantin heitossa. Tämä tekee ajatuskulusta hieman epämääräisen. Asia on kuitenkin sen verran syvällinen, että siihen ei voi puuttua tässä yhteydessä. Frekventistisen tulkinnan tämän tapaisia vaikeuksia käsittelee mainiosti viite WIL- LIAMS suosittelemme niille, joita asia jäi vaivaamaan! Frekventistisen ajattelutavan vahvaa kritiikkiä esittää myös viite JAYNES &BRETTHORST. Jotta mallia voisi käyttää reaalisen ilmiön kuvaamiseen, koetoistojen tulisi vaikuttaa riippumattomilta aikaisemmin esitetyssä mielessä ja tapahtumien esiintymisfrekvenssien tulisi vaikuttaa stabiloituvilta koetoistojen määrän kasvaessa. Tämä kaikki on kuitenkin helpommin sanottu kuin tehty, joten tilastomatematiikan soveltamisen johtava periaate on: Jos malli osoittautuu huonoksi, tehdään uusi.

13 Luku 2 TODENNÄKÖISYYS 2. Joukko-opillisia käsitteitä Edellä totesimme, että tilastomatemaattisen mallin peruskäsitteitä ovat otosavaruus Ω (kaikkien mahdollisten satunnaismuuttujan x R p saamien arvojen joukko), tapahtuma (kiinnostavaan tapahtumaan liittyvä Ω:n osajoukko, joka karakterisoidaan muuttujan x kyseeseen tulevien arvojen avulla) sekä tapahtumaan (vastaavaan Ω:n osajoukkoon) tavalla tai toisella liitettävä todennäköisyys. Useita erilaisia tapahtumia voi liittyä samaan otosavaruuteen. Tilastomatemaattinen kalkyyli rakennetaan näiden käsitteiden varaan. Koska tilastomatematiikan keskeisinä työvälineinä ovat joukot, kertaamme aluksi hieman alkeellista joukko-oppia. Joukon A komplementti perusjoukon Ω suhteen on Ω A = A = {x Ω x / A}, havainnollisesti Ω Ω A = A A Joukkojen A Ω ja B Ω leikkaus on A B = {x Ω x A ja x B} ja yhdiste on havainnollisesti A B = {x Ω x A tai/ja x B}, 9

14 LUKU 2. TODENNÄKÖISYYS 0 Ω A B Ω A B A B A B De Morganin kaavat ovat A B = A B ja A B = A B, havainnollisesti ja Koska yhdiste ja leikkaus ovat liitännäisiä operaatioita, ts. (A B) C = A (B C) =A B C

15 LUKU 2. TODENNÄKÖISYYS ja (A B) C = A (B C) =A B C, voimme helposti yleistää de Morganin kaavat ainakin numeroituvalle määrälle perusjoukon Ω osajoukkoja A i : A i = A i ja A i = A i. i i i i Määritelmien perusteella on vielä helposti todettavissa (katso kuvia), että mikäli A Ω, niin A A =Ω ja A A = ( on tyhjä joukko). Jatkossa tarvitsemme useasti seuraavaa käsitettä. Sanomme, että tapahtumat A,A 2,... (äärellinen tai numeroituvasti ääretön määrä) muodostavat perusjoukon Ω täydellisen tapahtumajärjestelmän, jos. A i Ω (i =, 2,...), 2. A i A j =, kun i j, ts. tapahtumat ovat pareittain erilliset, ja 3. i A i =Ω. Ilmeisestikin tapahtuma ja sen komplementti muodostavat aina täydellisen tapahtumajärjestelmän. 2.2 Todennäköisyyslaskennan aksioomat Koska todennäköisyyslaskennan aksioomat saattavat helpottaa satunnaisilmiön ja sen tilastomatemaattisen mallin välisen suhteen ymmärtämistä, esittelemme seuraavassa ns. Kolmogorovin aksioomat. Ensinnäkin, minkälaiset tapahtumat A Ω, perusjoukon osajoukot, ovat sallittuja? Jos tapahtumien joukkoa merkitään kirjaimella S, niin seuraavien vaatimusten pitää olla voimassa:. Ω S 2. Jos A S, niin myös A S. 3. Jos A,A 2,... S, niin myös i A i S. Tarkastelemme vaatimusten merkitystä satunnaisilmiöön liittyvän kokeen yhteydessä. Kokeen jälkeen meiltä ei muuta vaadita kuin että osaamme sanoa realisoituiko tietty tapahtuma vai ei. Vaatimus. Jos ajattelemme satunnaisilmiöön liittyvän tapahtuman karakterisointia satunnaismuuttujan x arvojen avulla, ensimmäinen vaatimus ilmoittaa salonkikelpoiseksi tapahtuman, jossa muuttuja x saa ylipäänsä jonkin arvon, ts. kunhan vain koe suoritetaan. Vaatimus 2. Jos kokeen jälkeen osaamme tunnistaa, että tapahtuma A realisoitui, meidän tulee myös osata päättää, milloin A ei realisoitunut (satunnaismuuttuja sai sellaisen arvon, joka ei kuulu A:n karakterisoivaan arvoalueeseen). Joukko S on tällöin ns. σ-algebra.

16 LUKU 2. TODENNÄKÖISYYS 2 Vaatimus 3. Jos osaamme tunnistaa erikseen kunkin tapahtuman A i realisoitumisen, meidän tulee pystyä tunnistamaan (erillisenä tapahtumana) myös tapahtuma, joka karakterisoidaan sillä vaatimuksella, että kokeessa realisoituu ainakin yksi tapahtumista A i. Huomautus. Jos A Sja B S, niin myös A B S.Vaatimuksen 2 perusteella riittää osoittaa, että A B S.DeMorganin kaavan mukaan A B = A B. Vaatimuksen 2 mukaisesti A ja B kuuluvat tapahtumien joukkoon S, jolloin Vaatimuksen 3 perusteella myös A B on tapahtuma. Yleisemmin havaitsemme helposti, että jos A,A 2,... S, niin i A i S. Todennäköisyyslaskennassa jokaiseen tapahtumaan A Ω, A S,(S oli tapahtumien joukko) tulee voida liittää todennäköisyys P(A).(P on reaaliarvoinen funktio, jonka argumentteina ovat joukot. P on ns. todennäköisyysmitta.) Suuri osa käytännön tilastomatematiikkaa on tekemisissä ilmiön kuvaamiseen sopivan todennäköisyysmitan löytämisen kanssa. 2 Todennäköisyysmitan P on täytettävä seuraavat Kolmogorovin aksioomat: K. 0 P(A) kaikille tapahtumille A S. ( ) K2. Jos A,A 2,... Sja A i A j = kun i j, niinp A i = P(A i ). i i K3. P(Ω) = Siinä kaikki. Tarkastelemme jälleen, miten aksioomat soveltuvat satunnaisilmiön kuvaamiseen (frekvenssitulkinta). Kuten muistamme, tapahtuman todennäköisyydellä pyritään mallintamaan tapahtuman esiintymisfrekvenssiä koetoistoissa näiden määrän kasvaessa suureksi. Kuvaus on mielekäs tietenkin vain sellaisissa tapauksissa, joissa empiirisesti tiedämme (luulemme) tapahtuman esiintymisfrekvenssin stabiloituvan koetoistojen määrän kasvaessa. Aksiooma K. Tämä vastaa esiintymisfrekvenssille reaalilukuna asetettavia luonnollisia vaatimuksia: Jos n koetoistossa tapahtuma A on realisoitunut n A kertaa, niin joten tapahtuman A esiintymisfrekvenssi 0 n A n, toteuttaa ehdon 0 f A. f A = n A n Aksiooma K2. Frekvenssitulkinta on seuraanvanlainen. Koska A i A j = kun i j, niin samassa yksittäisessä kokeessa voi realisoitua korkeintaan yksi tapahtumista A i (ei siis kahta tai useampaa). Väite x on kroonisesti epätosi, emmekä voi siten kirjata tapahtumaa x A i A j realisoituneeksi yhdessäkään kokeessa. Kun suoritamme n koetoistoa tapahtumien esiintymiskertojen ollessa n Ai,selvästikin n i A i = i n Ai, jolloin f i A i = n i A i n = n Ai = n i i n Ai n = i Aksiooma K3. Frekvenssitulkinnassa tapahtuma x Ω kirjataan tapahtuneeksi jokaisessa koetoistossa. Siten n Ω = n ja f Ω =. 2 Usein käytetään merkinnän P(A) asemesta joukko-opillista merkintää P(x A). f Ai.

17 LUKU 2. TODENNÄKÖISYYS Joukko-oppiin pohjautuvaa todennäköisyyslaskentaa Joukko-oppia hyväksi käyttäen pystymme johtamaan eräitä perustuloksia suoraan todennäköisyyslaskennan aksioomista lähtien. Koska aksioomissa esiintyi vain erillisiä joukkoja (keskinäiset leikkaukset A i A j = ), meidän on pyrittävä joukko-opillisilla tempuilla erillisiin joukkoihin silloinkin, kun kiinnostavilla tapahtumilla (perusjoukon osajoukoilla) A ja B leikkaus A B. Tätä varten esittelemme pari yksinkertaista tulosta joukko-opista. Lause 2.. Oletamme, että B,B 2,...,B n on Ω:n täydellinen tapahtumajärjestelmä. Tällöin A Ω voidaan esittää erillisten osajoukkojen A B i yhdisteenä: A = missä (A B i ) (A B j )=, kun i j. n (A B i ), Sivuutamme muodollisen todistuksen katso kuvaa! Ω B B 2 A A B 4 B 3 B 4 A B 3 A B 2 Lause 2.2. Oletamme, että A, B Ω. Tällöin (A B) B = B ja (A B) B = A B. Lukijaa kehoitetaan jälleen verifioimaan tulos kuvan perusteella: Ω B A B Lauseesta 2. näemme välittömästi, että P(A) = P(A). Käytämme nyt tuloksia seuraavien todennäköisyyslaskennan lauseiden todistamiseen.

18 LUKU 2. TODENNÄKÖISYYS 4 Lause 2.3. (Kokonaistodennäköisyysperiaate) Oletamme, että B,B 2,...,B n on Ω:n täydellinen tapahtumajärjestelmä. Jos tapahtuma A Ω, niin P(A) = n P(A B i ). Todistus. Lauseen 2. mukaan A = n (A B i). Koska saman lauseen mukaan (A B i ) (A B j )=, kun i j,niin todennäköisyyslaskennan aksiooman K2 mukaisesti ( n ) n P(A) =P (A B i ) = P(A B i ). Lause 2.4. (Yhteenlaskukaava) P(A B) =P(A) +P(B) P(A B) Todistus. Ensinnäkin Ω = B B ja B B =. Kyseessä on perusjoukon hajoitelma kahteen erilliseen joukkoon, joten voimme käyttää Lauseen 2.3 tulosta: Samalla tavoin päätellen P(A) =P(A B)+P(A B). P(A B) =P((A B) B)+P((A B) B) =P(B)+P(A B) Lauseen 2.2 perusteella. Vähentämällä jälkimmäisestä yhtälöstä edellisen saamme yhtälön Väite seuraa tästä välittömästi. P(A B) P(A) =P(B) P(A B). 2.4 Todennäköisyysmitasta Mallinnettava ilmiö on se mikä se on, meidän asiamme on laatia sille hyvin istuva tilastollinen malli. Kun olemme päättäneet mikä on koe (koetoisto) ja mitkä ovat meitä kiinnostavia siihen liittyviä tapahtumia, seuraava askel on mallintaa tapahtumiin liittyvät todennäköisyydet ns. todennäköisyysmitan avulla. Mallintaminen tapahtuu ilmiöstä kerättyjen koetulosten pohjalta Klassinen todennäköisyys Klassinen todennäköisyyslaskenta perustuu pitkälti uhkapelistä saatuihin kokemuksiin. Arvioidaan kokemuksen perusteella, että rehellisessä lantin heitossa kruunan ja klaavan esiintymisfrekvenssit ovat samat: ei ole mitään rationaalista syytä olla toisinkaan. Vastaavasti nostettaessa hyvin sekoitetusta pakasta kortti jokaisen nimetyn kortin saaminen arvioidaan yhtä todennäköiseksi. Tapahtumat karakterisoivan satunnaismuuttujan koetoistojen on tietenkin oltava riippumattomia. Klassista todennäköisyyttä voidaan soveltaa tapauksissa, joissa on käytössä perusjoukon äärellinen täydellinen tapahtumajärjestelmä A,...,A N. Jos silloin yksi tapahtumista realisoituu kokeessa, toiset eivät voi realisoitua. Alkeistapahtumien A i todennäköisyydet päätellään toisaalta yhtä suuriksi. Tämä päättely tapahtuu epämatemaattisesti, maailman tuntemuksen pohjalta. Yhden lantin heitossa mainitut alkeistapahtumat ovat kruuna ja klaava, vastaavasti 0 ja.

19 LUKU 2. TODENNÄKÖISYYS 5 Koska Ω= N A i ja A i A j =, kun i j,kolmogorovin aksioomien K2 ja K3 perusteella ( N ) N P(Ω) =P A i = P(A i )=Np, kun kunkin alkeistapahtuman todennäköisyydeksi oletetaan p. Siis p = N. Esimerkki. Tällä tavoin saamme sekä kruunan että klaavan todennäköisyyksiksi /2 yksinkertaisessa lantin heitossa. Samoin perustein nimetyn kortin vetämisen todennäköisyydeksi hyvin sekoitetusta 52 kortin pakasta päätellään /52. Esimerkki. Kahden lantin samanaikaisen heittämisen tapaus on hieman mutkikkaampi. Koko perusjoukon kattavien toisensa poissulkevien alkeistapausten joukoksi voitaisiin valita 0 klaavaa, klaava ja 2 klaavaa. Terve järki kuitenkin sanoo, että nämä eivät ole keskenään yhtä todennäköiset: tapauksia klaava realisoituu useammin kuin muita. Saamme alkeistapaukset keskenään symmetrisiksi todennäköisyyden suhteen yksilöimällä lantit: ensimmäinen lantti ja toinen lantti, 50-senttinen ja euro. Tällöin pariheiton tulos on järjestetty pari, vektori. Jos käytämme aikaisempia merkintöjämme, alkeistapahtumat ovat (0, 0) T, (0, ) T, (, 0) T ja (, ) T. Elämän kokemus kertoo nämä keskenään yhtä todennäköisiksi, joten kunkin todennäköisyys on /4. Tapahtuma klaava on alkeistapahtumien avulla lausuttuna {(0, ) T } {(, 0) T }.Koska alkeistapahtumat ovat toisensa poissulkevat (erilliset), Lauseen 2.4 avulla saamme todennäköisyyden P( klaava ) =2/4 =/ Tiheysfunktio Jatkuvaan satunnaismuuttujaan liittyvien tapahtumien todennäköisyyksien mallintaminen on hieman mutkikasta, sillä mahdollisia tapahtumia on äärettömän monta. Kuinka voisimme liittää mielivaltaiseen tapahtumaan A luvun P(A), 0 P(A)? Koska tapahtuma on karakterisoitavissa perusjoukon Ω osajoukkona A Ω, ongelmamme palautuu keinoon assosioida tarvittava luku P(A) mielivaltaista tapahtumaa karakterisoivaan joukkoon A Ω. Jos jatkuva satunnaismuuttuja x R p käyttäytyy riittävän säännöllisesti, on tavallista mallintaa tapahtumaan A Ω R p liittyvä todennäköisyys tiheysfunktion (probability density function) f :Ω R, x f(x), avulla: P(A) = f(x) dx. A Integrointi suoritetaan tapahtumaa A vastaavan perusjoukon Ω osan yli. Havaitsemme heti, että konstruktio todellakin liittää tietyn reaaliluvun kyseiseen joukkoon, kun funktio f on tunnettu. Ajattelevaa lukijaa riivaa kuitenkin välittömästi kaksi seikkaa: mistä otetaan tuollainen funktio, ja kuinka ihmeessä integraalien arvot lasketaan. Kiiruhdamme asioiden edelle antamaan lyhyet vastaukset kysymyksiin. Mallin viritys sopivan funktion f löytäminen perustuu aina todellisesta ilmiöstä kerättyyn dataan. Tätä dataa on käytettävissä vain äärellinen määrä, muutamia satoja mittauksia ehkä. Tällaiseen aineistoon voitaisiin periaatteessa sovittaa äärettömän monta erilaista tiheysfunktiota f. Niinpä käytännön tarpeita silmälläpitäen on mielekästä rajoittua mallintamaan ilmiötä standardityyppisillä tiheysfunktioilla. Itse asiassa käytettävissämme

20 LUKU 2. TODENNÄKÖISYYS 6 on erilaisia tiheysfunktioperheitä kuten esimerkiksi normaalijakaumiin liittyvät tiheysfunktiot. Perheen funktioissa on tiettyjä sovitusparametreja (yksidimensionaalisessa normaalijakaumassa koulusta tutut µ ja σ). Valitsemme parametrien avulla tiheysfunktioperheen sen jäsenen, joka istuu kerättyyn dataan mahdollisimman hyvin. (Toimenpidettä kutsutaan parametrien estimoinniksi, johon palaamme myöhemmin.) Mitä sitten integraalien laskemiseen tulee, niin niitä joutuu vain harvoin laskemaan, käytännössä ei juuri koskaan. Tarvitsemme vain tavallisen Riemannin integraalin yleisiä ominaisuuksia. Tulokset onnistutaan useimmiten muokkaamaan muotoon, jossa kyseeseen tuleva integraali on tavallista yhden muuttujan tyyppiä. Tämänkin arvot saadaan valmisohjelmista. Tässä suhteessa otetaan siis lepo. Sen sijaan integraalin yleisten ominaisuuksien ymmärtäminen on seuraavalle täysin välttämätöntä. Lue siis huolella ja katsele johtoja ymmärtääksesi ne! Huomautus. Integraaleja joutuu laskemaan hyvinkin mutkikkaissa tapauksissa mm. ns. Bayesin menetelmissä, ja tällaisia laskuja varten on kehitetty omat menetelmänsä ja ohjelmistonsa. Me emme tässä Bayesin menetelmiä sen kummemmin käsittele, viittammepahan vain kevyesti kirjaan GELMAN, A.&CARLIN, J.B. & STERN, H.S. & RUBIN, D.B.: Bayesian Data Analysis. Chapman & Hall/CRC (998). Tarkastelemme seuraavaksi käyttöön otetulle todennäköisyysmitalle asetettavia vaatimuksia. Todennäköisyyslaskennan aksioomista seuraa suoraan, että on oltava (aksioomat K ja K3): f(x) 0 (tämä on fiksua, sillä koska aina P(A) 0, eif ainakaan jatkuvuuspisteissään voi olla negatiivinen) ja f(x) dx = (koskapa P(Ω) = ). Todennäköisyyslaskennan aksiooma K2 Ω Jos A,A 2,... Sja A i A j = kun i j, niin P( i A i)= i P(A i). toteutuu integraalin ominaisuuksista johtuen. Jos nimittäin A B =, niin tunnetusti f(x) dx = f(x) dx + f(x) dx. A B A B Riittävän säännöllisissä tapauksissa tulos on yleistettävissä mielivaltaiselle määrälle joukkoja (tapahtumia) A i.kysehän on vain integrointialueen jakamisesta toisiaan leikkaamattomiin osaalueisiin. Mikäli tiheysfunktio f toteuttaa sille edellä johdetut ehdot, voimme konstruoida erään todennäköisyysmitan sen avulla. Jatkuvan moniulotteisen satunnaismuuttujan x R p tapauksessa tämä on ylivoimaisesti yleisin menetelmä. Vakio-ohjelmistojen taustalla on tällöin pääsääntöisesti moniulotteiseen normaalijakaumaan liittyvä tiheysfunktio, tapauskohtaisesti viritettynä Tiheysfunktion tulkintaa Tilastomatemaattisen mallintamisen perusideana on suhtautua todellisesta ilmiöstä kerättävään dataan ikäänkuin se olisi ideaalisen satunnaismuuttujan avulla generoitua. Minkälaista dataa tuottaisi ideaalinen satunnaismuuttuja x R p, jonka jakauman tiheysfunktio on f, kun koetta toistettaisiin riittävän monta kertaa?

21 LUKU 2. TODENNÄKÖISYYS 7 Käytämme todennäköisyyden frekvenssitulkintaa. Oletamme, että koe toistetaan riippumattomin koetoistoin N kertaa, missä N oletetaan suureksi. Tarkastelemme perusjoukon pientä osajoukkoa A Ω. Mallimme antaa tämän tapahtuman todennäköisyydeksi P( A) = f(x) dx. A Oletamme, että tiheysfunktio f on jatkuva ja merkitsemme alueen A mittaa, tilavuutta A :lla. (Viittaamme tässä kurssiin Laaja vektorianalyysi.) Integraalilaskennan väliarvolauseen mukaan P( A) = f(x) dx = f(ξ) A, A missä ξ on tietty alueen A sisäpiste. Frekvenssitulkinnan mukaisesti tapahtuman A esiintymisfrekvenssi lähenee koetoistojen määrän kasvaessa arvoa P( A). N:stä koetoistosta saaduista satunnaismuuttujan x arvoista alueeseen osuu siten noin NP( A) =Nf(ξ) A kappaletta. Koetoistojen osumatiheys mainittuun alueeseen saadaan jakamalla osumat alueen mitalla (tilavuudella). Osumatiheys on siten suuruudeltaan noin Nf(ξ). Kun alueen lävistäjä 3 lähenee nollaa, funktion f jatkuvuudesta johtuen f(ξ) f(x), missä x on tarkastelupiste. Siten tiheysfunktion arvo on suoraan verrannollinen paikalliseen osumatiheyteen koetoistojen määrän kasvaessa rajatta. Esimerkki. Tiedämme, että satunnaispopulaatiossa aikuisten miesten pituuden x jakauma on mallinnettavissa normaalijakauman avulla, jolloin tiheysfunktio f on muotoa (yleisesti tunnettu Gaussin kellokäyrä ) f(x) = e 2σ 2 (x µ)2. 2πσ Mallin viritys sopivassa, satunnaisessa kollipopulaatiossa antaa estimaatit ˆµ = 74 ja ˆσ = 8.5 (yksikkönä on sentti). Seuraavassa on esitetty 500 satunnaismiehen pituudet histogrammin muodossa: lkm eli suurin etäisyys alueen kahden pisteen välillä otosarvot

22 LUKU 2. TODENNÄKÖISYYS 8 Kuva näyttää, montako jeppeä otoksesta osui kuhunkin pituusluokkaan leveydeltään 2 cm. Vaikka maailma on niin satunnainen kuin se on, osumistiheyttä kuvaava jakauma muistuttaa kiitettävästi kellokäyrää. Käytettyyn satunnaismuuttujaan x liittyvien tapahtumien todennäköisyydet, esimerkiksi P(80 <x 85), saadaan kätevimmin ohjelmistoilla. (Huomaa miten käytimme varsin sutjakkaa merkintää tapahtumalle {x R 80 <x 85}.) Matlabilla se käy seuraavasti:»normcdf(85,74,8.5)-normcdf(80,74,8.5) ans = normcdf on normaalijakauman kertymäfunktio, ks. alla Kertymäfunktio Todennäköisyyden mallintaminen tiheysfunktiota käyttäen on mahdollista perinteisin konstein vain jos tiheysfunktio f on paloittain jatkuva. (Totta puhuen tällä pärjätään pitkälle.) Hankalammissa tapauksissa käytetään kertymäfunktiota. Esittelemme sen ainoastaan yksidimensionaalisessa tapauksessa. Oletamme, että satunnaismuuttuja x R. Mallinnamme tapahtuman todennäköisyyttä x y P(x y) =F (y), missä funktio F on satunnaismuuttujan x jakauman kertymäfunktio (cumulative distribution function). Määritelmän avulla saamme helposti esimerkiksi todennäköisyyden Onhan näet ja joten P(y <x y 2 )=F (y 2 ) F (y ). {x x y 2 } = {x x y } {x y <x y 2 } {x x y } {x y <x y 2 } =, P(x y 2 )=P(x y )+P(y <x y 2 ). Mikäli Ω=R, näemme välittömästi, että F ( ) =ja F ( ) =0(raja-arvoina). Yllä olevan välin todennäköisyyden perusteella havaitsemme myös, että funktio F on ei-vähenevä: mikäli y <y 2, niin F (y ) F (y 2 ). Mikäli kertymäfunktio F on jatkuvasti derivoituva, saamme mielivaltaiselle välille [y,y 2 ] (vasemmalla päätepisteellä ei ole tässä tapauksessa merkitystä): P(y x y 2 )=F (y 2 ) F (y )= y 2 y F (x) dx. Tämä pitää paikkansa kaikille väleille [y,y 2 ].Kun vertaamme tulosta tiheysfunktion f määritelmään havaitsemme, että kertymäfunktion derivaatta on jakauman tiheysfunktio f: F (x) =f(x).

23 LUKU 2. TODENNÄKÖISYYS 9 Saamme kertymäfunktiolle F vastaavanlaisen koetoistotulkinnan kuin tiheysfunktiollekin. Oletamme, että satunnaismuuttujan x perusjoukko on R ja että siihen liittyvien tapausten todennäköisyydet ovat mallinnettavissa kertymäfunktion F avulla. N:n koetoiston tuloksista likimäärin NF(y) kappaletta osuu frekvenssitulkinnan mukaan alueeseen {x x y}. F (y) on siten verrannollinen niiden osumien lukumäärään, jotka sattuvat kyseiseen alueeseen. Mukaan tulevat kumulatiivisesti pienimmistä arvoista alkaen kaikki ne, joilla vielä x y. Esimerkki. (Jatkoa) Seuraavaan kuvaan on kerätty kumulatiivisesti aikaisemman miespopulaatiomme yksilöt siten, että kuvasta näkyy niiden miesten lukumäärä, joiden pituus on korkeintaan x-akselilla annetun pituuden suuruinen. Pylväsdiagrammin muodon tulisi mukailla funktion F kuvaajan kulkua: kumulatiivinen lkm otosarvot Pylväiden yläreunan viivan pitäisi olla likipitäen funktion x 2πσ e 2σ 2 (t µ)2 dt kuvaajan muotoinen, missä µ = 74 ja σ =8.5, eikö? Niin se myös on! (Kysymys: Otoksen koko oli 500. Miten se näkyy kuvassa?) Mainittakoon vielä, että kertymäfunktion käsite on helposti yleistettävissä satunnaismuuttujalle x R p.kertymäfunktio F :Ω R, x F (x), missä Ω R p. Määrittelemme (sutjakkaan merkintätyyliimme). F (y) =P(x y,x 2 y 2,...,x p y p ) Muuttujan vaihto ja tiheysfunktio Oletamme, että satunnaismuuttujalla x R p on tiheysfunktio f. Mikä tiheysfunktio on satunnaismuuttujalla y R p, joka määritellään satunnaismuuttujan x avulla: x = h(y)? (Huomaa argumenttien järjestys!) Oletamme tässä, että funktio h on kuvaus Ω 2 Ω perusjoukkojen välillä kääntäen yksikäsitteisesti. Oletamme myös, että Ω 2 :n sisällä det(h (y)) 0 (derivaattamatriisin rangi täysi). 4 4 Muunlaisillekin funktioille saadaan vastaavia tuloksia, mutta ne ovat huomattavasti hankalampia.

24 LUKU 2. TODENNÄKÖISYYS 20 Koska kyse on vain saman ilmiön kuvailusta uusien muuttujien avulla, vastintapahtumien todennäköisyyksien tulee pysyä samoina. Ja jos differentiaalisen pienten vastintapahtumien todennäköisyydet pysyvät samoina, pysyvät näistä yhdistettyjen suurempienkin. Tarkastelemmekin satunnaismuuttujan x perusjoukon differentiaalisen pientä osajoukkoa dx (aluetta) pisteen x 0 ympäristössä ja oletamme alueen mitaksi (tilavuudeksi) dx. Osajoukon dx kuva dy sijaitsee satunnaismuuttujan y perusjoukossa pisteen y 0 ympäristössä. Muuttujien funktioriippuvuudesta johtuen tarkastelupisteiden yhteys toisiinsa on x 0 = h(y 0 ). Joukkojen dx ja dy pisteet ovat kääntäen yksikäsitteisessä suhteessa toisiinsa kuvauksen x = h(y) kautta. Seuraavaksi meidän on pääteltävä alueen dy mitta (tilavuus), jota merkitsemme dy :llä. Tähän käytämme suoraan kurssista Laaja vektorianalyysi peräisin olevaa tulosta: dx = det(h (y 0 )) dy. Alueeseen dx liittyvän tapahtuman todennäköisyys on f(x 0 ) dx. Jos satunnaismuuttujan y tiheysfunktiota merkitään g:llä, niin vastaavasti alueeseen dy liittyvän tapahtuman todennäköisyys on g(y 0 ) dy (alueet oletettiin differentiaalisen pieniksi ). Näiden tapahtumien todennäköisyyksien tulee olla yhtä suuret: aina kun satunnaismuuttuja x osuu koerealisaatiossa alueeseen dx, osuu myös muuttujasta x laskettu muuttuja y alueeseen dy vastaavuuden perusteella. Siten g(y 0 ) dy = f(x 0 ) dx. Kun sijoitamme yhtälöön x 0 = h(y 0 ) (funktioriippuvuuden perusteella) sekä dx = det(h (y 0 )) dy (alueiden mitat toisiinsa sitova ehto), saamme g(y 0 ) dy = f(h(y 0 )) det(h (y 0 )) dy. Supistamalla tilavuusmitan dy puolittain saamme haluamamme tuloksen: Toteamme tuloksen lauseen muodossa: g(y 0 )=f(h(y 0 )) det(h (y 0 )). Lause 2.5. Oletamme, että satunnaismuuttujalla x R p on perusjoukko Ω ja tiheysfunktio f. Otamme käyttöön uuden muuttujan y, joka määritellään yhtälön x = h(y) avulla ja jonka perusjoukko on Ω 2. Oletamme, että funktio h : Ω 2 Ω kääntäen yksikäsitteisesti siten, että Ω 2 :n sisällä det(h (y)) 0(derivaattamatriisin rangi täysi). Tällöin uutta muuttujaa y vastaava tiheysfunktio on g(y) =f(h(y)) det(h (y)). Lausetta 2.5 voi usein soveltaa myös funktiolle k :Ω Ω 3, y = k(x), missä Ω 3 R r ja r<p. Tällöin lisätään k:hon aikaisemmista funktionaalisesti riippumattomia uusia komponentteja, niin että käänteisfunktiona saadaan funktio h :Ω 2 Ω. Sen jälkeen sovelletaan Lausetta 2.5 ja lopuksi integroidaan pois lisätyt komponentit (reunajakauma), ks. Pykälä 3.4. Skalaariarvoisten satunnaismuuttujan funktioiden tiheysfunktion saa kuitenkin usein helpommin kertymäfunktion kautta. Lasketaan esimerkki tällä tekniikalla: Esimerkki. Oletamme, että x ja x 2 ovat samassa kokeessa realisoituvia (yksidimensioisia) satunnaismuuttujia, joiden yhteisjakauman tiheysfunktio on f ja perusjoukko koko R 2. Laskemme satunnaismuuttujan x + x 2 tiheysfunktion. Muodostamme satunnaismuuttujan x + x 2 kertymäfunktion y x 2 G(y) =P(x + x 2 y) = f(x,x 2 ) dx dx 2

25 LUKU 2. TODENNÄKÖISYYS 2 ja derivoimme sen y:n suhteen: g(y) =G (y) = f(y x 2,x 2 ) dx 2. (Oletimme tässä, että derivointi voidaan suorittaa ulomman integraalin sisällä.) Tätä integraalia muuten kutsutaan tiheysfunktion f konvoluutioksi. Samalla tekniikalla voitaisiin muodostaa mm. satunnaismuuttujien x x 2, x x 2 ja x /x 2 tiheysfunktiot, ja yhden satunnaismuuttujan x tapauksessa mm. satunnaismuuttujien x, x 2, e x ja ln x tiheysfunktiot Diskreetti satunnaismuuttuja Diskreetti satunnaismuuttuja x R p voi saada vain äärellisen tai numeroituvasti äärettömän määrän erillisiä arvoja x i. Kaikki muuttujaan liittyvät tapahtumat ovat niin muodoin yhdisteitä erillisistä pisteistä. Esimerkiksi tapahtuma A voitaisiin karakterisoida joukkona A = {x 7, x 9, x 23, x 65 }. Mallinnettaessa diskreettiä satunnaismuuttujaa ei auta muu kuin mallintaa jokaiselle alkeistapahtumalle x i oma todennäköisyytensä p i =P(x = x i ).Yo. tapahtuman A todennäköisyydeksi saadaan silloin P(A) = x i A p i, (summaukseen mukaan tuleva indeksijoukko vastaa tapahtumaa A). Kolmogorovin aksiooman K3 perusteella tällöin kaikkien alkeistapahtumien todennäköisyyksien summa (kaikkien p i :tten summa) on =. Kuinka sitten saamme mallinnetuksi alkeistapahtumien todennäköisyydet p i?klassiseen todennäköisyyslaskentaan liittyvissä tilanteissa päästään järkeilemään symmetrian avulla: rajoitutaan tapauksiin, missä alkeistapahtumien todennäköisyydet arvioidaan apriorisesti keskenään yhtä suuriksi. Mutkikkaammissa tilanteissa todennäköisyydet on estimoitava kerätyn datan perusteella tätä varten kehitetyillä menetelmillä Mielikuva todennäköisyysmassasta Jatkuvan satunnaismuuttujan tapauksessa tapahtumaan A liittyvä todennäköisyys mallinnetaan useimmiten tiheysfunktion f avulla: P(A) = f(x) dx. A Integraali lasketaan tapahtumaa A vastaavan joukon A Ω R p yli. Koska f(x) 0, tiheysfunktio on tulkittavissa eräänlaiseksi tiheydeksi (probability density function) analogisesti aineen tiheyden kanssa. Tällöin yllä mainittu todennäköisyys voidaan tulkita tapahtumaan A liittyväksi todennäköisyysmassaksi. Koska P(Ω) = f(x) dx =, Ω

26 LUKU 2. TODENNÄKÖISYYS 22 koko otosavaruuden todennäköisyysmassa on =. Perusjoukko voidaan siten tulkita avaruudessa R p sijaitsevana vaihtelevatiheyksisenä kappaleena, josta eri tapahtumat A (perusjoukon osajoukot) muodostavat osia. Kyseessä on tietenkin puhdas mielikuva. Tämä on kuitenkin siinä mielessä hyödyllinen, että voimme integraaliin turvautumatta ottaa mielikuvaamme mukaan myös diskreettiä muuttujaa vastaavan tapauksen. Tällöin yksityisiin perusjoukon pisteisiin liittyy aidosti positiivisia todennäköisyyksiä. Mielikuvassamme voimme korvata tällaiset pisteet massapisteillä pisteiden massojen vastatessa ao. tapahtumaan liittyvää todennäköisyyttä. (Sekajakautuneen muuttujan osittain jatkuvan, osittain diskreetin tapauksessa voimme jopa hurjastella pintatiheydellä varustetuilla massa(hyper)pinnoilla tai deltafunktioilla.) Pääasia on, että koko otosavaruutta vastaavan alueen kokonaismassa on =, eri tapahtumat leikkaavat siitä sitten erilaisia kakkuja. Näiden massoista pidämme lukua arkijärkisesti muistaen mahdolliset massapisteet ja muut erikoisuudet. On tavallista esittää tilannetta vastaava kuva tasoalueen muodossa Vennin diagrammina, kuten jo edellä teimme, vaikka dimensio olisi korkeampikin: Ω A B A B Tapahtumaan liittyvä todennäköisyysmassa eli todennäköisyys on vastaavan osa-alueen massa mahdollisine massapisteineen kaikkineen. Tämän tulkinnan perusteella vakuuttaudumme esimerkiksi intuitiivisesti siitä, että todellakin P(A B) =P(A) +P(B) P(A B) (Lause 2.4). Yhdistettä vastaavan alueen massa on kummankin osa-alueen massa vähennettynä niiden yhteisen alueen massalla, joka muuten tulisi laskettua mukaan kahteen kertaan. Mielikuvan avulla voimme helposti päästä oikean tuloksen jäljille riittävän alkeellisissa tapauksissa. Osaisitko katsoa kuvasta, mitä olisi P(A B C)? 5 5 No, paljastamme toki vastauksen: P(A B C) =P(A)+P(B)+P(C) P(A B) P(A C) P(B C)+P(A B C). Eipä olekaan enää täysin yksinkertaista! Tämä on esimerkki vieläkin yleisemmästä ns. Inkluusio ekskluusio-periaatteesta, joka voidaan todistaa induktiolla: ( m ) P A i = P(A i ) P(A i A j )+ ( m ) P(A i A j A k ) + +( ) m+ P A i. i m i<j m i<j<k m

27 Luku 3 EHDOLLINEN TODENNÄKÖISYYS. REUNAJAKAUMA Tulemme seuraavissa tarkasteluissa karakterisoimaan satunnaismuuttujaan x R p liittyvien tapahtumien todennäköisyydet tiheysfunktion f avulla. Jos määrittelemme tiheysfunktion identtisesti nollaksi perusjoukon Ω ulkopuolella avaruudessa R p,voimme ottaa uudeksi perusjoukoksi koko avaruuden R p. Laajennettu malli antaa ilmeisestikin samat todennäköisyydet mahdollisille tapahtumille kuin alkuperäinen. Oletamme jatkossa satunnaismuuttujan x R p perusjoukoksi koko avaruuden R p, ellei nimenomaisesti toisin sovita. 3. Ehdollinen todennäköisyys. Bayesin kaava Esittelemme ehdollisen todennäköisyyden käsitteen. Oletamme, että tapahtumat A ja B liittyvät samaan satunnaismuuttujaan: yksittäisessä kokeessa voisivat realisoitua esimerkiksi jokin tai jotkin tapahtumista A, B, A B, A B tai ei yksikään niistä. Määritelmä. Oletamme, että P(B) 0. Tapahtuman A ehdolliseksi todennäköisyydeksi tapahtuman B suhteen määritellään P(A B) = P(A B). P(B) Mikä on ehdollisen todennäköisyyden frekvenssitulkinta? Oletamme, että koetoistojen lukumäärä n on suuri. Merkitsemme n AB :llä niiden tapausten lukumäärää, joissa esiintyy sekä A että B. Vastaavasti merkitsemme n B :llä niiden tapausten lukumäärää, joissa esiintyy (ainakin) B. Koetoistojen määrän kasvaessa osamäärä n AB /n stabiloituu kohti arvoa P(A B), osamäärä n B /n puolestaan kohti arvoa P(B).Niinpä osamäärä n AB /n B stabiloituu kohti arvoa P(A B) P(B) =P(A B). Kuinka olisi osamäärä n AB /n B tulkittava? No, sehän on niiden tapausten lukumäärä, joissa on realisoitunut sekä A että B niiden tapausten lukumäärä, joissa on realisoitunut (ainakin) B. 23

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1 Todennäköisyyslaskun kertaus Vilkkumaa / Kuusinen 1 Satunnaismuuttujat ja todennäköisyysjakaumat Vilkkumaa / Kuusinen 2 Motivointi Kokeellisessa tutkimuksessa tutkittaviin ilmiöihin liittyvien havaintojen

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Matemaattinen tilastotiede Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto Alkusanat Tämä moniste perustuu vuosina 2002-2004 pitämiini matemaattisen tilastotieteen luentoihin

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Kertymäfunktio TKK (c) Ilkka Mellin (2005) 1 Kertymäfunktio Kertymäfunktio: Määritelmä Diskreettien jakaumien kertymäfunktiot Jatkuvien jakaumien kertymäfunktiot TKK (c)

Lisätiedot

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä

TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä J. Virtamo 38.3143 Jonoteoria / Todennäköisyyslaskenta 1 TODENNÄKÖISYYSLASKUN KERTAUS Peruskäsitteitä Otosavaruus S S on satunnaiskokeen E kaikkien mahdollisten alkeistapahtumien e joukko. Esim. 1. Noppaa

Lisätiedot

B. Siten A B, jos ja vain jos x A x

B. Siten A B, jos ja vain jos x A x Mat-1.2600 Sovellettu todennäköisyyslaskenta B / Ratkaisut Aiheet: Johdanto Joukko-opin peruskäsitteet Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat: Alkeistapahtuma,

Lisätiedot

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten Todennäköisyys Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten tietoliikennejärjestelmien ymmärtämisessä

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 20. syyskuuta 2007 Antti Rasila () TodB 20. syyskuuta 2007 1 / 17 1 Kolmogorovin aksioomat σ-algebra Tapahtuman todennäköisyys 2 Satunnaismuuttujat Todennäköisyysjakauma

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Todennäköisyys (englanniksi probability)

Todennäköisyys (englanniksi probability) Todennäköisyys (englanniksi probability) Todennäköisyyslaskenta sai alkunsa 1600-luvulla uhkapeleistä Ranskassa (Pascal, Fermat). Nykyisin todennäköisyyslaskentaa käytetään hyväksi mm. vakuutustoiminnassa,

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio TKK (c) Ilkka Mellin (2007) 1 Kertymäfunktio >> Kertymäfunktio: Määritelmä Diskreettien jakaumien

Lisätiedot

Jatkuvat satunnaismuuttujat

Jatkuvat satunnaismuuttujat Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Todennäköisyyslaskennan käsitteitä Satunnaisuus ja deterministisyys Deterministisessä ilmiössä alkutila määrää lopputilan yksikäsitteisesti. Satunnaisilmiö puolestaan arpoo - yhdestä alkutilasta voi päätyä

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Satunnaismuuttujat ja todennäköisyysjakaumat Mitä tänään? Jos satunnaisilmiötä halutaan mallintaa matemaattisesti, on ilmiön tulosvaihtoehdot kuvattava numeerisessa muodossa. Tämä tapahtuu liittämällä

Lisätiedot

031021P Tilastomatematiikka (5 op) Kurssi-info ja lukion kertausta

031021P Tilastomatematiikka (5 op) Kurssi-info ja lukion kertausta 031021P Tilastomatematiikka (5 op) Kurssi-info ja lukion kertausta Jukka Kemppainen Mathematics Division Käytännön asioita Luennot (yht. 7 4 h) ke 12-14 ja pe 8-10 (ks. tarkemmin Oodista tai Nopasta) Harjoitukset

Lisätiedot

Luku 1. Johdanto. 1.1 Todennäköisyys ja tilastotiede. 1.2 Havaitut frekvenssit ja empiiriset jakaumat

Luku 1. Johdanto. 1.1 Todennäköisyys ja tilastotiede. 1.2 Havaitut frekvenssit ja empiiriset jakaumat Luku 1 Johdanto 1.1 Todennäköisyys ja tilastotiede Tämä kurssi käsittelee sekä todennäköisyyslaskentaa että tilastotiedettä. Uhkapelurien ongelmat inspiroivat todennäköisyyslaskennan uranuurtajien ajattelua,

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila Kalvoissa käytetään materiaalia P. Palon vuoden 2005 kurssista. 07.09.2007 Antti Rasila () SovTodB 07.09.2007 07.09.2007 1 / 24 1 Todennäköisyyslaskennan

Lisätiedot

Johdatus tn-laskentaan perjantai 17.2.2012

Johdatus tn-laskentaan perjantai 17.2.2012 Johdatus tn-laskentaan perjantai 17.2.2012 Kahden diskreetin muuttujan yhteisjakauma On olemassa myös monen muuttujan yhteisjakauma, ja jatkuvien muuttujien yhteisjakauma (jota ei käsitellä tällä kurssilla;

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 27. syyskuuta 2007 Antti Rasila () TodB 27. syyskuuta 2007 1 / 15 1 Diskreetit jakaumat Diskreetti tasainen jakauma Bernoulli-jakauma Binomijakauma Geometrinen

Lisätiedot

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1, Todennäköisyyslaskenta, 2. kurssikoe 7.2.22 Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu.. Satunnaismuuttujien X ja Y yhteistiheysfunktio on

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa? 21.3.2019/1 MTTTP1, luento 21.3.2019 7 TILASTOLLISEN PÄÄTTELYN PERUSTEITA Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

30A02000 Tilastotieteen perusteet

30A02000 Tilastotieteen perusteet 30A02000 Tilastotieteen perusteet Kertaus 1. välikokeeseen Lauri Viitasaari Tieto- ja palvelujohtamisen laitos Kauppatieteiden korkeakoulu Aalto-yliopisto Syksy 2019 Periodi I-II Sisältö Välikokeesta Joukko-oppi

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2 HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 208 Harjoitus 4 Ratkaisuehdotuksia Tehtäväsarja I. Satunnaismuuttuja U Exp(2) ja V = U/(3 + U). Laske f V käyttämällä muuttujanvaihtotekniikkaa.

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 21. syyskuuta 2007 Antti Rasila () TodB 21. syyskuuta 2007 1 / 19 1 Satunnaismuuttujien riippumattomuus 2 Jakauman tunnusluvut Odotusarvo Odotusarvon ominaisuuksia

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Tilastollinen aineisto Luottamusväli

Tilastollinen aineisto Luottamusväli Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden

Lisätiedot

Todennäköisyyslaskenta

Todennäköisyyslaskenta Todennäköisyyslaskenta Opintomoniste kurssille MAT-25 Todennäköisyyslaskenta, Tampereen teknillinen yliopisto Antti Perttula, Kimmo Vattulainen, Tia Suurhasko Versio 9/212 Sisältö 1 Todennäköisyys 3 1.1

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi

Lisätiedot

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 1 Luento 23.9.2014 KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja 2 Ristiintaulukko Esim. Toyota Avensis farmariautoja, nelikenttä (2x2-taulukko) 3 Esim. 5.2.6. Markkinointisuunnitelma

Lisätiedot

Tilastomatematiikka Kevät 2008

Tilastomatematiikka Kevät 2008 Tilastomatematiikka Kevät 2008 Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastomatematiikka p.1/19 4.3 Varianssi Satunnaismuuttuja on neliöintegroituva, jos odotusarvo

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I Tehtävä 1 on klassikko. 1. Tässä tehtävässä tapahtumat A ja B eivät välttämättä

Lisätiedot

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden aksioomat

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden aksioomat Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Todennäköisyyden aksioomat TKK (c) Ilkka Mellin (2007) 1 Todennäköisyyden aksioomat >> Todennäköisyyden määritteleminen Todennäköisyyden

Lisätiedot

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.

Tehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8. HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 8 Harjoitus Ratkaisuehdotuksia Tehtäväsarja I Tehtävät -5 perustuvat monisteen kappaleisiin..7 ja tehtävä 6 kappaleeseen.8..

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä

Lisätiedot

&idx=2&uilang=fi&lang=fi&lvv=2015

&idx=2&uilang=fi&lang=fi&lvv=2015 20.10.2015/1 MTTTP5, luento 20.10.2015 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Otanta Poisson- Jakaumien tunnusluvut Diskreetit jakaumat Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen

Lisätiedot

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: 8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)

Lisätiedot

FUNKTIONAALIANALYYSIN PERUSKURSSI 1. 0. Johdanto

FUNKTIONAALIANALYYSIN PERUSKURSSI 1. 0. Johdanto FUNKTIONAALIANALYYSIN PERUSKURSSI 1. Johdanto Funktionaalianalyysissa tutkitaan muun muassa ääretönulotteisten vektoriavaruuksien, ja erityisesti täydellisten normiavaruuksien eli Banach avaruuksien ominaisuuksia.

Lisätiedot

4.0.2 Kuinka hyvä ennuste on?

4.0.2 Kuinka hyvä ennuste on? Luonteva ennuste on käyttää yhtälöä (4.0.1), jolloin estimaattori on muotoa X t = c + φ 1 X t 1 + + φ p X t p ja estimointivirheen varianssi on σ 2. X t }{{} todellinen arvo Xt }{{} esimaattori = ε t Esimerkki

Lisätiedot

Inversio-ongelmien laskennallinen peruskurssi Luento 7

Inversio-ongelmien laskennallinen peruskurssi Luento 7 Inversio-ongelmien laskennallinen peruskurssi Luento 7 Kevät 2012 1 Tilastolliset inversio-ongelmat Tilastollinen ionversio perustuu seuraaviin periaatteisiin: 1. Kaikki mallissa olevat muuttujat mallinnetaan

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko ÌÓÒÒĐĐÓ ÝÝ ÔÖÙ ØØ Naiiveja määritelmiä Suhteellinen frekvenssi kun ilmiö toistuu Jos tehdas on valmistanut 1000000 kpl erästä tuotetta, joista 5013 ovat viallisia, niin todennäköisyys, että tuote on viallinen

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia KE (2014) 1 Hypergeometrinen jakauma Hypergeometrinen jakauma

Lisätiedot

f(x, y) = x 2 y 2 f(0, t) = t 2 < 0 < t 2 = f(t, 0) kaikilla t 0.

f(x, y) = x 2 y 2 f(0, t) = t 2 < 0 < t 2 = f(t, 0) kaikilla t 0. Ääriarvon laatu Jatkuvasti derivoituvan funktion f lokaali ääriarvokohta (x 0, y 0 ) on aina kriittinen piste (ts. f x (x, y) = f y (x, y) = 0, kun x = x 0 ja y = y 0 ), mutta kriittinen piste ei ole aina

Lisätiedot

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 25.10.2016/1 MTTTP5, luento 25.10.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585 &idx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat TKK (c) Ilkka Mellin (2005) 1 Todennäköisyyden aksioomat Todennäköisyyden määritteleminen Todennäköisyyden aksioomat äärellisissä otosavaruuksissa

Lisätiedot

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja. Luku 1 Johdanto 1.1 Todennäköisyys ja tilastotiede Kurssi käsittelee todennäköisyyslaskentaa ja tilastotiedettä. Laaditaan satunnaisilmiöille todennäköisyysmalleja. Miten hyvin mallit kuvaavat todellisuutta?

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty Juuri 0 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 9..08 Kertaus K. a) Alapaineiden pienin arvo on ja suurin arvo 74, joten vaihteluväli on [, 74]. b) Alapaineiden keskiarvo on 6676870774

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 31.03.2012 klo. 9.00-12.00 saleissa L1,L3 Jukka Kemppainen Mathematics

Lisätiedot

Määritelmä 3.1 (Ehdollinen todennäköisyys) Olkoot A ja B otosavaruuden Ω tapahtumia. Jos P(A) > 0, niin tapahtuman B ehdollinen todennäköisyys

Määritelmä 3.1 (Ehdollinen todennäköisyys) Olkoot A ja B otosavaruuden Ω tapahtumia. Jos P(A) > 0, niin tapahtuman B ehdollinen todennäköisyys Luku 3 Satunnaismuuttujat, ehdollistaminen ja riippumattomuus Tässä luvussa käsitellään satunnaismuuttujien ominaisuuksia ja täydennetään todennäköisyyslaskennan tietoja. Erityisesti satunnaismuuttujien

Lisätiedot

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015

https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 12.1.2016/1 MTTTP5, luento 12.1.2016 1 Kokonaisuudet, joihin opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=11585&i dx=2&uilang=fi&lang=fi&lvv=2015 2 Osaamistavoitteet Opiskelija osaa

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

4. laskuharjoituskierros, vko 7, ratkaisut

4. laskuharjoituskierros, vko 7, ratkaisut 4. laskuharjoituskierros, vko 7, ratkaisut D1. Kone valmistaa kuulalaakerin kuulia, joiden halkaisija vaihtelee satunnaisesti. Halkaisijan on oltava tiettyjen rajojen sisällä, jotta kuula olisi käyttökelpoinen.

Lisätiedot

3.7 Todennäköisyysjakaumia

3.7 Todennäköisyysjakaumia MAB5: Todennäköisyyden lähtökohdat 4 Luvussa 3 Tunnusluvut perehdyimme jo jakauman käsitteeseen yleensä ja normaalijakaumaan vähän tarkemmin. Lähdetään nyt tutustumaan binomijakaumaan ja otetaan sen jälkeen

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Johdantoa. Jokaisen matemaatikon olisi syytä osata edes alkeet jostakin perusohjelmistosta, Java MAPLE. Pascal MathCad

Johdantoa. Jokaisen matemaatikon olisi syytä osata edes alkeet jostakin perusohjelmistosta, Java MAPLE. Pascal MathCad Johdantoa ALGORITMIT MATEMA- TIIKASSA, MAA Vanhan vitsin mukaan matemaatikko tietää, kuinka matemaattinen ongelma ratkaistaan, mutta ei osaa tehdä niin. Vitsi on ajalta, jolloin käytännön laskut eli ongelman

Lisätiedot

Todennäköisyyslaskun kertaus. Heliövaara 1

Todennäköisyyslaskun kertaus. Heliövaara 1 Todennäköisyyslaskun kertaus Heliövaara 1 Satunnaismuuttujat ja todennäköisyysjakaumat Heliövaara 2 Stunnaismuuttujat ja todennäköisyysjakaumat Jos satunnaisilmiötä halutaan mallintaa matemaattisesti,

Lisätiedot

031021P Tilastomatematiikka (5 op)

031021P Tilastomatematiikka (5 op) 031021P Tilastomatematiikka (5 op) Jukka Kemppainen Mathematics Division Yleinen todennäköisyys Kertausmateriaalissa esiteltiin koulusta tuttuja todennäköisyysmalleja. Tällä kurssilla todennäköisyys on

Lisätiedot

Tutkimustiedonhallinnan peruskurssi

Tutkimustiedonhallinnan peruskurssi Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,

Lisätiedot

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A)

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A) Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 017 Insinöörivalinnan matematiikan koe 30..017, Ratkaisut (Sarja A) 1. a) Lukujen 9, 0, 3 ja x keskiarvo on. Määritä x. (1 p.) b) Mitkä reaaliluvut

Lisätiedot

Johdatus tn-laskentaan torstai 16.2.2012

Johdatus tn-laskentaan torstai 16.2.2012 Johdatus tn-laskentaan torstai 16.2.2012 Muunnoksen jakauma (ei pelkkä odotusarvo ja hajonta) Satunnaismuuttujien summa; Tas ja N Vakiokerroin (ax) ja vakiolisäys (X+b) Yleinen muunnos: neulanheittoesimerkki

Lisätiedot

Tilastomatematiikka TUDI

Tilastomatematiikka TUDI Miika Tolonen http://www.mafy.lut.fi/tilmattudi Laboratory of Applied Mathematics Lappeenranta University of Technology 10. syyskuuta 2014 Sisältö I Johdanto 1 Johdanto 2 Satunnaiskokeet ja satunnaismuuttujat

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio

Lisätiedot

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla? 6.10.2006 1. Keppi, jonka pituus on m, taitetaan kahtia täysin satunnaisesti valitusta kohdasta ja muodostetaan kolmio, jonka kateetteina ovat syntyneet palaset. Kolmion pinta-ala on satunnaismuuttuja.

Lisätiedot

1. Tilastollinen malli??

1. Tilastollinen malli?? 1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen

Lisätiedot

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut

Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut TILASTO-OPPIA Tilastolliset jakaumat, niiden esittäminen ja tunnusluvut Diskreetit jakaumat ja niiden esittäminen frekvenssitauluna ja kaaviona Jakauma on diskreetti jos tilastomuuttuja voi saada vain

Lisätiedot

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017

Luku 10. Bayesläiset estimaattorit Bayesläiset piste-estimaatit. Lasse Leskelä Aalto-yliopisto 18. lokakuuta 2017 Luku 1 Bayesläiset estimaattorit Lasse Leskelä Aalto-yliopisto 18. lokakuuta 217 1.1 Bayesläiset piste-estimaatit Tarkastellaan datalähdettä, joka tuottaa tiheysfunktion f(x θ) mukaan jakautuneita riippumattomia

Lisätiedot

8.1 Ehdolliset jakaumat

8.1 Ehdolliset jakaumat 8 Ehdollinen jakauma Tämän kappaleen tärkeitä käsitteitä: Ehdollinen jakauma; ehdollinen ptnf/tf. Kertolaskusääntö eli ketjusääntö yhteisjakauman esittämiseksi. Ehdollinen odotusarvo ja ehdollinen varianssi.

Lisätiedot

TODENNÄKÖISYYS JA TILASTOT MAA6 KERTAUS

TODENNÄKÖISYYS JA TILASTOT MAA6 KERTAUS TODENNÄKÖISYYS JA TILASTOT MAA6 KERTAUS Klassinen todennäköisyys P suotuisten alkeistapausten lkm kaikkien alkeistapausten lkm P( mahdoton tapahtuma ) = 0 P( varma tapahtuma ) = 1 0 P(A) 1 Todennäköisyys

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi M-0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Viikko 1: Todennäköisyyslaskennan peruskäsitteet; Todennäköisyyden aksioomat; Todennäköisyyslaskennan peruslaskusäännöt; Kokonaistodennäköisyyden

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 4. lokakuuta 2007 Antti Rasila () TodB 4. lokakuuta 2007 1 / 17 1 Moniulotteiset todennäköisyysjakaumat Johdanto Kaksiulotteiset satunnaismuuttujat Kaksiulotteisen

Lisätiedot

D ( ) E( ) E( ) 2.917

D ( ) E( ) E( ) 2.917 Mat-2.091 Sovellettu todennäköisyyslasku 4. harjoitukset/ratkaisut Aiheet: Diskreetit jakaumat Avainsanat: Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen jakauma, Kertymäfunktio,

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 1 1 Matemaattisesta päättelystä Matemaattisen analyysin kurssin (kuten minkä tahansa matematiikan kurssin) seuraamista helpottaa huomattavasti, jos opiskelija ymmärtää

Lisätiedot

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu 1. Tyhjentävä tunnusluku (sucient statistics ) Olkoon (P(X = x θ) : θ Θ) todennäköisyysmalli havainnolle X. Datan funktio T (X ) on Tyhjentävä tunnusluku jos ehdollinen todennäköisyys (ehdollinen tiheysfunktio)

Lisätiedot

Stokastiikan perusteet

Stokastiikan perusteet Stokastiikan perusteet Lasse Leskelä 10. joulukuuta 2013 Tiivistelmä Tämä luentomoniste sisältää muistiinpanoja asioista, joita käsiteltiin Jyväskylän yliopiston kurssilla MATA280 Stokastiikan perusteet

Lisätiedot

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen MAT-25 Todennäköisyyslaskenta Tentti 12.4.216 / Kimmo Vattulainen Funktiolaskin sallittu. Palauta kaavakokoelma 1. a) Pelaajat A ja B heittävät noppaa vuorotellen ja pelin voittaa se, joka saa ensimmäiseksi

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 5.4.2014 klo. 9.00-12.00 saleissa L1,L3 Koealue: luentojen luvut 7-11

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä Todennäköisyys 1 Klassinen todennäköisyys: p = Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä Esimerkkejä: Nopan heitto, kolikon heitto Satunnaismuuttuja Tilastollisesti vaihtelevaa

Lisätiedot