TKK (c) Ilkka Melli (2004) 1 Todeäköisyyslaskea peruskäsitteet Johdatus todeäköisyyslasketaa Todeäköisyyslaskea peruskäsitteet TKK (c) Ilkka Melli (2004) 2 Todeäköisyyslaskea peruskäsitteet: Mitä opimme? 1/2 Opimme millaie reaalimaailma ilmiö o satuaisilmiö ja mitä tarkoitetaa, ku puhutaa tapahtumie todeäköisyyksistä. Opimme, että ilmiö satuaisuus ei merkitse ilmiö tulokse mielivaltaista vaihtelua. Esitämme kolme aiivia määritelmää todeäköisyydelle: (i) Empiirise todeäköisyyde määritelmä mukaa tapahtuma todeäköisyys o tapahtuma (tilastollisesti stabiili) suhteellie frekvessi ilmiö toistokertoje joukossa. (ii) Klassise todeäköisyyde määritelmä mukaa tapahtuma todeäköisyys o tapahtumalle suotuisie tulosvaihtoehtoje suhteellie frekvessi. (iii) Tapahtuma todeäköisyys o tapahtuma sattumise mahdollisuude mitta. Todeäköisyyslaskea peruskäsitteet: Mitä opimme? 2/2 Opimme myös, että satuaisilmiö tilastollise malli eli todeäköisyysmalli o sisällettävä kuvaus ilmiö tulosvaihtoehdoista ja iide todeäköisyyksistä. Jotta satuaisilmiöistä ja iide tulosvaihtoehdoista voitaisii puhua täsmällisesti, määrittelemme todeäköisyyslaskea peruskäsitteet otosavaruus, tapahtuma ja alkeistapahtuma. Näemme myös, että todeäköisyyslaskea peruskäsitteille voidaa ataa joukko-opilliset tulkiat sekä esittelemme todeäköisyyde perusomiaisuudet. TKK (c) Ilkka Melli (2004) 3 TKK (c) Ilkka Melli (2004) 4 Todeäköisyyslaskea peruskäsitteet: Lisätiedot Todeäköisyyslaskea perusoperaatiot ja peruslaskusääöt esitellää luvussa Todeäköisyyslaskea peruslaskusääöt Todeäköisyyslaskea peruskäsitteet >> TKK (c) Ilkka Melli (2004) 5 TKK (c) Ilkka Melli (2004) 6
TKK (c) Ilkka Melli (2004) 7 Determiistiset ilmiöt Avaisaat Determiistie ilmiö Frekvessi Koetoisto Peli Peli luotoa vastaa Reilu peli Satuaisilmiö Satuaiskoe Stokastie ilmiö Suhteellie frekvessi Tilastollie stabiliteetti Todeäköisyyde frekvessitulkita Tulosvaihtoehto Reaalimaailma ilmiö o determiistie, jos ilmiö alkutila perusteella voidaa eustaa tarkasti ilmiö lopputila eli tulos. Determiistise ilmiö alkutila määrää tarkasti ilmiö lopputila eli tulokse. Determiistisiä ilmiöitä kutsutaa usei eksakteiksi tai kausaalisiksi. TKK (c) Ilkka Melli (2004) 8 Determiistiset ilmiöt: Esimerkkejä Moia fysiika, kute klassise mekaiika, tutkimia ilmiöitä pidetää tavallisesti determiistisiä. Esimerkiksi kappalee letorata voidaa eustaa hyvi tarkasti, jos tuetaa kappalee paio, lähtöopeus, lähtökulma, lähtösuuta, ilmavastus je. Huomautuksia: Determiistisistä ilmiöistä tehtävii havaitoihi liittyy hyvi usei luoteeltaa satuaisia havaitovirheitä. Determiistisii ilmiöihi saattaa liittyä eustamattomuutta, jota kutsutaa kaaokseksi. Satuaisilmiöt Reaalimaailma ilmiö o stokastie ilmiö eli satuaisilmiö, jos sillä o seuraavat omiaisuudet: (i) Ilmiö voi päätyä alkutilastaa useisii erilaisii lopputiloihi eli ilmiöllä o useita erilaisia vaihtoehtoisia tuloksia. (ii) Ilmiö alkutila perusteella ei voida tarkasti eustaa ilmiö lopputilaa eli sitä, mikä mahdollisista tulosvaihtoehdoista realisoituu eli toteutuu. (iii) Vaikka ilmiö lopputilaa ei voida eustaa tarkasti, tulosvaihtoehtoje suhteelliste frekvessie eli osuuksie ähdää ilmiö toistuessa käyttäytyvä sääömukaisesti. TKK (c) Ilkka Melli (2004) 9 TKK (c) Ilkka Melli (2004) 10 Satuaisilmiöt: Esimerkkejä 1/2 Satuaisilmiöt: Esimerkkejä 2/2 Biologiset ilmiöt sukupuole määräytymie periöllisyys Havaitovirheide sytymie empiirisissä tutkimuksessa Ihmise omiaisuuksie periytymie fyysiset omiaisuudet hekiset omiaisuudet suorituskyky Kvattimekaiika ilmiöt radioaktiivie hajoamie hiukkasfysiika ilmiöt Tilastollise tutkimusaieisto keruu otokse poimita satuaistus empiirisissä kokeissa Uhkapelit rahaheitto korttipelit lotto ruletti arpajaiset Yhteiskualliset ilmiöt sosiologiset ilmiöt taloustieteelliset ilmiöt Satuaisilmiöide tulosta ei voida eustaa tarkasti, mutta ilmiö toistuessa mahdolliste tulosvaihtoehtoje suhteelliste frekvessie eli osuuksie havaitaa käyttäytyvä sääömukaisesti. Esimerkkejä sääömukaisuuksista satuaisilmiöissä: Satuaisesti valitu ihmise älykkyysosamäärää ei tiedetä, mutta älykkyysosamäärät jakautuvat suurissa ihmisjoukoissa ormaalijakauma mukaa. Havaitovirhee suuruutta ei voida eustaa yksittäiselle havaiolle, mutta havaitovirheet jakautuvat suurissa havaitomäärissä usei ormaalijakauma mukaa. Radioaktiivise aiee yksittäise atomi hajoamishetkeä ei voida eustaa, mutta puoliitumisaika o jokaiselle radioaktiiviselle aieelle omiaie vakio. TKK (c) Ilkka Melli (2004) 11 TKK (c) Ilkka Melli (2004) 12
TKK (c) Ilkka Melli (2004) 13 Satuaisuus ei ole mielivaltaisuutta Tilastollie stabiliteetti Ilmiö satuaisuudella tarkoitetaa sitä, että ilmiö tulos vaihtelee ilmiö toistuessa tavalla, jota ei voida eustaa tarkasti. Satuaisilmiö tulos ei kuitekaa saa ilmiö toistuessa vaihdella mielivaltaisella tavalla. Satuaisilmiö sääömukaiste piirteide o tultava esille ilmiö toistuessa. Satuaisilmiö toistuessa ilmeevää sääömukaisuutta kutsutaa tilastotieteessä tilastolliseksi stabiliteetiksi. Jos satuaisilmiö ei ole tilastollisesti stabiili, sitä ei voida mallitaa tilastollisilla malleilla. Huomautus: Tilastollise stabiliteeti idea saa matemaattisesti täsmällise muotoilu s. suurte lukuje laissa; ks. lukua Kovergessikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Melli (2004) 14 Tilastollie stabiliteetti: Esimerkki 1/2 Heitetää virheetötä eli harhatota rahaa toistuvasti ja pidetää kirjaa kruuie suhteellisesta osuudesta eli frekvessistä. Yksittäise heito tulosta ei voida eustaa. Kruuie suhteellie frekvessi vaihtelee heittoja toistettaessa, mutta lähestyy virheettömä raha tapauksessa lukua 1/2 site, että suuret poikkeamat luvusta 1/2 tulevat yhä epätodeäköisemmiksi eli harviaisemmiksi. Huomautuksia: Luku 1/2 ei ole kruuie suhteellise frekvessi raja-arvo tavaomaisessa mielessä. Tapa, jolla kruuie suhteellie frekvessi lähestyy lukua 1/2, o esimerkki s. stokastisesta kovergessista. Tilastollie stabiliteetti: Esimerkki 2/2 f / 1 0.5 0 Esimerkki kruua suhteellise frekvessi f / kehittymisestä pitkässä rahaheittosarjassa 1 10 100 1000 10000 Heito umero (log) TKK (c) Ilkka Melli (2004) 15 TKK (c) Ilkka Melli (2004) 16 Satuaisilmiöt, tilastolliset mallit ja todeäköisyyslasketa 1/2 Tilastotietee tehtävää o raketaa (tilastollisia) malleja, joide avulla voidaa kuvata ja selittää mekaismit, jotka tuottavat tiedot tutkimukse kohteea olevasta reaalimaailma ilmiöstä. Koska tilastollisissa tutkimusasetelmissa ilmiötä koskevii tietoihi sisältyy satuaisuutta ja epävarmuutta, tilastollisia malleja rakeettaessa sovelletaa todeäköisyyslasketaa. Satuaisilmiöt, tilastolliset mallit ja todeäköisyyslasketa 2/2 Satuaisilmiölle voidaa raketaa tilastollisia malleja vai, jos ilmiöide tulokset eivät vaihtele mielivaltaisella tavalla. Ei-mielivaltaisuudella tarkoitetaa sitä, että ilmiö toistuessa tulosvaihtoehtoje suhteelliset frekvessit eli osuudet käyttäytyvät tilastollisesti stabiilisti. TKK (c) Ilkka Melli (2004) 17 TKK (c) Ilkka Melli (2004) 18
TKK (c) Ilkka Melli (2004) 19 Satuaiskokeet ja koetoistot: Määritelmät Kutsumme satuaisilmiötä tavallisesti satuaiskokeeksi. Esimerkkejä: Lapse sukupuole määräytymismekaismi muasolu hedelmöittyessä o satuaiskoe. Nopaheitto o satuaiskoe. Kutsumme satuaisilmiö esiitymiskertaa tavallisesti koetoistoksi. Esimerkkejä: Yksittäise lapse sukupuole määräytymie o koetoisto. Yksittäie opaheitto o koetoisto. Satuaiskokeet ja koetoistot, tilastollie stabiliteetti ja reilu peli vaatimus Satuaiskokee toistamie samoissa olosuhteissa ts. kokee olosuhteide vakioiti takaa tavallisesti se, että satuaiskokee tulokset käyttäytyvät tilastollisesti stabiilisti. Stabiliteettivaatimus voidaa tulkita vaatimukseksi reilusta pelistä. TKK (c) Ilkka Melli (2004) 20 Reilu vs epäreilu peli: Esimerkki 1/3 Pelaat Mr. Ebeezer Scroogea vastaa peliä, jolla o seuraavat sääöt: (i) Mr. Scroogella o hallussaa useita erilaisia oppia, joide silmälukuja et tiedä. (ii) Mr. Scrooge valitsee opistaa yhde. (iii) Et saa ottaa Mr. Scrooge valitsemaa oppaa käteesi, mutta Mr. Scrooge o heitettävä valitsemaasa oppaa ii mota kertaa kui haluat. (iv) Jokaise heito jälkee Mr. Scrooge o äytettävä siulle heito tulos eli silmäluku, joka o opa ylösjääeellä tahkolla. (v) Voitat ealta sovitu rahasumma, jos saat selville Mr. Scrooge heittämä opa silmäluvut. Reilu vs epäreilu peli: Esimerkki 2/3 Saat Mr. Scrooge heittämä opa silmäluvut selville, jos toistatat opaheittoa riittävä mota kertaa ja tarkkailet heittoje tuloksea esiityvie silmälukuje suhteellisia frekvessejä. Oletetaa esimerkiksi, että Mr. Scrooge valitsema opa silmäluvut ovat 1, 1, 1, 2, 2, 3 Tällöi o ilmeistä, että silmälukuje 1, 2, 3 suhteelliste frekvessie o jakauduttava pitkässä heittosarjassa suuillee suhteessa 3 : 2 : 1 TKK (c) Ilkka Melli (2004) 21 TKK (c) Ilkka Melli (2004) 22 Reilu vs epäreilu peli: Esimerkki 3/3 Oletetaa, että Mr. Scrooge vaihtaa salaa oppaasa peli aikaa. Tällöi et voi voittaa peliä, koska Mr. Scrooge rikkoo tietämättäsi peli säätöä (ii) vastaa. Vaatimus reilusta pelistä tarkoittaa sitä, että tällaista säätöje rikkomista ei saa tapahtua. Tilastollie tutkimus o peliä luotoa vastaa 1/3 Tilastollista tutkimusta voidaa kuvata peliksi luotoa vastaa. Tilastollisessa tutkimuksessa pyritää tekemää luoo tilaa koskevia johtopäätöksiä luoo tilasta kerättyje havaitoje perusteella. Luoo tila o sitä, että luoolla o kädessää joukko pelikortteja. Tutkija tavoitteea o ottaa selville luoo kädessä olevat kortit. Luoo tavoitteea o salata kädessää olevat kortit tutkijalta. TKK (c) Ilkka Melli (2004) 23 TKK (c) Ilkka Melli (2004) 24
TKK (c) Ilkka Melli (2004) 25 Tilastollie tutkimus o peliä luotoa vastaa 2/3 Tilastollie tutkimus o peliä luotoa vastaa 3/3 Peli koostuu eristä, joissa jokaisessa tutkija voi katsoa yhde satuaisesti valitsemasa korti luoo kädestä tämä o havaitoje keräämistä. Tutkija voi saada selville luoo tila eli luoo kädessä olevat kortit pelaamalla riittävä mota erää eli keräämällä riittävästi havaitoja. Tilastollisessa tutkimuksessa pyritää satuaisilmiötä koskevie havaitoje perusteella päättelemää, millaie o havaiot tuottaut mekaismi. Päättely ei oistu, jos havaiot tuottaut mekaismi ei ole jossaki mielessä pysyvä eli tilastollisesti stabiili. Oletus havaiot tuottaee mekaismi pysyvyydestä voidaa tulkita oletukseksi siitä, että luoto pelaa reilusti eikä riko peli säätöjä vastaa vaihtamalla peli aikaa salaa kädessää olevia kortteja. TKK (c) Ilkka Melli (2004) 26 Tilastollie tutkimus o peliä luotoa vastaa: Kommetteja Tilastotiede tutee myös sellaisia meetelmiä, joilla voidaa paljastaa muutokset havaiot tuottaeessa mekaismissa. Tilastollise tutkimukse kohteea ovat usei seuraavat kysymykset: (i) Oko havaiot tuottaeessa mekaismissa tapahtuut muutoksia? (ii) Mitkä ovat tapahtueide muutoste syyt? Jotta tilastotiede pystyisi mallitamaa muutokset ja iide syyt, muutokset eivät saa kuitekaa tapahtua mielivaltaisella tavalla, vaa iissä o oltava joki systemaattie piirre. TKK (c) Ilkka Melli (2004) 27 Todeäköisyyslaskea peruskäsitteet >> TKK (c) Ilkka Melli (2004) 28 Todeäköisyyde aiivit määritelmät Avaisaat Empiirie todeäköisyys Frekvessi Klassie todeäköisyys Suhteellie frekvessi Suotuisa tulosvaihtoehto Tapahtuma Tilastollie stabiliteetti Todeäköisyyde frekvessitulkita ja empiirie todeäköisyys ja klassie todeäköisyys Todeäköisyyde määrittelemie Todeäköisyyde aiivit määritelmät Todeäköisyys Todeäköisyys mittaa Tulosvaihtoehto Satuaisilmiöide tapahtumie todeäköisyydelle voidaa esittää seuraavat aiivit määritelmät: (i) Tapahtuma (empiirie) todeäköisyys o tapahtuma suhteellie frekvessi ilmiö toistokertoje joukossa. (ii) Tapahtuma (klassie) todeäköisyys o tapahtumalle suotuisie tulosvaihtoehtoje suhteellie frekvessi. (ii) Tapahtuma todeäköisyys o tapahtuma sattumise mahdollisuude mitta. TKK (c) Ilkka Melli (2004) 29 TKK (c) Ilkka Melli (2004) 30
TKK (c) Ilkka Melli (2004) 31 Todeäköisyyde aiivit määritelmät: Kommetteja Määritelmiä kutsutaa aiiveiksi, koska e eivät määrittele todeäköisyyttä matemaattisesti täsmällisellä tavalla. Todeäköisyyde täsmällie määrittelemie tapahtuu s. Kolmogorovi aksioomie avulla. Ks. lukua Todeäköisyyde aksioomat. Kolmogorovi aksioomie oleaisea sisältöä o se, että todeäköisyys o mitta matemaattise mittateoria tarkoittamassa mielessä. Todeäköisyyde aiivit määritelmät voidaa sisällyttää Kolmogorovi aksioomie muodostamaa kehikkoo todeäköisyyde tulkitoia. Empiirise todeäköisyyde määritelmä 1/2 Tarkastellaa satuaiskoetta, jota voidaa toistaa site, että seuraavat ehdot pätevät: (i) Kokee olosuhteet säilyvät muuttumattomia koetoistosta toisee. (ii) Koetoistot ovat riippumattomia siiä mielessä, että yhdekää koetoisto tulos ei riipu siitä mitä tuloksia muista koetoistoista o saatu. TKK (c) Ilkka Melli (2004) 32 Empiirise todeäköisyyde määritelmä 2/2 Tarkkaillaa joki tulosvaihtoehdo esiitymistä koetoistoje aikaa. Jos tulosvaihtoehdo suhteellie frekvessi eli osuus lähestyy jotaki kiiteätä lukua koetoistoje lukumäärä rajatta kasvaessa, lukua kutsutaa tulosvaihtoehdo empiiriseksi todeäköisyydeksi. Empiirie todeäköisyys ja suhteellie frekvessi 1/2 Toistetaa satuaiskoetta kertaa. Tarkkaillaa joki tulosvaihtoehdo esiitymistä koetoistoje aikaa. Olkoo f ko. tulosvaihtoehdo frekvessi eli lukumäärä koetoistoje joukossa. Tällöi f o ko. tulosvaihtoehdo suhteellie frekvessi eli suhteellie osuus koetoistoje joukossa. TKK (c) Ilkka Melli (2004) 33 TKK (c) Ilkka Melli (2004) 34 Empiirie todeäköisyys ja suhteellie frekvessi 2/2 Aetaa koetoistoje lukumäärä kasvaa rajatta. Oletetaa, että (jossaki mielessä) f p, ku + Tällöi luku p o ko. tulosvaihtoehdo empiirie todeäköisyys. Huomautus: Suhteellise frekvessi f/ rajakäyttäytymie koetoistoje lukumäärä kasvaessa ei ole tavaomaista lukujookovergessia. Todeäköisyyslaskea kovergessikäsitteitä käsitellää luvussa Kovergessikäsitteet ja raja-arvolauseet. Kommetteja Tulosvaihtoehdo empiirie todeäköisyys o tulosvaihtoehdo suhteellie frekvessi pitkässä juoksussa. Empiirise todeäköisyyde määritelmä edellyttää tulosvaihtoehtoje suhteellisilta frekvesseiltä tilastollista stabiliteettia: Tulosvaihtoehdo empiirisestä todeäköisyydestä ei ole mielekästä puhua, ellei tulosvaihtoehdo suhteellie frekvessi käyttäydy satuaiskoetta toistettaessa tilastollisesti stabiilisti. Matemaattista todeäköisyyttä voidaa pitää empiirise todeäköisyyde käsittee idealisoitia. TKK (c) Ilkka Melli (2004) 35 TKK (c) Ilkka Melli (2004) 36
TKK (c) Ilkka Melli (2004) 37 Ogelmat määritelmässä 1/2 Empiirie todeäköisyys o empiirie käsite siiä mielessä, että tulosvaihtoehdo suhteellise frekvessi f/ määräämie vaatii satuaiskokee toistamista ja havaitoje keräämistä satuaiskokee tuloksista. Tulosvaihtoehdo empiiristä todeäköisyyttä ei kuitekaa voida imestää huolimatta määrätä kokeellisesti, koska suhteellise frekvessi tilastollise stabiliteeti empiirie todetamie vaatisi satuaiskokee toistamista äärettömä mota kertaa. Empiirise todeäköisyyde käsite ei aa mahdollisuutta puhua sellaiste tapahtumie todeäköisyyksistä, joista ei ole havaitoja. Ogelmat määritelmässä 2/2 Empiirise todeäköisyyde määritelmässä esiityvä suhteellise frekvessi raja-arvo ei ole hyvi määritelty: Mikää ei takaa, että määritelmässä esiityvä raja-arvo o olemassa. Empiiristä todeäköisyyttä voidaa pikemmiki pitää tilastollisesti stabiilisti käyttäytyvä suhteellise frekvessi omiaisuutea kui todeäköisyyde määritelmää. TKK (c) Ilkka Melli (2004) 38 Empiirie todeäköisyys ja todeäköisyyde frekvessitulkita Oletetaa, että toistamme jotaki satuaiskoetta ja tarkkailemme joki tulosvaihtoehdo suhteellista frekvessiä koetoistoje aikaa. Todeäköisyyde frekvessitulkia mukaa ko. tulosvaihtoehdo suhteellie frekvessi vaihtelee satuaisesti koetoistosta toisee, mutta saa keskimääri tulosvaihtoehdo todeäköisyyttä lähellä olevia arvoja. Vahvistavatko havaiot tämä o empiirie kysymys. Esimerkki laaduvalvoasta 1/3 Tehdas valmistaa erästä sähkölaitetta 300 kpl päivässä. Osa laitteista ei täytä akaria laatukriteereitä. Merkitää: K = Laite o kelvollie V = Laite o viallie Oletetaa, että vialliset laitteet sytyvät tuotaossa täysi satuaisesti. Eräää päivää valmistettuje laitteide joukossa o 6 viallista laitetta. TKK (c) Ilkka Melli (2004) 39 TKK (c) Ilkka Melli (2004) 40 Esimerkki laaduvalvoasta 2/3 Satuaisilmiö: Laittee laatu Koetoisto: Valmistetaa 1 laite Koetoistoje lkm : 300 Tulosvaihtoehto V: Laite o viallie Vialliste laitteide frekvessi: f = 6 Vialliste laitteide suhteellie frekvessi: f 6 1 0.02 = 300 = 50 = Esimerkki laaduvalvoasta 3/3 Oletetaa, että vialliste laitteide suhteellie osuus pysyy päivästä toisee suuillee samaa eli, että vialliste laitteide suhteellie osuus käyttäytyy tilastollisesti stabiilisti. Tällöi suhteellista frekvessiä f 6 1 p = = = = 0.02 300 50 o järkevää kutsua todeäköisyydeksi saada viallie laite, jos tehtaalla valmistettuje laitteide joukosta poimitaa satuaisesti 1 laite tarkastettavaksi. TKK (c) Ilkka Melli (2004) 41 TKK (c) Ilkka Melli (2004) 42
TKK (c) Ilkka Melli (2004) 43 Esimerkki otaasta 1/4 Väestötilasto mukaa Suome väestö jakautui vuode 1998 lopussa miehii ja aisii seuraavasti: Miehet 2 516 000 Naiset 2 643 600 Yhteesä 5 159 600 Tyypillisessä otatatutkimuksessa tutkimukse kohteet valitaa poimimalla satuaisotos kaikkie suomalaiste joukosta. Satuaisotokse poimitaa voidaa kuvata arvotaa, jossa jokaista suomalaista vastaa yksi arpalippu. Todeäköisyys poimia tietty hekilö o 1 5159600 Esimerkki otaasta 2/4 Suomalaiste lukumäärä: 5 159 600 Mieste lukumäärä eli frekvessi: 2 516 000 Mieste suhteellie osuus eli suhteellie frekvessi kaikkie suomalaiste joukosta: 2516000 5159600 = 0.488 Naiste lukumäärä eli frekvessi: 2 643 600 Naiste suhteellie osuus eli suhteellie frekvessi kaikkie suomalaiste joukosta: 2643600 5159600 = 0.512 TKK (c) Ilkka Melli (2004) 44 Esimerkki otaasta 3/4 Koska suomalaisia o äiki paljo, mieste ja aiste suhteelliset frekvessit voidaa tulkita empiirise todeäköisyyde määritelmä mukaa todeäköisyyksiksi. Site todeäköisyys, että satuaisesti suomalaiste joukosta poimittu hekilö o mies, o 2516000 5159600 = 0.488 Site todeäköisyys, että satuaisesti suomalaiste joukosta poimittu hekilö o aie, o 2643600 5159600 = 0.512 Todeäköisyys poimia suomalaiste joukosta aie o suurempi kui todeäköisyys poimia mies, koska aisia o eemmä. Esimerkki otaasta 4/4 Oletetaa, että suomalaiste joukosta poimitaa arpomalla yhä uusia 1 000 hekilö satuaisotoksia. Tällöi otoksee poimittuje mieste ja aiste suhteelliset osuudet vaihtelevat otoksesta toisee, mutta otoksee poimituista hekilöistä keskimääri 2516000 100 = 48.8 % 5159600 o miehiä ja keskimääri 2643600 100 = 51.2 % 5159600 o aisia. Tilastollie stabiliteetti o sitä, että ämä suhdeluvut pysyvät otoksesta toisee suuillee samoia. TKK (c) Ilkka Melli (2004) 45 TKK (c) Ilkka Melli (2004) 46 Klassise todeäköisyyde määritelmä Tarkastellaa satuaisilmiötä, joho liittyy yhtä todeäköistä tulosvaihtoehtoa. Tarkastellaa satuaisilmiö puitteissa tapahtumaa, joho liittyy k yhtä todeäköistä tulosvaihtoehtoa, joita saotaa ko. tapahtumalle suotuisiksi. Ko. tapahtuma klassie todeäköisyys p o tapahtumalle suotuisie tulosvaihtoehtoje suhteellie frekvessi eli tapahtumalle suotuisie tulosvaihtoehtoje osuus satuaisilmiö kaikista tulosvaihtoehdoista: k p = Klassie todeäköisyys: Kommetteja Klassise todeäköisyyde käsite sopii erityisesti uhkapelie aalysoitii. Uhkapeleissä pelitapahtumie todeäköisyydet voidaa tavallisesti määrätä päättelemällä e peli sääöistä. Historiallisesti todeäköisyyslasketa sai alkusa 1600- luvulla juuri uhkapeleihi liittyvie ogelmie ratkaisuyrityksistä. Tulosvaihtoehtoje lukumäärie laskemie o usei epätriviaali tehtävä ja apua tarvitaa kombiatoriikaksi kutsuttua matematiika osa-aluetta. Ks. lukua Klassie todeäköisyys ja kombiatoriikka. TKK (c) Ilkka Melli (2004) 47 TKK (c) Ilkka Melli (2004) 48
TKK (c) Ilkka Melli (2004) 49 Klassie todeäköisyys: Ogelmat määritelmässä Klassise todeäköisyyde määritelmä ei aa mahdollisuutta puhua sellaiste tapahtumie todeäköisyyksistä, joihi liittyvät tulosvaihtoehdot eivät ole yhtä todeäköisiä. Klassise todeäköisyyde määritelmä ei aa mahdollisuutta puhua sellaiste tapahtumie todeäköisyyksistä, joihi liittyy äärettömä mota tulosvaihtoehtoa. Klassie todeäköisyys ja todeäköisyyde frekvessitulkita Oletetaa, että toistamme jotaki satuaiskoetta ja tarkkailemme joki tulosvaihtoehdo suhteellista frekvessiä koetoistoje aikaa. Todeäköisyyde frekvessitulkia mukaa ko. tulosvaihtoehdo suhteellie frekvessi vaihtelee satuaisesti koetoistosta toisee, mutta saa keskimääri tulosvaihtoehdo todeäköisyyttä lähellä olevia arvoja. Vahvistavatko havaiot tämä o empiirie kysymys. TKK (c) Ilkka Melli (2004) 50 Klassie todeäköisyys: Esimerkki opaheitosta 1/2 Heitetää oppaa. Tällöi tulosvaihtoehtoja o 6 kpl: Silmäluvut 1, 2, 3, 4, 5, 6 Tarkastellaa tapahtumia A = Silmäluku o parillie B = Silmäluku < 3 Tapahtumalle A suotuisia tulosvaihtoehtoja o 3 kpl: Silmäluvut 2, 4, 6 Tapahtumalle B suotuisia tulosvaihtoehtoja o 2 kpl: Silmäluvut 1, 2 Klassie todeäköisyys: Esimerkki opaheitosta 2/2 Tapahtuma A = Silmäluku o parillie todeäköisyys o 3 1 p = = = 0.5 6 2 Tapahtuma B = Silmäluku < 3 todeäköisyys o 2 1 p = = 0.333 6 3 Site tapahtuma A o todeäköisempi kui tapahtuma B. Oletetaa, että heität oppaa useita kertoja. Todeäköisyyde frekvessitulkia mukaa o odotettavissa, että keskimääri 1/3 heitoista ataa tulokseksi tapahtuma B ja tapahtuma A esiityy heittoje tuloksea useammi kui tapahtuma B. TKK (c) Ilkka Melli (2004) 51 TKK (c) Ilkka Melli (2004) 52 Todeäköisyys mittaa: Määritelmä Hyödyllise mielikuva todeäköisyyde luoteesta ataa seuraava aiivi määritelmä: Todeäköisyys o mitta, jolla mitataa satuaisilmiö tapahtumavaihtoehtoje sattumise mahdollisuutta. Todeäköisyys mittaa: Kommetteja 1/2 Määritelmä ei täytä hyvä määritelmä tuusmerkkejä, koska se o kehämääritelmä: Sattumise mahdollisuus ja todeäköisyys tarkoittavat suuillee samaa. Kuiteki o totta, että Kolmogorovi aksioomie mukaa todeäköisyys o mitta matemaattise mittateoria tarkoittamassa mielessä. Kolmogorovi aksioomie mukaa todeäköisyysmitta käyttäytyy samalla tavalla kui pita-alamitta paitsi, että todeäköisyysmitalla o ylärajaa s. varma tapahtuma todeäköisyys. TKK (c) Ilkka Melli (2004) 53 TKK (c) Ilkka Melli (2004) 54
TKK (c) Ilkka Melli (2004) 55 Todeäköisyys mittaa: Kommetteja 2/2 Todeäköisyyde laskusäätöjä voidaa havaiollistaa joukko-opissa käytettävie Ve-diagrammie avulla. Ve-diagrammie idea: (i) Tapahtumia kuvataa tasoalueilla. (ii) Tapahtumie todeäköisyyksiä kuvataa tasoalueide pita-aloilla. Ve-diagrammie käyttö todeäköisyyslaskea laskusäätöje havaiollistamisessa perustuu siihe, että todeäköisyydellä o mittaa (lähes kaikki) samat omiaisuudet kui pita-alalla. Todeäköisyyslaskea peruskäsitteet >> TKK (c) Ilkka Melli (2004) 56 Satuaisilmiöt ja iide tilastolliset mallit Avaisaat Alkeistapahtuma Alkio Joukko Joukko-opi relaatiot kuulua joukkoo osajoukko Joukko-oppi Mahdoto tapahtuma Osajoukko Otosavaruus Perusjoukko Stokastie malli Symmetriset alkeistapahtumat Tapahtuma Tilastollie malli Todeäköisyyde frekvessitulkita Todeäköisyyde perusomiaisuudet Todeäköisyyksie vertailu Todeäköisyys Todeäköisyysmalli Tulosvaihtoehto Tyhjä joukko Varma tapahtuma Ve-diagrammi Äärellise otosavaruude tapahtumat Äärellie otosavaruus Tilastotietee tehtävää o kehittää satuaisilmiöille tilastollisia malleja, joide avulla pyritää tekemää satuaisilmiöitä koskevia johtopäätöksiä. Satuaisilmiöide tilastolliset mallit perustuvat todeäköisyyslasketaa ja siksi iitä kutsutaa usei myös stokastisiksi malleiksi eli todeäköisyysmalleiksi. TKK (c) Ilkka Melli (2004) 57 TKK (c) Ilkka Melli (2004) 58 Todeäköisyysmallit satuaisilmiöide tilastollisia malleia Satuaisilmiö tilastollisessa mallissa eli todeäköisyysmallissa eli stokastisessa mallissa o kaksi osaa: (i) Satuaisilmiö kaikkie mahdolliste tulosvaihtoehtoje kuvaus. (ii) Tulosvaihtoehtoje todeäköisyyksie kuvaus. Satuaisilmiö tilastollie malli esitetää tavallisesti satuaisilmiö tulosvaihtoja umeerisessa muodossa kuvaavaa satuaismuuttuja ja se todeäköisyysjakauma avulla. Ks. lukua Satuaismuuttujat ja todeäköisyysjakaumat. Tilastolliste mallie raketamie ja tilastollise tutkimukse tavoitteet 1/2 Tilastollise tutkimukse päätavoitteea o tilastollise malli raketamie tutkimukse kohteea olevalle satuaisilmiöille. TKK (c) Ilkka Melli (2004) 59 TKK (c) Ilkka Melli (2004) 60
TKK (c) Ilkka Melli (2004) 61 Tilastolliste mallie raketamie ja tilastollise tutkimukse tavoitteet 2/2 Tilastollise malli raketamise työvaiheet: (1) Malli muodostamie ilmiölle. (2) Ilmiötä koskevie havaitoje keräämie. Ks. lukua Tilastolliste aieistoje keräämie ja mittaamie. (3) Malli parametrie estimoiti. Ks. lukua Tilastolliste mallie parametrie estimoiti. (4) Malli ja havaitoje yhteesopivuude testaamie. Jos mallissa havaitaa puutteita vaiheessa (4), o palattava vaiheesee (1). Ks. luetosarjaa Tilastollise aalyysi perusteet. Todeäköisyyslasketa ja joukko-oppi Todeäköisyyslaskea historia tärkeimpiä teoreettisia oivalluksia o ollut se, että satuaisilmiö tapahtumia voidaa käsitellä joukkoia. Siksi seuraavassa palautetaa mielee joukko-opi perusmääritelmät. Huomautus: Täydellisempi esitys joukko-opi peruskäsitteistä ja -määritelmistä o koottu liitteeksi Joukko-oppi. TKK (c) Ilkka Melli (2004) 62 Joukko-opi perusmääritelmät: Joukko ja se alkiot Joukko o kokoelma olioita, joita kutsutaa jouko alkioiksi. Joukko o hyvi määritelty, jos se alkiot tuetaa. Merkitää jouko ja se alkioide välistä relaatiota seuraavasti: (i) s o jouko A alkio eli s kuuluu joukkoo A: s A (ii) s ei ole jouko A alkio eli s ei kuulu joukkoo A: s A Joukko-opi perusmääritelmät: Osajoukko Olkoot A ja B kaksi joukkoa. Jos jokaiselle jouko B alkiolle s pätee, että s B s A ii saomme, että joukko B o jouko A osajoukko tai, että joukko B sisältyy joukkoo A. Merkitä: Joukko B o jouko A osajoukko: B A tai A B TKK (c) Ilkka Melli (2004) 63 TKK (c) Ilkka Melli (2004) 64 Joukko-opi perusmääritelmät: Tyhjä joukko Joukko o tyhjä, jos siihe ei kuulu yhtää alkiota. Tyhjää joukkoa merkitää symbolilla Jos joukko o tyhjä, ei ole olemassa oliota s, jolle s Tyhjä joukko o jokaise jouko osajoukko eli mielivaltaiselle joukolle A pätee: A Otosavaruus ja alkeistapahtumat Satuaisilmiö kaikkie mahdolliste tulosvaihtoehtoje joukkoa kutsutaa otosavaruudeksi. Otosavaruude alkioita kutsutaa alkeistapahtumiksi. Merkiät: (i) Otosavaruutta (egl. sample space) merkitää isolla kirjaimella S. (ii) Otosavaruude S alkiota merkitää vastaavalla pieellä kirjaimella s. Jos siis alkeistapahtuma s kuuluu otosavaruutee S, merkitää: s S TKK (c) Ilkka Melli (2004) 65 TKK (c) Ilkka Melli (2004) 66
TKK (c) Ilkka Melli (2004) 67 Otosavaruus ja alkeistapahtumat: Kommetteja Otosavaruus muodostaa perusjouko, jossa satuaisilmiö tulosvaihtoehtoja tarkastellaa. Satuaisilmiötä ei voida purkaa otosavaruude alkeistapahtumia alkeellisempii tulosvaihtoehtoihi. Tapahtumat 1/2 Olkoo S otosavaruus eli tarkasteltava satuaisilmiö kaikkie mahdolliste tulosvaihtoehtoje joukko. Tarkasteltava satuaisilmiö tapahtumat ovat otosavaruude S alkeistapahtumie muodostamia joukkoja. Site tapahtumat ovat tarkasteltavaa satuaisilmiöö liittyvä otosavaruude S osajoukkoja. TKK (c) Ilkka Melli (2004) 68 Tapahtumat 2/2 Jos siis A o joki otosavaruude S tapahtuma, ii A S eli s A s S jossa s o tapahtumaa A kuuluva alkeistapahtuma. Ku saomme, että tapahtuma A sattuu, tarkoitamme sitä, että joki tapahtumaa A kuuluva alkeistapahtuma s sattuu. Otosavaruus, alkeistapahtumat ja tapahtumat: Esimerkki sukupuole määräytymisestä Satuaisilmiö: Lapse sukupuole määräytymie Otosavaruus: S = {Tyttö, Poika} Alkeistapahtumat: s 1 = Tyttö s 2 = Poika TKK (c) Ilkka Melli (2004) 69 TKK (c) Ilkka Melli (2004) 70 Otosavaruus, alkeistapahtumat ja tapahtumat: Esimerkki 1 opaheitosta Satuaisilmiö: Nopaheito tulos Otosavaruus: Silmälukuje joukko S = {1, 2, 3, 4, 5, 6} Alkeistapahtumat: Silmäluvut 1, 2, 3, 4, 5, 6 Esimerkki tapahtumasta: A = Silmäluku o parillie = {2, 4, 6} Otosavaruus, alkeistapahtumat ja tapahtumat: Esimerkki 2 opaheitosta 1/3 Satuaisilmiö: Tulokset kahdesta opaheitosta Otosavaruus S: Silmälukuparie (i, j) (36 kpl) joukko, jossa i = 1. opaheito silmäluku, i = 1, 2, 3, 4, 5, 6 j = 2. opaheito silmäluku, j = 1, 2, 3, 4, 5, 6 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) S = (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1)(6,2)(6,3)(6,4)(6,5)(6,6) TKK (c) Ilkka Melli (2004) 71 TKK (c) Ilkka Melli (2004) 72
TKK (c) Ilkka Melli (2004) 73 Otosavaruus, alkeistapahtumat ja tapahtumat: Esimerkki 2 opaheitosta 2/3 Otosavaruude alkiot voidaa esittää seuraavaa taulukkoa: (i, j) j = tulos 2. opa heitosta i = tulos 1. opaheitosta 1 2 3 4 5 6 1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) 2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) 3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) 4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) 5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) 6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) Otosavaruus, alkeistapahtumat ja tapahtumat: Esimerkki 2 opaheitosta 3/3 Esimerkki tapahtumasta: A = Kummallaki opalla saadaa sama silmäluku = {(1,1), (2,2), (3,3), (4,4), (5,5), (6,6)} Esimerkiksi: (2,2) A (6,1) A A S TKK (c) Ilkka Melli (2004) 74 Varma tapahtuma ja mahdoto tapahtuma Varma tapahtuma Tapahtuma o varma, jos se esiityy aia, ku satuaisilmiö toistuu. Otosavaruus S o varma tapahtuma. Mahdoto tapahtuma Tapahtuma o mahdoto, jos se ei voi esiityä koskaa, ku satuaisilmiö toistuu. Tyhjä joukko o mahdoto tapahtuma. Varma tapahtuma ja mahdoto tapahtuma: Esimerkit raha- ja opaheitosta Esimerkki 1: Rahaa heitettäessä tuloksea o aia joko kruua tai klaava. Tapahtuma S = {Kruua, Klaava} o varma. Esimerkki 2: Tavallista oppaa heitettäessä silmäluku 7 ei voi olla tuloksea. Tapahtuma {7} o mahdoto. TKK (c) Ilkka Melli (2004) 75 TKK (c) Ilkka Melli (2004) 76 Todeäköisyyksie vertailu Olkoo S otosavaruus, jossa satuaisilmiötä tarkastellaa. Jokaise tapahtuma A S todeäköisyys Pr(A) o reaaliluku välillä [0,1]: 0 Pr( A) 1 Varma tapahtuma S todeäköisyys o 1: Pr( S ) = 1 Mahdottoma tapahtuma todeäköisyys o 0: Pr( ) = 0 Jos Pr( A) > Pr( B) ii saomme: Tapahtuma A o todeäköisempi kui tapahtuma B tai Tapahtuma B o epätodeäköisempi kui tapahtuma A TKK (c) Ilkka Melli (2004) 77 TKK (c) Ilkka Melli (2004) 78
TKK (c) Ilkka Melli (2004) 79 Todeäköisyyksie vertailu ja todeäköisyyde frekvessitulkita Mitä todeäköisempi tapahtuma o, sitä useammi tapahtumalla o taipumus esiityä satuaisilmiö toistuessa eli sitä suurempi o tapahtuma havaittu suhteellie frekvessi. Mitä epätodeäköisempi tapahtuma o, sitä harvemmi tapahtumalla o taipumus esiityä satuaisilmiö toistuessa eli sitä pieempi o tapahtuma havaittu suhteellie frekvessi. Lukumääräfuktio Olkoo (A) fuktio, joka kertoo jouko A alkioide lukumäärä. Kutsumme fuktiota ( ) lukumääräfuktioksi. Jos siis jouko A alkioide lukumäärä o k, ii (A) = k TKK (c) Ilkka Melli (2004) 80 Äärelliset otosavaruudet Olkoo otosavaruus S äärellie joukko ja olkoo S ( ) = otosavaruude S alkeistapahtumie eli alkioide lukumäärä. Merkitää alkeistapahtumia seuraavalla tavalla: si, i= 1,2,, Tällöi otosavaruus S voidaa määritellä luettelemalla se alkiot: S = { s1, s2,, s} Äärelliset otosavaruudet: Alkeistapahtumie todeäköisyydet Äärellise otosavaruude S = {s 1, s 2,, s } alkeistapahtumie s 1, s 2,, s todeäköisyyksie Pr(s i ) = p i, i = 1, 2,, o toteuttava ehto p = 1 i= 1 i TKK (c) Ilkka Melli (2004) 81 TKK (c) Ilkka Melli (2004) 82 Äärelliset otosavaruudet: Tapahtumie todeäköisyydet Olkoo A äärellise otosavaruude S tapahtuma eli A S. Tällöi tapahtuma A todeäköisyys Pr(A) o Pr( A) = pi isi A Summassa lasketaa yhtee kaikki todeäköisyydet p i = Pr(s i ) joille s i A. Symmetriset alkeistapahtumat ja iide todeäköisyydet Oletetaa, että äärellise otosavaruude S = {s 1, s 2,, s } alkeistapahtumie s 1, s 2,, s todeäköisyydet ovat yhtä suuria: 1 Pr( si ) =, i = 1,2,, Tällöi saomme, että alkeistapahtumat s 1, s 2,, s ovat symmetrisiä. TKK (c) Ilkka Melli (2004) 83 TKK (c) Ilkka Melli (2004) 84
TKK (c) Ilkka Melli (2004) 85 Symmetriset alkeistapahtumat ja klassie todeäköisyys 1/2 Olemme määritelleet tapahtuma klassise todeäköisyyde tapahtumalle suotuisie tulosvaihtoehtoje suhteellisea frekvessiä satuaisilmiö kaikista tulosvaihtoehdoista (ks. <). Olkoot otosavaruude S = {s 1, s 2,, s } alkeistapahtumat s 1, s 2,, s symmetrisiä: 1 Pr( si ) =, i = 1,2,, Symmetriset alkeistapahtumat ja klassie todeäköisyys 2/2 Olkoo A otosavaruude S tapahtuma, joho liittyvie alkeistapauste lukumäärä o k: A S (A) = k = (S) Tällöi tapahtuma A klassie todeäköisyys o k Pr( A) = jossa siis k = (A) = (S) TKK (c) Ilkka Melli (2004) 86 Symmetriaoletus ja uhkapelit Useimmissauhkapeleissä peli sääöt edellyttävät, että pelii liittyvät alkeistapahtumat ovat symmetrisiä. Tyypillisiä uhkapelie sääöissä esitettyjä symmetriavaatimuksia ovat seuraavat: (i) Käytettävie pelivälieide (esim. opa, raha tai rulettipyörä) o oltava fysikaalisesti symmetrisiä. (ii) Käytettävillä pelivälieillä (esim. arpalipuilla tai korteilla) o oltava sama todeäköisyys tulla valituiksi tai jaetuiksi. Huomaa, että vaatimus (ii) edellyttää pelivälieide (esim. arpalippuje tai korttie) huolellista sekoittamista. Symmetriaoletus: Kommetteja Otosavaruude alkeistapahtumie symmetrisyyttä voidaa vai harvoi perustella uhkapelie ulkopuolella. Oletus alkeistapahtumie symmetrisyydestä o oletus, jota voidaa testata tilastollisesti, jos ko. satuaisilmiöstä kerätää havaitoja. Klassise todeäköisyyde määritelmä edellyttää sitä, että otosavaruus o äärellie ja se alkeistapahtumat ovat symmetrisiä. TKK (c) Ilkka Melli (2004) 87 TKK (c) Ilkka Melli (2004) 88 Symmetriset alkeistapahtumat: Esimerkki Satuaisilmiö: Tulos opaheitosta Otosavaruus S: Silmälukuje i = 1, 2, 3, 4, 5, 6 joukko: S = {1, 2, 3, 4, 5, 6} Oletus opa virheettömyydestä voidaa pukea seuraavaa muotoo: 1 Pr( i) =, i= 1,2,3,4,5,6 6 Site oletus oppie virheettömyydestä merkitsee oletusta alkeistapahtumie i = 1, 2, 3, 4, 5, 6 symmetrisyydestä. TKK (c) Ilkka Melli (2004) 89