Sattuman matematiiaa III Kolmogorovin asioomat ja frevenssitulinta Tommi Sottinen Tutija Matematiian ja tilastotieteen laitos, Helsingin yliopisto Laboratoire de Probabilités et Modèles Aléatoires, Université de Paris VI Solmun numerossa 2/2002 aloitettiin todennäöisyyslasentaa äsittelevä irjoitussarja. Osassa I äsiteltiin todennäöisyyslasennan historiaa ja muutamia todennäöisyyden tulintoja: lassista, freventististä ja geometrista. Osassa II (Solmu /2003 esitettiin modernin todennäöisyyslasennan perusta: Kolmogorovin [2] asioomat. Tässä irjoitussarjan olmannessa osassa emme mene tarinassa eteenpäin vaan syvemmälle. Osoitamme, että Kolmogovin asioomat ovat siinä mielessä sopiva matemaattinen malli todennäöisyyslasennalle, että frevenssitulinta voidaan johtaa niistä. (On itsestään selvää, että lassinen ja geometrinen tulinta seuraavat Kolmogorovin asioomista. Kolmogorovin asioomat Kertaamme lyhyesti irjoitussarjan osassa II esitetyt asioomat, eli olmion (Ω, F, P. Ω on perusjouo, josta ohtalon jumalatar, Lady Fortuna, valitsee satunnaisoeen tulosen ω. F on ooelma Ω:n osajouoja, joa on suljettu numeroituvan monien jouo-operaatioiden suhteen (siis F on σ-algebra, s. osa II. Kutsumme F:n jäseniä tapahtumisi. Välttämättä aii Ω:n osajouot eivät siis ole tapahtumia. Syy tähän valitettavaan seiaan löytyy mittateorian syvistä vesistä. Emme äsittele tätä aihetta enempää. Luija voi lohduttautua sillä, että äytännössä on vaieaa esiä osajouoa, joa ei ole tapahtuma. P on todennäöisyys, siis uvaus tapahtumajouolta F reaaliluujouolle R, joa toteuttaa ehdot (TN P(A 0 aiilla tapahtumilla A, (TN 2 P(Ω, (TN 3 jos A, A 2,... ovat tapahtumia, joista oreintaan ysi voi sattua errallaan, niin ( P i A i P(A i. i Kohdat (TN ja (TN 2 ovat luonnollisia. Kohta (TN 3, täysadditiivisuus, on vähemmän viaton. Siitä seuraa esimerisi, ettemme voi valita luonnollista luua umpimähään (siis siten, että joaisella luvulla
on yhtä suuri todennäöisyys tulla valitusi. Joainen varmasti hyväsyy, että todennäöisyys on additiivinen: (TN 3 jos tapahtumat A ja A 2 eivät voi molemmat sattua samalla ertaa, niin P ( A A 2 P ( A + P ( A2. Jos lisäsi hyväsymme, että todennäöisyys on jatuva: (TN 3 jos tapahtumien jono A, A 2,... on laseva, toisin sanoen A A 2, niin ( P A n lim P( A n, niin joudumme hyväsymään täysadditiivisuuden. Nimittäin (TN 3 yhdessä (TN 3:n anssa on yhtäpitävä (TN 3 :n anssa. Emme perustele tätä tässä, vaiaaan perustelu ei ole erityisen hanala. Joa tapausessa additiivisuus täydessä muodossaan on välttämätön frevenssitulinnan annalta. Huomautamme lopusi, että täysadditiivisuudesta seuraa, että olivatpa jouot A, A 2,... erillisiä tai eivät, niin joa tapausessa ( ( P i A i P(A i. i Epäyhtälön ( oiealla puolella on liiaa jouojen A, A 2,... mahdolliset päälleäisyydet. Kahden jouon tapausessa tämä päälleäisyys on helppo nähdä: P(A A 2 P(A + P(A 2 P(A A 2 P(A + P(A 2. Toistooe: riippumattomien toistojen satunnaisoe Frevenssitulinnassa on yse toistooeesta, eli yhdestä ja samasta satunnaisoeesta, jota toistetaan loputtomasti. Tällöin Ω:n aliot ovat jonoja ω (ω, ω 2,.... Tässä ω i on se alio, jona Lady Fortuna valitsee toistossa i. Lisäsi toistot ovat riippumatomia: jos A ja B ovat tapahtumia, jota määräytyvät erillisten toistoertojen perusteella, niin P ( A B P ( A P ( B. Toistooeella ei siis ole muistia: aiaisemmat tapahtumat eivät vaiuta tulevien tapahtumien todennäöisyysiin. Tyypillinen esimeri toistooeesta on olion heitto. Jos olio on joa heitolla samanlainen, se ei siis esimerisi ulu heitossa, niin toistot ovat riippumattomia. Oloon nyt A join ysittäiseen satunnaisoeeseen liittyvä tapahtuma. Esimerisi olion heitossa se voisi olla olio laseutuu laavapuoli ylöspäin. Kosa yse on toistooeesta, meritsemme A i {A sattuu toistossa i. Tapahtuma A i riippuu ω:sta vain oordinaatin ω i autta. Siten A i :t ovat riippumattomia. Frevenssitulinta ja binomimuuttuja Oloon n luonnollinen luu. Tapahtuman A frevenssi F n [A] # { i : A i, i n { niiden i n luumäärä, joilla A i { niiden toistojen i n luumäärä, joilla A i sattuu ja sen suhteellinen frevenssi f n [A] F n[a] n. Jos f n [A] suppenee jossain mielessä ohti jotain luua p, niin tällöin tulitsemme, että p P(A. Kosa tapahtuma A on jatossa aina sama, niin irjoitamme lyhyesti F n F n [A] ja f n f n [A]. Käsittelemme nyt hieman suppenemista (2 f n p. Ongelma tämän suppenemisen ymmärtämisessä on se, että f n ei ole miään iinteä luu. Se on satunnaismuuttuja, eli funtio perusjouolta Ω reaaliluvuille R. Kiinnittämällä ω Ω voimme tarastella tavallista reaaliluujonojen suppenemista ja yrittää osoittaa esimerisi, että f n (ω p aiilla ω Ω. Tämä siis vastaa funtioiden pisteittäistä suppenemista. Emme uitenaan voi toivoa mitään näin hienoa tulosta. Tämän näemme tarastelemalla olion heittoa. Oloon A i tapahtuma i:nnellä heitolla tulee laava. Jos ω (laava, laava,..., niin f n (ω. Toisaalta jos ω (ruuna, ruuna,..., niin f n (ω 0.
Määrittelemme suppenemisen (2 seuraavassa osiossa ahdella eri tavalla. Sitä ennen äsittelemme satunnaismuuttujia F n ja f n. Oletamme nyt, että tapahtumilla A i on todennäöisyys Kolmogorovin asiomaattisessa mielessä. Meritsemme p P(A i. Tässä P on todennäöisyys jonoavaruudessa Ω, vaiain itse tapahtuma liittyy vain ysittäiseen toistoon i. Tällöin F n siis lasee onnistuneiden tapahtumien luumäärän n:n toiston sarjassa, un ysittäisen onnistumisen todennäöisyys on p. Satunnaismuuttuja F n saa siis jonin arvon jouosta {0,,..., n. Etsimme nyt satunnaismuuttujan F n jaauman, toisin sanoen uvausen P ( F n. Tarastelaamme tapahtumaa {F n. Tällöin siis A on sattunut ertaa ja jäänyt sattumatta n ertaa. Näin voi äydä mm. silloin, un A sattuu alusi ertaa puteen, eli tapahtumat A, A 2,..., A sattuvat, ja tämän jäleen ei A enää satu, eli tapahtumat A c +, Ac +2,..., Ac n sattuvat. Kosa P(A i p, niin P(A c i p. Siten juuri uvatun tapahtuman todennäöisyys on riippumattomuuden nojalla (3 p ( p n. Yleisesti ottaen onnistumisien A i ei tarvitse tapahtua alusi puteen, vaan ne voivat tapahtua missä tahansa ohtaa n:ssä toistossa. Kuitenin joaisen ysittäisen n toiston tapahtuman, jossa on appaletta onnistumisia, todennäöisyys on (3. Näitä ysittäisiä tapahtumia on, uten irjoitussarjan osassa I todettiin, ( n n!!(n! eri appaletta. Siten, asiooman (TN 3 nojalla, ( n P(F n p ( p n. Sanomme, että F n on binomijaautunut parametrein n ja p, ja äytämme merintää F n Bin(n, p. 0 0 0.28 0.66 0 0.3 0.7 0 0.28 0.65 Kuva. Satunnaismuuttujan f n F n /n jaauma, un p 0,2 ja n, 0, 50, 00. Suurten luujen lait Tarastelemme, missä mielessä raja-arvo (2, ja siten frevenssitulinta, voidaan ymmärtää. Jo aiaisemmin huomasimme, että funtioiden pisteittäinen suppeneminen on liian vahva äsite tässä yhteydessä. Heion suurten luujen lain tapausessa ymmärrämme suppenemisen f n p niin, että (4 P ( fn p ε 0 millä tahansa luvulla ε > 0. Suppeneminen aavassa (4 taroittaa tietysti tavallista reaaliluujonon suppenemista. Heio suurten luujen lai taroittaa siis sitä, että todennäöisyys sille, että f n poieaa luvusta p menee ohti nollaa, un n asvaa. Sanomme myös, että f n suppenee ohti luua p stoastisesti. Vahva suurten luujen lai on lähellä funtioiden pisteittäistä suppenemista: ymmärrämme suppenemisen f n p niin, että (5 P(f n p P ({ ω Ω : f n (ω p. Kyse on siis siitä, että funtiot f n suppenevat pisteittäin ohti luua p paitsi ehä jossain poieusellisessa pistejouossa, jona todennäöisyys on nolla. Tällöin sanomme myös, että f n suppenee ohti luua p melein varmasti. Ensimmäisen version suurten luujen laeista todisti Jaob Bernoulli []. Hänen unniaseen satunnaisoetta, jossa on asi tulosmahdolisuutta, utsutaan Bernoulli-oeesi ja siten Bin(, p-jaautuneesta satunnaismuuttujasta äytetään myös nimitystä Bernoulli-muuttuja. Mainittooon vielä, että irjoittajan mielestä nimitys suurten luujen lai ei ole erityisen onnistunut. Parempi nimitys olisi loputtomien toistojen lai. Onneton nimitys lienee Siméon Poisson n peruja. Suurten luujen laien perustelu Tämä on irjoitusen teninen osio, sen matemaattinen pihvi. Todennäöisyyslasennan teoriasta vähemmän iinnostunut luija halunnee siirtyä suoraan osioon Varoitusen sanoja. Heio tapaus
Tehtävänämme on löytää sellainen yläraja (6 r(n, ε P ( f n p ε, että r(n, ε 0 aiilla positiivisilla ε. Tämä ei itse asiassa ole erityisen vaieaa. Ennaoimme uitenin vahvan tapausen ja etsimme sellaisen ylärajan, joa suppenee riittävän nopeasti. Tämä on jo hieman hanalaa. Käytämme luennoissa [3] esitettyä teniiaa. Tarastelemme alusi tapahtumassa { f n p ε { F n np nε itseisarvon positiivista puolta. Oloon r ja a (p, ε+p] sellainen luu, että an N (tällainen luu löytyy, unhan n on riittävän iso. Kosa F n on Bin(n, p- jaautunut, niin P ( F n (ε+pn P ( F n an ( n p ( p n an an an 0 r m p ( p n (rp ( p n (rp ( p n. Binomiteoreeman, siis sen joa ertoo miten sulut avataan, nojalla Siten 0 ( n (rp ( p n ( rp + ( p n. (7 P ( F n an ( rp ( p n. Epäyhtälön (7 vasen puoli ei riipu parametrin r valinnasta. Etsimme siten optimaalisen arvon r:lle. Optimiohta löytyy tavalliseen tapaan derivoimalla. Jätämme nämä työläät, mutta suoraviivaiset ysityisohdat luijalle. Toteamme vain, että minimiohta on r min p p a a >. Sijoittamalla r min :n aavaan (7 saamme ylärajan P ( f n p ε C a,p (r min an g + (n, ε. Tässä on täreää, että yläraja g + (n, ε suppenee ohti nollaa esponentiaalista vauhtia. Tarastelemme nyt itseisarvon negatiivista puolta. Vaihtamalla onnistumiset epäonnistumisisi huomaamme, että satunnaismuuttuja n F n on binomijaautunut parametrein n ja p. Kosa { F n na {n F n ( an, niin voimme päätellä, uten edellä, että P ( f n p ε g (n, ε, missä g (n, ε suppenee nollaan esponentiaalista vauhtia. Yhdistämällä saadut ylärajat olemme todistaneet heion suurten luujen lain. Voimme nimittäin valita ylärajasi (6 Vahva tapaus g(r, ε g + (r, ε + g (r, ε. Käytämme esponentiaalista ylärajaa (6 ja seuraavaa tulosta. Borel Cantellin lemma. Oloot A, A 2,... sellaisia tapahtumia, että sarja P(A n suppenee. Tällöin A n sattuu, melein varmasti, vain äärellisen monella indesillä n. Toisin sanoen P ( A n äärettömän usein 0. Tässä {A n äärettömän usein on niiden ω Ω jouo, joilla ω A n äärettömän usealla idesillä n. Perustelemme nyt Borel Cantellin lemman. Meritsemme alusi B n A i. in Toisin sanoen B n {A i jollain i n. Siten { An äärettömän usein B n. Jouot B n ovat lasevia: B n+ B n. Siten todennäöisyyden jatuvuudesta (asiooma (TN 3 seuraa, että ( P B n lim P(B n. Toisaalta epäyhtälöstä ( seuraa, että P(B n P(A i. in
Lemman väite seuraa ooamalla yllä luettelemamme (epäyhtälöt: P ( A n äärettömän usein ( P B n lim P(B n lim P(A i 0. in Vahva suurten luujen lai seuraa nyt suoraan Borel Cantellin lemmasta. Nimittäin, jos A n, { f n p, niin f n p taroittaa, että A n, sattuu jollain N äärettömän usein. Siis { {f n p A n, äärettömän usein. Toisaalta ylärajan (6 nojalla P(A n, g ( n,, missä ( g(n, / suppenee sarjana. Siten, Borel Cantellin lemman nojalla, P(A n, äärettömän usein 0. Lopulta väite seuraa epäyhtälöstä (: ( { P(f n p P An, äärettömän usein P(A n, äärettömän usein 0 0. Vahva suurten luujen lai seurasi siis siitä, että aiilla ε > 0 (8 P ( fn p ε <. Satunnaismuuttujajono, joa toteuttaa ehdon (8, suppenee ohti luua p nopeasti. Esitettyjen olmen suppenemisen välinen suhde on: nopea melein varma stoastinen. Nämä impliaatiot ovat siinä mielessä aitoja, ettei niitä voida ääntää. Varoitusen sanoja Frevensitulinnan muaan suhteellinen erotus f n p F n np n suppenee ohti nollaa, un n asvaa. Absoluuttisen erotusen tapausessa uitenin Fn np, vieläpä niin että F n np saa mielivaltaisen suuria ja pieniä arvoja. Todennäöisyys ei siis ole miään uminauha, jona ohtalo paottaa ohti esiarvoa. Se ei vastaa näemystä osmisesta oieudenmuaisuudesta, jona muaan onnistumisien jäleen on seurattava epäonnistumisia ja että joainen on esimäärin yhtä hyvä. Kohtalo voi toi muistaa aiaisemmat epäonnistumiset, mutta satunnainen riippumaton toistooe ei niitä muista. 5 0 5 0 0.2 0.0 0.2 0 200 400 600 800 000 0 200 400 600 800 000 Kuva 2. Simuloidut polut F n np ja f n p, un p 0,2 ja n,..., 000. Jos siis pelaat rulettia ja olet havainnut 9 punaista ja mustan, niin ei annata ruveta pelaamaan mustaa sen taia, että pitäähän niitä mustiain tulla, un on tullut niin paljon punaisia. Itse asiassa nyt annattaa pelata punaista! Syyn tähän erromme seuraavissa irjoitusissa. Viitteet [] Bernoulli, Jaob: Ars Conjectandi, Basel, 73. [2] Kolmogorov, Andrei Niolaevitš: Grundbegriffe der Wahrscheinlicheitsrechnung, Berlin, 933. [3] Nummelin, Esa: Todennäöisyysteoria, Luennot, Helsingin yliopisto, Matematiian laitos, 2003.