Veikkaus Oy Veikkauksen tulosvetopelien pelikäyttäytymisestä TEKNILLINEN KORKEAKOULU Systeemianalyysin laboratorio Ville Venojärvi, 54284B 4.8.2009
Sisällysluettelo 1 JOHDANTO... 1 2 VEIKKAUKSEN TULOSVETOPELIN MÄÄRITELMÄ... 2 3 POISSON JAKAUMAN PARAMETRIEN MÄÄRITTÄMISESTÄ... 2 3.1 Poisson jakauman valinnasta... 2 3.2 Pelijakauman ennustamiseen käytettyjen parametrien määrittäminen... 4 3.3 Lopullisesta pelijakaumasta määritetty maali intensiteettiparametri... 5 3.4 Jakaumien virheen määrittäminen... 6 4 JALKAPALLOON LIITTYVÄT TULOSVEDOT... 6 4.1 Jalkapalloliigoihin liittyvät tulosvedot... 7 4.2 Jalkapalloturnauksiin liittyvät tulosvedot... 8 5 JÄÄKIEKKOON LIITTYVÄT TULOSVEDOT... 8 6 POISSON JAKAUMAN OPTIMOINTI JA NEGATIIVISEN BINOMIJAKAUMAN KÄYTTÖ... 9 7 JAKAUMASOVITUSTEN TILASTOLLINEN TESTAUS... 10 7.1 LPJ Poisson jakauman testaus jalkapalloliigoille... 10 7.2 LPJ Poisson jakauman testaus optimoiduille Poisson jakaumille... 11 8 TULOSVETOPELIEN PELIJAKAUMAN KEHITTYMINEN... 11 9 JALKAPALLOLIIGOJEN JAKAUMISTA... 12 10 YHTEENVETO... 13 11 LÄHTEET... 14 12 LIITTEET... 15 12.1 Taulukot... 15
12.2 Kuvat... 19
1 Johdanto Tämä erikoistyö on laadittu VEIKKAUS Oy:n toimeksiannosta. Työn tarkoituksena on tutkia pelaajien pelikäyttäytymistä Veikkauksen muuttuvakertoimisissa peleissä. Muuttuvakertoimisilla peleillä tarkoitetaan tässä tutkielmassa eri urheilutapahtumiin liittyviä tulosvetoja, vaikka kategoriaan kuuluisivat muuten esimerkiksi Veikkauksen tarjoamat moni ja voittajavedot. Tutkielmassa tulen keskittymään tulosvetoihin jotka kohdistuvat jalkapallo ja jääkiekko otteluihin. Tämän työn tarkoituksena on pyrkiä identifioimaan sitä pelaavatko Veikkauksen tulosvetojen pelaajat tiettyjen todennäköisyysjakaumien mukaan. Lähtökohtaisesti oletuksena on että pelaajat pelaavat suhteellisen tarkasti Poisson jakauman mukaisesti. Lähtökohdan oletuksen perusteina voidaan pitää Poisson jakauman määritelmää, olettaen että tarkastelutapahtumana on maalien esiintyminen. Tutkielmassa pyrin tarkastelemaan muun muassa seuraavia tulosvetojen jakaumiin liittyviä kysymyksiä: Onko mahdollista pyrkiä ennakoimaan sitä, minkä jakauman mukaan pelaajat tulevat pelaaman tiettyä urheilutapahtumaa. Tarkoituksena tässä on tutkia sitä voiko pelaajien pelikäyttäytymisen Poisson jakauman parametrin (urheiluvedonlyönnissä ottelun maali intensiteetti) määrittää mahdollisimman yksinkertaisesti ennen tulosvedon aukeamista pelaajille. Toisena tutkimuskohteena on se, kuinka tarkasti pelaajat pelaavat Poisson jakauman mukaan, olettaen että maali intensiteetin parametrina käytetään tarkasteltavan tulosvedon lopullisen pelijakauman maali odotusarvoja. Kolmanneksi tutkin yksittäisen esimerkin avulla sitä, kuinka staattisena tietyn tulosvetokohteen pelijakauma säilyy pelin aukioloaikana. Neljäntenä tutkimuskohteena on se noudattaako tulosvetokohteet mahdollisesti jotain muuta todennäköisyysjakaumaa kuin Poissonjakaumaa. Vaihtoehtoiseksi jakaumaksi valitsin negatiivisen binomijakauman. Samalla tarkastelen myös sitä, voidaanko optimointialgoritmeja käyttämällä löytää tulosvetojakaumille parempia maali intensiteetin arvioita, kuin mitä lopullisesta pelijakaumasta määritetyt arviot ovat. Työssäni olen myös lyhyesti tarkastelut sitä läpäisevätkö pelijakaumien Poisson estimaattorit tilastollisen yhteensopivuustestin toteutuneeseen pelijakaumaan nähden. Lopussa esitän kuriositeettina havaintoja siitä kuinka hyvin esimerkiksi Englannin valioliigan tai Espanjan La Ligan yhden kauden otteluiden maalimäärät noudattavat Poisson jakaumaa. 1
2 Veikkauksen tulosvetopelin määritelmä Veikkauksen tulosvetopeleissä pelaajat veikkaavat pelikohteena olevan ottelun lopputulosta varsinaisen peliajan jälkeen. Tulosvedon kohdeotteluna voi olla muun muassa jalkapallo, jääkiekko tai pesäpallo ottelu. Pelikohteen ollessa esimerkiksi jalkapallo ottelu Fc Barcelona Real Madrid, pelaaja voi veikata että ottelu päättyy 2 0 Fc Barcelonan voittoon. Veikkauksen tarjoamassa tulosvedossa yksittäisen pelirivin panos voi vaihdella välillä 1 100. Tulosvedon kertoimet määräytyvät siten, että pelaajille palautettava summa (palautus % * pelivaihto) jaetaan euromäärällä, jolla tulosta on pelattu. 13.10.2008 Veikkauksen tulosvedon palautus oli 80 %. 3 Poisson jakauman parametrien määrittämisestä Tässä osiossa on esitetty lyhyt kuvaus siitä kuinka pelijakaumaa approksimoivien Poissonjakaumien parametrit on muodostettu. Olen myös lyhyesti perustellut sitä minkä takia lähtökohta tälle erikoistyölle on ollut se että tulosvetojen pelijakaumat noudattaisivat hyvin Poisson jakaumaa. Lopullisia pelijakaumia ja niiden estimaattoreita laatiessani päädyin tutkimaan pelikäyttäytymisen suhteellisia % osuuksia. Tämän perusteluna on se että tarkasteltavat tulosvedot omaavat kaikki toisistaan riippumattoman vaihdon. Näin ollen keskinäisten otteluiden selitysjakaumien hyvyyttä on helpompi arvioida jos tarkastelukohteena ovat pelivaihdon suhteelliset osuudet, eikä absoluuttiset määrät. Suhteellisella osuudella tarkoitetaan tässä kullekin maalimäärälle pelattujen eurojen osuutta pelikohteen kokonaisvaihdosta. 3.1 Poisson jakauman valinnasta Tarkasteltaessa tulosvetojen pelikäyttäytymistä diskreetti todennäköisyysjakauma on luonnollisin valinta. Tämä voidaan perustella helposti sillä, että pelaajat veikkaavat aina kokonaislukuja otteluiden tuloksiksi. Diskreeteistä jakaumista Poisson jakauma sopii määrittelyltään hyvin niin kokonaisten sarjojen maalijakaumien määrittämiseen, kuin yksittäisen ottelun pelijakauman määrittämiseen. Poisson jakauman määritelmä lyhyesti (Mellin, 2007): Määritellään diskreetti satunnaismuuttuja. tapahtuman esiintymisten lukumäärä ajanjaksona, jonka kesto on. Tässä työssä tapahtuma on maalin esiintyminen koti /vierasjoukkueelle. Seuraavissa tarkasteluissa ajanjakson kesto on yksi ottelu (tai ottelun puoliaika). Näin ollen 1, kaikille seuraaville tarkasteluille. Tietyin oletuksin satunnaismuuttuja noudattaa Poisson jakaumaa parametrilla. 2
Tässä työssä tarkastellaan pääasiassa sitä kuinka tarkasti noudattaa Poissonjakaumaa. Poisson jakauman pistetodennäköisyysfunktio on esitetty kaavassa (1) (1)! Poisson jakauman valintaperusteena voidaan käyttää sitä että parametri on helppo mieltää ottelun maali intensiteetiksi. Kuten myöhemmin tullaan huomaamaan, on mahdollista muodostaa negatiivinen binomijakauma, joka kuvaa paremmin pelaajien pelikäyttäytymistä kuin tarkinkaan Poisson jakauma. Negatiivisen binomijakauman parametreille toisaalta on vaikea antaa samanlaista tulkintaa kuin Poisson jakauman parametrille. Oletuksenani on ollut että ihmisten pelikäyttäytymistä voitaisiin mallintaa Poisson prosessin avulla. Poisson prosessin oletuksina ovat muun muassa seuraavat(wikipedia; Poisson process): 1. Toisistaan erillisten tarkasteluajanjaksojen tapahtumamäärät ovat toisistaan riippumattomia. 2. Millä tahansa ajanjaksolla tapahtumamäärä riippuu ainoastaan tarkasteltavan aikavälin pituudesta. 3. Tapahtumat eivät esiinny samanaikaisesti Oletetaan että pyritään mallintamaan jalkapallo ottelun maalimääriä Poisson prosessina. Voidaan havaita etteivät ehdot 1 2 välttämättä täyty, sillä jalkapallossa maalin syntyminen vaikuttaa hyvin usein tulevien ajanhetkien pelidynamiikkaan. Ehto 3 kuitenkin täyttyy. Tarkasteltaessa tulosvetopelaajien pelikäyttäytymistä Poisson prosessina kohdataan seuraavia haasteita. Peliprosessi toimii siten että pelaajat veikkaavat maalimäärää, jonka he uskovat joukkueen tekevän. Panoksen määrä ei myöskään ole kiinteä. Näin ollen jokaista yhden pelaajan pelitapahtumaa voidaan tarkastella yhtenä "jalkapallo otteluna", jonka maalit esiintyvät joukkona eivät yksitellen (mikä on Poisson prosessin oletus). Tulosvedoissa pelipanos ei myöskään ole kiinteä (se on välillä 1 100 ). Edellä esitetyistä syistä johtuen Poisson prosessin ehto 3 ei tulosvetojen osalta täyty. Ihmisten pelikäyttäytymisestä voidaan myös todeta sen verran että osaan pelaajista vaikuttaa kulloinenkin pelijakauma > ehdot 1 & 2 eivät täyty. Edellä huomattiin että niin urheiluotteluiden kuin niihin liittyvän pelikäyttäytymisen mallintaminen Poisson prosessina omaa selkeitä haasteita. Toisaalta niiden mallintaminen Poisson prosessina omaa selkeitä vahvuuksia, kuten yksinkertaisuus ja parametrien helppo ymmärrettävyys (ottelun maali intensiteetti). 3
3.2 Pelijakauman ennustamiseen käytettyjen parametrien määrittäminen Jalkapallo ja jääkiekkoliigojen otteluiden maalijakaumien ennustamiseen sovelsin seuraavia metodeja: Joukkueiden maalikeskiarvoon perustuva metodi (JMK), sekä modifioitu maalikeskiarvoihin perustuva metodi (mjmk). JMK metodissa sekä koti että vierasjoukkueen tehtyjen maalien maali intensiteettiparametrin määritys on tehty seuraavasti: kotijoukkueen tehtyjen maalien maali intensiteettiparametri : (2) vierasjoukkueen tehtyjen maalien maali intensiteettiparametri : (3) mjmk metodissa sekä koti että vierasjoukkueen maali intensiteettiparametrin määritys on tehty seuraavasti: kotijoukkueen tehtyjen maalien maali intensiteettiparametri : (4) vierasjoukkueen tehtyjen maalien maali intensiteettiparametri : (5) kaavoissa (2) (5) kuvaa joukkueiden kauden aikana pelaamien koti/vieras otteluiden lukumäärää, / / / koti /vierasjoukkueen tekemää/päästämää maalimäärää ottelussa. Indeksi viittaa kotijoukkueeseen ja vierasjoukkueeseen. alaindeksi kuvaa sitä että kyseessä on joukkueen tekemät ja päästetyt maalit. Parametri kuvaa tarkasteltavan sarjan kotijoukkueiden keskimääräistä tehtyjen maalien määrää ja vierasjoukkueiden vastaavaa. JMK menetelmän (kaavat (2) (3)) perusteluna voidaan pitää seuraavaa: On loogista olettaa että joukkueiden keskimääräisesti tekemät koti/vieras maalit olisivat hyvä pohja sille arviolle kuinka pelaajat uskovat niiden tekevän maaleja. Matemaattisesta näkökulmasta JMKmetodilla määritettävät maali intensiteettiparametrit ovat myös todellisten intensiteettien maximum likelihood estimaattoreita(weisstein, E). Urheilutapahtumia tarkastellessa maximum likelihood funktio ei kuitenkaan välttämättä ole paras estimaattori maaliintensiteetille. Se ei esimerkiksi lainkaan huomioi vastajoukkueen vahvuutta. 4
mjmk menetelmä (kaavat (4) (5)) vie JMK menetelmän pidemmälle. Siinä esimerkiksi kotijoukkueen tekemien maalien odotusarvoon (kaava 4) lisätään vierasjoukkueen keskimäärin päästämät maalit vähennettynä sarjan kotijoukkueen keskimäärin tekemillä maaleilla. Tämän perusteluna voidaan pitää sitä että jos vierasjoukkue keskimäärin päästää vähemmän maaleja kuin liigan kotijoukkue keskimäärin tekee, on vierasjoukkueen puolustus (ainakin vieraskentällä) keskimääräistä parempi. Sekä JMK että mjmk menetelmät ovat molemmat erittäin yksinkertaistettuja. Tarkoituksena tässä ei ole ollut löytää tapaa ennustaa tarkasti pelaajien pelikäyttäytymistä vaan muodostaa mahdollisimman yksinkertainen malli, jonka avulla voidaan saada jonkinlainen käsitys siitä miten pelikäyttäytyminen voisi mennä. Näiden ennustusmenetelmien suurin mielenkiinto on siinä onko pelaajien pelikäyttäytymisen suhteen eri liigojen välillä merkittäviä eroja ja kuinka usein ne oikeasti antavat suhteellisen tarkkoja tuloksia. Huomion arvoista myös on se, että kumpikaan menetelmistä JMK tai mjmk yleisesti ottaen ei soveltuisi kovinkaan tarkkaan approksimointiin esim. ottelun lopputuloksen (tulos tai merkki) todennäköisyysjakauman määrittämiseen. Ennustusmenetelmiin liittyvänä yleisenä huomautuksena se, että keskiarvoja laskiessani käytin aina kyseisen sarjan kaikkien otteluiden tietoja (vaikka peli olisi pelattu ensimmäisellä kierroksella). Näin ollen pelaajilla ei olisi ollut käytössä samaa dataa mikä minulla oli kausien jo päätyttyä. Poikkeuksena tästä Veikkausliiga, joka on vielä kesken tutkimuksen laatimishetkellä. Päädyin tähän ratkaisuun, koska jokaiselle pelille omien keskiarvojen laskeminen olisi ollut suhteettoman työlästä. 3.3 Lopullisesta pelijakaumasta määritetty maali intensiteettiparametri Kaavoissa (6) (7) on kuvattu se kuinka kunkin ottelun lopullisesta pelijakaumasta(lpj) on määritetty sekä koti että vierasjoukkueen maali intensiteettiparametrit ja. Tässä intensiteettiparametrit määritetään vasta pelikohteen sulkeuduttua, joten oletettavasti tämä menetelmä on kaikista tarkin selittämään pelikäyttäytymistä. kotijoukkueen tehtyjen maalien maali intensiteettiparametri (6) 5
vierasjoukkueen tehtyjen maalien maali intensiteettiparametri (7) Kaavoissa (8) (9) kuvaa tarkasteltavan ottelun maksimaalista maalimäärää, jonka olen ottanut huomioon. Analyyseissäni käytin arvoa 15 ja huomasin sen olevan riittävä (tosin joskus pelaajat pelaavat ottelun lopputulokseksi esim. 30 25, mikä on kuitenkin marginaalista). kuvaa kutakin maalimäärää ja sitä osuutta, jolla pelaajat ovat maalimäärää pelanneet. 3.4 Jakaumien virheen määrittäminen Muodostamieni pelikäyttäytymistä approksimoivien jakaumien virheen muodostaminen on esitetty kaavassa (8). Kaavasta (8) voidaan havaita että kyseessä on oikeastaan pienimmän neliösumman virhe, joka on ottelukohtaisesti määritetty sekä koti että vierasjoukkueelle ja virheet on tämän jälkeen laskettu yhteen. Mahdollisuutena olisi ollut myös määrittää erikseen sekä koti että vierasjoukkueiden sovitusten virheet erikseen. päädyin kuitenkin yhdistämään virheet säilyttääkseni mallin mahdollisimman yksinkertaisena. Ottelukohtainen virhe pelijakauman estimointimallille : (8) Kaavassa (8) kuvaa joko osuutta millä maalilukua on pelattu tai estimointimallin antamaa osuutta (riippuen alaindeksistä). Alaindeksi kuvaa pelattua osuutta ja mallin osuutta. Alaindeksi kuvaa kotijoukkueen maaleja ja vierasjoukkueen maaleja. 4 Jalkapalloon liittyvät tulosvedot Tässä osiossa on tarkasteltu sitä kuinka hyvin jalkapallo otteluiden jakaumia voidaan etukäteen ennustaa Poisson jakauman avulla (parametrit:,,, ). Tarkastelun kohteena on myös se kuinka hyvin lopullisesta pelijakaumasta määritetyt maali odotusarvot soveltuvat Poisson jakauman maali intensiteetin parametriksi (parametrit: ). Tarkasteluissani olen tutkinut seuraavien sarjojen jalkapallo otteluita: Espanjan La Liga (08 09), Englannin Premier League(08 09), Saksan Bundesliiga(08 09), Italian Serie A(08 09) ja 6
Veikkausliiga(09). Olen erikseen tutkinut myös kahden jalkapalloturnauksen(confederations Cup (09) ja jalkapallon EM kisat (08)) pelikäyttäytymistä. 4.1 Jalkapalloliigoihin liittyvät tulosvedot Jokaisesta edellä mainitusta jalkapalloliigasta valitsin kahdeksan ottelua, joista suoritin analyysin siitä kuinka hyvin niissä esiintynyt pelikäyttäytyminen noudattaa edellä esitettyjä Poisson jakauma estimaattoreita (JMK, mjmk ja LPJ). Veikkauksen pelitarjonnasta ja omasta mielenkiinnosta johtuen keskityin pääasiassa suurimpien seurojen otteluihin. Liitteissä oleva taulukko 1 kuvaa kaikkien tutkimieni otteluiden vaihdot ja eri approksimointimenetelmillä esiintyneet virheet. Taulukossa 11 on eritelty kaikkien tässä työssä tarkastelemieni otteluiden koti ja vierasjoukkueet. Kuvassa 1 on esitetty eri estimointimenetelmien keskimääräiset virheet sarjoittain. Siitä voidaan huomata että LPJ selitysmenetelmä toimii selkeästi parhaiten aivan kuten olettaa saattaa. Ennustavista menetelmistä JMK toimii paremmin Bundesliigan ja Veikkausliigan otteluissa. mjmk puolestaan on tarkempi La Ligan ja Englannin Premier Leaguen otteluissa. Serie A:n otteluissa sekä JMK että mjmk menestyvät suunnilleen yhtä hyvin. Taulukosta 1 ja kuvasta 2 voidaan hyvin havaita että tulosvetokohteen vaihdon merkitys virheen suuruuteen on merkityksetön (Kuvasta 2 jätetty pois yksi selkeästi poikkeava virhe). Tätä voidaan pitää oletettuna tuloksena sillä tarkastelukohteina ovat pelivaihtojen suhteelliset osuudet. Kahdella estimointimenetelmistä vaihdon korrelaatio virheen kanssa on lievästi negatiivinen (JMK & mjmk), kun taas menetelmällä LPJ korrelaatio on lievästi positiivinen. Korrelaatioita ei kuitenkaan voida pitää merkityksellisinä. Pelkästään virheiden suuruuden nojalla on hyvin vaikea arvioida sitä kuinka hyvin estimointimenetelmät oikeastaan kuvaavat pelaajien pelikäyttäytymistä. Kuvissa 3 4 on esitetty sitä kuinka hyvin eri estimointimenetelmät toimivat eri otteluissa. Kuvissa yhtenäinen viiva kuvaa todellista pelikäyttäytymistä ja katkoviiva estimaattori menetelmällä saatua käytöstä. Kuviin olen pyrkinyt valitsemaan sellaisia otteluita joissa selitys menetelmät toimivat hyvin, kohtalaisesti tai heikosti. Mittarina tässä olen käyttänyt parametria(, kaava 8). Taulukossa 2 on eritelty kuvien 3 4 otteluiden joukkueet. Tarkastelemalla kuvia 3 4 voidaan tehdä seuraavia huomioita: Estimointimenetelmistä LPJ on selkeästi paras. Tätä voidaan pitää erittäin odotettuna tuloksena. Parhaimmillaan se ennustaa pelikäyttäytymisen lähes täydellisesti (ottelu 1). Tarkastelu otteluissa heikoimmillaankin (ottelu 3) se ennustaa vierasjoukkueen pelijakauman todella tarkasti. Kotijoukkueen pelijakauman estimoinnissa LPJ menetelmä onnistuu tällöin heikosti. JMK ja mjmk menetelmät näyttäisivät suoriutuvan valituissa otteluissa pelijakaumien ennakoimisessa suunnilleen yhtä hyvin. Parhaimmillaan ne kykenevät 7
ennustamaan vierasjoukkueen pelijakauman erittäin hyvin. Heikoimmillaan mjmk ei kykene ennustamaan kohtuullisesti koti tai vieras pelijakaumaa (ottelu 9). JMK onnistuu heikoimmillaankin suhteellisen hyvin kotijakauman ennustamisessa. Mielenkiintoisena huomiona voidaan havaita että kaikissa muissa paitsi ottelussa 9 estimointimenetelmät kykenevät ennustamaan ainakin koti tai vieras pelijakauman hyvin. Syytä tälle on hyvin vaikea lähteä arvioimaan, kyse voi olla puhtaasta sattumastakin. 4.2 Jalkapalloturnauksiin liittyvät tulosvedot Jalkapalloturnauksista ei ole mahdollista laatia järkevästi samankaltaisia ennustusmenetelmiä (JMK & mjmk), kuin jalkapalloliigoista. Seuraavassa on esitetty sitä kuinka hyvin LPJ menetelmällä muodostettu Poisson jakauma noudattaa todellista pelijakaumaa jalkapalloturnauksissa. Vaihdon ja virheen korrelaatio oli myös jalkapalloturnauksissa merkityksetön. Tarkasteltaessa taulukon 3 LPJ estimointi menetelmän keskivirheitä huomataan niiden olevan samaa suuruusluokkaa kuin eri liigoille määritetyt LPJ virheet. Näin ollen voidaan olettaa että LPJ menetelmä kykenee selittämään pelikäyttäytymistä suhteellisen hyvin myös jalkapalloturnausten osalta. 5 Jääkiekkoon liittyvät tulosvedot Taulukossa 4 ja kuvassa 5 on esitetty tulokset jääkiekon SM liiga kauden 08 09 ja NHL kauden 08 09 pelikäyttäytymis estimoinneille. Jalkapallosta poiketen jääkiekko otteluiden vaihdon ja ennustusvirheiden välillä oli havaittavissa lievää positiivista korrelaatiota. Tämä on saattanut osaltaan vaikuttaa arvioihin estimointimenetelmien tarkkuudesta. Taulukosta 4 ja kuvasta 5 voidaan havaita että LPJ estimointimenetelmällä saadut virheet ovat samaa suuruusluokkaa kuin jalkapalloliigojen vastaavat. Näin ollen voidaan olettaa että Jääkiekko otteluiden pelijakaumaa voidaan estimoida suhteellisen tehokkaasti LPJ menetelmän avulla. JMK ja mjmk menetelmät onnistuvat nekin suhteellisen hyvin ennustamaan pelikäyttäytymistä. Näiden menetelmien keskinäisestä paremmuudesta jääkiekkootteluiden pelijakaumien ennustamisesta on vaikea sanoa mitään varmasti. mjmk vaikuttaisi selviävän ennustamisesta hieman paremmin, toisaalta analysoitujen otteluiden suhteellisen alhainen lukumäärä saattaa vaikuttaa estimoituihin keskivirheisiin. Verrattaessa JMK ja mjmk menetelmien tarkkuutta jääkiekko otteluiden ja jalkapallo otteluiden pelijakaumien määrittämisessä, voidaan havaita että menetelmät kykenevät ennustamaan jääkiekko otteluiden jakaumia hieman tarkemmin (virheen (8) osalta) kuin jalkapallo otteluiden. Tämä voidaan havaita vertaamalla kuvia 1 & 5. Kuvassa 6 on havainnollistettu 8
estimointimenetelmien kykyä selittää jääkiekko otteluiden pelijakaumia. Havaintoesimerkiksi valitsin sellaiset ottelut, joissa LPJ menetelmä onnistui selittämään pelijakaumaa suhteellisen hyvin. Kuten kuvasta 6 voidaan nähdä parhaimmillaan LPJ selittää pelikäyttäytymisen lähes täydellisesti. Mielenkiintoisena lisähuomiona voidaan nähdä että sekä JMK että mjmk kykenevät ennustamaan SM liiga ottelun pelijakauman eritäin hyvin. NHL ottelun pelijakaumaa niiden avulla ei voi aivan yhtä hyvin estimoida, vaikka ne onnistuvat tässä tapauksessa myös siinä kohtalaisen hyvin. 6 Poisson jakauman optimointi ja Negatiivisen binomijakauman käyttö Kuvassa 7 ja taulukossa 7 on esitetty Poisson jakauman optimoinnin tulokset kuudelle valitulle ottelulle. Otteluiden valitseminen tapahtui sillä perusteella että mukana olisi otteluita joissa LPJ estimointi on toiminut hyvin, kohtalaisesti tai heikosti. Poisson jakauman optimoinnilla tarkoitetaan tässä sitä, että sekä koti että vierasjoukkueiden maaliintensiteettiparametrit optimoitiin numeerisesti siten että muodostuvan pelijakauman estimaatin virhe (8) saatiin minimoitua. Kuvissa kotijoukkueen jakauman estimaattori on esitetty yhtenäisellä viivalla ja toteutunut jakauma "+" merkillä. Vierasjoukkueen jakauman estimaattori on puolestaan merkitty katkoviivoin ja "o" merkillä. Tarkasteltaessa kuvaa 7 huomataan että Poisson jakaumaa optimoimalla voidaan muodostaa kohtalaisen hyvä estimaattori kaikkien otteluiden pelijakaumille. Heikoiten tässä onnistutaan otteluiden 3 & 4 kohdalla ja parhaiten ottelun 1 osalta. Mielenkiintoista on huomata että vaikka otteluita 5 & 6 voitiin estimoida LPJmenetelmällä heikommin kuin otteluita 3 & 4 (taulukko 7), optimoimalla maaliintensiteettiparametria saadaan otteluiden 5 & 6 jakaumille selkeästi parempi estimaattori kuin otteluiden 3 & 4 (virheen (8) osalta). Ottelun 1 osalta voidaan myös huomata että maali intensiteettiparametrin optimointi ei juuri pienennä virheen (8) suuruutta. Kuvassa 8 ja taulukossa 8 on esitetty samoille otteluille vastaavanlaisen optimointiprosessin tulokset Negatiiviselle binomijakaumalle. Taulukosta 8 ja kuvasta 8 voidaan huomata että negatiivisen binomijakauman parametreja optimoimalla voidaan estimoida erittäin tarkasti kunkin ottelun pelijakaumat. Toisaalta negatiivisen binomijakauman parametreilla ei ole vastaavaa realiteettia itse jalkapallon kanssa, kuten Poisson jakaumalla (maali intensiteetti). Näin ollen Negatiivisen binomijakauman parametrien määrittäminen ennen pelitapahtuman alkua on erittäin hankalaa (vrt. JMK & mjmk). Negatiivisen binomijakauman parametreja & voi kuitenkin pyrkiä tulkitsemaan seuraavalla tavalla. kuvaa jalkapallossa todennäköisyyttä että epäonnistutaan maalinteossa ja puolestaan maalinteko yritysten määrää. Nämä oletukset eivät kuitenkaan optimointitulosten osalta ole realistisia (ks. taulukko 8), mutta antavat perustelun sille minkä takia Negatiivista binomijakaumaa voidaan perustellusti käyttää tulosvetopelien pelijakaumien mallintamisessa hyödyksi. 9
Parametrien epärealistisuudella tässä tarkoitan sitä, että jalkapallo ottelussa ei yleensä kummallakaan joukkueella ole yli 100:a maalintekoyritystä (taulukko 8). Negatiivisella binomijakaumalla saadaan selkeästi parempia estimointituloksia kuin Poissonjakaumalla (vrt. kuvat ja taulukot 7 & 8). Negatiivisen binomijakauman ongelmana kuitenkin on myös se, ettei ottelun pelijakaumasta voida määrittää parametreja & samoin kuin LPJ menetelmässä määritettiin ottelun maali intensiteettiparametri lopullisesta pelijakaumasta. Näin ollen Negatiivista pelijakaumaa ei voida käyttää pelijakauman approksimointiin samoin kuin Poisson jakaumaa. Mielenkiintoista on kuitenkin nähdä kuinka hyvin Negatiivisen binomijakauman optimointi onnistuu sellaisessakin ottelussa jossa Poisson jakauman optimointi ei kykene kovinkaan hyvin selittämään pelikäyttäytymistä (vrt. ottelut 3 & 4). Tulosta voidaan pitää kuitenkin suhteellisen odotettuna, ottaen huomioon että Negatiivinen binomijakauma sisältää kaksi parametria, joiden suhteen estimaattorijakaumaa voidaan optimoida (Wikipedia, Negative binomial distribution). 7 Jakaumasovitusten tilastollinen testaus Tässä osiossa on esitetty tuloksia laadittujen jakauma estimaattoreiden yhteensopivuudesta havaittujen pelijakaumien kanssa. Testaus menetelmänä on käytetty yhteensopivuustestiä. 7.1 LPJ Poisson jakauman testaus jalkapalloliigoille Edellä on esitetty kuinka LPJ jakauma estimaattori muodostettiin jalkapallo otteluille. Taulukossa 9 on esitetty yhteensopivuustestin tulokset tarkastelluille jalkapalloliigoille. Merkitsevyystasona laadituissa tilastollisissa testauksissa on ollut 0.05. Tilastollista testausta varten jokaisen maalimäärän peliosuus muutettiin pelivaihtojen avulla maalikohtaiseksi pelimääräksi. Tämä tuli aiheuttamaan vääristymää yhteensopivuustestin tuloksissa. Taulukosta voidaan hyvin huomata että tilastollinen testaus hyväksyy ainoastaan muutaman todellisen pelijakauman yhteensopivaksi LPJ menetelmällä laadittujen pelijakaumien kanssa. Tulosta voidaan pitää hieman yllättävänä, sillä graafisen tarkastelun nojalla olisi voinut olettaa että suurempi osa jakaumista läpäisisi tilastollisen yhteensopivuustestin. Tilastollinen testaus on tässä suoritettu siten että kullekin maaliluvulle panostetut eurot on tulkittu omiksi tapahtumikseen. Tämä ei tosiasiassa pidä paikkaansa, sillä tulosvedossa pelaajat saavat päättää oman pelipanoksensa väliltä 1 100. Näin ollen pelipanosten kasautumista eri maaliluvuille ei voida pitää perinteisenä Poisson prosessina (kuten todettu 10
jo aiemmin). Taulukosta 9 kuitenkin huomataan että arvon ja kaavan (8) avulla lasketun virheen välillä on selkeää korrelaatiota. Esimerkiksi jos verrataan Bundesliigan ja LaLigan kaavalla (8) määritettyjä arvoja sekä kyseisten liigojen estimaattorijakaumien arvoja havaitaan niiden välillä selvää positiivista korrelaatiota. Tilastollisen testaamisen luotettavuutta tässä myös heikentää se että kaavassa (9) esitetty testisuure (Mellin, 2007) on voimakkaasti pelikohteen vaihdosta riippuvainen. Näin ollen eri pelivaihtojen otteluiden vertaaminen keskenään tämän testisuureen avulla on hankalaa, sillä pienten vaihtojen otteluiden arvoa voidaan pitää oletusarvoisesti pienempänä kuin suurten vaihtojen otteluiden. Tämän perustelu nähdään kaavan (9) avulla: suuremmat vaihdot kasvaa suuremmaksi, vaikka kaavan virhe (8) ei kasvaisi. 2 0 Kaavassa9: on maalimäärälle pelatut eurot, estimointimallin ennustamat eurot maalimäärälle. 7.2 LPJ Poisson jakauman testaus optimoiduille Poisson jakaumille (9) Tässä on esitetty tulokset optimoitujen Poisson jakaumien tilastolliselle yhteensopivuudelle havaitun pelijakauman kanssa. Kuten jo edellisessä kohdassa todettiin, menetelmän heikkous pelikäyttäytymisen testaamisessa on se että testi ei ota huomioon pelivaihdon merkitystä estimointimallin hyvyyden määrittämisessä. Tulokset optimoidun jakauman tilastollisesta yhteensopivuudesta on esitetty taulukossa 10. Taulukosta nähdään että ainoastaan kahden ottelun kotijakaumat läpäisevät tilastollisen yhteensopivuustestin. Tulokset näyttäisivät olevan yhteneviä taulukossa 1 esitettyjen tulosten kanssa, siinä mielessä että virheen (8) ja arvon välillä näyttäisi olevan selkeää positiivista korrelaatiota. 8 Tulosvetopelien pelijakauman kehittyminen Veikkaus julkaisee lähes reaaliaikaisia päivityksiä kunkin tulosvetokohteen pelijakaumasta. Kuvassa 9 olen esittänyt kuinka erään tulosvetokohteen lopullinen pelijakauma suhtautuu aikaisempina ajankohtina voimassa olleeseen jakaumaan. Lopullinen pelijakauma on kuvissa esitetty yhtenäisellä viivalla, kun taas kulloistakin ajankohtaa vastaava jakauma katkoviivoilla. Hypoteesina tässä on että mitä lähemmäksi pelin sulkeutumista mennään (ajankohdan suhteen) sitä paremmin pelijakauma kuvaa lopullista pelijakaumaa. Kohteena tarkastelussani oli Mestareiden Liigan karsintaottelu: Fc Inter Fc Sheriff. Taulukossa 6 on esitetty valitsemieni pelijakaumien ajankohdat, vaihdot ja virheet. Taulukosta voidaan pääsääntöisesti huomata että mitä lähempänä pelin sulkeutumista ollaan, sitä lähempänä pelijakauma on lopullista pelijakaumaa. Sama asia voidaan havaita myös kuvasta 9. 11
Mielenkiintoisena yksityiskohtana voidaan havaita että tämän yhden esimerkin nojalla voitaisiin sanoa että aikaisemmat pelijakaumat ovat lopullisen pelijakauman estimointimielessä lähes LPJ menetelmän tasoa. Toisaalta koska kyseessä on ainoastaan yhden ottelun jakauma, mitään näin pitkälle meneviä johtopäätöksiä ei voida luotettavasti tehdä. 9 Jalkapalloliigojen jakaumista Tässä osiossa on esitetty lyhyesti havaintoja sitä, kuinka tarkasti jalkapalloliigojen tulokset noudattavat Poisson jakaumaa. Tarkastelun kohteeksi olen valinnut vuosien 08 09 Espanjan La Ligan ja Englannin Valioliigan. Tässä tarkastelussa olen myös erikseen tutkinut sitä voidaanko otteluiden jakaumat estimoida tarkemmin, jos ensimmäisen ja toisen puoliajan tulokset erotetaan toisistaan. Perusteena tälle tarkastelulle on se että jalkapallossa hyvin usein joukkueiden taktiset ratkaisut muuttuvat voimakkaasti ottelun puoliajalla. Poisson jakauman maali intensiteettiparametrien estimointimenetelmänä olen tässä käyttänyt kaikkien liigan otteluiden maalikeskiarvoja. Näin ollen kotijoukkueiden maali intensiteetti on keskimäärin liigan kotijoukkueiden tekemä maalimäärä. Sama pätee myös vierasjoukkueiden intensiteettiparametrille. Vastaavasti olen myös määrittänyt puoliajoille omat maali intensiteettiparametrit:,,,, missä numero indeksi indikoi tarkastellaanko ensimmäistä vai toista puoliaikaa. Näin ollen Poisson jakauman maali intensiteettiparametri on määritetty samankaltaisesti kuin kaavoissa (2) (3). Taulukossa 5 on esitetty La Ligan ja Englannin Valioliigan maali intensiteettiparametrit. Siinä on kuvattuna myös estimaattoreilla saatujen jakaumien virheet suhteessa toteutuneisiin maalijakaumiin. Kuvassa 10 on esitetty Sekä La Ligan että Englannin Valioliigan otteluiden maalijakaumat, sekä niiden Poisson estimaattorit. Kuvassa yhtenäinen viiva kuvaa toteutuneita jakaumia, kun taas katkoviiva esittää estimoidun jakauman. Kuvasta 10 ja taulukosta 5 voidaan havaita että molemmat sarjoista noudattavat suhteellisen tarkasti Poisson jakaumaa lopputulostensa osalta. Mielenkiintoista on esim. huomata että Valioliigan osalta ensimmäisen puoliajan toteutunut ja estimoitu jakauma lähes yhtenevät sekä koti että vierasjoukkueelle. Toisen puoliajan vierasjoukkueen estimoitu jakauma puolestaan poikkeaa todellisesta jakaumasta huomattavasti enemmän kuin muut puoliaikajakaumat. La Ligan kotijoukkueen osalta taas toisen puoliajan jakauma noudattaa tarkemmin estimoitua Poisson jakaumaa kuin ensimmäisen puoliajan jakauma. Vierasjoukkueen osalta tilanne puolestaan on päinvastainen. Koko otteluiden estimaattorijakaumat puolestaan häviävät selvästi tarkimmille puoliaikaestimaattoreille, mutta toisaalta ovat tarkempia kuin heikoimmat puoliaika selittäjät. Kaiken kaikkiaan voidaan sanoa että tarkastellut sarjat noudattavat maalimääriensä osalta hämmästyttävän hyvin Poisson jakaumaa niin koko otteluiden kuin puoliaikojenkin osalta. 12
10 Yhteenveto Tämän työn tarkoituksena oli pyrkiä selvittämään sitä kuinka Veikkauksen pelien pelaajat pelaavat muuttuvakertoimisia ja eritoten tulosvetopelejä. Tarkastelun kohteena olivat Veikkauksen tarjoamat jalkapalloon ja jääkiekkoon liittyvät tulosvedot. Pelijakaumien ennustamiseen käytettiin kahta eri menetelmää JMK ja mjmk. Menetelmien toimivuuden kannalta on vaikea tehdä selkeää eroa. Analyysien perusteella vaikutti siltä että JMK menetelmä onnistuu ennustamaan pelikäyttäytymistä paremmin Bundes ja Veikkausliigan osalta. mjmk pärjäsi puolestaan paremmin La Ligan, Englannin Valioliigan ja SM liigan jakaumien estimoinnissa. Muissa sarjoissa menetelmät menestyivät suunnilleen yhtä hyvin. Poisson jakaumaan liittyvistä estimointimenetelmistä selvästi tehokkain oli lopulliseen pelijakaumaan perustuva LPJ menetelmä. Sen avulla kyettiin laatimaan ajoittain hyvinkin tarkkoja estimaattoreita pelaajien pelikäyttäytymiselle. Optimoimalla Poisson jakauman maali intensiteettiparametria kyettiin parantamaan estimaattoreiden tarkkuutta jonkin verran. Joidenkin otteluiden tapauksissa tarkkuus ei juuri parantunut LPJ menetelmän arvoista, kun taas toisissa parannus oli huomattavaa. Negatiivisen binomijakauman avulla kyettiin estimoimaan pelijakaumat erittäin tarkasti. Tätä tulosta osattiin tosin odottaa, johtuen negatiivisen binomijakauman suuremmasta parametrien lukumäärästä (2). Negatiivisen binomijakauman heikkoutena pelikäyttäytymisen selittäjänä on kuitenkin se, ettei pelijakaumasta voida helposti estimoida sen parametreja. Jakaumaestimaattoreiden tilastollinen testaus testin avulla ehdotti että suurin osa estimaattorijakaumista ei noudattaisi LPJ Poisson tai optimoitua Poisson jakaumaa. Tämän syynä osittain oli se, että otteluiden vaihdot vaikuttivat voimakkaasti tilastollisen testisuureeseen. Toisaalta havaittiin selkeää positiivista korrelaatiota testisuureen ja virheen (8) välillä. Pelijakaumien kehittymisestä huomattiin yksittäisen esimerkin avulla se, että mitä lähempänä kohteen sulkeutumista ollaan, sitä tarkemmin jakaumasta muodostettu LPJ estimaattori lopullista pelijakaumaa estimoi. Lopussa havainnoitiin myös sitä kuinka tarkasti jalkapalloliigojen maalijakaumia voidaan estimoida Poisson jakauman avulla. Kokonaisuutena voitiin huomata että Poisson jakaumaa voidaan soveltaa yleisesti ottaen suhteellisen tarkasti pelijakaumien estimointiin. Negatiivinen binomijakauma olisi mitä todennäköisimmin vieläkin parempi jakaumien mallintaja, jos kyettäisiin arvioimaan tehokkaasti parametrit. Jakaumien yhteensopivuuden tilastolliseen testaamiseen testi soveltuu tässä tapauksessa ainoastaan rajoitetusti, johtuen pelikohteiden vaihtelevista pelivaihdoista. Tarkempien tilastollisten analyysien laadintaan tulisi löytää testisuure, johon vaihdon suuruus ei yhtä merkittävästi vaikuttaisi. 13
Jatkotutkimuksen aiheina voisi olla muun muassa sellainen jakaumien yhteensopivuuden tilastollinen analyysi, johon ottelukohtaiset vaihdot eivät vaikuttaisi. Mahdollista olisi myös tutkia sitä onko tiettyjen joukkueiden pelien pelikäyttäytymisen estimointi helpompaa kuin toisten. Myös virheen (8) tarkempi analyysi koti ja vierasjoukkueiden osalta saattaisi olla mielenkiintoista. 11 Lähteet Mellin, I. 2007. Todennäköisyyslaskenta ja tilastotiede: Kaavat ja taulukot. Helsinki: Teknillinen korkeakoulu. Weisstein, Eric W. "Maximum Likelihood." From MathWorld A Wolfram Web Resource. http://mathworld.wolfram.com/maximumlikelihood.html (26.07.2009). Wikipedia. In Negative binomial distribution. Retrieved 04.08.2009, from http://en.wikipedia.org/wiki/negative_binomial_distribution. (24.06.2009). Wikipedia. In Wikipedia Poisson Process. Retrieved 04.08.2009, from http://en.wikipedia.org/wiki/poisson_process. 14
12 Liitteet 12.1 Taulukot sarja/virhe nro vaihto LPJ JMK mjmk sarja/virhe nro vaihto LPJ JMK mjmk LaLiga 1 6486.0 0.0044 0.0594 0.0142 BundL 1 2786.7 0.0062 0.1831 0.3420 LaLiga 2 5293.3 0.0026 0.0676 0.0474 BundL 2 3919.7 0.0025 0.0419 0.0873 LaLiga 3 12747.3 0.0023 0.0151 0.0139 BundL 3 6680.8 0.0017 0.0265 0.0520 LaLiga 4 5619.3 0.0035 0.0241 0.0182 BundL 4 5416.4 0.0026 0.0118 0.0280 LaLiga 5 27184.1 0.0027 0.0469 0.0087 BundL 5 4507.4 0.0032 0.0089 0.0385 LaLiga 6 9764.2 0.0045 0.0676 0.0529 BundL 6 4148.5 0.0007 0.0535 0.0839 LaLiga 7 9443.4 0.0035 0.0744 0.0111 BundL 7 3248.4 0.0027 0.0846 0.0621 LaLiga 8 6568.4 0.0023 0.0298 0.0147 BundL 8 738.0 0.0039 0.0612 0.0038 ka. 10388.3 0.0032 0.0481 0.0226 ka. 3930.7 0.0029 0.0589 0.0872 otosv 4.59E+07 0.0000 0.0004 0.0003 otosv 2.76E+06 0.0000 0.0028 0.0100 otoskh 6777.4 0.0009 0.0212 0.0161 otoskh 1662.8 0.0015 0.0527 0.0998 EPL 1 7615.9 0.0006 0.0702 0.0255 VeikkausL 1 7749.2 0.0032 0.0627 0.0366 EPL 2 6735.1 0.0003 0.0495 0.0358 VeikkausL 2 9453.9 0.0024 0.1649 0.1183 EPL 3 13523.8 0.0010 0.0625 0.0202 VeikkausL 3 5626.2 0.0100 0.0506 * EPL 4 14383.0 0.0012 0.0959 0.0159 VeikkausL 4 5779.6 0.0018 0.0200 0.0138 EPL 5 10515.7 0.0028 0.0981 0.0270 VeikkausL 5 4519.6 0.0650 0.0728 0.1397 EPL 6 7613.4 0.0037 0.0084 0.0692 VeikkausL 6 5538.0 0.0026 0.0118 0.0453 EPL 7 15217.2 0.0007 0.1022 0.0150 VeikkausL 7 9053.6 0.0025 0.0674 0.1369 EPL 8 8344.3 0.0010 0.0344 0.0348 VeikkausL 8 3922.7 0.0047 0.0217 0.2417 ka. 10493.6 0.0014 0.0651 0.0304 ka. 6455.4 0.0115 0.0590 0.1046 otosv 1.02E+07 0.0000 0.0010 0.0003 otosv 3.70E+06 0.0004 0.0021 0.0054 otoskh 3200.5 0.0011 0.0313 0.0163 otoskh 1922.3 0.0204 0.0457 0.0733 SerieA 1 4346.5 0.0064 0.0118 0.0548 *Tässä ottelussa mjmk menetelmä ei antanut SerieA 2 3956.2 0.0044 0.0069 0.0346 validia maali intensiteetti parametria SerieA 3 5327.7 0.0036 0.0205 0.0164 SerieA 4 4791.2 0.0018 0.0343 0.0170 SerieA 5 3955.2 0.0062 0.0485 0.0440 SerieA 6 3910.4 0.0035 0.0274 0.0157 SerieA 7 3712.5 0.0035 0.0088 0.0101 SerieA 8 2626.1 0.0106 0.0101 0.0027 kaikki sarjat ka. 4078.2 0.0050 0.0210 0.0244 ka. 7069.2 0.0048 0.0504 0.0262 otosv 5.55E+05 0.0000 0.0002 0.0003 otosv 2.16E+07 0.0001 0.0016 0.0320 otoskh 745.2 0.0025 0.0138 0.0169 otoskh 4643.3 0.0100 0.0398 0.1790 Taulukko 1: Jalkapallo liigojen ottelukohtaiset vaihdot ja virheet eri estimointimenetelmillä ottelu nro. joukkueet ottelu nro. joukkueet ottelu nro. joukkueet 1 Chelsea Liverpool 4 Juventus Ca tania 7 Barcelona At. Madrid 2 Barcelona Valladolid 5 Chelsea Liverpool 8 Liverpool Arsenal 3 HJK KuPS 6 Fc Lahti Tampere Utd. 9 Fc Inter MyPa Taulukko 2: Kuvissa 3 4 esiintyvien otteluiden joukkueet 15
turnaus nro vaihto virhe turnaus nro vaihto virhe ConfCup09 1 8768.6 0.0022 EM08 1 163376 0.0036 ConfCup09 2 20243.5 0.0045 EM08 2 80150 0.0023 ConfCup09 3 33877.7 0.0065 EM08 3 49642.2 0.0017 ConfCup09 4 12744.6 0.0015 EM08 4 34887.8 0.0019 ConfCup09 5 27553.4 0.0024 EM08 5 38268.4 0.0027 ka. 20637.56 0.0034 ka. 73264.88 0.0024 otosv 1.07E+08 4.11E 06 otosv 2.86E+09 5.65E 07 otoskh 10325.41 0.0020 otoskh 53439.23 0.0008 kaikki ottelut ka. otosv otoskh vaihto 46951.22 2.09E+09 4.57E+04 virhe 0.0029 2.36E 06 1.54E 03 Taulukko 3: Jalkapalloturnausten ottelukohtaiset vaihdot ja virheet LPJ estimointimenetelmällä. sarja/virhe nro vaihto LPJ JMK mjmk sarja/virhe nro vaihto LPJ JMK mjmk SM Liiga 1 24910.10 0.0030 0.0348 0.0174 NHL 1 6245.60 0.0010 0.0110 0.0064 SM Liiga 2 15614.90 0.0023 0.0420 0.0357 NHL 2 45419.50 0.0035 0.0437 0.0560 SM Liiga 3 122122.50 0.0032 0.0500 0.0266 NHL 3 14394.60 0.0022 0.0219 0.0329 SM Liiga 4 10890.80 0.0011 0.0028 0.0030 NHL 4 5570.80 0.0023 0.0287 0.0346 SM Liiga 5 180888.10 0.0036 0.0458 0.0271 NHL 5 4214.10 0.0033 0.0042 0.0092 SM Liiga 6 80670.10 0.0014 0.0026 0.0024 NHL 6 25397.60 0.0026 0.0117 0.0107 SM Liiga 7 11766.60 0.0025 0.0046 0.0125 NHL 7 7229.80 0.0019 0.0057 0.0039 SM Liiga 8 20067.70 0.0045 0.0302 0.0090 NHL 8 7321.10 0.0024 0.0048 0.0079 ka. 58366.35 0.0027 0.0266 0.0167 ka. 14474.1375 0.0024 0.0165 0.0202 otosv 4.06E+09 1.25E 06 4.09E 04 1.48E 04 otosv 2.05E+08 6.17E 07 1.97E 04 3.53E 04 otoskh 63710.44 0.0011 0.0202 0.0122 otoskh 14307.0253 0.0008 0.0140 0.0188 va ihto LPJ JMK mjmk Kaikki ottelut ka. 36420.2438 0.0025 0.0215 0.0185 otosv 2.503E+09 8.93E 07 3.10E 04 2.37E 04 otoskh 50034.71 0.0009 0.0176 0.0154 Taulukko 4: Jääkiekkoliigojen ottelukohtaiset vaihdot ja estimointivirheet. Sarja/parametri La Liga (08 09) 1.661 1.237 0.787 0.874 0.553 0.684 EPL (08 09) 1.4 1.079 0.613 0.787 0.434 0.645 Virhe La Liga (08 09) 0.0008 0.0012 0.0026 0.0003 0.0007 0.0039 Virhe EPL (08 09) 0.0014 0.0049 0.0002 0.0007 0.0002 0.0082 Taulukko 5: La Ligan ja Valioliigan maali intensiteettiparametrit, sekä niillä laskettujen jakauma estimaattoreiden virheet pelijakauma 1 2 3 4 5 lopullinen kello 13.20 14.20 15.20 16.20 17.20 lopullinen vaihto 1868 2178 2651 3532 4407 6785.1 virhe 0.0039 0.0027 0.0017 0.0018 0.0008 0.0000 Taulukko 6: Pelijakauman kehittyminen 16
17
Liiga / turnaus ottelu nro koti vieras Liiga / turnaus ottelu nro koti vieras LaLiga 1 Barcelona Valladolid VeikkausL 1 HJK TPS LaLiga 2 Barcelona At. Madrid VeikkausL 2 Fc Lahti Tampere U LaLiga 3 Real Madrid Sevilla VeikkausL 3 HJK KuPS LaLiga 4 Real Madrid Valencia VeikkausL 4 RoPS Fc Honka LaLiga 5 Barcelona Real Madrid VeikkausL 5 Inter MyPa LaLiga 6 Real Madrid Barcelona VeikkausL 6 HJK Fc Inter LaLiga 7 Osasuna Barcelona VeikkausL 7 TPS MyPa LaLiga 8 Villareal Real Madrid VeikkausL 8 TPS Fc Haka EPL 1 Manchester U Arsenal ConfCup 1 USA Brasili a EPL 2 Chelsea Liverpool ConfCup 2 Espanja USA EPL 3 Liverpool Arsenal ConfCup 3 USA Brasilia EPL 4 Manchester U Chels ea ConfCup 4 Espanja E Afrikka EPL 5 Manchester U Liverpool ConfCup 5 Brasilia E Afrikka EPL 6 Chelsea Manchester U EM08 1 Venäjä Espanja EPL 7 Liverpool Chelsea EM08 2 Portugali Saksa EPL 8 Arsenal Liverpool EM08 3 Hollanti Italia SerieA 1 Milan Lazio EM08 4 Tsekki Portugali SerieA 2 Fiorentina Juventus EM08 5 Kroatia Saksa SerieA 3 Juventus Udinese SM Liiga 1 JYP TPS SerieA 4 Udinese Milan SM Liiga 2 Jokerit Kärpät SerieA 5 Inter Siena SM Liiga 3 JYP Kärpät SerieA 6 Milan Juventus SM Liiga 4 Blues Tappara SerieA 7 Juventus Catania SM Liiga 5 Kärpät JYP SerieA 8 Inter Lazio SM Liiga 6 Kärpät Blues BundL 1 Hamburg Berlin SM Liiga 7 Lukko Kalpa BundL 2 Karlsruher Fc Köln SM Liiga 8 HIFK Jokerit BundL 3 Bayern München HSV NHL 1 Detroit Rangers BundL 4 Leverkusen Fc Köln NHL 2 Detroit Pittsburgh BundL 5 Schalke 04 Werder Bremen NHL 3 Detroit Chicago BundL 6 Bayern München Vfb Stuttgart NHL 4 St. Louis Los Angeles BundL 7 Hoffenheim Bayern München NHL 5 Phoenix Pittsburgh BundL 8 E. Frankfurt Karlsruher NHL 6 Pittsburgh Detroit NHL 7 Carolina Pittsburgh NHL 8 Nashville Detroit Taulukko 11: Kaikki analyyseissä käytetyt ottelut 18
12.2 Kuvat 0,12 keskimääräiset virheet selitysjakaumille 0,1 0,08 0,06 0,04 LPJ JMK mjmk 0,02 0 LaLiga EPL SerieA BundL VeikkausL Kuva 1: keskimääräiset virheet selitysjakaumille jalkapalloliigat 0,3000 Vaihdon ja virheen riippumattomuus Virhe 0,2500 0,2000 0,1500 0,1000 0,0500 JMK LPJ mjmk 0,0000 0 10000 20000 30000 Vaihto Kuva 2: Vaihdon ja virheen riippumattomuus jalkapalloliigat 19
Kuva 3: Kotijoukkueiden maalit jalkapallossa (liigat) Kuva 4: Vierasjoukkueiden maalit jalkapallossa (liigat) 20
0,03 Keskimääräiset virheet selitysjakaumille 0,025 0,02 0,015 0,01 SM Liiga NHL 0,005 0 LPJ JMK mjmk Kuva 5: Jääkiekko otteluiden ennustusmenetelmien keskimääräiset virheet. Kuva 6: Jääkiekko otteluiden pelijakaumien estimoinnit 21
Kuva 7: Poisson jakauman optimointi valituille otteluille Kuva 8: Negatiivisen binomijakauman optimointi valituille otteluille 22
Kuva 9: Pelijakauman kehittyminen ottelussa Fc Inter Fc Sheriff Kuva 10: La Ligan ja Valioliigan kauden 08 09 maalijakaumat, sekä niiden estimaattorit 23