Ilmari Juva. Jalkapallo-ottelun lopputuloksen stokastinen mallintaminen



Samankaltaiset tiedostot
1. Luvut 1, 10 on laitettu ympyrän kehälle. Osoita, että löytyy kolme vierekkäistä

Uuden eläkelaitoslain vaikutus allokaatiovalintaan

Työn tavoitteita. 1 Johdanto. 2 Ideaalikaasukäsite ja siihen liittyvät yhtälöt

Jaksolliset ja toistuvat suoritukset

3.5 Generoivat funktiot ja momentit

Kuluttajahintojen muutokset

FYSA220/2 (FYS222/2) VALON POLARISAATIO

6. Stokastiset prosessit (2)

ABTEKNILLINEN KORKEAKOULU

Monte Carlo -menetelmä

Mat Lineaarinen ohjelmointi

Työn tavoitteita. 1 Johdanto. 2 Ideaalikaasukäsite ja siihen liittyvät yhtälöt

Luento 6 Luotettavuus Koherentit järjestelmät

Markov-prosessit (Jatkuva-aikaiset Markov-ketjut)

Tarkastellaan kuvan 8.1 (a) lineaarista nelitahoista elementtiä, jonka solmut sijaitsevat elementin kärkipisteissä ja niiden koordinaatit ovat ( xi

Työllistääkö aktivointi?

HASSEN-WEILIN LAUSE. Kertausta

MS-A0205/MS-A0206 Differentiaali- ja integraalilaskenta 2 Luento 7: Lagrangen kertojat. Pienimmän neliösumman menetelmä.

Mittausepävarmuus. Mittaustekniikan perusteet / luento 7. Mittausepävarmuus. Mittausepävarmuuden laskeminen. Epävarmuuslaskelma vai virhearvio?

Kollektiivinen korvausvastuu

Lohkoasetelmat. Lohkoasetelmat. Lohkoasetelmat: Mitä opimme? Lohkoasetelmat. Lohkoasetelmat. Satunnaistettu täydellinen lohkoasetelma 1/4

Mittausvirhe. Mittaustekniikan perusteet / luento 6. Mittausvirhe. Mittausepävarmuus ja siihen liittyvää terminologiaa

3.3 Hajontaluvuista. MAB5: Tunnusluvut

Mat Tilastollinen päättely 7. harjoitukset / Tehtävät. Hypoteesien testaus. Avainsanat:

Tilastollisen fysiikan luennot

1, x < 0 tai x > 2a.

Tchebycheff-menetelmä ja STEM

Hallin ilmiö. Laatija - Pasi Vähämartti. Vuosikurssi - IST4SE. Tekopäivä Palautuspäivä

Aamukatsaus

A250A0100 Finanssi-investoinnit Harjoitukset

7. Modulit Modulit ja lineaarikuvaukset.

Ilmanvaihdon lämmöntalteenotto lämpöhäviöiden tasauslaskennassa

KUVIEN LAADUN ANALYSOINTI

Suurivaltaisin, Armollisin Keisari ja Suuriruhtinas!

Tavoitteet skaalaavan funktion lähestymistapa eli referenssipiste menetelmä

JYVÄSKYLÄN YLIOPISTO Taloustieteiden tiedekunta

Turingin kone on kuin äärellinen automaatti, jolla on käytössään

COULOMBIN VOIMA JA SÄHKÖKENTTÄ, PISTEVARAUKSET, JATKUVAT VARAUSJAKAUMAT

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

SU/Vakuutusmatemaattinen yksikkö (5)

Työssä tutustutaan harmonisen mekaanisen värähdysliikkeen ominaisuuksiin seuraavissa

Mittaustulosten käsittely

4. A priori menetelmät

Rahastoonsiirtovelvoitteeseen, perustekorkoon ja vakuutusmaksukorkoon liittyvät laskentakaavat ja periaatteet

on määritelty tarkemmin kohdassa 2.3 ja pi kohdassa 2.2.

Mat /Mat Matematiikan peruskurssi C3/KP3-I Harjoitus 2, esimerkkiratkaisut

r i m i v i = L i = vakio, (2)

Kokonaislukuoptimointi

Yksikköoperaatiot ja teolliset prosessit

Tietojen laskentahetki λ α per ,15 0,18 per ,15 0,18 per tai myöhempi 0,20 0,18

Jaetut resurssit. Tosiaikajärjestelmät Luento 5: Resurssien hallinta ja prioriteetit. Mitä voi mennä pieleen? Resurssikilpailu ja estyminen

Moderni portfolioteoria

Timo Tarvainen PUROSEDIMENTIIANALYYSIEN HAVAINNOLLISTAMINEN GEOSTATISTIIKAN KEINOIN. Outokumpu Oy Atk-osasto

d L q i = V = mc 2 q i 1 γ = = p i. = V = γm q i + QA i. ṗ i + Q A i + Q da i t + j + V + Q φ

Maanhintojen vikasietoisesta mallintamisesta

Hanna-Kaisa Hurme Teräksen tilastollinen rakenneanalyysi Diplomityö

Yrityksen teoria ja sopimukset

Mekaniikan jatkokurssi Fys102

Puupintaisen sandwichkattoelementin. lujuuslaskelmat. Sisältö:

HY, MTO / Matemaattisten tieteiden kandiohjelma Tilastollinen päättely II, kevät 2018 Harjoitus 7B Ratkaisuehdotuksia.

Galerkin in menetelmä

Sähkökiukaan kivimassan vaikutus saunan energiankulutukseen

SU/Vakuutusmatemaattinen yksikkö (6)

13. Lineaariset ensimmäisen kertaluvun differentiaalisysteemit

Mat Tilastollisen analyysin perusteet, kevät 2007

= E(Y 2 ) 1 n. = var(y 2 ) = E(Y 4 ) (E(Y 2 )) 2. Materiaalin esimerkin b) nojalla log-uskottavuusfunktio on l(θ; y) = n(y θ)2

Geneettiset algoritmit ja luonnossa tapahtuva mikroevoluutio

Saatteeksi. Vantaalla vuoden 2000 syyskuussa. Hannu Kyttälä Tietopalvelupäällikkö

Kansainvälisen konsernin verosuunnittelu ja tuloksenjärjestely

Ilkka Mellin (2008) 1/24

Mat Koesuunnittelu ja tilastolliset mallit. Yhden selittäjän lineaarinen regressiomalli. Avainsanat:

1. (Monisteen teht. 5.16) Eräiden kuulalaakereiden kestoa (miljoonaa kierrosta) on totuttu kuvaamaan Weibull-jakaumalla, jonka tiheysfunktio on

1 0 2 x 1 a. x 1 2x c b 2a c a. Alimmalta riviltä nähdään että yhtälöyhmällä on ratkaisu jos ja vain jos b 3a + c = 0.

Rahastoonsiirtovelvoitteeseen ja perustekorkoon liittyvät laskentakaavat. Soveltaminen

PPSS. Roolikäyttäytymisanalyysi Tämän raportin on tuottanut: MLP Modular Learning Processes Oy Äyritie 8 A FIN Vantaa info@mlp.

Paikkatietotyökalut Suomenlahden merenkulun riskiarvioinnissa

Kuntoilijan juoksumalli

Mat Sovelletun matematiikan erikoistyö. Sijoitussalkun optimointi Black-Litterman -mallilla

MTTTP1 SELITYKSIÄ JA ESIMERKKEJÄ KAAVAKOKOELMAN KAAVOIHIN LIITTYEN

Palkanlaskennan vuodenvaihdemuistio 2014

VATT-TUTKIMUKSIA 124 VATT RESEARCH REPORTS. Tarmo Räty* Jussi Kivistö** MITATTAVISSA OLEVA TUOTTAVUUS SUOMEN YLIOPISTOISSA

Esitä koherentin QAM-ilmaisimen lohkokaavio, ja osoita matemaattisesti, että ilmaisimen lähdöstä saadaan kantataajuiset I- ja Q-signaalit ulos.

A = B = T = Merkkijonon A osamerkkijono A[i..j]: n merkkiä pitkä merkkijono A:

Matematiikan ja tilastotieteen laitos Johdatus diskreettiin matematiikkaan (Syksy 2008) 4. harjoitus Ratkaisuja (Jussi Martin)

VERKKOJEN MITOITUKSESTA

Paperikoneiden tuotannonohjauksen optimointi ja tuotefokusointi

S , FYSIIKKA III (ES), Syksy 2002, LH 4, Loppuviikko 39. Partitiofunktiota käyttäen keskiarvo voidaan kirjoittaa muotoon

Ilkka Mellin. Sovellettu todennäköisyyslasku: Kaavat ja taulukot

AINEIDEN OMINAISUUKSIIN PERUSTUVA SEOSTEN LUOKITUS JA VAARAA OSOITTAVAT LAUSEKKEET

4. Datan käsittely lyhyt katsaus. Havaitsevan tähtitieteen peruskurssi I, luento Thomas Hackman

Painotetun metriikan ja NBI menetelmä

9. Jakojärjestelmät. Sisältö. Puhdas jakojärjestelmä. Yksinkertainen liikenneteoreettinen malli

Segmentointimenetelmien käyttökelpoisuus

TYÖVOIMAKOULUTUKSEN VAIKUTUS TYÖTTÖMIEN TYÖLLISTYMISEEN

FDS-OHJELMAN UUSIA OMINAISUUKSIA

Mat Sovellettu todennäköisyyslasku A

OUTOKUMPU OY 0 K MALMINETSINTA. talta.

Usean muuttujan funktioiden integraalilaskentaa

AB TEKNILLINEN KORKEAKOULU

3 Tilayhtälöiden numeerinen integrointi

Transkriptio:

Ilmar Juva 45727R Mat-2.108 Sovelletun matematkan erkostyö Jalkaallo-ottelun loutuloksen stokastnen mallntamnen

1 Johdanto Jalkaallo-ottelun loutuloksen mallntamsesta tlastollsn ja todennäkösyyslaskun kenon on olemassa jotakn tutkmuksa. Tässä työssä lähteenä käytetyssä tutkmuksssa on ollut tavotteena muodostaa mall joka elattujen ottelujen anestosta ystys ennustamaan määrätyn ottelun loutulosvahtoehtojen todennäkösyydet. Merkttävä osa-alue tällasen malln luomsessa on löytää jakauma jolla mallntaa joukkueden maalmäärät. Ylesest käytetty lähtökohta on Posson-jakauma. Tutkmustulokssta on kutenkn huomattu ettevät Posson-jakauman ennustamat loutulosten todennäkösyydet vastaa täysn toteutuneta tuloksa kaklta osn. Erlasa korjaustermejä Posson-jakaumaan on estetty aremman malln löytämseks, mutta varsnasest syytä lmölle e ole ohdttu. Aemmat tutkmukset ovat keskttyneet van ottelujen loutuloksen analysontn. Tässä työssä tutktaan loutulosten lsäks myös maalen syntymsen ntensteettä ottelun tlanteeseen ehdollstaen. Tällä lähestymstavalla seltetään loutulosten jakauman eroavasuudet Posson-jakaumasta ja muodostetaan Markovmall jolla ottelun loutulosjakaumaa vodaan mallntaa, olettaen että käytössä on arvot joukkueden ottelussa tekemen maalen odotusarvolle. Se mten tällaset arvot saadaan jätetään tämän työn tarkastelun ulkouolelle. 2 Posson-jakauma Taahtuma on Posson-jakautunut kun se esntyy satunnasn akavälen keskmäärn θ kertaa akaykskössä [7]. Esmerkk Posson-jakautuneesta satunnasmuuttujasta on johonkn alvelusteeseen tetyllä akavälllä saauvat asakkaat. Odotusarvo θ vodaan estmoda tällön aemna vastaavna ajanjaksona toteutunesta asakasmäärstä. Tonen esmerkk vos olla hajonneden komonentten lukumäärä koneessa tetyllä ajanjaksolla. Odotusarvo vodaan jälleen estmoda koneen käytössä saadusta tlastosta. Samalla tavalla jalkaallo-ottelussa vodaan joukkueden tekemät maalmäärät estmoda tlastosta esmerkks tarkasetelemalla saman tyysten otteluden aema tuloksa. Näden keskarvosta saadaan odotusarvot: kotjoukkue tekee kesk- 1

määrn λ maala ja verasjoukkue µ maala. Maalen syntymsen akavälen vos olettaa olevan satunnasa. Ratanen [3] toteaa että lajn luonne vttas shen että maallukujen jakauma saattas noudattaa Posson-jakaumaa. Jos joukkueden maalmäärät noudattavat Posson jakaumaa, vodaan krjottaa X P osson(λ) Y P osson(µ), mssä satunnasmuuttuja X on kotjoukkueen maalmäärä ottelussa ja Y vastaavast verasjoukkueen maalmäärä ja ne noudattavat Posson-jakaumaa odotusarvolla λ ja µ. Tällön todennäkösyys että kotjoukkueen maalmäärä ottelussa on täsmälleen x on estetty kaavassa (1), ja vastaavast todennäkösyys että verasjoukkue tekee täsmälleen y maala on estetty kaavassa (2). P (X = x) = λx e λ (1) x! P (Y = y) = µy e µ. (2) y! Kaaleessa 4.1 tutktaan vodaanko maalmäären jakauman katsoa noudattavan Posson-jakaumaa. Lsäks jos tarkotus on arvoda ottelun tulosten todennäkösyydet Posson-jakauman avulla kaavan (3) mukasest, on joukkueden maalmäären oltava rumattomat tosstaan. Tätä tutktaan kaaleessa 4.2. Jos rumattomuusehto maalmäären välllä ätee, vodaan ottelun loutuloksen x-y,jossa ss kotjoukkue tekee x maala ja verasjoukkue y maala, todennäkösyys esttää muodossa P (X = x, Y = y) = λx e λ x! µy e µ. (3) y! 3 Krjallsuuskatsaus 3.1 Varhasmmat tutkmukset Ilmesest ensmmäsen kerran Posson-jakauman soveltuvuutta jalkaallotuloksn tutkttn vuonna 1956 [3, 4]. Moroney [1] tutk tuollon maalmäärä jalkaalloottelussa ja totes Posson-jakauman olevan "adeuate ft"tulosanestoon, mut- 2

ta ääty negatvsen bnomjakaumaan käyttöön. Vuonna 1982 Maher [2] tutk usean er lgan maaljakauma ja totes nden noudattavan osson-jakaumaa, jotakn systemaattsa eroja lukuunottamatta. Mahern mall ol myös ensmmänen, joka e tyytynyt tutkmaan tkän ajan keskarvoja vaan yrtt mallntaa yksttäsen ottelun tulostodennäkösyyksä. Hän olett kot- ja verasmaalen olevan tosstaan rumattomast Posson-jakautuneta ja estmo ottelukohtaset odotusarvot aemmsta tulokssta suurmman uskottavuuden menetelmällä. Tämä mall ol ohjana Dxonn ja Colesn kehttämälle malllle. 3.2 Dxon ja Coles Dxon ja Coles [4] tutkvat vuosen 92 95 välllä Englannn neljällä ylmmällä sarjatasolla elattujen ottelujen tuloksa ja muodostvat emrset estmaatt er loutulosvahtoehdolle. Anestosta saadut tulosten reunajakaumat kot- ja verasjoukkueen maalmäärlle noudattvat erttän tarkast Posson-jakaumaa. Maalmäären rumattomuutta tutkttn emrsen jakauman avulla laskemalla kullekn tulokselle x-y suure f(x, y) f kot (x) f veras (y), (4) jossa f on tulosten emrnen jakauma ja f kot sekä f veras kot- ja verasjoukkueen maalmäären reunajakaumat. Jos rumattomuusehto ätee, täs kysesen suureen olla lkman 1.0. Dxon ja Coles toteavat että rumattomuus ehto ätee, lukuun ottamatta tuloksa 0-0,1-0,0-1,1-1. Nästä tasaeltulokset 0-0 ja 1-1 esntyvät useammn kun kaava (3) antas odottaa, kaks muuta uolestaan harvemmn. He ottvat käyttöön korjaustermn ja määrttelvät tuloksen x-y todennäkösyyden seuraavast mssä P (X,j = x, Y,j = y) = τ λ,µ (x, y) λx e λ x! 1 λµρ jos x = y = 0 1 + λρ jos x = 0, y = 1 τ λ,µ (x, y) = 1 + µρ jos x = 1, y = 0 1 ρ jos x = y = 1 1 muualla. µy e µ, (5) y! (6) 3

Tässä mallssa ρ = 0 vastas rumattomuutta. Dxon ja Coles esttvät artkkelssaan myös Mahern malln ohjautuvan malln, jolla suurmman uskottavuuden menetelmällä estmodaan sarjan kaklle joukkuelle hyökkäys- ja uolustusarametrt, joden funktona määrteltn maalodotusarvot λ ja µ. 3.3 Ratanen Ratanen [3] tutk Englannn Valolgan tuloksa vuosen 1994 ja 1998 välseltä ajalta. Hän havats että anestossa maallukujen varanss on suurem kun keskarvo, mkä vttaa shen ette Posson-jakauma äde, sllä Posson-jakaumassa varanss on yhtä suur kun keskarvo. Hän toteaakn, tosn kun Dxon ja Coles, ette Posson-jakauma ole tyydyttävä mall maalmäären todennäkösyyksen arvontn ja ottaa käyttöön ylestetyn Posson-jakauman, jonka osottaa sovan anestoon selkeäst aremmn χ 2 -yhteensovuustestn erusteella. Rumattomuutta Ratanen tutk χ 2 -rumattomuustestllä sekä Bootstra menetelmällä. Hän toteaa että ennumerosten tulosten arvota on korjattava. Ratanen havats että Dxonn ja Colesn "korjaustermä e voda kutenkaan käyttää ylesest mulle tulokslle, koska sllon reunajakaumat muuttuvat ja todennäkösyyksen summasta tulee ersuur kun yks"[3]. Hän esttää arannellun korjaustermn, jolla vo korjata mnkä tahansa tulosten todennäkösyyttä, kun löydetään maalluvut x 1,x 2 sekä y 1, y 2 sten että x 1 -y 1 sekä x 2 -y 2 tuloksen määrä anestossa on suurem kun mall antas odottaa ja vastaavast x 1 -y 2 ja x 2 -y 1 tulosten määrä enem. Ratasen korjausterm on muotoa 1 + ρ jos x = x 1, y = y 1 ˆπ x1 + (1+ρ)ˆπ x1 y 1 ˆπ x1 y 2 jos x = x 1, y = y 2 ˆπ +y1 (1+ρ)ˆπ x1 y 1 ˆπ x2 y 1 jos x = x 2, y = y 1 ˆπ ++ {(1+ρ)ˆπ x1 y 1 +[ˆπ x1 + (1+ρ)ˆπ x1 y 1 ]+[ˆπ +y1 (1+ρ)ˆπ x1 y 1 ]} [ˆπ x2 y 2 ] jos x = x 2, y = y 2 1 muualla, (7) mssä ˆπ x1 + ja ˆπ +y1 ovat reunatodennäkösyyksä ja ˆπ ++ on neljän korjattavan tu- 4

loksen odotettu kokonastodennäkösyys, sekä ρ ruvuusarametr kuten kaavassa (6). Sen arvo vodaan selvttää taauskohtasest teromalla, laskemalla χ 2 - testsuure malln antamlle odotetulle frekvensselle verrattuna toteutunelle frekvensselle, ja etstään testsuureen mnmova ρ arvo. 3.4 Rue ja Salvesen Rue ja Salvesen [5] toteavat että vakka Posson oletus on järkeenkäyä, se e välttämättä dä akkaansa sllon, kun tonen joukkuesta tekee runsaast maaleja ja srtyy käytännössä tavottamattomaan johtoon. Tällanen tlanne lannstaa taolla olevan joukkueen, ja johtaa maalntekontensteetn muutokseen, joka on rstrdassa oletuksen kanssa että maal-ntensteett e ole ruvanen ottelussa aemmn tehdystä maalesta. Rue ja Salvesen muokkaavat Dxonn ja Colesn malla nn että joukkueen vdennen maaln jälkeen tehtyjä maaleja e oteta huomoon joukkueden hyökkäys- ja uolustusarametreja määrteltäessä. 4 Posson tarkastelut Tarkasteltaessa stä vodaanko ottelun loutulosten todennäkösyyksä mallntaa Posson-jakaumalla, tulee todeta kaks asaa. Ensnnäkn, ovatko loutulosten todennäkösyystaulukon reunajakaumat, el joukkuekohtaset maalfrekvensst Possonjakautuneta. Toseks, ovatko kot- ja verasjoukkueen maalt rumattoma tosstaan. Usemmat aemmat tutkmukset ovat keskttyneet Englannn lgan otteluhn, mutta tässä työssä tutktaan Italan ylmmän sarjatason, Sere A:n, otteluta vuosen 1994 2001 välllä. 4.1 Reunajakaumen Possonsuus Dxonn ja Colesn [4] aneston reunajakaumat noudattavat tarkast Posson-jakaumaa kun taas Ratasen [3] aneston reunajakaumat evät noudata stä yhtä tarkast. Molemmat tutkvat Englannn lgan otteluta, joten eroavuus on heman yllättävä, 5

mutta johtunee stä että Dxonn ja Colesn otos ssältää myös alemen dvsoonen otteluta. Taulukossa 1 on estetty otteluden loutulosten reunajakaumat ts. kot- ja verasjoukkueen maalmäären havatut frekvensst n sekä kot- ja verasjoukkueden keskmäärässtä maalmäärstä Posson-jakaumalla lasketut odotetut frekvensst g. maala n kot g kot n veras g veras 0 431 433 749 786 1 691 700 787 757 2 554 540 414 395 3 296 298 145 133 4 119 117 38 53 5 38 37 8 15 6+ 12 15 3 1 Taulukko 1: Maalmäären havatut ja odotetut frekvensst χ 2 -yhteensovuustestssä vodaan tutka noudattaako anesto tettyä jakaumaa [9]. Testataan ovatko havatut maalfrekvensst sousonnussa sen oletuksen kanssa että maalmäärät olsvat Posson-jakautuneta. Testsuureessa anestosta kerätty otos, tässä taauksessa joukkueden maalmäärät, muodostaa havatut frekvensst n 1,...,n k. Posson-hyoteesn mukaset odotetut frekvensst ovat uolestaan g 1,...,g k. Nyt ss n 1 on sellasten ottelujen määrä anestossa jossa joukkue on tehnyt nolla maala, n 2 sellasten ottelujen määrä jossa joukkue on tehnyt yhden maaln ja nn edelleen. g 1 on Posson-jakauman antama todennäkösyys slle että joukkue tekee nolla maala kerrottuna havantojen kokonasmäärällä n. g = n P (X = 1), = 1,..., k. (8) jossa satunnasmuuttuja X on Posson-jakautunut odotusarvolla λ kotjoukkueen maalmäärälle ja odotusarvolla µ verasjoukkueen maalmäärlle. Odotusarvona käytetään aneston keskarvoja. Havattujen ja odotettujen frekvenssen yhteensovuutta vodaan testata suureella k χ 2 (n g ) 2 0 =, (9) g =1 6

joka on χ 2 -jakautunut vaausarametrllä k 1. Otetaan nollahyoteesks H 0 : Maalmäärät noudattavat Posson-jakaumaa χ 2 -testsuureen arvo kotjoukkueelle on χ 2 0 = ja vastaavast verasjoukkueelle χ 2 0 = k =1 k =1 (n kot (n veras g kot ) 2 g kot g veras ) 2 g veras = 1.16 (10) = 16.44 (11) -arvoks tulee kotjoukkueen kohdalla 0.979 ja verasjoukkueen kohdalla 0.012. Verasjoukkueen maalmäären osalta nollahyotees joudutaan ss hylkäämään. On kutenkn otettava huomoon että sarjassa elataan lähtökohdltaan hyvn erlasa otteluja. Verasjoukkueen maalmäärän odotusarvo on varmast erlanen sellasessa ottelussa, jossa sarjan kärkjoukkue kohtaa sarjan hekomman joukkueen, kun sellasessa ottelussa, jossa verasjoukkue on joukkuesta tasokkaam. Tämä saattaa väärstää tuloksen vakka Posson-oletus yksttäsessä ottelussa olskn okeutettu, kuten seuraavasta esmerkstä huomataan. Esmerkk 1 Olkoon uolet havatusta maalmäärstä Posson-jakautuneta odotusarvolla 0.5 ja tonen uol odotusarvolla 1.5. Jos nästä kootaan edellsen taulukon kokonen non 2000 havannon anesto, tulee ss kummastakn 1000 havantoa. Keskmääränen maalmäärä on 1.0 jota käytetään Possonjakauman odotusarvona odotettuja frekvensseja laskettaessa. Taulukossa 2 on estetty jakaumat josta vasemman uolenen odotettu frekvenss on ss Posson jakautunut odotusarvolla 1.00 ja okean uolenen otos on yhdstetty kahdesta edellä mantusta jakaumasta. Taulukosta huomataan ettevät havatut frekvensst vastaa tosan kovnkaan tarkast. χ 2 0 = 21.3 ja χ 2 - testsuureen -arvoks saadaan 0.0016, el Posson-oletus jouduttasn tämän erusteella hylkäämään, vakka koko anesto ol nmenomaan Posson-jakaumaa käyttäen generotu. 7

maala Posson(1)-jakauma yhdstetty jakauma 0 446 503 1 669 639 2 502 455 3 251 242 4 94 106 5 28 39 6+ 9 17 Taulukko 2: Posson(1.0) -jakauman odotetut frekvensst vs. Posson(0.5) ja Posson(1.5) jakaumsta yhdstetty jakauma On ss syytä olla tarkkana Posson-omnasuuksa tutkessa. Edellsen esmerkn valossa yrtään tarkastelemaan van lähtöasetelmltaan mahdollsmman samankaltasa otteluja. Taulukossa 3 on estetty odotetut ja havatut frekvensst rajatusta anestosta, jossa huomodaan van tasavahvojen joukkueden välset ottelut. Tasavahvojen joukkueden välnen ottelu tässä yhteydessä tarkottaa ottelua, jossa aremman joukkueen kauden akana keräämät sarjasteet ovat korkentaan 20% suuremmat kun hekomman joukkueen steet. Määrtelmä on varsn melvaltanen, mutta johonkn raja on vedettävä. maala n kot g kot maala n veras g veras 0 144 152 0 268 267 1 246 239 1 276 269 2 191 188 2 126 136 3 98 99 3 43 46 4 41 39 4 14 12 5 7 12 5+ 5 3 6+ 5 4 Taulukko 3: Maalmäären havatut ja odotetut frekvensst tasavahvojen joukkueden ottelussa Nyt χ 2 -testsuureen -arvoks saadaan kotjoukkueen kohdalla 0.793 ja verasjoukkueen kohdalla 0.733. Vomme ss hyväksyä nollahyoteesn maallukujen 8

Posson-jakautunesuudesta. Tässäkn anestossa on velä mukana erlasa otteluja. Vakka kakk ottelut ovat lähtökohtasest tasavahvojen joukkueden välllä, jodenkn joukkueden eltyyl johtaa suuremn maallukuhn kun tosten. Jos tämäkn ystyttäsn ottamaan huomoon, saattasvat toteutuneet jakaumat noudattaa veläkn tarkemmn Posson-jakaumaa. 4.2 Kot- ja verasjoukkueen maalen rumattomuus Aemmn on kot- ja verasjoukkueen maallukujen välstä ruvuutta tutkttu van vertalemalla toteutuneden loutuloksen frekvenssejä reunajakaumen tulon antamaan odotettuun frekvenssn. Dxon ja Coles [4] laskvat kaavan 4 mukaset suureet ja keskvrheet jokaselle loutulokselle. Italan lgan anestosta on taulukossa 4 estetty havattujen loutulosten suhteellnen määrä verrattuna reunajakaumen tulona saatuun odotusarvoon, sekä 95% luottamusväl. 0 1 2 3 0 1, 19 ± 0, 16 0, 78 ± 0, 14 0, 98 ± 0, 21 1, 04 ± 0, 38 1 0, 95 ± 0, 11 1, 13 ± 0, 12 0, 77 ± 0, 15 1, 22 ± 0, 32 2 0, 94 ± 0, 13 1, 03 ± 0, 14 1, 23 ± 0, 21 0, 66 ± 0, 27 3 0, 97 ± 0, 18 0, 93 ± 0, 18 1, 18 ± 0, 28 0, 97 ± 0, 45 4 1, 02 ± 0, 30 1, 04 ± 0, 31 0, 88 ± 0, 39 1, 10 ± 0, 76 Taulukko 4: Loutulosten havattujen frekvenssen ja rumattomuus ehdolla laskettujen odotettujen frekvenssen suhde Myös Italan lgan anestossa huomataan ss sama lmö jonka Dxon ja Coles sekä Ratanen havatsvat Englannn lgan anestosta. Varsnkn enmaalset tasaelt okkeavat ylösän odotetusta määrästä. Aemmssa tutkmuksssa on todettu edellä manttu lmö ja rakennettu mall jolla tämä otetaan huomoon. Sytä tlanteeseen e sen kummemmn ole ohdttu. Seuraavassa kaaleessa tutktaan nätä sytä. 9

4.3 Pokkeaman syyt Rue ja Salvesen [5] huomauttvat, että maalntekontensteett muuttuu kun tonen joukkuesta srtyy tavottamattomaan johtoon. On kutenkn oletettavaa että ntensteett muuttuu mussakn tlantessa, mahdollsest dramaattsestkn. Vuoksenmaa [6] toteaa että tasaelejä jalkaallossa elataan useammn kun maalmäären erusteella vos olettaa. Syy tähän on ennen kakkea sykologsssa tekjössä. "Usemmat elaajat saavat enemmän tyydytystä kahdesta tasaelstä kun yhdestä votosta ja yhdestä taosta."myös lehdstön ja kannattajen ane johtaa shen että "Kukaan e halua ottaa turha rskejä tekemällä vrheen tasatlanteessa. Pel menee todella varovaseks ja tasaeln todennäkösyys kasvaa."[6] Tosaalta taolla oleva joukkue vo ottaa kovakn rskejä tasotusmaala tavotellessaan, koska slle e ole yleensä suuremaa merktystä hävääkö se yhdellä va useammalla maallla. Tutktaan ss maalntekontensteettejä ottelussa ehdollstettuna ottelun tlanteeseen. Ensn täytyy ottaa huomoon että ottelussa jossa kotjoukkue on selväst tasokkaam, äädytään useammn tlanteeseen jossa kotjoukkue on johdossa. Nän ollen jos tarkastellaan kakka sellasa tlanteta jossa kotjoukkue on johdossa, tulee anestoon okkeuksellsen aljon juur sellasa otteluta, jossa kotjoukkue ol alun alkaen tasokkaam ja tämän taka tlasto väärstyy. Otetaan ss mukaan tutkmusanestoon van ennakkoon tasasa otteluta, kaaleessa 4.1 käytetyn krteern mukasest. Taulukossa 5 on estetty maalntekontensteetn ruvuus ottelun tlanteesta. Maalntekontensteett on yksnkertasest nden elmnuutten osuus kaksta elmnuutesta anestossa, joden akana on tehty maal: tehdyt maalt elatut mnuutt, ja yksköks tulee ss maala mnuutssa. Mahdollset tlanteet on jaettu vteen kategoraan: tasatlanne(merkntä: 0), yhden maaln johto kotjoukkueelle (+1), useamman maaln johto kotjoukkueelle (+n), sekä vastaavat verasjoukkueelle ( 1, n). 10

tla yht +n 0.0176 0.0139 0.0315 +1 0.0150 0.0129 0.0279 0 0.0157 0.0091 0.0248-1 0.0204 0.0115 0.0319 -n 0.0195 0.0158 0.0353 yht 0.0164 0.0109 0.0273 Taulukko 5: Maalenntensteett (maala/mnuutt) er tlantessa Luottamusväl nälle vodaan laskea lausekkeesta ˆ(1 ˆ ˆ ± z α/2. n (12) Taulukossa 6 on estetty edellsen taulukon luvut ja nden 95% luottamusvält jaettuna keskmääräsellä ntensteetllä. tlanne kot veras yht +n 1.07 ± 0.18 1.28 ± 0.25 1.15 ± 0.15 +1 0.91 ± 0.11 1.18 ± 0.15 1.02 ± 0.09 0 0.96 ± 0.07 0.83 ± 0.08 0.91 ± 0.06-1 1.24 ± 0.17 1.06 ± 0.20 1.17 ± 0.13 -n 1.19 ± 0.32 1.45 ± 0.43 1.29 ± 0.26 Taulukko 6: Suhteellnen maal-ntensteett er tlantessa Huomataan että useat ntensteetestä eroavat keskmääräsestä ntensteetstä tlastollsest merktseväst. Oletusta maallukujen rumattomuudesta on ss vakea hyväksyä tämän erusteella. Snä mssä aemmat mallnnukset ovat lsälleet korjaustermejä Posson-jakaumaan komensodakseen tätä ruvuutta, kaaleessa 5 rakennetaan stokastnen mall, joka yrk ostamaan tulosten ruvuusongelman ottamalla huomoon tässä kaaleessa havatun maal-ntensteetn muutoksen ottelun tlanteesta ruen. 11

5 Stokastnen mall 5.1 Markov-mall Olkoon kotjoukkueen maal-ntensteett maala mnuutssa ja verasjoukkueen vastaavast maala mnuutssa. Mall on dskreett ajan suhteen, el snä oletetaan että ottelussa vo syntyä van yks maal mnuutta kohden. Tätä vodaan tää järkevänä oletuksena myös käytännön systä sllä maaln juhlmseen ja joukkueden ryhmttymseen alotusta varten kuluu akaa tlanteesta ruen useta kymmenä sekunteja. Yl 2000 ottelun havantoanestossa e ollut yhtään taausta jossa samalla mnuutlla ols tullut useama maaleja. ja ovat sten todennäkösyydet että joukkue tekee maaln tetyllä elmnuutlla. Ottelun alkaessa tlanteesta 0-0, on ss ensmmäsen mnuutn akana todennäkösyys että kotjoukkue tekee maaln ja srrytään tlanteeseen 1-0, ja todennäkösyys että verasjoukkue tekee maaln, jollon srrytään tlanteeseen 0-1. Todennäkösyys ette kumkaan tee maala kysesellä mnuutlla, el ottelu sälyy samassa tlanteessa, on tällön 1. Samalla tavon tlanteesta 0-1 srrytään määrätyllä mnuutlla tlaan 1-1 todennäkösyydellä ja tlaan 0-2 todennäkösyydellä, sekä ysytään tlassa 0-1 todennäkösyydellä 1. Kuvassa 1 on estetty maalntekorosess Markov-mallna. Kysesestä mallsta muodostettava srtotodennäkösyysmatrs ols kutenkn erttän suur. Jos ollaan knnostuneta van kotvoton, tasaeln ja verasvoton todennäkösyyksstä, mall vodaan muuttaa muotoon jossa kakk tasaelt ovat yks tla, kakk kotjoukkueen yhden maaln johdot yks tla jne. Katso kuva 2. Edelleen ongelmana on se, että teorassa tarvttasn tlat ana 90 maaln ast kumaankn suuntaan. Käytännössä kutenkn hyvn harvon joukkue ääsee yl vden maaln johtoon ottelussa, ja velä harvemmn, käytännössä e koskaan, vastustaja ystyy tuollasen eron syntyessä nousemaan takasn tasatlanteeseen, saat vottoon. Malln rajaamseks vden maaln johdot, el tlat (+5) ja ( 5) määrtellään absorbovks tloks. Katso kuva 3. Kuvan 3 rosessa vastaava srtotodennäkösyysmatrs on: 12

1- - 1- - 0-0 1- - 1- - 1-0 1- - 0-1 1- - 1- - 2-0 1-1 0-2 1- - 1- - 1- - 3-0 2-1 1-2 0-3 1- - 1- - Kuva 1: Maalnteko stokastsena rosessna 1- - 1- - 1- - 1- - 1- - 1- - 1- - 1- - +5 +4 +3 +2 +1 0-1 -2-3 -4-5 1- - Kuva 2: Sueam mall, jossa tuloksa e ole eroteltu P = 1 r r r r r r r r r 1 jossa on käytetty merkntää r = 1 selkeyden taka. Kuten aemmn todettn, srtotodennäkösyydet ja evät ole samoja jokaselle tlalle. Srtotoden- 13

1- - 1- - 1- - - 1 - - 1 - - 1-1- - 1- - 1- - 1 1 +5 +4 +3 +2 +1 0-1 -2-3 -4-5 Kuva 3: Sueamman malln äärellnen verso näkösyysmatrs krjotetaan ss muotoon: P = 1 +n r +n +n +n r +n +n +n r +n +n +1 r +1 +1 0 r 0 0 1 r 1 1 n r n n n r n n n r n n 1 jossa ja vastaavast = k kot, (13) = k veras, (14) sekä käytetään lyhennysmerkntää r = 1. Korjauskertomet k ruvat stä tlasta jossa rosess on, ja ne vodaan katsoa taulukosta 6. Matrsssa P on estetty yhden askeleen srtotodennäkösyydet. t askeleen srtotodennäkösyysmatrs P (t) saadaan laskettua korottamalla yhden askeleen srtotodennäkösyysmatrs askelten lukumäärän t otenssn [8]. P (t) = P t (15) Vektor α on rosessn alkujakauma, joka tässä taauksessa on muotoa α = ( 0 0 0 0 0 1 0 0 0 0 ) 0 14

el tasaeltlanteen todennäkösyys alkujakaumassa on α 0 todennäkösyys α = 0. = 1, muden tlojen Nyt vodaan laskea vektor (t) jonka komonentt ovat tlatodennäkösyydet t askeleen jälkeen. (t) = αp (t) = αp t (16) Ottelun tuus on eraatteessa 90 mnuutta, mutta kummankn uolajan loussa elataan lsäks tuomarn antama lsäaka. Ensmmäsen uolajan lsäajalla tehdyt maalt merktään tlastossa 45:llä mnuutlla tehdyks, ja tosen uolajan lsäajalla tehdyt 90:llä mnuutlla tehdyks. Koska käytetyssä Italan lgaan anestossa 45. mnuutlla maaleja on syntynyt lkman kaks kertaa enemmän kun 44. mnuutlla, ja vodaan olettaa että maalntekotodennäkösyys e dramaattsest muutu näden välllä, äätellään että lsäakaa on ollut keskmäärn yks mnuutt. Vastaavast 90. mnuutlla on maaleja nelnkertanen määrä 89. mnuuttn verrattuna, joten lsäakaa on elattu keskmäärn kolme mnuutta. Koko ottelun kesto on ss non 94 mnuutta, el t = 94. loutulos = (94) = αp 94 (17) 5.2 Malln valdont Jos korjauskertomet olsvat k = 1, kaklle tuls malln vastata osson-jakaumasta saatuja todennäkösyyksä. Possonset tlatodennäkösyydet saadaan määrttelemällä kullekn tulokselle todennäkösyys Posson-jakaumasta saatujen reunajakaumen tulona, ja laskemalla yhteen kuhunkn tlaan kuuluvat tulokset. Esmerkks tlaan (0) lukeutuvat ss tulokset 0-0, 1-1, 2-2,.... Taulukossa 7 on estetty Markov-malln antamat tlatodennäkösyydet ja edellä kuvatulla tavalla lasketut tlatodennäkösyydet. Kot- ja verasjoukkueen maal- 15

odotusarvoks ottelussa on otettu jo aemmn käytetystä tasavahvojen joukkueden otteluden anestosta lasketut keskarvot λ = 1.55, µ = 1.02. Jos oletetaan että maalt jakautuvat tasasest ottelun elajalle tehdään tetyllä mnuutlla maal todennäkösyyksllä: = λ t = 1.57 94 = 0.0165 (18) = µ t = 1.02 = 0.0109, (19) 94 jotka ovat, kuten olettaa so, lkman samat kun taulukossa 5 estetyt maalntenssteett samalle anestolle. +n +2 +1 0-1 -2 -n Posson 0,104 0,151 0,241 0,255 0,158 0,065 0,026 Markov-mall 0,104 0,152 0,241 0,253 0,158 0,066 0,026 Taulukko 7: Markov-mall vs Posson-todennäkösyydet Mall vakuttaa tulosten erusteella valdlta. Dskreetn ajan ja tlojen (+5),( 5) absorvovks muuttamsen aheuttama eätarkkuus on ahmmllaankn van 0.5 rosentn luokkaa. 5.3 Malln tomvuus Kaaleen 4.2 taulukossa 4, samon kun aemmssa tutkmuksssa, huomo knntty ertysest enmaalsten tulosten havattujen frekvenssen okkeamseen osson-malln mukassta odotetusta frekvenssestä. Tutkaksemme kunka hyvn Markov-mall ennustaa nämä okkeamat, muodostetaan rosess joka on yhdstelmä kuven 1 ja 3 rosessesta. Tulokset 0-0, 1-0, 0-1 ja 1-1 erytetään omks tlokseen, mutta multa osn detään mall kuvan 3 kaltasessa muodossa, sälyttäen tlat (+5) ja ( 5) absorvovna. Katso kuva 4 srtotodennäkösyysmatrssta P tulee nyt heman sekavam, joten se on selkeyden vuoks estetty taulukossa 8. Myös vektorn α tehdään tarvttavat lsäykset. Nän kaavasta (17) saadaan tulokseks vektor, jossa on todennäkösyydet 16

1 - - 1 - - 0-0 1 - - 1-0 1 - - 0-1 1-1 +3 +2 +1 0-1 -2-3 1 - - 1 - - 1 - - 1 - - 1 - - 1 - - 1 - - Kuva 4: Markov-mall, jossa ennumeroset tulokset erytetty omks tlokseen mantulle neljälle vähämaalselle tulokselle, sekä maaleron mukaan luoktellulle tlolle. On huomattava, että tlat (+1), (0) ja ( 1) evät nyt ss ssällä edellä manttuja tuloksa. Korjauskertomet on valttu taulukon 6 mukasest: k kot = 1.07 jos 2 0.91 jos = 1 0.95 jos = 0 1.24 jos = 1 1.19 jos 2 k veras = 1.28 jos 2 1.18 jos = 1 0.83 jos = 0 1.06 jos = 1 1.45 jos 2 Tlossa 0-0 ja 1-1 käytettän kerronta k 0, tlassa 1-0 kerronta k 1 ja tlassa 0-1 kerronta k 1. 17

5 4 3 2 1 1-0 1-1 0-0 0 0-1 1 2 3 4 5 5 1 4 r 3 r 2 r 1 r 1-0 r 1-1 r 0-0 r 0 r 0-1 r 1 r 2 r 3 r 4 r 5 1 Taulukko 8: Kuvan 4 mukasen Markov-malln srtotodennäkösyysmatrs +n +2 +1 1-0 1-1 0-0 0 0-1 1 2 n Havatut frekvensst 73 105 90 114 37 89 68 55 41 41 19 Posson 78,6 111,9 90,1 87,9 56 86,2 54,9 42,1 58,6 47,2 18,4 Dxon & Coles 78,6 111,9 90,1 101,4 42,5 72,8 68,4 42,1 58,6 47,2 18,4 Markov-mall 68,4 98 100 105,5 42,8 90,7 68,6 52,4 50,8 35,1 19,8 χ 2 0 -arvo Posson 28.2 0.002 Dxon & Coles 16.8 0.080 Markov-mall 6.4 0.782 Taulukko 9: Mallen yhteensovuustest havantoaneston kanssa Taulukossa 9 on estetty er mallen antamat odotetut frekvensst sekä nden yhteensovuus aneston havattujen frekvenssen kanssa. Kaaleessa 3 estelty Dxonn ja Colesn mall saavuttaa enmmän χ 2 0 -arvon kun ρ = 0.153. Markovmall on kutenkn selväst aremmn soveltuva, anakn tähän anestoon. On 18

kutenkn huomotava että Dxonn ja Colesn mallssa arametreja on van kolme: λ, µ ja ρ. Markov-mallssa sen sjaan arametreja on kakstosta:, sekä 10 korjauskerronta k. 5.4 Malln käyttö yksttäsen ottelun todennäkösyysarvoon Arvodaan odotusarvot λ ja µ joukkueden maalmäärllä ottelussa. Tämä vodaan tehdä esmerkks Dxonn ja Colesn [4] ehdottamalla suurmman uskottavuuden menetelmällä. Lasketaan maaltekontensteett ja kaavojen (18,19) mukasest. Katsotaan korjauskertomet k taulukosta 6, ja muodostetaan tlaruvat maalntensteett ja kaavojen (13,14) mukaset. Tämän jälkeen vodaan muodostaa srtotodennäkösyysmatrs P. Ottelun loutuloksen tlatodennäkösyysvektor on loutulos = αp 94 (20) Malla vodaan käyttää myös arvomaan loutuloksa ottelun ollessa käynnssä. Esmerkks jos ottelua on elattu t mnuutta, ja tlanne on x-y, saadaan arvo er tulosten todennäkösyykslle kaavan (21) mukasest, kun muutetaan alkujakaumavektora α sten, että tulosta x-y vastaava alko on yks ja muut nolla. loutulos = αp 94 t (21) Tällön ols kutenkn oletettava että tlakohtaset maalntekontensteett ysyvät vakona koko ottelun ajan, mkä e todennäkösest dä akkaansa. 6 Yhteenveto Tässä työssä tutkttn jalkaallo-ottelun loutuloksen mallntamsta Posson-jakauman ja stokastsen Matrkov-malln avulla. Kuten aemmssakn tutkmuksssa, huomattn ette Posson-jakauma mallnna tarkast kakken loutulosten todennäkösyyksä, sllä joukkueden maallukujen rumattomuus e äde. Tämä osotettn loutulosjakaumen lsäks myös tutkmalla maalnteko-ntensteettä ottelun er tlantessa. Huomattn että todennäkösyys maaln syntymselle on esmerkks tasatlanteessa huomattavast, ja tlastollsest merktseväst, enem 19

kun muuten. Tämän havannon ohjalta kaaleessa 5.1 konstruotn Markovmall jolla tämä vodaan ottaa huomoon. Tulokssta nähdään että Markov-mall arvo anakn nyt käytetyn aneston ottelujen tulosvahtoehtojen todennäkösyydet huomattavast tarkemmn kun Posson-jakauma ta Dxonn ja Colesn Possonjakaumaan ohjautuva mall. Vtteet [1] M.J. Moroney, "Facts from Fgures", Pengun, London. 1956. [2] M.J. Maher, "Modellng Assocaton Football Scores", Statstca Neerlandca, Vol. 36, No. 3,. 109 118, 1982. [3] J. Ratanen, "Jalkaallo-ottelun loutuloksen tlastollnen mallntamnen", Pro Gradu -tutkelma, Tamereen Ylosto, 1999. [4] M. Dxon, S. Coles, "Modellng Assocaton Football Scores and Ineffcences n the Football Bettng Market", Aled Statstcs, Vol. 46, No. 2,. 265 280, 1997. [5] H. Rue, Ø. Salvesen, "Predctng and Retrosectve Analyss of Soccer Matches n a League", The Statstcan, 49,. 399 418, 2000. [6] J. Vuoksenmaa, A. Kuronen, J. Nåls, "Urheluvedonlyönt", Gummerrus, Jyväskylä, 1999. [7] P. Lannen "Todennäkösyys ja sen tlastollnen soveltamnen"otateto, 1998. [8] P. Lannen "Mat-2.111 Stokastset rosesst - Luennot 93" [9] P. Lannen "Mat-2.104 Tlastollsen analyysn erusteet - Vuoden 2000 tekst" 20