Veikkauksen tulosvetopelien pelikäyttäytymisestä

Koko: px
Aloita esitys sivulta:

Download "Veikkauksen tulosvetopelien pelikäyttäytymisestä"

Transkriptio

1 Veikkaus Oy Veikkauksen tulosvetopelien pelikäyttäytymisestä TEKNILLINEN KORKEAKOULU Systeemianalyysin laboratorio Ville Venojärvi, 54284B

2 Sisällysluettelo 1 JOHDANTO VEIKKAUKSEN TULOSVETOPELIN MÄÄRITELMÄ POISSON JAKAUMAN PARAMETRIEN MÄÄRITTÄMISESTÄ Poisson jakauman valinnasta Pelijakauman ennustamiseen käytettyjen parametrien määrittäminen Lopullisesta pelijakaumasta määritetty maali intensiteettiparametri Jakaumien virheen määrittäminen JALKAPALLOON LIITTYVÄT TULOSVEDOT Jalkapalloliigoihin liittyvät tulosvedot Jalkapalloturnauksiin liittyvät tulosvedot JÄÄKIEKKOON LIITTYVÄT TULOSVEDOT POISSON JAKAUMAN OPTIMOINTI JA NEGATIIVISEN BINOMIJAKAUMAN KÄYTTÖ JAKAUMASOVITUSTEN TILASTOLLINEN TESTAUS LPJ Poisson jakauman testaus jalkapalloliigoille LPJ Poisson jakauman testaus optimoiduille Poisson jakaumille TULOSVETOPELIEN PELIJAKAUMAN KEHITTYMINEN JALKAPALLOLIIGOJEN JAKAUMISTA YHTEENVETO LÄHTEET LIITTEET Taulukot... 15

3 12.2 Kuvat... 19

4 1 Johdanto Tämä erikoistyö on laadittu VEIKKAUS Oy:n toimeksiannosta. Työn tarkoituksena on tutkia pelaajien pelikäyttäytymistä Veikkauksen muuttuvakertoimisissa peleissä. Muuttuvakertoimisilla peleillä tarkoitetaan tässä tutkielmassa eri urheilutapahtumiin liittyviä tulosvetoja, vaikka kategoriaan kuuluisivat muuten esimerkiksi Veikkauksen tarjoamat moni ja voittajavedot. Tutkielmassa tulen keskittymään tulosvetoihin jotka kohdistuvat jalkapallo ja jääkiekko otteluihin. Tämän työn tarkoituksena on pyrkiä identifioimaan sitä pelaavatko Veikkauksen tulosvetojen pelaajat tiettyjen todennäköisyysjakaumien mukaan. Lähtökohtaisesti oletuksena on että pelaajat pelaavat suhteellisen tarkasti Poisson jakauman mukaisesti. Lähtökohdan oletuksen perusteina voidaan pitää Poisson jakauman määritelmää, olettaen että tarkastelutapahtumana on maalien esiintyminen. Tutkielmassa pyrin tarkastelemaan muun muassa seuraavia tulosvetojen jakaumiin liittyviä kysymyksiä: Onko mahdollista pyrkiä ennakoimaan sitä, minkä jakauman mukaan pelaajat tulevat pelaaman tiettyä urheilutapahtumaa. Tarkoituksena tässä on tutkia sitä voiko pelaajien pelikäyttäytymisen Poisson jakauman parametrin (urheiluvedonlyönnissä ottelun maali intensiteetti) määrittää mahdollisimman yksinkertaisesti ennen tulosvedon aukeamista pelaajille. Toisena tutkimuskohteena on se, kuinka tarkasti pelaajat pelaavat Poisson jakauman mukaan, olettaen että maali intensiteetin parametrina käytetään tarkasteltavan tulosvedon lopullisen pelijakauman maali odotusarvoja. Kolmanneksi tutkin yksittäisen esimerkin avulla sitä, kuinka staattisena tietyn tulosvetokohteen pelijakauma säilyy pelin aukioloaikana. Neljäntenä tutkimuskohteena on se noudattaako tulosvetokohteet mahdollisesti jotain muuta todennäköisyysjakaumaa kuin Poissonjakaumaa. Vaihtoehtoiseksi jakaumaksi valitsin negatiivisen binomijakauman. Samalla tarkastelen myös sitä, voidaanko optimointialgoritmeja käyttämällä löytää tulosvetojakaumille parempia maali intensiteetin arvioita, kuin mitä lopullisesta pelijakaumasta määritetyt arviot ovat. Työssäni olen myös lyhyesti tarkastelut sitä läpäisevätkö pelijakaumien Poisson estimaattorit tilastollisen yhteensopivuustestin toteutuneeseen pelijakaumaan nähden. Lopussa esitän kuriositeettina havaintoja siitä kuinka hyvin esimerkiksi Englannin valioliigan tai Espanjan La Ligan yhden kauden otteluiden maalimäärät noudattavat Poisson jakaumaa. 1

5 2 Veikkauksen tulosvetopelin määritelmä Veikkauksen tulosvetopeleissä pelaajat veikkaavat pelikohteena olevan ottelun lopputulosta varsinaisen peliajan jälkeen. Tulosvedon kohdeotteluna voi olla muun muassa jalkapallo, jääkiekko tai pesäpallo ottelu. Pelikohteen ollessa esimerkiksi jalkapallo ottelu Fc Barcelona Real Madrid, pelaaja voi veikata että ottelu päättyy 2 0 Fc Barcelonan voittoon. Veikkauksen tarjoamassa tulosvedossa yksittäisen pelirivin panos voi vaihdella välillä Tulosvedon kertoimet määräytyvät siten, että pelaajille palautettava summa (palautus % * pelivaihto) jaetaan euromäärällä, jolla tulosta on pelattu Veikkauksen tulosvedon palautus oli 80 %. 3 Poisson jakauman parametrien määrittämisestä Tässä osiossa on esitetty lyhyt kuvaus siitä kuinka pelijakaumaa approksimoivien Poissonjakaumien parametrit on muodostettu. Olen myös lyhyesti perustellut sitä minkä takia lähtökohta tälle erikoistyölle on ollut se että tulosvetojen pelijakaumat noudattaisivat hyvin Poisson jakaumaa. Lopullisia pelijakaumia ja niiden estimaattoreita laatiessani päädyin tutkimaan pelikäyttäytymisen suhteellisia % osuuksia. Tämän perusteluna on se että tarkasteltavat tulosvedot omaavat kaikki toisistaan riippumattoman vaihdon. Näin ollen keskinäisten otteluiden selitysjakaumien hyvyyttä on helpompi arvioida jos tarkastelukohteena ovat pelivaihdon suhteelliset osuudet, eikä absoluuttiset määrät. Suhteellisella osuudella tarkoitetaan tässä kullekin maalimäärälle pelattujen eurojen osuutta pelikohteen kokonaisvaihdosta. 3.1 Poisson jakauman valinnasta Tarkasteltaessa tulosvetojen pelikäyttäytymistä diskreetti todennäköisyysjakauma on luonnollisin valinta. Tämä voidaan perustella helposti sillä, että pelaajat veikkaavat aina kokonaislukuja otteluiden tuloksiksi. Diskreeteistä jakaumista Poisson jakauma sopii määrittelyltään hyvin niin kokonaisten sarjojen maalijakaumien määrittämiseen, kuin yksittäisen ottelun pelijakauman määrittämiseen. Poisson jakauman määritelmä lyhyesti (Mellin, 2007): Määritellään diskreetti satunnaismuuttuja. tapahtuman esiintymisten lukumäärä ajanjaksona, jonka kesto on. Tässä työssä tapahtuma on maalin esiintyminen koti /vierasjoukkueelle. Seuraavissa tarkasteluissa ajanjakson kesto on yksi ottelu (tai ottelun puoliaika). Näin ollen 1, kaikille seuraaville tarkasteluille. Tietyin oletuksin satunnaismuuttuja noudattaa Poisson jakaumaa parametrilla. 2

6 Tässä työssä tarkastellaan pääasiassa sitä kuinka tarkasti noudattaa Poissonjakaumaa. Poisson jakauman pistetodennäköisyysfunktio on esitetty kaavassa (1) (1)! Poisson jakauman valintaperusteena voidaan käyttää sitä että parametri on helppo mieltää ottelun maali intensiteetiksi. Kuten myöhemmin tullaan huomaamaan, on mahdollista muodostaa negatiivinen binomijakauma, joka kuvaa paremmin pelaajien pelikäyttäytymistä kuin tarkinkaan Poisson jakauma. Negatiivisen binomijakauman parametreille toisaalta on vaikea antaa samanlaista tulkintaa kuin Poisson jakauman parametrille. Oletuksenani on ollut että ihmisten pelikäyttäytymistä voitaisiin mallintaa Poisson prosessin avulla. Poisson prosessin oletuksina ovat muun muassa seuraavat(wikipedia; Poisson process): 1. Toisistaan erillisten tarkasteluajanjaksojen tapahtumamäärät ovat toisistaan riippumattomia. 2. Millä tahansa ajanjaksolla tapahtumamäärä riippuu ainoastaan tarkasteltavan aikavälin pituudesta. 3. Tapahtumat eivät esiinny samanaikaisesti Oletetaan että pyritään mallintamaan jalkapallo ottelun maalimääriä Poisson prosessina. Voidaan havaita etteivät ehdot 1 2 välttämättä täyty, sillä jalkapallossa maalin syntyminen vaikuttaa hyvin usein tulevien ajanhetkien pelidynamiikkaan. Ehto 3 kuitenkin täyttyy. Tarkasteltaessa tulosvetopelaajien pelikäyttäytymistä Poisson prosessina kohdataan seuraavia haasteita. Peliprosessi toimii siten että pelaajat veikkaavat maalimäärää, jonka he uskovat joukkueen tekevän. Panoksen määrä ei myöskään ole kiinteä. Näin ollen jokaista yhden pelaajan pelitapahtumaa voidaan tarkastella yhtenä "jalkapallo otteluna", jonka maalit esiintyvät joukkona eivät yksitellen (mikä on Poisson prosessin oletus). Tulosvedoissa pelipanos ei myöskään ole kiinteä (se on välillä ). Edellä esitetyistä syistä johtuen Poisson prosessin ehto 3 ei tulosvetojen osalta täyty. Ihmisten pelikäyttäytymisestä voidaan myös todeta sen verran että osaan pelaajista vaikuttaa kulloinenkin pelijakauma > ehdot 1 & 2 eivät täyty. Edellä huomattiin että niin urheiluotteluiden kuin niihin liittyvän pelikäyttäytymisen mallintaminen Poisson prosessina omaa selkeitä haasteita. Toisaalta niiden mallintaminen Poisson prosessina omaa selkeitä vahvuuksia, kuten yksinkertaisuus ja parametrien helppo ymmärrettävyys (ottelun maali intensiteetti). 3

7 3.2 Pelijakauman ennustamiseen käytettyjen parametrien määrittäminen Jalkapallo ja jääkiekkoliigojen otteluiden maalijakaumien ennustamiseen sovelsin seuraavia metodeja: Joukkueiden maalikeskiarvoon perustuva metodi (JMK), sekä modifioitu maalikeskiarvoihin perustuva metodi (mjmk). JMK metodissa sekä koti että vierasjoukkueen tehtyjen maalien maali intensiteettiparametrin määritys on tehty seuraavasti: kotijoukkueen tehtyjen maalien maali intensiteettiparametri : (2) vierasjoukkueen tehtyjen maalien maali intensiteettiparametri : (3) mjmk metodissa sekä koti että vierasjoukkueen maali intensiteettiparametrin määritys on tehty seuraavasti: kotijoukkueen tehtyjen maalien maali intensiteettiparametri : (4) vierasjoukkueen tehtyjen maalien maali intensiteettiparametri : (5) kaavoissa (2) (5) kuvaa joukkueiden kauden aikana pelaamien koti/vieras otteluiden lukumäärää, / / / koti /vierasjoukkueen tekemää/päästämää maalimäärää ottelussa. Indeksi viittaa kotijoukkueeseen ja vierasjoukkueeseen. alaindeksi kuvaa sitä että kyseessä on joukkueen tekemät ja päästetyt maalit. Parametri kuvaa tarkasteltavan sarjan kotijoukkueiden keskimääräistä tehtyjen maalien määrää ja vierasjoukkueiden vastaavaa. JMK menetelmän (kaavat (2) (3)) perusteluna voidaan pitää seuraavaa: On loogista olettaa että joukkueiden keskimääräisesti tekemät koti/vieras maalit olisivat hyvä pohja sille arviolle kuinka pelaajat uskovat niiden tekevän maaleja. Matemaattisesta näkökulmasta JMKmetodilla määritettävät maali intensiteettiparametrit ovat myös todellisten intensiteettien maximum likelihood estimaattoreita(weisstein, E). Urheilutapahtumia tarkastellessa maximum likelihood funktio ei kuitenkaan välttämättä ole paras estimaattori maaliintensiteetille. Se ei esimerkiksi lainkaan huomioi vastajoukkueen vahvuutta. 4

8 mjmk menetelmä (kaavat (4) (5)) vie JMK menetelmän pidemmälle. Siinä esimerkiksi kotijoukkueen tekemien maalien odotusarvoon (kaava 4) lisätään vierasjoukkueen keskimäärin päästämät maalit vähennettynä sarjan kotijoukkueen keskimäärin tekemillä maaleilla. Tämän perusteluna voidaan pitää sitä että jos vierasjoukkue keskimäärin päästää vähemmän maaleja kuin liigan kotijoukkue keskimäärin tekee, on vierasjoukkueen puolustus (ainakin vieraskentällä) keskimääräistä parempi. Sekä JMK että mjmk menetelmät ovat molemmat erittäin yksinkertaistettuja. Tarkoituksena tässä ei ole ollut löytää tapaa ennustaa tarkasti pelaajien pelikäyttäytymistä vaan muodostaa mahdollisimman yksinkertainen malli, jonka avulla voidaan saada jonkinlainen käsitys siitä miten pelikäyttäytyminen voisi mennä. Näiden ennustusmenetelmien suurin mielenkiinto on siinä onko pelaajien pelikäyttäytymisen suhteen eri liigojen välillä merkittäviä eroja ja kuinka usein ne oikeasti antavat suhteellisen tarkkoja tuloksia. Huomion arvoista myös on se, että kumpikaan menetelmistä JMK tai mjmk yleisesti ottaen ei soveltuisi kovinkaan tarkkaan approksimointiin esim. ottelun lopputuloksen (tulos tai merkki) todennäköisyysjakauman määrittämiseen. Ennustusmenetelmiin liittyvänä yleisenä huomautuksena se, että keskiarvoja laskiessani käytin aina kyseisen sarjan kaikkien otteluiden tietoja (vaikka peli olisi pelattu ensimmäisellä kierroksella). Näin ollen pelaajilla ei olisi ollut käytössä samaa dataa mikä minulla oli kausien jo päätyttyä. Poikkeuksena tästä Veikkausliiga, joka on vielä kesken tutkimuksen laatimishetkellä. Päädyin tähän ratkaisuun, koska jokaiselle pelille omien keskiarvojen laskeminen olisi ollut suhteettoman työlästä. 3.3 Lopullisesta pelijakaumasta määritetty maali intensiteettiparametri Kaavoissa (6) (7) on kuvattu se kuinka kunkin ottelun lopullisesta pelijakaumasta(lpj) on määritetty sekä koti että vierasjoukkueen maali intensiteettiparametrit ja. Tässä intensiteettiparametrit määritetään vasta pelikohteen sulkeuduttua, joten oletettavasti tämä menetelmä on kaikista tarkin selittämään pelikäyttäytymistä. kotijoukkueen tehtyjen maalien maali intensiteettiparametri (6) 5

9 vierasjoukkueen tehtyjen maalien maali intensiteettiparametri (7) Kaavoissa (8) (9) kuvaa tarkasteltavan ottelun maksimaalista maalimäärää, jonka olen ottanut huomioon. Analyyseissäni käytin arvoa 15 ja huomasin sen olevan riittävä (tosin joskus pelaajat pelaavat ottelun lopputulokseksi esim , mikä on kuitenkin marginaalista). kuvaa kutakin maalimäärää ja sitä osuutta, jolla pelaajat ovat maalimäärää pelanneet. 3.4 Jakaumien virheen määrittäminen Muodostamieni pelikäyttäytymistä approksimoivien jakaumien virheen muodostaminen on esitetty kaavassa (8). Kaavasta (8) voidaan havaita että kyseessä on oikeastaan pienimmän neliösumman virhe, joka on ottelukohtaisesti määritetty sekä koti että vierasjoukkueelle ja virheet on tämän jälkeen laskettu yhteen. Mahdollisuutena olisi ollut myös määrittää erikseen sekä koti että vierasjoukkueiden sovitusten virheet erikseen. päädyin kuitenkin yhdistämään virheet säilyttääkseni mallin mahdollisimman yksinkertaisena. Ottelukohtainen virhe pelijakauman estimointimallille : (8) Kaavassa (8) kuvaa joko osuutta millä maalilukua on pelattu tai estimointimallin antamaa osuutta (riippuen alaindeksistä). Alaindeksi kuvaa pelattua osuutta ja mallin osuutta. Alaindeksi kuvaa kotijoukkueen maaleja ja vierasjoukkueen maaleja. 4 Jalkapalloon liittyvät tulosvedot Tässä osiossa on tarkasteltu sitä kuinka hyvin jalkapallo otteluiden jakaumia voidaan etukäteen ennustaa Poisson jakauman avulla (parametrit:,,, ). Tarkastelun kohteena on myös se kuinka hyvin lopullisesta pelijakaumasta määritetyt maali odotusarvot soveltuvat Poisson jakauman maali intensiteetin parametriksi (parametrit: ). Tarkasteluissani olen tutkinut seuraavien sarjojen jalkapallo otteluita: Espanjan La Liga (08 09), Englannin Premier League(08 09), Saksan Bundesliiga(08 09), Italian Serie A(08 09) ja 6

10 Veikkausliiga(09). Olen erikseen tutkinut myös kahden jalkapalloturnauksen(confederations Cup (09) ja jalkapallon EM kisat (08)) pelikäyttäytymistä. 4.1 Jalkapalloliigoihin liittyvät tulosvedot Jokaisesta edellä mainitusta jalkapalloliigasta valitsin kahdeksan ottelua, joista suoritin analyysin siitä kuinka hyvin niissä esiintynyt pelikäyttäytyminen noudattaa edellä esitettyjä Poisson jakauma estimaattoreita (JMK, mjmk ja LPJ). Veikkauksen pelitarjonnasta ja omasta mielenkiinnosta johtuen keskityin pääasiassa suurimpien seurojen otteluihin. Liitteissä oleva taulukko 1 kuvaa kaikkien tutkimieni otteluiden vaihdot ja eri approksimointimenetelmillä esiintyneet virheet. Taulukossa 11 on eritelty kaikkien tässä työssä tarkastelemieni otteluiden koti ja vierasjoukkueet. Kuvassa 1 on esitetty eri estimointimenetelmien keskimääräiset virheet sarjoittain. Siitä voidaan huomata että LPJ selitysmenetelmä toimii selkeästi parhaiten aivan kuten olettaa saattaa. Ennustavista menetelmistä JMK toimii paremmin Bundesliigan ja Veikkausliigan otteluissa. mjmk puolestaan on tarkempi La Ligan ja Englannin Premier Leaguen otteluissa. Serie A:n otteluissa sekä JMK että mjmk menestyvät suunnilleen yhtä hyvin. Taulukosta 1 ja kuvasta 2 voidaan hyvin havaita että tulosvetokohteen vaihdon merkitys virheen suuruuteen on merkityksetön (Kuvasta 2 jätetty pois yksi selkeästi poikkeava virhe). Tätä voidaan pitää oletettuna tuloksena sillä tarkastelukohteina ovat pelivaihtojen suhteelliset osuudet. Kahdella estimointimenetelmistä vaihdon korrelaatio virheen kanssa on lievästi negatiivinen (JMK & mjmk), kun taas menetelmällä LPJ korrelaatio on lievästi positiivinen. Korrelaatioita ei kuitenkaan voida pitää merkityksellisinä. Pelkästään virheiden suuruuden nojalla on hyvin vaikea arvioida sitä kuinka hyvin estimointimenetelmät oikeastaan kuvaavat pelaajien pelikäyttäytymistä. Kuvissa 3 4 on esitetty sitä kuinka hyvin eri estimointimenetelmät toimivat eri otteluissa. Kuvissa yhtenäinen viiva kuvaa todellista pelikäyttäytymistä ja katkoviiva estimaattori menetelmällä saatua käytöstä. Kuviin olen pyrkinyt valitsemaan sellaisia otteluita joissa selitys menetelmät toimivat hyvin, kohtalaisesti tai heikosti. Mittarina tässä olen käyttänyt parametria(, kaava 8). Taulukossa 2 on eritelty kuvien 3 4 otteluiden joukkueet. Tarkastelemalla kuvia 3 4 voidaan tehdä seuraavia huomioita: Estimointimenetelmistä LPJ on selkeästi paras. Tätä voidaan pitää erittäin odotettuna tuloksena. Parhaimmillaan se ennustaa pelikäyttäytymisen lähes täydellisesti (ottelu 1). Tarkastelu otteluissa heikoimmillaankin (ottelu 3) se ennustaa vierasjoukkueen pelijakauman todella tarkasti. Kotijoukkueen pelijakauman estimoinnissa LPJ menetelmä onnistuu tällöin heikosti. JMK ja mjmk menetelmät näyttäisivät suoriutuvan valituissa otteluissa pelijakaumien ennakoimisessa suunnilleen yhtä hyvin. Parhaimmillaan ne kykenevät 7

11 ennustamaan vierasjoukkueen pelijakauman erittäin hyvin. Heikoimmillaan mjmk ei kykene ennustamaan kohtuullisesti koti tai vieras pelijakaumaa (ottelu 9). JMK onnistuu heikoimmillaankin suhteellisen hyvin kotijakauman ennustamisessa. Mielenkiintoisena huomiona voidaan havaita että kaikissa muissa paitsi ottelussa 9 estimointimenetelmät kykenevät ennustamaan ainakin koti tai vieras pelijakauman hyvin. Syytä tälle on hyvin vaikea lähteä arvioimaan, kyse voi olla puhtaasta sattumastakin. 4.2 Jalkapalloturnauksiin liittyvät tulosvedot Jalkapalloturnauksista ei ole mahdollista laatia järkevästi samankaltaisia ennustusmenetelmiä (JMK & mjmk), kuin jalkapalloliigoista. Seuraavassa on esitetty sitä kuinka hyvin LPJ menetelmällä muodostettu Poisson jakauma noudattaa todellista pelijakaumaa jalkapalloturnauksissa. Vaihdon ja virheen korrelaatio oli myös jalkapalloturnauksissa merkityksetön. Tarkasteltaessa taulukon 3 LPJ estimointi menetelmän keskivirheitä huomataan niiden olevan samaa suuruusluokkaa kuin eri liigoille määritetyt LPJ virheet. Näin ollen voidaan olettaa että LPJ menetelmä kykenee selittämään pelikäyttäytymistä suhteellisen hyvin myös jalkapalloturnausten osalta. 5 Jääkiekkoon liittyvät tulosvedot Taulukossa 4 ja kuvassa 5 on esitetty tulokset jääkiekon SM liiga kauden ja NHL kauden pelikäyttäytymis estimoinneille. Jalkapallosta poiketen jääkiekko otteluiden vaihdon ja ennustusvirheiden välillä oli havaittavissa lievää positiivista korrelaatiota. Tämä on saattanut osaltaan vaikuttaa arvioihin estimointimenetelmien tarkkuudesta. Taulukosta 4 ja kuvasta 5 voidaan havaita että LPJ estimointimenetelmällä saadut virheet ovat samaa suuruusluokkaa kuin jalkapalloliigojen vastaavat. Näin ollen voidaan olettaa että Jääkiekko otteluiden pelijakaumaa voidaan estimoida suhteellisen tehokkaasti LPJ menetelmän avulla. JMK ja mjmk menetelmät onnistuvat nekin suhteellisen hyvin ennustamaan pelikäyttäytymistä. Näiden menetelmien keskinäisestä paremmuudesta jääkiekkootteluiden pelijakaumien ennustamisesta on vaikea sanoa mitään varmasti. mjmk vaikuttaisi selviävän ennustamisesta hieman paremmin, toisaalta analysoitujen otteluiden suhteellisen alhainen lukumäärä saattaa vaikuttaa estimoituihin keskivirheisiin. Verrattaessa JMK ja mjmk menetelmien tarkkuutta jääkiekko otteluiden ja jalkapallo otteluiden pelijakaumien määrittämisessä, voidaan havaita että menetelmät kykenevät ennustamaan jääkiekko otteluiden jakaumia hieman tarkemmin (virheen (8) osalta) kuin jalkapallo otteluiden. Tämä voidaan havaita vertaamalla kuvia 1 & 5. Kuvassa 6 on havainnollistettu 8

12 estimointimenetelmien kykyä selittää jääkiekko otteluiden pelijakaumia. Havaintoesimerkiksi valitsin sellaiset ottelut, joissa LPJ menetelmä onnistui selittämään pelijakaumaa suhteellisen hyvin. Kuten kuvasta 6 voidaan nähdä parhaimmillaan LPJ selittää pelikäyttäytymisen lähes täydellisesti. Mielenkiintoisena lisähuomiona voidaan nähdä että sekä JMK että mjmk kykenevät ennustamaan SM liiga ottelun pelijakauman eritäin hyvin. NHL ottelun pelijakaumaa niiden avulla ei voi aivan yhtä hyvin estimoida, vaikka ne onnistuvat tässä tapauksessa myös siinä kohtalaisen hyvin. 6 Poisson jakauman optimointi ja Negatiivisen binomijakauman käyttö Kuvassa 7 ja taulukossa 7 on esitetty Poisson jakauman optimoinnin tulokset kuudelle valitulle ottelulle. Otteluiden valitseminen tapahtui sillä perusteella että mukana olisi otteluita joissa LPJ estimointi on toiminut hyvin, kohtalaisesti tai heikosti. Poisson jakauman optimoinnilla tarkoitetaan tässä sitä, että sekä koti että vierasjoukkueiden maaliintensiteettiparametrit optimoitiin numeerisesti siten että muodostuvan pelijakauman estimaatin virhe (8) saatiin minimoitua. Kuvissa kotijoukkueen jakauman estimaattori on esitetty yhtenäisellä viivalla ja toteutunut jakauma "+" merkillä. Vierasjoukkueen jakauman estimaattori on puolestaan merkitty katkoviivoin ja "o" merkillä. Tarkasteltaessa kuvaa 7 huomataan että Poisson jakaumaa optimoimalla voidaan muodostaa kohtalaisen hyvä estimaattori kaikkien otteluiden pelijakaumille. Heikoiten tässä onnistutaan otteluiden 3 & 4 kohdalla ja parhaiten ottelun 1 osalta. Mielenkiintoista on huomata että vaikka otteluita 5 & 6 voitiin estimoida LPJmenetelmällä heikommin kuin otteluita 3 & 4 (taulukko 7), optimoimalla maaliintensiteettiparametria saadaan otteluiden 5 & 6 jakaumille selkeästi parempi estimaattori kuin otteluiden 3 & 4 (virheen (8) osalta). Ottelun 1 osalta voidaan myös huomata että maali intensiteettiparametrin optimointi ei juuri pienennä virheen (8) suuruutta. Kuvassa 8 ja taulukossa 8 on esitetty samoille otteluille vastaavanlaisen optimointiprosessin tulokset Negatiiviselle binomijakaumalle. Taulukosta 8 ja kuvasta 8 voidaan huomata että negatiivisen binomijakauman parametreja optimoimalla voidaan estimoida erittäin tarkasti kunkin ottelun pelijakaumat. Toisaalta negatiivisen binomijakauman parametreilla ei ole vastaavaa realiteettia itse jalkapallon kanssa, kuten Poisson jakaumalla (maali intensiteetti). Näin ollen Negatiivisen binomijakauman parametrien määrittäminen ennen pelitapahtuman alkua on erittäin hankalaa (vrt. JMK & mjmk). Negatiivisen binomijakauman parametreja & voi kuitenkin pyrkiä tulkitsemaan seuraavalla tavalla. kuvaa jalkapallossa todennäköisyyttä että epäonnistutaan maalinteossa ja puolestaan maalinteko yritysten määrää. Nämä oletukset eivät kuitenkaan optimointitulosten osalta ole realistisia (ks. taulukko 8), mutta antavat perustelun sille minkä takia Negatiivista binomijakaumaa voidaan perustellusti käyttää tulosvetopelien pelijakaumien mallintamisessa hyödyksi. 9

13 Parametrien epärealistisuudella tässä tarkoitan sitä, että jalkapallo ottelussa ei yleensä kummallakaan joukkueella ole yli 100:a maalintekoyritystä (taulukko 8). Negatiivisella binomijakaumalla saadaan selkeästi parempia estimointituloksia kuin Poissonjakaumalla (vrt. kuvat ja taulukot 7 & 8). Negatiivisen binomijakauman ongelmana kuitenkin on myös se, ettei ottelun pelijakaumasta voida määrittää parametreja & samoin kuin LPJ menetelmässä määritettiin ottelun maali intensiteettiparametri lopullisesta pelijakaumasta. Näin ollen Negatiivista pelijakaumaa ei voida käyttää pelijakauman approksimointiin samoin kuin Poisson jakaumaa. Mielenkiintoista on kuitenkin nähdä kuinka hyvin Negatiivisen binomijakauman optimointi onnistuu sellaisessakin ottelussa jossa Poisson jakauman optimointi ei kykene kovinkaan hyvin selittämään pelikäyttäytymistä (vrt. ottelut 3 & 4). Tulosta voidaan pitää kuitenkin suhteellisen odotettuna, ottaen huomioon että Negatiivinen binomijakauma sisältää kaksi parametria, joiden suhteen estimaattorijakaumaa voidaan optimoida (Wikipedia, Negative binomial distribution). 7 Jakaumasovitusten tilastollinen testaus Tässä osiossa on esitetty tuloksia laadittujen jakauma estimaattoreiden yhteensopivuudesta havaittujen pelijakaumien kanssa. Testaus menetelmänä on käytetty yhteensopivuustestiä. 7.1 LPJ Poisson jakauman testaus jalkapalloliigoille Edellä on esitetty kuinka LPJ jakauma estimaattori muodostettiin jalkapallo otteluille. Taulukossa 9 on esitetty yhteensopivuustestin tulokset tarkastelluille jalkapalloliigoille. Merkitsevyystasona laadituissa tilastollisissa testauksissa on ollut Tilastollista testausta varten jokaisen maalimäärän peliosuus muutettiin pelivaihtojen avulla maalikohtaiseksi pelimääräksi. Tämä tuli aiheuttamaan vääristymää yhteensopivuustestin tuloksissa. Taulukosta voidaan hyvin huomata että tilastollinen testaus hyväksyy ainoastaan muutaman todellisen pelijakauman yhteensopivaksi LPJ menetelmällä laadittujen pelijakaumien kanssa. Tulosta voidaan pitää hieman yllättävänä, sillä graafisen tarkastelun nojalla olisi voinut olettaa että suurempi osa jakaumista läpäisisi tilastollisen yhteensopivuustestin. Tilastollinen testaus on tässä suoritettu siten että kullekin maaliluvulle panostetut eurot on tulkittu omiksi tapahtumikseen. Tämä ei tosiasiassa pidä paikkaansa, sillä tulosvedossa pelaajat saavat päättää oman pelipanoksensa väliltä Näin ollen pelipanosten kasautumista eri maaliluvuille ei voida pitää perinteisenä Poisson prosessina (kuten todettu 10

14 jo aiemmin). Taulukosta 9 kuitenkin huomataan että arvon ja kaavan (8) avulla lasketun virheen välillä on selkeää korrelaatiota. Esimerkiksi jos verrataan Bundesliigan ja LaLigan kaavalla (8) määritettyjä arvoja sekä kyseisten liigojen estimaattorijakaumien arvoja havaitaan niiden välillä selvää positiivista korrelaatiota. Tilastollisen testaamisen luotettavuutta tässä myös heikentää se että kaavassa (9) esitetty testisuure (Mellin, 2007) on voimakkaasti pelikohteen vaihdosta riippuvainen. Näin ollen eri pelivaihtojen otteluiden vertaaminen keskenään tämän testisuureen avulla on hankalaa, sillä pienten vaihtojen otteluiden arvoa voidaan pitää oletusarvoisesti pienempänä kuin suurten vaihtojen otteluiden. Tämän perustelu nähdään kaavan (9) avulla: suuremmat vaihdot kasvaa suuremmaksi, vaikka kaavan virhe (8) ei kasvaisi. 2 0 Kaavassa9: on maalimäärälle pelatut eurot, estimointimallin ennustamat eurot maalimäärälle. 7.2 LPJ Poisson jakauman testaus optimoiduille Poisson jakaumille (9) Tässä on esitetty tulokset optimoitujen Poisson jakaumien tilastolliselle yhteensopivuudelle havaitun pelijakauman kanssa. Kuten jo edellisessä kohdassa todettiin, menetelmän heikkous pelikäyttäytymisen testaamisessa on se että testi ei ota huomioon pelivaihdon merkitystä estimointimallin hyvyyden määrittämisessä. Tulokset optimoidun jakauman tilastollisesta yhteensopivuudesta on esitetty taulukossa 10. Taulukosta nähdään että ainoastaan kahden ottelun kotijakaumat läpäisevät tilastollisen yhteensopivuustestin. Tulokset näyttäisivät olevan yhteneviä taulukossa 1 esitettyjen tulosten kanssa, siinä mielessä että virheen (8) ja arvon välillä näyttäisi olevan selkeää positiivista korrelaatiota. 8 Tulosvetopelien pelijakauman kehittyminen Veikkaus julkaisee lähes reaaliaikaisia päivityksiä kunkin tulosvetokohteen pelijakaumasta. Kuvassa 9 olen esittänyt kuinka erään tulosvetokohteen lopullinen pelijakauma suhtautuu aikaisempina ajankohtina voimassa olleeseen jakaumaan. Lopullinen pelijakauma on kuvissa esitetty yhtenäisellä viivalla, kun taas kulloistakin ajankohtaa vastaava jakauma katkoviivoilla. Hypoteesina tässä on että mitä lähemmäksi pelin sulkeutumista mennään (ajankohdan suhteen) sitä paremmin pelijakauma kuvaa lopullista pelijakaumaa. Kohteena tarkastelussani oli Mestareiden Liigan karsintaottelu: Fc Inter Fc Sheriff. Taulukossa 6 on esitetty valitsemieni pelijakaumien ajankohdat, vaihdot ja virheet. Taulukosta voidaan pääsääntöisesti huomata että mitä lähempänä pelin sulkeutumista ollaan, sitä lähempänä pelijakauma on lopullista pelijakaumaa. Sama asia voidaan havaita myös kuvasta 9. 11

15 Mielenkiintoisena yksityiskohtana voidaan havaita että tämän yhden esimerkin nojalla voitaisiin sanoa että aikaisemmat pelijakaumat ovat lopullisen pelijakauman estimointimielessä lähes LPJ menetelmän tasoa. Toisaalta koska kyseessä on ainoastaan yhden ottelun jakauma, mitään näin pitkälle meneviä johtopäätöksiä ei voida luotettavasti tehdä. 9 Jalkapalloliigojen jakaumista Tässä osiossa on esitetty lyhyesti havaintoja sitä, kuinka tarkasti jalkapalloliigojen tulokset noudattavat Poisson jakaumaa. Tarkastelun kohteeksi olen valinnut vuosien Espanjan La Ligan ja Englannin Valioliigan. Tässä tarkastelussa olen myös erikseen tutkinut sitä voidaanko otteluiden jakaumat estimoida tarkemmin, jos ensimmäisen ja toisen puoliajan tulokset erotetaan toisistaan. Perusteena tälle tarkastelulle on se että jalkapallossa hyvin usein joukkueiden taktiset ratkaisut muuttuvat voimakkaasti ottelun puoliajalla. Poisson jakauman maali intensiteettiparametrien estimointimenetelmänä olen tässä käyttänyt kaikkien liigan otteluiden maalikeskiarvoja. Näin ollen kotijoukkueiden maali intensiteetti on keskimäärin liigan kotijoukkueiden tekemä maalimäärä. Sama pätee myös vierasjoukkueiden intensiteettiparametrille. Vastaavasti olen myös määrittänyt puoliajoille omat maali intensiteettiparametrit:,,,, missä numero indeksi indikoi tarkastellaanko ensimmäistä vai toista puoliaikaa. Näin ollen Poisson jakauman maali intensiteettiparametri on määritetty samankaltaisesti kuin kaavoissa (2) (3). Taulukossa 5 on esitetty La Ligan ja Englannin Valioliigan maali intensiteettiparametrit. Siinä on kuvattuna myös estimaattoreilla saatujen jakaumien virheet suhteessa toteutuneisiin maalijakaumiin. Kuvassa 10 on esitetty Sekä La Ligan että Englannin Valioliigan otteluiden maalijakaumat, sekä niiden Poisson estimaattorit. Kuvassa yhtenäinen viiva kuvaa toteutuneita jakaumia, kun taas katkoviiva esittää estimoidun jakauman. Kuvasta 10 ja taulukosta 5 voidaan havaita että molemmat sarjoista noudattavat suhteellisen tarkasti Poisson jakaumaa lopputulostensa osalta. Mielenkiintoista on esim. huomata että Valioliigan osalta ensimmäisen puoliajan toteutunut ja estimoitu jakauma lähes yhtenevät sekä koti että vierasjoukkueelle. Toisen puoliajan vierasjoukkueen estimoitu jakauma puolestaan poikkeaa todellisesta jakaumasta huomattavasti enemmän kuin muut puoliaikajakaumat. La Ligan kotijoukkueen osalta taas toisen puoliajan jakauma noudattaa tarkemmin estimoitua Poisson jakaumaa kuin ensimmäisen puoliajan jakauma. Vierasjoukkueen osalta tilanne puolestaan on päinvastainen. Koko otteluiden estimaattorijakaumat puolestaan häviävät selvästi tarkimmille puoliaikaestimaattoreille, mutta toisaalta ovat tarkempia kuin heikoimmat puoliaika selittäjät. Kaiken kaikkiaan voidaan sanoa että tarkastellut sarjat noudattavat maalimääriensä osalta hämmästyttävän hyvin Poisson jakaumaa niin koko otteluiden kuin puoliaikojenkin osalta. 12

16 10 Yhteenveto Tämän työn tarkoituksena oli pyrkiä selvittämään sitä kuinka Veikkauksen pelien pelaajat pelaavat muuttuvakertoimisia ja eritoten tulosvetopelejä. Tarkastelun kohteena olivat Veikkauksen tarjoamat jalkapalloon ja jääkiekkoon liittyvät tulosvedot. Pelijakaumien ennustamiseen käytettiin kahta eri menetelmää JMK ja mjmk. Menetelmien toimivuuden kannalta on vaikea tehdä selkeää eroa. Analyysien perusteella vaikutti siltä että JMK menetelmä onnistuu ennustamaan pelikäyttäytymistä paremmin Bundes ja Veikkausliigan osalta. mjmk pärjäsi puolestaan paremmin La Ligan, Englannin Valioliigan ja SM liigan jakaumien estimoinnissa. Muissa sarjoissa menetelmät menestyivät suunnilleen yhtä hyvin. Poisson jakaumaan liittyvistä estimointimenetelmistä selvästi tehokkain oli lopulliseen pelijakaumaan perustuva LPJ menetelmä. Sen avulla kyettiin laatimaan ajoittain hyvinkin tarkkoja estimaattoreita pelaajien pelikäyttäytymiselle. Optimoimalla Poisson jakauman maali intensiteettiparametria kyettiin parantamaan estimaattoreiden tarkkuutta jonkin verran. Joidenkin otteluiden tapauksissa tarkkuus ei juuri parantunut LPJ menetelmän arvoista, kun taas toisissa parannus oli huomattavaa. Negatiivisen binomijakauman avulla kyettiin estimoimaan pelijakaumat erittäin tarkasti. Tätä tulosta osattiin tosin odottaa, johtuen negatiivisen binomijakauman suuremmasta parametrien lukumäärästä (2). Negatiivisen binomijakauman heikkoutena pelikäyttäytymisen selittäjänä on kuitenkin se, ettei pelijakaumasta voida helposti estimoida sen parametreja. Jakaumaestimaattoreiden tilastollinen testaus testin avulla ehdotti että suurin osa estimaattorijakaumista ei noudattaisi LPJ Poisson tai optimoitua Poisson jakaumaa. Tämän syynä osittain oli se, että otteluiden vaihdot vaikuttivat voimakkaasti tilastollisen testisuureeseen. Toisaalta havaittiin selkeää positiivista korrelaatiota testisuureen ja virheen (8) välillä. Pelijakaumien kehittymisestä huomattiin yksittäisen esimerkin avulla se, että mitä lähempänä kohteen sulkeutumista ollaan, sitä tarkemmin jakaumasta muodostettu LPJ estimaattori lopullista pelijakaumaa estimoi. Lopussa havainnoitiin myös sitä kuinka tarkasti jalkapalloliigojen maalijakaumia voidaan estimoida Poisson jakauman avulla. Kokonaisuutena voitiin huomata että Poisson jakaumaa voidaan soveltaa yleisesti ottaen suhteellisen tarkasti pelijakaumien estimointiin. Negatiivinen binomijakauma olisi mitä todennäköisimmin vieläkin parempi jakaumien mallintaja, jos kyettäisiin arvioimaan tehokkaasti parametrit. Jakaumien yhteensopivuuden tilastolliseen testaamiseen testi soveltuu tässä tapauksessa ainoastaan rajoitetusti, johtuen pelikohteiden vaihtelevista pelivaihdoista. Tarkempien tilastollisten analyysien laadintaan tulisi löytää testisuure, johon vaihdon suuruus ei yhtä merkittävästi vaikuttaisi. 13

17 Jatkotutkimuksen aiheina voisi olla muun muassa sellainen jakaumien yhteensopivuuden tilastollinen analyysi, johon ottelukohtaiset vaihdot eivät vaikuttaisi. Mahdollista olisi myös tutkia sitä onko tiettyjen joukkueiden pelien pelikäyttäytymisen estimointi helpompaa kuin toisten. Myös virheen (8) tarkempi analyysi koti ja vierasjoukkueiden osalta saattaisi olla mielenkiintoista. 11 Lähteet Mellin, I Todennäköisyyslaskenta ja tilastotiede: Kaavat ja taulukot. Helsinki: Teknillinen korkeakoulu. Weisstein, Eric W. "Maximum Likelihood." From MathWorld A Wolfram Web Resource. ( ). Wikipedia. In Negative binomial distribution. Retrieved , from ( ). Wikipedia. In Wikipedia Poisson Process. Retrieved , from 14

18 12 Liitteet 12.1 Taulukot sarja/virhe nro vaihto LPJ JMK mjmk sarja/virhe nro vaihto LPJ JMK mjmk LaLiga BundL LaLiga BundL LaLiga BundL LaLiga BundL LaLiga BundL LaLiga BundL LaLiga BundL LaLiga BundL ka ka otosv 4.59E otosv 2.76E otoskh otoskh EPL VeikkausL EPL VeikkausL EPL VeikkausL * EPL VeikkausL EPL VeikkausL EPL VeikkausL EPL VeikkausL EPL VeikkausL ka ka otosv 1.02E otosv 3.70E otoskh otoskh SerieA *Tässä ottelussa mjmk menetelmä ei antanut SerieA validia maali intensiteetti parametria SerieA SerieA SerieA SerieA SerieA SerieA kaikki sarjat ka ka otosv 5.55E otosv 2.16E otoskh otoskh Taulukko 1: Jalkapallo liigojen ottelukohtaiset vaihdot ja virheet eri estimointimenetelmillä ottelu nro. joukkueet ottelu nro. joukkueet ottelu nro. joukkueet 1 Chelsea Liverpool 4 Juventus Ca tania 7 Barcelona At. Madrid 2 Barcelona Valladolid 5 Chelsea Liverpool 8 Liverpool Arsenal 3 HJK KuPS 6 Fc Lahti Tampere Utd. 9 Fc Inter MyPa Taulukko 2: Kuvissa 3 4 esiintyvien otteluiden joukkueet 15

19 turnaus nro vaihto virhe turnaus nro vaihto virhe ConfCup EM ConfCup EM ConfCup EM ConfCup EM ConfCup EM ka ka otosv 1.07E E 06 otosv 2.86E E 07 otoskh otoskh kaikki ottelut ka. otosv otoskh vaihto E E+04 virhe E E 03 Taulukko 3: Jalkapalloturnausten ottelukohtaiset vaihdot ja virheet LPJ estimointimenetelmällä. sarja/virhe nro vaihto LPJ JMK mjmk sarja/virhe nro vaihto LPJ JMK mjmk SM Liiga NHL SM Liiga NHL SM Liiga NHL SM Liiga NHL SM Liiga NHL SM Liiga NHL SM Liiga NHL SM Liiga NHL ka ka otosv 4.06E E E E 04 otosv 2.05E E E E 04 otoskh otoskh va ihto LPJ JMK mjmk Kaikki ottelut ka otosv 2.503E E E E 04 otoskh Taulukko 4: Jääkiekkoliigojen ottelukohtaiset vaihdot ja estimointivirheet. Sarja/parametri La Liga (08 09) EPL (08 09) Virhe La Liga (08 09) Virhe EPL (08 09) Taulukko 5: La Ligan ja Valioliigan maali intensiteettiparametrit, sekä niillä laskettujen jakauma estimaattoreiden virheet pelijakauma lopullinen kello lopullinen vaihto virhe Taulukko 6: Pelijakauman kehittyminen 16

20 17

21 Liiga / turnaus ottelu nro koti vieras Liiga / turnaus ottelu nro koti vieras LaLiga 1 Barcelona Valladolid VeikkausL 1 HJK TPS LaLiga 2 Barcelona At. Madrid VeikkausL 2 Fc Lahti Tampere U LaLiga 3 Real Madrid Sevilla VeikkausL 3 HJK KuPS LaLiga 4 Real Madrid Valencia VeikkausL 4 RoPS Fc Honka LaLiga 5 Barcelona Real Madrid VeikkausL 5 Inter MyPa LaLiga 6 Real Madrid Barcelona VeikkausL 6 HJK Fc Inter LaLiga 7 Osasuna Barcelona VeikkausL 7 TPS MyPa LaLiga 8 Villareal Real Madrid VeikkausL 8 TPS Fc Haka EPL 1 Manchester U Arsenal ConfCup 1 USA Brasili a EPL 2 Chelsea Liverpool ConfCup 2 Espanja USA EPL 3 Liverpool Arsenal ConfCup 3 USA Brasilia EPL 4 Manchester U Chels ea ConfCup 4 Espanja E Afrikka EPL 5 Manchester U Liverpool ConfCup 5 Brasilia E Afrikka EPL 6 Chelsea Manchester U EM08 1 Venäjä Espanja EPL 7 Liverpool Chelsea EM08 2 Portugali Saksa EPL 8 Arsenal Liverpool EM08 3 Hollanti Italia SerieA 1 Milan Lazio EM08 4 Tsekki Portugali SerieA 2 Fiorentina Juventus EM08 5 Kroatia Saksa SerieA 3 Juventus Udinese SM Liiga 1 JYP TPS SerieA 4 Udinese Milan SM Liiga 2 Jokerit Kärpät SerieA 5 Inter Siena SM Liiga 3 JYP Kärpät SerieA 6 Milan Juventus SM Liiga 4 Blues Tappara SerieA 7 Juventus Catania SM Liiga 5 Kärpät JYP SerieA 8 Inter Lazio SM Liiga 6 Kärpät Blues BundL 1 Hamburg Berlin SM Liiga 7 Lukko Kalpa BundL 2 Karlsruher Fc Köln SM Liiga 8 HIFK Jokerit BundL 3 Bayern München HSV NHL 1 Detroit Rangers BundL 4 Leverkusen Fc Köln NHL 2 Detroit Pittsburgh BundL 5 Schalke 04 Werder Bremen NHL 3 Detroit Chicago BundL 6 Bayern München Vfb Stuttgart NHL 4 St. Louis Los Angeles BundL 7 Hoffenheim Bayern München NHL 5 Phoenix Pittsburgh BundL 8 E. Frankfurt Karlsruher NHL 6 Pittsburgh Detroit NHL 7 Carolina Pittsburgh NHL 8 Nashville Detroit Taulukko 11: Kaikki analyyseissä käytetyt ottelut 18

22 12.2 Kuvat 0,12 keskimääräiset virheet selitysjakaumille 0,1 0,08 0,06 0,04 LPJ JMK mjmk 0,02 0 LaLiga EPL SerieA BundL VeikkausL Kuva 1: keskimääräiset virheet selitysjakaumille jalkapalloliigat 0,3000 Vaihdon ja virheen riippumattomuus Virhe 0,2500 0,2000 0,1500 0,1000 0,0500 JMK LPJ mjmk 0, Vaihto Kuva 2: Vaihdon ja virheen riippumattomuus jalkapalloliigat 19

23 Kuva 3: Kotijoukkueiden maalit jalkapallossa (liigat) Kuva 4: Vierasjoukkueiden maalit jalkapallossa (liigat) 20

24 0,03 Keskimääräiset virheet selitysjakaumille 0,025 0,02 0,015 0,01 SM Liiga NHL 0,005 0 LPJ JMK mjmk Kuva 5: Jääkiekko otteluiden ennustusmenetelmien keskimääräiset virheet. Kuva 6: Jääkiekko otteluiden pelijakaumien estimoinnit 21

25 Kuva 7: Poisson jakauman optimointi valituille otteluille Kuva 8: Negatiivisen binomijakauman optimointi valituille otteluille 22

26 Kuva 9: Pelijakauman kehittyminen ottelussa Fc Inter Fc Sheriff Kuva 10: La Ligan ja Valioliigan kauden maalijakaumat, sekä niiden estimaattorit 23

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

ENERGIALIIGA TIISTAI kellonaika kenttä sarja

ENERGIALIIGA TIISTAI kellonaika kenttä sarja ENERGIALIIGA TIISTAI 9.8.2016 17:30 Belgia v Saksa 1 C 17:30 Portugali v Italia 2 C 17:30 Hollanti v Ranska 3 C 17:30 Ruotsi v Irlanti 4 C 17:30 Sveitsi v Espanja 5 C 17:30 Englanti v Kroatia 6 C 18:00

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen

Lisätiedot

Tilastollisia peruskäsitteitä ja Monte Carlo

Tilastollisia peruskäsitteitä ja Monte Carlo Tilastollisia peruskäsitteitä ja Monte Carlo Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Tilastollisia peruskäsitteitä ja Monte Carlo 1/13 Kevät 2003 Tilastollisia

Lisätiedot

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Tilastollinen testaus. Vilkkumaa / Kuusinen 1 Tilastollinen testaus Vilkkumaa / Kuusinen 1 Motivointi Viime luennolla: havainnot generoineen jakauman muoto on usein tunnettu, mutta parametrit tulee estimoida Joskus parametreista on perusteltua esittää

Lisätiedot

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Testit laatueroasteikollisille muuttujille

Testit laatueroasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten

Lisätiedot

Ylikerroinstrategiat ja Poissonmallit vedonlyönnissä (aihe-esittely) Jussi Kolehmainen

Ylikerroinstrategiat ja Poissonmallit vedonlyönnissä (aihe-esittely) Jussi Kolehmainen Ylikerroinstrategiat ja Poissonmallit vedonlyönnissä (aihe-esittely) Jussi Kolehmainen 23.01.2012 Ohjaaja: Jussi Kangaspunta Valvoja: Ahti Salo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit laatueroasteikollisille muuttujille Laatueroasteikollisten muuttujien testit Testi suhteelliselle

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut Mat-2.091 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Yhteensopivuuden testaaminen Homogeenisuuden testaaminen Riippumattomuuden testaaminen Avainsanat: Estimointi, Havaittu frekvenssi, Homogeenisuus,

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme? TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin

Lisätiedot

Nollasummapelit ja bayesilaiset pelit

Nollasummapelit ja bayesilaiset pelit Nollasummapelit ja bayesilaiset pelit Kristian Ovaska HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Seminaari: Peliteoria Helsinki 18. syyskuuta 2006 Sisältö 1 Johdanto 1 2 Nollasummapelit 1 2.1

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

Väliestimointi (jatkoa) Heliövaara 1

Väliestimointi (jatkoa) Heliövaara 1 Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).

Lisätiedot

Estimointi. Vilkkumaa / Kuusinen 1

Estimointi. Vilkkumaa / Kuusinen 1 Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

11. laskuharjoituskierros, vko 15, ratkaisut

11. laskuharjoituskierros, vko 15, ratkaisut 11. laskuharjoituskierros vko 15 ratkaisut D1. Geiger-mittari laskee radioaktiivisen aineen emissioiden lukumääriä. Emissioiden lukumäärä on lyhyellä aikavälillä satunnaismuuttuja jonka voidaan olettaa

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo

Lisätiedot

D ( ) E( ) E( ) 2.917

D ( ) E( ) E( ) 2.917 Mat-2.091 Sovellettu todennäköisyyslasku 4. harjoitukset/ratkaisut Aiheet: Diskreetit jakaumat Avainsanat: Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen jakauma, Kertymäfunktio,

Lisätiedot

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 LIITE 1 VIRHEEN ARVIOINNISTA Mihin tarvitset virheen arviointia? Mittaustulokset ovat aina todellisten luonnonvakioiden ja tutkimuskohdetta kuvaavien suureiden likiarvoja, vaikka mittauslaite olisi miten

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu 5.3.2018/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 5.3.2018, osa 1 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2017

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (004) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (5) 1 Momenttiemäfunktio ja karakteristinen funktio Momenttiemäfunktio Diskreettien jakaumien momenttiemäfunktioita

Lisätiedot

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden 1.12.2006 1. Satunnaisjakauman tiheysfunktio on Ü µ Üe Ü, kun Ü ja kun Ü. Määritä parametrin estimaattori momenttimenetelmällä ja suurimman uskottavuuden menetelmällä. Ratkaisu: Jotta kyseessä todella

Lisätiedot

Otoskoko 107 kpl. a) 27 b) 2654

Otoskoko 107 kpl. a) 27 b) 2654 1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää

Lisätiedot

805306A Johdatus monimuuttujamenetelmiin, 5 op

805306A Johdatus monimuuttujamenetelmiin, 5 op monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista

Lisätiedot

III- Divisioona playoff- ottelut Etelän loppusarjan ylempi jatkosarja ja Kymi-Saimaan loppusarja

III- Divisioona playoff- ottelut Etelän loppusarjan ylempi jatkosarja ja Kymi-Saimaan loppusarja 6.3.2014 III- Divisioona playoff- ottelut Etelän loppusarjan ylempi jatkosarja ja Kymi-Saimaan loppusarja Huom. Välierät ja finaalit pelataan paras kahdesta järjestelmällä (ja 2 pisteen systeemillä) peliajan

Lisätiedot

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on Mat-2.090 Sovellettu todennäköisyyslasku A / Ratkaisut Aiheet: Avainsanat: Otanta Poisson- Jakaumien tunnusluvut Diskreetit jakaumat Binomijakauma, Diskreetti tasainen jakauma, Geometrinen jakauma, Hypergeometrinen

Lisätiedot

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu 10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio Ilkka Mellin Todennäköisyyslaskenta Osa : Satunnaismuuttujat ja todennäköisyysjakaumat Momenttiemäfunktio ja karakteristinen funktio TKK (c) Ilkka Mellin (7) 1 Momenttiemäfunktio ja karakteristinen funktio

Lisätiedot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1 Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA Oulun yliopisto Fysiikan opetuslaboratorio Fysiikan laboratoriotyöt 1 1 LIITE 1 VIRHEEN RVIOINNIST Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi

Lisätiedot

T Luonnollisten kielten tilastollinen käsittely

T Luonnollisten kielten tilastollinen käsittely T-61.281 Luonnollisten kielten tilastollinen käsittely Vastaukset 3, ti 11.2.2003, 16:15-18:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

4. laskuharjoituskierros, vko 7, ratkaisut

4. laskuharjoituskierros, vko 7, ratkaisut 4. laskuharjoituskierros, vko 7, ratkaisut D1. Kone valmistaa kuulalaakerin kuulia, joiden halkaisija vaihtelee satunnaisesti. Halkaisijan on oltava tiettyjen rajojen sisällä, jotta kuula olisi käyttökelpoinen.

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

VEDONLYÖNTI PELIOPAS

VEDONLYÖNTI PELIOPAS VEDONLYÖNTI PELIOPAS PITKÄVETO Tiedätkö kumpi voittaa vai päättyykö peli tasan? NÄIN SE SUJUU Pitkävedossa lyöt vetoa yhdestä tai useammasta pelikohteesta. Pitkävedon kohteet ja kertoimet saat pelimyyjältä,

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 5B Bayesläiset piste- ja väliestimaatit Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Harjoitus 2: Matlab - Statistical Toolbox

Harjoitus 2: Matlab - Statistical Toolbox Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE OPETUSSUUNNITELMALOMAKE Tällä lomakkeella dokumentoit opintojaksoasi koskevaa opetussuunnitelmatyötä. Lomake on suunniteltu niin, että se palvelisi myös Oodia varten tehtävää tiedonkeruuta. Voit siis dokumentoida

Lisätiedot

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE OPETUSSUUNNITELMALOMAKE Tällä lomakkeella dokumentoit opintojaksoasi koskevaa opetussuunnitelmatyötä. Lomake on suunniteltu niin, että se palvelisi myös Oodia varten tehtävää tiedonkeruuta. Voit siis dokumentoida

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

LIITE 1 VIRHEEN ARVIOINNISTA

LIITE 1 VIRHEEN ARVIOINNISTA 1 Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi miten uudenaikainen tai kallis tahansa ja mittaaja olisi alansa huippututkija Tästä johtuen mittaustuloksista

Lisätiedot

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin) 1/10 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Ratkaise

Lisätiedot

tilastotieteen kertaus

tilastotieteen kertaus tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla

Lisätiedot

Otteluohjelmien tekeminen. a) optimoimalla b) manuaalisesti siirtämällä

Otteluohjelmien tekeminen. a) optimoimalla b) manuaalisesti siirtämällä Otteluohjelmien tekeminen a) optimoimalla b) manuaalisesti siirtämällä Otteluohjelmien tekeminen tietokoneella optimoimalla käyttämällä CI:n PEAST-algoritmia (soveltuu ammattilaissarjoihin) Otteluohjelman

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1 T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A050 Todennäköisyyslaskennan ja tilastotieteen peruskurssi B Satunnaismuuttujat ja todennäköisyysjakaumat Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30. FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.

Lisätiedot

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle

Tilastollisen analyysin perusteet Luento 4: Testi suhteelliselle osuudelle Tilastollisen analyysin perusteet Luento 4: Sisältö Testiä suhteelliselle voidaan käyttää esimerkiksi tilanteessa, jossa tarkastellaan viallisten tuotteiden osuutta tuotantoprosessissa. Tilanne palautuu

Lisätiedot

Vedonlyöntistrategioiden simulointi ja evaluointi

Vedonlyöntistrategioiden simulointi ja evaluointi Vedonlyöntistrategioiden simulointi ja evaluointi Aleksi Avela 15.10.2018 Ohjaaja: Juho Roponen Valvoja: Ahti Salo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin

Lisätiedot

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan 17.11.2006 1. Kahdesta kohteesta (A ja K) kerättiin maanäytteitä ja näistä mitattiin SiO -pitoisuus. Tulokset (otoskoot ja otosten tunnusluvut): A K 10 16 Ü 64.94 57.06 9.0 7.29 Oletetaan mittaustulosten

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

Teema 8: Parametrien estimointi ja luottamusvälit

Teema 8: Parametrien estimointi ja luottamusvälit Teema 8: Parametrien estimointi ja luottamusvälit Todennäköisyyslaskennan perusteet (Teemat 6 ja 7) antavat hyvän pohjan siirtyä kurssin viimeiseen laajempaan kokonaisuuteen, nimittäin tilastolliseen päättelyyn.

Lisätiedot

2. TILASTOLLINEN TESTAAMINEN...

2. TILASTOLLINEN TESTAAMINEN... !" # 1. 1. JOHDANTO... 3 2. 2. TILASTOLLINEN TESTAAMINEN... 4 2.1. T-TESTI... 4 2.2. RANDOMISAATIOTESTI... 5 3. SIMULOINTI... 6 3.1. OTOSTEN POIMINTA... 6 3.2. TESTAUS... 7 3.3. TESTIEN TULOSTEN VERTAILU...

Lisätiedot

Harjoitukset 4 : Paneelidata (Palautus )

Harjoitukset 4 : Paneelidata (Palautus ) 31C99904, Capstone: Ekonometria ja data-analyysi TA : markku.siikanen(a)aalto.fi & tuuli.vanhapelto(a)aalto.fi Harjoitukset 4 : Paneelidata (Palautus 7.3.2017) Tämän harjoituskerran tarkoitus on perehtyä

Lisätiedot

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit Sisältö Tilastollisia testejä tehdään jatkuvasti lukemattomilla aloilla. Meitä saattaa kiinnostaa esimerkiksi se, että onko miesten ja

Lisätiedot

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi. 10.11.2006 1. Pituushyppääjä on edellisenä vuonna hypännyt keskimäärin tuloksen. Valmentaja poimii tämän vuoden harjoitusten yhteydessä tehdyistä muistiinpanoista satunnaisesti kymmenen harjoitushypyn

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4B Bayesläinen tilastollinen päättely Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy

Lisätiedot

Hallisarjan uudistaminen

Hallisarjan uudistaminen Hallisarjan uudistaminen Parin viimeisen vuoden aikana ollessani sarjavastaavana olen havainnut useita ongelmia hallisarjan järjestämiseen liittyen. Järjestämisongelmien lisäksi joukkueiden ja pelaajien

Lisätiedot

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin Tilastollisen analyysin perusteet Luento 10: Sisältö Varianssianalyysi Varianssianalyysi on kahden riippumattoman otoksen t testin yleistys. Varianssianalyysissä perusjoukko koostuu kahdesta tai useammasta

Lisätiedot

PALLOVERKKO SÄHKÖINEN OTTELUPÖYTÄKIRJA

PALLOVERKKO SÄHKÖINEN OTTELUPÖYTÄKIRJA PALLOVERKKO SÄHKÖINEN OTTELUPÖYTÄKIRJA 30.6.2011 KÄYTTÄJÄTUNNUKSEN TILAAMINEN LÖYTYY SIVUN ALAREUNASTA TUNNUSTEN TILAAMINEN: JOTTA PÄÄSEE KIRJAUTUMAAN JÄRJESTELMÄÄN TULOSPALVELUVASTAAVANA, PITÄÄ OLLA TUNNUKSET

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3

Lisätiedot

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1 Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (005) 1 Testit suhdeasteikollisille muuttujille Testit normaalijakauman parametreille Yhden otoksen t-testi Kahden

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 4. luento: Jakaumaoletuksien testaaminen Kai Virtanen 1 Jakaumaoletuksien testaamiseen soveltuvat testit χ 2 -yhteensopivuustesti yksi otos otoksen

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Satunnaismuuttujat ja todennäköisyysjakaumat Mitä tänään? Jos satunnaisilmiötä halutaan mallintaa matemaattisesti, on ilmiön tulosvaihtoehdot kuvattava numeerisessa muodossa. Tämä tapahtuu liittämällä

Lisätiedot

Kaikki kurssin laskuharjoitukset pidetään Exactumin salissa C123. Malliratkaisut tulevat nettiin kurssisivulle.

Kaikki kurssin laskuharjoitukset pidetään Exactumin salissa C123. Malliratkaisut tulevat nettiin kurssisivulle. Kombinatoriikka, kesä 2010 Harjoitus 1 Ratkaisuehdotuksia (RT (5 sivua Kaikki kurssin laskuharjoitukset pidetään Exactumin salissa C123. Malliratkaisut tulevat nettiin kurssisivulle. 1. Osoita, että vuoden

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut

Lisätiedot

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾. 24.11.2006 1. Oletetaan, että kaksiulotteinen satunnaismuuttuja µ noudattaa kaksiulotteista normaalijakaumaa. Oletetaan lisäksi, että satunnaismuuttujan regressiofunktio satunnaismuuttujan suhteen on ݵ

Lisätiedot

CHAMPIONS CUP

CHAMPIONS CUP CHAMPIONS CUP 2 16 6.2.2016 Champions Cup 2016 Turnaus pelataan kahdessa sarjassa, kilpa ja haaste, joissa molemmissa on kolme alkulohkoa. Kotijoukkue pelaa puffetin puoleisessa päädyssä ja vierasjoukkue

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 2A Satunnaismuuttujan odotusarvo Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Blackjack on korttipeli, jossa pelaajan tavoitteena on voittaa pelinhoitaja.

Blackjack on korttipeli, jossa pelaajan tavoitteena on voittaa pelinhoitaja. POHDIN projekti Blackjack Blackjack on pelinhoitajaa vastaan pelattava korttipeli mutta myös ns. uhkapeli 1. Kun kyseessä on ns. rahapeli, niin ikäraja Suomessa on tällaiselle pelille K-18. Blackjackissä

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 6. luento Pertti Palo 1.11.2012 Käytännön asioita Harjoitustöiden palautus sittenkin sähköpostilla. PalautusDL:n jälkeen tiistaina netistä löytyy

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi, kesä 2016 Laskuharjoitus 5, Kotitehtävien palautus laskuharjoitusten

Lisätiedot

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta MS-A00 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta 7.. Gripenberg Kirjoita jokaiseen koepaperiin nimesi, opiskelijanumerosi ym. tiedot ja minkä kokeen suoritat! Laskin,

Lisätiedot