Batch means -menetelmä

Samankaltaiset tiedostot
Väliestimointi (jatkoa) Heliövaara 1

Estimointi. Vilkkumaa / Kuusinen 1

3.6 Su-estimaattorien asymptotiikka

Tilastollinen aineisto Luottamusväli

Sovellettu todennäköisyyslaskenta B

Oletetaan, että virhetermit eivät korreloi toistensa eikä faktorin f kanssa. Toisin sanoen

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

S Tietoverkkojen simulointi / Varianssinreduktiotekniikat 1(37) Teoria

S Tietoverkkojen simulointi / Varianssinreduktiotekniikat 1(32) Teoria

Parametrin estimointi ja bootstrap-otanta

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Identifiointiprosessi

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Simuloinnin taktisia kysymyksiä

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Osa 2: Otokset, otosjakaumat ja estimointi

tilastotieteen kertaus

Sovellettu todennäköisyyslaskenta B

Simuloinnin taktisia kysymyksiä

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 6. luento. Pertti Palo

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

9. laskuharjoituskierros, vko 12-13, ratkaisut

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

Tilastollinen päättömyys, kevät 2017 Harjoitus 6B

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

Regressioanalyysi. Kuusinen/Heliövaara 1

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Mat Tilastollisen analyysin perusteet, kevät 2007

5.7 Uskottavuusfunktioon perustuvia testejä II

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Sovellettu todennäköisyyslaskenta B

2. Keskiarvojen vartailua

Teema 8: Parametrien estimointi ja luottamusvälit

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Kaksisuuntainen varianssianalyysi. Heliövaara 1

edellyttää valintaa takaisinpanolla Aritmeettinen keskiarvo Jos, ½ Ò muodostavat satunnaisotoksen :n jakaumasta niin Otosvarianssi Ë ¾

Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:

dx=5&uilang=fi&lang=fi&lvv=2014

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tutkimustiedonhallinnan peruskurssi

riippumattomia ja noudattavat samaa jakaumaa.

Harjoitus 7: NCSS - Tilastollinen analyysi

11 Raja-arvolauseita ja approksimaatioita

3 Yleistä estimointiteoriaa. Olemme perehtuneet jo piste-estimointiin su-estimoinnin kautta Tässä luvussa tarkastellaan piste-estimointiin yleisemmin

805306A Johdatus monimuuttujamenetelmiin, 5 op

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

1. Tilastollinen malli??

Sovellettu todennäköisyyslaskenta B

Kaksisuuntainen varianssianalyysi. Vilkkumaa / Kuusinen 1

ABHELSINKI UNIVERSITY OF TECHNOLOGY

2. Uskottavuus ja informaatio

031021P Tilastomatematiikka (5 op) viikko 5

Maximum likelihood-estimointi Alkeet

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Tilastolliset menetelmät. Osa 1: Johdanto. Johdanto tilastotieteeseen KE (2014) 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

4.0.2 Kuinka hyvä ennuste on?

Harjoitus 2: Matlab - Statistical Toolbox

,ܾ jaü on annettu niin voidaan hakea funktion

Tutkimustiedonhallinnan peruskurssi

Tilastollisia peruskäsitteitä ja Monte Carlo

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

Sovellettu todennäköisyyslaskenta B

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Testejä suhdeasteikollisille muuttujille

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Mat Tilastollisen analyysin perusteet, kevät 2007

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

Mat Tilastollisen analyysin perusteet, kevät 2007

pitkittäisaineistoissa

Testit laatueroasteikollisille muuttujille

Korrelaatiokertoinen määrittely 165

10. laskuharjoituskierros, vko 14, ratkaisut

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Transkriptio:

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 1(9) Batch means -menetelmä Batch means -menetelmää käytetään hyvin yleisesti Simulointi suoritetaan tässä yhtenä pitkänä ajona olkoon simuloinnin pituus M tässä ajatellaan, että järjestelmää tarkastellaan asiakaspohjaisesti, jolloin M voi tarkoittaa kiinnostavien havaintojen lukumäärää (yhtä hyvin M voisi tarkoittaa aikaa) olkoon kiinnostuksen kohteena oleva suure X (esim. odotusaika jonossa) ja tehtävänä on arvioida sen odotusarvo µ = E[X] Simuloinnin alusta karsitaan pois alkulämmittelyosuutena K havaintoa Hyötyajo (pituus M K) jaetaan N:ään erään (batches) eli jokaisessa erässä havaintojaon n = M K N

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 2(9) Batch means -menetelmä (jatkoa) Erässä i saadaan X:lle otoskeskiarvo (X ij on j:s havainto kyseisessä erässä) X i = 1 n X ij j=1 Lopullinen estimaattori odotusarvolle µ on ˆµ N = 1 N N X i = 1 nn N X ij j=1 Tämä on yksinkertaisesti otoskeskiarvo koko ajosta (alkutransientin karsinnan jälkeen) eriin jakamisella ei ole mitään merkitystä itse estimaattorin arvon kannalta sen ainoana tarkoituksena on saada käsitys estimaattorin luottamusvälistä Olettaen, että erät ovat kyllin pitkiä, otoskeskiarvot X i ovat likimain riippumattomia Niiden otosvarianssi tarjoaa silloin estimaatin yksittäisen X i :n varianssille S 2 = 1 N ( N 1 X i ˆµ N ) 2

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 3(9) Batch means -menetelmä (jatkoa) Estimaattorin luottamusväli (luottamustasolla 1 β) on S ˆµ N ± z 1 β/2 N Menetelmän etuna on, että lämmittelyjaksoja on vain yksi Eriä pitäisi olla vähintään luokkaa 20-30 kappaletta, jotta otosvarianssi voidaan järkevästi arvioida Erien pitää olla kestoltaan riittävän suuria (paljon pitempiä kuin alkutransientin kesto), jotta X i :t olisivat likimain riippumattomia Jos riippuvuutta on, korrelaatio on yleensä positiivinen Tällöin ˆµ:n todellinen luottamusväli on suurempi kuin edellä annettu riippumattomien erien oletukseen perustuva arvio riippuvuus ei mitenkään heikennä itse estimaattorin arvoa se voi ainoastaan johtaa siihen, että arvio estimaattorin tarkkuudesta on liian optimistinen

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 4(9) Regeneratiivinen menetelmä (uusiutumismenetelmä) Soveltuu ns. regeneratiivisiin järjestelmiin Tällaisella järjestelmällä on olemassa ainakin yksi regeneraatiotila järjestelmän kehitys tästä eteenpäin ei riipu lainkaan siitä, miten tilaan on tultu Markovisten järjestelmien jokainen tila on regeneratiivinen G/G/1-jonossa tila, jossa systeemi on tyhjä, on regeneratiivinen Jos regeneratiivisia tiloja on useita, valitaan niistä yksi menetelmän pohjaksi jatkossa regeneraatiotilalla tarkoitetaan kyseistä valittua tilaa Järjestelmä aina silloin tällöin palaa regeneraatiotilaan eli regeneroi itsensä tästä alkaa uusi elämä joka ei riipu entisestä

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 5(9) Regeneratiivinen menetelmä (jatkoa) Hetkeä, jolloin järjestelmä palaa regeneraatiotilaan, kutsutaan regeneraatiopisteeksi Periodia kahden regeneraatiopisteen välillä kutsutaan regeneraatiojaksoksi Regeneraatiojaksojen kulut ovat täysin toisistaan riippumattomia tämä on koko menetelmän varsinainen idea τ 1 τ 2 τ 3 τ 4 τ 5

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 6(9) Regeneratiivinen menetelmä: piste-estimaatori Olkoon tutkittavan suureen kumulatiivinen arvo regeneraatiojakson aikana X, esim. kokonaisaika, jonka systeemi on ollut estotilassa jakson aikana puskurista ylivuotaneiden solujen lukumäärä jakson aikana Olkoon τ regeneraatiojakson kesto tämä voi tarkoittaa jakson todellista kestoa ajassa voi olla myös esim. saapumisten lukumäärä regeneraatiojakson aikana Tutkittavan suureen odotusarvolle l (esim. aikaeston odotusarvolle) pätee l = E[X] E[τ] n:n regeneraatiojakson jälkeen saadaan (vahvasti konsistentti) estimaattori l n = X τ missä X ja τ ovat otoskeskiarvot X = 1 n X i ja τ = 1 n τ i

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 7(9) Regeneraatiomenetelmän estimaattorin luottamusväli Tarkastellaan muuttujaa Z i = X i lτ i Z i :t ovat riippumattomia identtisesti jakautuneita sm:ia (odotusarvo 0) samoin X i :t ja τ i :t Merkitään X = 1 X i, τ = 1 n n Keskeisen raja-arvolauseen mukaan τ i, Z = 1 n Z i = X l τ n 1/2 Z σ = n1/2 ( X l τ) σ N(0, 1), kun n missä σ 2 on Z:n varianssi σ 2 =V[Z] =V[X] 2lCov[X, τ]+l 2 V[τ]

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 8(9) Luottamusväli regeneraatiomentelmässä (jatkoa) Jakamalla τ:lla saadaan n 1/2 ( l n l) σ/ τ N(0, 1), kun n n:n regeneraatiojakson mittaukseen perustuvan piste-estimaattorin l n luottamusväliksi saadaan (luottamustasolla 1 β) l n ± z 1 β/2s n τ missä S 2 on otoksesta laskettu harhaton σ 2 :n estimaattori S 2 = S 11 2 l n S 12 + l 2 n S 22 ja S 11, S 22 ja S 12 ovat X:n ja τ:n otosvarianssit ja kovarianssi S 11 = 1 (X i n 1 X) 2, S 22 = 1 (τ i τ) 2, S 12 = 1 n 1 n 1 (X i X)(τ i τ)

S-38.148 Tietoverkkojen simulointi / Tulosten keruu ja analyysi 9(9) Regeneratiivinen menetelmä: tarkastelua Menetelmän etuja erillistä transientin poistoa ei tarvita etukäteen ei tarvitse kiinnittää parametreja kuten batchien lukumäärä asymptoottisesti tarkka helppo ymmärtää ja toteuttaa Menetelmällä on kuitenkin seuraavia haittoja käytännössä voi olla vaikea identifioida regeneraatiopisteitä jos sellainen löytyykin regeneraatiojakso voi olla hyvin pitkä (siihen ei voi vaikuttaa) mutkikkaassa järjestelmässä tilan tunnistaminen voi olla laskennallisesti kallista äärellisellä arvolla n estimaattori l n on harhainen itse asiassa alkutransienttiongelma on sittenkin olemassa vaikkakin piilossa