S-38.45 Liikenneteorian perusteet K-99 5. Liikenteen mallinnus ja mittaus lect5.ppt Sisältö Perinteinen puhelinliikenteen mallinnus Liikenteen vaihtelu Liikenteen mittaus Perinteinen dataliikenteen mallinnus Uudet dataliikenteen mallit
Puhelinliikenteen mallinnus Puhelinverkossa liikenne koostuu kutsuista (puheluista) Verkon kannalta on tärkeää kuvata kutsujen saapumisprosessi (millä hetkillä uusia puheluja yritetään käynnistää) kutsujen pitoaikajakauma (miten kauan yksittäiset puhelut kestävät) Nämä yhdessä muodostavat liikenneprosessin, joka kertoo montako puhelua on yhtaikaa käynnissä (ts. montako kanavaa on yhtaikaa varattuna) eli kuljetetun liikenteen (voimakkuuden) erlangeina Tiettynä ajanjaksona kuljetettua kokonaisliikennettä sanotaan liikennemääräksi eli liikenteen volyymiksi. Kyseessä on siis liikenteen voimakkuuden integraali yli ko. ajanjakson. 3 Liikenneprosessi 6 5 4 3 kanavakohtainen varaustilanne käynnissä oleva kutsu 6 5 4 3 0 kutsujen saapumishetket estynyt kutsu varattujen kanavien lkm liikennemäärä aika aika 4
Kutsujen saapumisprosessin mallinnus () aggregoitu liikenne (runkoverkko) perinteinen malli: Poisson-prosessi hyvin lyhyellä aikavälillä dt tulee joko uusi kutsu (tn:llä λdt) tai sitten ei (tn:llä - λdt) eri aikavälit ovat toisistaan riippumattomia tuloksena riippumattomat ja eksponentiaaliset saapumisten väliajat keskiarvolla /λ malli toimii, jos hyvin suuri käyttäjäpopulaatio, joka tekee päätöksiä kutsujen käynnistämisestä toisistaan (ja aiemmista päätöksistään) riippumatta vastaavat järjestelmämallit: Poisson-malli (ääretön kapasiteetti) Erlang-malli (äärellinen kapasiteetti) hierarkiseen vaihtoehtoisreititykseen liittyvä ylivuotoliikenne mallinnettu esim. keskeytyvänä Poisson-prosessina (Interrupted Poisson Process, IPP) tai yleisemmin Markov-moduloituna Poisson-prosessina (MMPP) ideana on, että Poisson-prosessin mukaiset saapumiset sallitaan tai estetään riippuen ns. moduloivan prosessin tilasta 5 Kutsujen saapumisprosessin mallinnus () yksittäinen käyttäjä (tilaajan käyttäytymisen mallinnus) perinteinen malli: eksponentiaalinen on-off-prosessi sekä kutsun pitoajat että eri kutsujen väliset ajat oletetaan eksponentiaalisesti jakautuneiksi (tosin eri parametreilla) yksittäisten käyttäjien superpositio eli kerrostaminen (tilaajaverkko) äärellinen määrä yksittäisiä käyttäjiä, jotka mallinnetaan kuten yllä ja toimivat toisistaan riippumatta vastaavat järjestelmämallit: Binomi-malli (riittävä kapasitetti) Engset-malli (riittämätön kapasiteetti) 6 3
Binomi-mallin liikenneprosessi 6 5 4 3 käyttäjäkohtainen kanavanvaraustilanne käynnissä oleva kutsu kutsujen saapumishetket aika 6 5 4 3 0 varattujen kanavien lkm liikennemäärä aika 7 Kutsujen pitoajan mallinnus perinteinen malli: eksponentiaaliset pitoajat parametri => yksinkertaisuus! muistittomuus: kestettyään jo ajan t, kutsu päättyy lyhyessä aikavälissä [t,t+dt] ajasta t riippumattomalla tn:llä µdt häntäjakauma katoaa eksponentiaalista vauhtia monimutkaisempia malleja: normaalijakauma (vain approksimatiivisesti, sillä negatiiviset arvot mahdollisia) parametria (keskiarvo, hajonta) log-normaalijakauma (so. pitoajan logaritmi normaalinen) parametria Weibull-jakauma parametria, tiheysfunktio β α β x f ( x ) = α β x e hypereksponentiaalijakauma k k kertymäfunktio P( X x) = pi exp( λ i x), missä pi = pitoaika riippuu myös siitä, i= i= onko kyseessä liike- vai yksityispuhelu (päivä vs. ilta) onko kyseessä tavallinen puheyhteys vai kenties puhelinyhteyden käyttö muihin tarkoituksiin (kuten Internet-surffailu, faxin lähetys yms.) 8 4
Sisältö Perinteinen puhelinliikenteen mallinnus Liikenteen vaihtelu Liikenteen mittaus Perinteinen dataliikenteen mallinnus Uudet dataliikenteen mallit 9 Liikenne vaihtelee useissa eri aikaskaaloissa trendikehitys (> vuosi) liikenteen määrän kasvu: olemassaolevat palvelut: käyttäjien määrän kasvu, käyttötottumuksen muutokset, tariffien muutokset uudet palvelut liikenne-ennusteet antavat lähtökohdan verkon suunnittelulle kausivaihtelu (kuukausia) vuodenaikoihin liittyvät vaihtelut (lomakausien kuopat) viikkorytmin vaihtelut (päiviä) eri viikonpäiviin liittyvät aktiviteettivaihtelut päiväprofiili (tunteja) työpäivän kulkuun liittyvät vaihtelut satunnaisvaihtelut (sekunteja - minuutteja) toisistaan riippumattomien käyttäjien lkm:n vaihtelut satunnainen saapumisprosessi (Poisson-prosessi) ja satunnaiset pitoajat (Exp-jak.) Huom. Viimeksimainittu komponentti on puhtaasti stokastinen. Muut vaihtelut noudattavat tiettyä profiilia, joista kuitenkin tapahtuu satunnaisia poikkeamia. Jokainen päivä, viikko, kuukausi jne on erilainen 0 5
Päiväprofiilin huippu: kiiretunti Verkon mitoittaminen suurimman milloinkaan esiintyvän liikennehuipun varalle ei ole tarkoituksenmukaista. Käytännön mitoitustehtäviä varten on haluttu kehittää laskennallinen liikennekuormaa kuvaava suure, joka kohtuullisessa määrin pyrkii esittämään huippukuormaa, mutta joka kuitenkin keskiarvoistaa yksittäiset liikennepiikit pois => Mitoitukseen sopivien keskimääräisten arvojen määräämiseksi suosituksissa on määritelty kiiretunnin liikenteelle tietty mittaustapa Itse asiassa on useita eri kiiretunnin liikenteen määritelmiä kiiretunti se yhden tunnin pituinen jakso, jona liikenteen volyymi on suurin Liikenne huojuu satunnaisten tekijöiden vaikutuksesta jatkuvasti keskimääräisen käyttäytymisensä ympärillä Kiiretunnin määritelmiä ADPH (Average Daily Peak Hour) huipputuntimenetelmä määrätään kullekin päivälle erikseen (mahdollisesti eri ajankohtiin sijoittuva) huipputunti ja keskiarvoistetaan liikenne esim. 0 päivän yli => a ADPH huipputunnin sijoittumisen tarkkuutena voi olla joko täysi tunti (ADPH-F) tai neljännestunti (ADPH-Q) TCBH (Time Consistent Busy Hour) kiiretuntimenetelmä joka päivä samaan kellonaikaan sijoittuva tunnin jakso, jona laskettu liikenteen keskiarvo (esim. 0 päivän ajalta) on suurin => a TCBH kiiretunnin sijoittumisen tarkkuutena voi olla joko täysi tunti tai neljännestunti FDMH (Fixed Daily Measurement Hour) etukäteen valittuun mittausaikaan (esim. 9.30-0.30) perustuva liikennemäärän mittaus, joka keskiarvoistetaan esim. 0 päivän ajalta => a FDMH afdmh atcbh aadph 6
Sisältö Perinteinen puhelinliikenteen mallinnus Liikenteen vaihtelu Liikenteen mittaus Perinteinen dataliikenteen mallinnus Uudet dataliikenteen mallit 3 Liikenteen mittaus () Liikennemittauksia tarvitaan mitoituksen pohjaksi liikennemallien luomiseksi liikenne-ennusteiden tekemiseksi verkon liikenteenhallinnan toteuttamiseksi dynaamisen reitityksen toteuttamiseksi laskutustiedon keräämiseksi Liikennemittausten tarve kasvaa tulee uusia palveluita ja uudenlaisia verkkoja liikenteen luonne muuttuu, käyttötottumukset muuttuvat liikenne tietoverkoissa on erilaista kuin perinteisessä puhelinverkossa 4 7
Liikenteen mittaus () Puhelinverkon mittaukset liikenne eri johdoilla (liikenteen määrä aikayksikössä, varattuina kanavina) tarkemmin pitoajat, saapumisväliajat eri suuntiin lähtevän liikenteen jakauma eri suunnista tulevan liikenteen jakauma liikenteen jakauma lähteen tyypin mukaan eri palveluiden käyttö Internetin/lähiverkkojen mittaukset liikenne eri linkeissä (liikenteen määrä aikayksikössä, bitteinä sekunnissa) pakettitasolla (IP) pakettien koot, saapumisväliajat yhteystasolla (TCP) yhteyksien kestot sovellutuksittain (ftp / http / email / telnet etc.) Mittaukset toteutetaan keskusten tai reitittimien omilla tiedonkeruujärjestelmillä erillisillä liikenneanalysaattoreilla 5 Liikenneintensiteetin arviointi mittaamalla liikenneprosessia Tarkastellaan liikenneprosessia jollakin aikavälillä [0.T] (esim. kiiretunti) Pyritään arvioimaan liikenteen intensiteettiä a (olettaen, että se pysyy kyseisenä aikana vakiona) Liikenneintensiteetin a harhaton estimaatti on liikenteen määrä tiettynä ajanjaksona [0,T] -------------------------------------------------------- jakson pituus T Toisin sanoen, ko. satunnaismuuttujan odotusarvo on a Liikennemäärä ko. ajanjaksolla saadaan joko mittaamalla se jatkuvalla mittauksella arvioimalla se säännöllisin väliajoin ( ) tehdyin pistokokein (näytteenotto) 6 8
Erilaiset mittaustavat Jatkuva mittaus rekisteröi varattujen kanavien lkm:n hetkellä 0 rekisteröi kunkin uuden yhteyden tarkan alkuhetken rekisteröi kunkin yhteyden tarkan lopetushetken tuottaa näin tarkan arvon ko. välissä kertyneelle liikennemäärälle Säännöllisin väliajoin tehdyissä pistokokeissa rekisteröidään varattujen kanavien lkm X(t) hetkillä t = 0,,,..., T- liikennemäärä arvioidaan kertomalla näytteet X(t) välin pituudella ja summaamalla yli t:n arvioidussa liikennemäärässä on selvästikin mittaukseen liittyvää epätarkkuutta: mitä lyhyempi mittausväli, sitä tarkempi arvio 7 Jatkuva mittaus pistokokeet 8 9
Estimaatin tarkkuudesta Em. menetelmin saatu liikenneintensiteetin estimaatti ei tietenkään ole aivan tarkka, vaan siinä on liikenteen satunnaisista vaihteluista johtuvaa virhettä (liikennemäärä on itsessään satunnaismuuttuja) ja pistokokein tehdyssä mittauksessa lisäksi mittaustavasta johtuvaa virhettä. Oletukset: Poisson-saapumiset, Exp-pitoajat keskiarvolla h =, ääretön systeemi Jatkuvaan mittaukseen perustuvan estimaatin suhteellinen virhe on tällöin likimain (kun T on hyvin pieni) a (kun T on tarpeeksi suuri) a T Pistokokeisiin perustuvan estimaatin suhteellinen virhe on tällöin likimain + exp( ) (kun T on tarpeeksi suuri) a T exp( ) 9 Huomioita Esimerkiksi pyrittäessä p = 5%:n tarkkuuteen a = 00 erlangin liikenteessä jatkuvassa mittauksessa mittausvälin T pitää olla vähintään T = 00 = a 8 keskim. pitoaikaa p 00 5 sen sijaan otettaessa näytteitä liikenteestä kerran keskimääräisessä pitoajassa ( = ) mittausvälin T pitää olla vähintään + exp( ). 64 T a exp( ) p 00 87. keskim. pitoaikaa Myös varattujen kanavien lkm X(t) millä tahansa hetkellä t on liikenneintensiteetin harhaton estimaatti, ts E[X(t)] = a. Samoin oletuksin kuin yllä, tiedämme, että X(t) noudattaa Poisson-jakaumaa parametrilla a. Suhteellinen virhe on tässä tapauksessa D[X(t)]/E[X(t)] = / a (eli odotetusti sama kuin jatkuvassa mittauksessa hyvin pienillä T:n arvoilla) 00 5 0 0
Mittaustulosten käsittely Perinteistä tilastollista analyysia Tunnuslukujen estimointi liikenneintensiteetti varianssi huipukkuus, variaatiokerroin,... Tiheysfunktioestimointi Uusia menetelmiä Skaalautuvuusominaisuuksien tarkastelu itsesimilaarisuus multifraktaalisuus Sisältö Perinteinen puhelinliikenteen mallinnus Liikenteen vaihtelu Liikenteen mittaus Perinteinen dataliikenteen mallinnus Uudet dataliikenteen mallit
Dataliikenteen mallinnus Yhteystasolla uusia yhteyksiä syntyy Poisson-prosessin mukaisesti yhteyksien kestot ovat eksponentiaalisesti jakautuneita Pakettitasolla Poisson-prosessin mukaiset saapumiset puskuriin siis eksponentiaaliset ja riippumattomat pakettien väliajat eksponentiaalisesti jakautuneet pakettien pituudet => eksponentiaalisesti jakautuneet lähetysajat Pakettitason liikenneprosessin luonne jatkuvassa ajassa tarkasteltuna on vain kaksi vaihtoehtoa joko linkin kapasiteetti on kokonaan käytössä tai sitten se ei ole ollenkaan käytössä riippuen siitä, onko linkkiä syöttävässä puskurissa paketteja vai ei keskiarvoistettaessa tätä prosessia varatulle kapasiteetille tulee useampia arvoja 3 Pakettitason liikenneprosessi 4 3 0 puskurissa olevien pakettien lkm pakettien saapumishetket aika linkin varaustilanne C aika 4
Liikenneprosessin keskiarvoistus linkin varaustilanne (jatkuva) C aika linkin varaustilanne (keskiarvoistettu) C aika 5 Sisältö Perinteinen puhelinliikenteen mallinnus Liikenteen vaihtelu Liikenteen mittaus Perinteinen dataliikenteen mallinnus Uudet dataliikenteen mallit 6 3
Esimerkki liikennemittauksesta: Ethernet 80-luvun lopussa ja 90-luvun alussa Fowler, Leland et al. suorittivat Bellcoren Ethernet-verkossa pitkäaikaisen, useita kuukausia kestäneen mittauksen, jossa rekisteröitiin jokaisen paketin koko ja lähetyshetki Tulokset ovat olleet käänteentekeviä Osoittautui, että perinteisen liikennemallien oletukset (Poisson-saapumisprosessi, Expjakaumat) soveltuvat varsin huonosti tyypillisen dataliikenteen kuvaamiseen Dataliikenne vaihtelee kaikissa aikaskaaloissa mikrosekunneista milli-sekunteihin, sekunteihin, tunteihin, kuukausiin, Jollakin tarkkuudella liikenteellä on itsesimilaarinen ominaisuus (self-similar): jos sitä tarkastellaan eri aikaskaaloissa (zoomataan) se näyttää samanlaiselta, ainoastaan vaihteluiden amplitudi muuttuu Itsesimilaarisuuteen liittyy pitkän ajan riippuvuus (long range dependence) seurauksena itsesimilaarisuudesta, jos prosessilla positiivisia korrelaatioita, ja eri jakaumien (pakettien koko ja väliaika) paksuhäntäisyys (heavy tailed distribution), mikä tarkoittaa, että jakauman häntä katoaa suhteessa johonkin potenssiin (siis oleellisesti hitaammin kuin eksponentiaalisesti) 7 8 4
Esimerkki liikennemittauksesta: Internet Paxson ja Floyd ovat 90-luvulla tutkineet Internet-liikennettä sekä yhteystasolla että pakettitasolla Yhteystasolla tuloksena oli, että yhteydet, joihin liittyy todellinen (elävä) käyttäjä ja joissa ko. käyttäjä ei käynnistä uusia yhteyksiä istuntonsa aikana (kuten TELNET ja FTP-istuntoihin liityvät TCP-yhteydet), voidaan mallintaa Poisson-saapumisprosessilla (kuitenkin tuntikohtaisin keskiarvoin) sen sijaan muunlaiset yhteydet, ts. aidosti tietokoneiden väliset (SMTP, NNTP) sekä sellaiset, joissa käyttäjä luo useita yhteyksiä saman istunnon aikana (kuten WWW:tä käytettäessä sekä FTP:n tiedonsiirtovaiheessa) ovat purskeisempia kuin mitä Poissonmalli antaisi olettaa: saapumisväliaikojen korreloituneisuus Pakettitasolla taas todettiin, että TELNET pakettien väliaikojen jakauma on paksuhäntäinen (eikä eksponentiaalinen) pakettien väliajat ovat korreloituneita 9 Dataliikenteen uudet mallit Pitkähäntäiset jakaumat (long-tailed distributions) kuten log-normaalinen ja Weibull-jakauma Paksuhäntäiset jakaumat (heavy-tailed distributions) kuten Pareto-jakauma (ääretön varianssi) α P( X x) = ( b / x), missä x b Pitkän aikavälin riippuvuutta (long range dependence) sisältävät prosessit itse-similaariset ja asymptoottisesti itse-similaariset prosessit Itsesimilaariset prosessit (self-similar processes) I. Norros (VTT) on ehdottanut ja soveltanut ns. fraktionaalista Brownin liikkeen mallia prosessi on aidosti itsesimilaarinen mallissa on vain 3 parametria, joista yksi, ns. Hurstin parametri H kuvaa pitkän aikavälin riippuvuutta (kunhan H > ½) kuvaa varsin hyvin aggregoidun liikenteen käyttäytymistä 30 5
Esimerkki paksuhäntäisyyden ja itsesimilaarisuuden välisestä yhteydestä Tarkastellaan ääretöntä systeemiä (M/G/ ) asiakkaita saapuu Poisson-prosessin mukaan pitoajat riippumattomia ja samoin jakautuneita pitoajan jakaumalla paksu häntä tarkemmin: jakaumalla ääretön varianssi, kuten esim. Pareto-jakaumalla sopivilla parametreillä Tällöin asiakkaiden lkm systeemissä on asymptoottisesti itsesimilaarinen prosessi 3 Esimerkki: ATM-liikenteen mallinnus Tarkastellaan liikennettä kolmessa eri aikaskaalassa 3 6
ATM-liikenteen mallinnus Kutsutaso voidaan mallittaa piirikytkentäisenä verkkona ainakin silloin kun tarkastellaan CBR (constant bit rate) tai VBR (variable bit rate) -yhteyksiä. Pursketaso jatkuvatilaiset purskeiden pituudet yleensä mallitetaan nestemallilla (fluid flow model), jossa liikenne kuvataan nesteenä ja palvelin ämpärinä, jossa on pohjassa vakiokokoinen reikä liikennemalleja ON-OFF-lähteiden superpositio uusiutumisprosessit itsesimilaariset prosesstit kuten FBM (fraktionaalinen Brownin liike) Poisson-purskeprosessit,... Solutaso vakiomittaiset solut liikennemalleja periodiset riippumattomat lähteet Poisson-prosessit diskreettiaikaiset Markov-saapumiset,... 33 7