Internet ja muut informaatioverkostot



Samankaltaiset tiedostot
VERKKORAKENTEEN VAIKUTUKSIA KAIKKI SOLMUT EIVÄT OLE SAMANLAISIA

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Arvostus Verkostoissa: PageRank. Idea.

MALLEJA JA MITTAREITA EPÄUNIFORMEILLE VERKOILLE

MALLEJA JA MITTAREITA

Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen

isomeerejä yhteensä yhdeksän kappaletta.

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Algoritmit 2. Luento 11 Ti Timo Männikkö

Algoritmit 1. Luento 9 Ti Timo Männikkö

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

Markov-ketjut pitkällä aikavälillä

Verkon värittämistä hajautetuilla algoritmeilla

Algoritmit 1. Luento 8 Ke Timo Männikkö

Suunnatut, etumerkilliset ja arvotetut graafit Sosiaalisten verkostojen analysoinnin näkökulmalla

Matematiikka ja teknologia, kevät 2011

2. Seuraavassa kuvassa on verkon solmujen topologinen järjestys: x t v q z u s y w r. Kuva 1: Tehtävän 2 solmut järjestettynä topologisesti.

PARITUS KAKSIJAKOISESSA

A TIETORAKENTEET JA ALGORITMIT

Suomen rautatieverkoston robustisuus

V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

58131 Tietorakenteet ja algoritmit (kevät 2013) Kurssikoe 2, , vastauksia

j n j a b a c a d b c c d m j b a c a d a c b d c c j

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Etsintä verkosta (Searching from the Web) T Datasta tietoon Jouni Seppänen

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

Finna käytön trendit 2014 Tiivistelmä

Erilaisia Markov-ketjuja

Informaation leviäminen väkijoukossa matemaattinen mallinnus

KYMENLAAKSON AMMATTIKORKEAKOULU Tietotekniikka / Tietoverkkotekniikka. Antti Parkkinen. ICTLAB tuotantoverkon IPv6 toteutus

10. Painotetut graafit

Tämän luvun sisältö. Luku 9. Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa. Webin lyhyt historia 1992: ensimmäisiä selaimia

Algoritmit 1. Luento 10 Ke Timo Männikkö

Johdatus graafiteoriaan

Johdatus verkkoteoriaan 4. luento

Luku 8. Aluekyselyt. 8.1 Summataulukko

Poikkeavuuksien havainnointi (palvelinlokeista)

Luku 9. Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa

Esimerkki: Tietoliikennekytkin

Logistinen regressio, separoivat hypertasot

Diskreetin matematiikan perusteet Esimerkkiratkaisut 3 / vko 10

Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen

Kustannustehokkaat riskienhallintatoimenpiteet kuljetusverkostossa (Valmiin työn esittely)

Probabilistiset mallit (osa 1) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 1 Jorma Merikoski Tampereen yliopisto

Induktiotodistus: Tapaus n = 0 selvä; ol. väite pätee kun n < m.

T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet )

j(j 1) = n(n2 1) 3 + (k + 1)k = (k + 1)(k2 k + 3k) 3 = (k + 1)(k2 + 2k + 1 1)

Verkkosyöte on erityinen tiedostomuoto, jonka avulla sivustojen päivityksiä voi jakaa nopeasti ja tehokkaasti.

Algoritmi on periaatteellisella tasolla seuraava:

Matriisilaskenta Luento 8: LU-hajotelma

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

58131 Tietorakenteet (kevät 2009) Harjoitus 11, ratkaisuja (Topi Musto)

30A02000 Tilastotieteen perusteet

Algoritmit 1. Luento 1 Ti Timo Männikkö

Miten toimia epidemiaepäilyssä? Ruska Rimhanen-Finne Epidemiologieläinlääkäri Infektiotautien torjunta ja rokotukset -yksikkö

l (φ; y) = l(θ(φ); y) Toinen derivaatta saadaan tulon derivaatan laskusäännöllä Uudelleenparametroidun mallin Fisherin informaatio on

Markov-ketjut pitkällä aikavälillä

Graafit ja verkot. Joukko solmuja ja joukko järjestämättömiä solmupareja. eli haaroja. Joukko solmuja ja joukko järjestettyjä solmupareja eli kaaria

verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen

Algoritmit 2. Luento 7 Ti Timo Männikkö

Tietorakenteet ja algoritmit - syksy

Kytkentäkentät, luento 2 - Kolmiportaiset kentät

4.1 Urakäsite. Ympyräviiva. Ympyrään liittyvät nimitykset

Tietorakenteet, laskuharjoitus 10, ratkaisuja. 1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

Kokonaislukuoptimointi hissiryhmän ohjauksessa

Algoritmit 1. Luento 13 Ti Timo Männikkö

Kiinnostuspohjainen topologian hallinta järjestämättömissä vertaisverkoissa

Implementation of Selected Metaheuristics to the Travelling Salesman Problem (valmiin työn esittely)

1. Mitä tehdään ensiksi?

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Webforum. Version 14.4 uudet ominaisuudet. Viimeisin päivitys:

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

TAMPEREEN YLIOPISTON KIRJASTO JULKAISUKESKUS

811312A Tietorakenteet ja algoritmit Kertausta jälkiosasta

Avoimen tieto luokkahuoneeseen Esimerkkejä avoimen ympäristötiedon hakemisesta. Ihan Pihalla & lähivedet kuntoon! luonnos 27.4.

Tarkennamme geneeristä painamiskorotusalgoritmia

Ympyrä 1/6 Sisältö ESITIEDOT: käyrä, kulma, piste, suora

Lähteisiin viittaaminen ja lähdekritiikki

ORMS2020 Päätöksenteko epävarmuuden vallitessa Syksy päätöspuiden avulla tarkastellaan vasta seuraavissa harjoituksissa.

Ongelma 1: Ovatko kaikki tehtävät/ongelmat deterministisiä?

Algoritmit 1. Luento 10 Ke Timo Männikkö

Silmukkaoptimoinnista

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto

T Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ke , 12:15 14:00 Puheentunnistus ja kielimallien evaluointi Versio 1.

ohjelman arkkitehtuurista.

Algoritmit 2. Luento 4 Ke Timo Männikkö

Yleinen paikallinen vakautuva synkronointialgoritmi

13 Lyhimmät painotetut polut

Ongelma 1: Ovatko kaikki tehtävät/ongelmat deterministisiä?

Tutkimustiedonhallinnan peruskurssi

58131 Tietorakenteet ja algoritmit (syksy 2015) Toinen välikoe, malliratkaisut

7. Satunnaisalgoritmit (randomized algorithms)

811312A Tietorakenteet ja algoritmit I Johdanto

k=0 saanto jokaisen kolmannen asteen polynomin. Tukipisteet on talloin valittu

811312A Tietorakenteet ja algoritmit Kertausta jälkiosasta

Oikeasta tosi-epätosi -väittämästä saa pisteen, ja hyvästä perustelusta toisen.

Tilanteen huomioon ottavat kännykät

Transkriptio:

Internet ja muut informaatioverkostot Pekka Orponen Teknillinen korkeakoulu Tietojenkäsittelyteorian laboratorio Tieteen päivät 2005 1

Tieteen päivät 2005 Pekka Orponen 2

Sisällys Verkostoja Verkostomalleja Verkostoprosesseja Tieteen päivät 2005 Pekka Orponen 3

Peruskäsitteitä Verkko t. verkosto: kokoelma solmuja ja niitä yhdistäviä kaaria. Kaaret voivat olla suunnattuja tai suuntaamattomia Tieteen päivät 2005 Pekka Orponen 4

Peruskäsitteitä (jatk.) Solmun aste k on sen välittömien naapureiden (= solmuun liittyvien kaarien) määrä: k = 4 Suunnatuissa verkoissa solmuilla on erikseen tulo- ja lähtöaste: k in = 3 k out = 1 Tieteen päivät 2005 Pekka Orponen 5

Verkostoja: Internet ja WWW Internet: n. 15.000 autonomista osaverkkoa n. 250.000(?) reittipalvelinta laitteiden fyys. yhteyksien mukaisen suuntaamattoman verkon keskim. asteluku osaverkkotasolla <k> ~ 3.5, reititintasolla <k> ~ 2.6 WWW n. 10 miljardia (??) WWW-sivua Sivulla keskim. 7 linkkiä muihin sivuihin -> suunnatun linkkiverkon keskim. lähtöasteluku <k> ~ 7 Tieteen päivät 2005 Pekka Orponen 6

Verkostoja: vertais-, spontaani- ja sensoriverkot Lähitulevaisuudessa tulevat yleistymään myös yksittäisten tietokonelaitteiden suoraan muodostamat infrastruktuurittomat verkot. Vertaisverkko ( peer-to-peer, p2p-verkko). Verkko, jossa laitteet jakavat resursseja (tiedostoja, koneaikaa, palveluja) keskenään ilman keskitettyjä resurssipalvelimia Spontaaniverkko ( ad hoc -verkko) Langattomien laitteiden keskenään, ilman kiinteän verkon tukea, muodostama tietoverkko Sensoriverkko: Ympäristön havainnointiin suunniteltujen pienten ja halpojen erikoislaitteiden muodostama spontaaniverkko Tieteen päivät 2005 Pekka Orponen 7

Verkkomalleja: miksi? Halutaan ymmärtää ja ennustaa em. tapaisten verkostojen rakennetta ja toimintaa yleisin perustein, esim.: Miten verkon solmujen väliset etäisyydet kasvavat verkon kasvaessa? Voiko etäisyydet pitää lyhyinä isossakin verkossa lisäämällä kaaria strategisiin paikkoihin? Mihin? Miten haavoittuva verkko on solmujen tai kaarien vikaantumiselle? Montako solmua yhtenäisestä verkosta voidaan poistaa ennen kuin se hajoaa pienempiin osiin? Mikä olisi paras tapa välittää sanomia verkon solmusta toiseen, jos verkon rakenne tunnetaan vain paikallisesti? Voiko verkostosta (esim. WWW) tunnistaa pelkän solmujen naapuruustiedon perusteella sisällöllisesti tärkeitä solmuja tai yhteenkuuluvien solmujen ryhmiä? Tieteen päivät 2005 Pekka Orponen 8

Erdös-Rényi -satunnaisverkot Klassinen, paljon tutkittu suuntaamattomien satunnaisverkkojen malli Erdös & Renyi (1959), Solomonoff & Rapoport (1951) Verkossa n solmua, kahden satunnaisesti valitun solmun välillä kaari tasaisella todennäköisyydellä p Seuraus: solmujen keskimääräinen asteluku <k> = p(n-1) ~ pn. Suurilla n ja pienillä p astelukujen jakauma vahvasti keskittynyt tämän arvon ympärille (ns. Poisson-jakauma). Tieteen päivät 2005 Pekka Orponen 9

ER-verkot ja Internet Esim. ER-prosessilla tuotettu verkko, jossa n = 100, <k> = 2 Onko Internet (<k> ~ 2.6) tällainen? 2 Tieteen päivät 2005 Pekka Orponen 10

Internetin astelukujakauma Internet ei ole ER-verkko (Faloutsos 3 1999) Astelukujakauma on pikemminkin tällainen: 2.6 Useimpien solmujen (reitittimien) asteluku on 1 tai 2, mutta joukossa on myös hyvin korkea-asteisia Tieteen päivät 2005 Pekka Orponen 11

AS-Internet (Faloutsos 3 1999) Internetin autonomisten osaverkkojen astelukujakauma noudattaa potenssilakia : astetta k olevien solmujen määrä ~ 1/k 2.15 log(lkm) -2.15 log(aste) 12

Muita skaalattomia verkostoja Internet-reititinverkko: astetta k olevien reitittimien lkm ~ 1/k 2.48 (Faloutsos 3 1999) WWW (Albert et al. 1999, Kumar et al. 1999): Verkkosivut, joissa on k linkkiä: lkm ~ 1/k 2.4 Verkkosivujen, joihin osoittaa k linkkiä: lkm ~ 1/k 2.1 lkm vs. lähtöaste lkm vs. tuloaste 13

Kasvavat satunnaisverkot Skaalattomia astelukujakaumia voidaan tuottaa kasvattamalla satunnaisverkko painotetusti. Preferential attachment (Barabási & Albert 1999); cumulative advantage (De Solla Price 1965); Matthew effect (Simon 1955). Verkostoa kasvatetaan solmu kerrallaan niin, että kunkin uuden solmun kaaret (linkit) kytketään vanhoihin solmuihin todennäköisyyksin, jotka ovat suhteessa niiden senhetkisiin astelukuihin. Näin suositut solmut lisäävät suosiotaan ja epäsuositut jäävät syrjään. De Solla Price: suunnatut verkot (esim. WWW); Barabási & Albert: suuntaamattomat (esim. Internet) Tieteen päivät 2005 Pekka Orponen 14

Kasvavat satunnaisverkot (jatk.) Kasvatusprosessi tuottaa verkkoja, joiden astelukujakaumat muistuttavat tunnettuja; esim. Pricen mallissa viittausten (tuloasteen) jakauma, kun keskim. lähtöaste on <k>: p k ~ 1/k α, missä α = 2+1/<k> Esim. WWW:n havaittu lähtöasteluku <k> ~ 7 antaa Pricen mallissa α ~ 2.14, mikä vastaa havaintoja (α ~ 2.1) erittäin hyvin Kasvumalleista on myös parametroituja versioita, joita voidaan sovittaa vapaammin dataan Tieteen päivät 2005 Pekka Orponen 15

WWW-verkon muita ominaisuuksia Pieni halkaisija: satunnaisesta solmusta pääsee toiseen keskimäärin 19 linkin kautta Internet: AS-halkaisija ~ 4; reititin-halkaisija ~ 9 Kasvumallit selittävät nämä ominaisuudet hyvin Klusteroituminen: naapurisolmut ovat usein naapureita myös keskenään Voidaan mallintaa kasvumalleilla, jotka kopioivat naapurustoja -- ei vielä aivan luontevaa mallia Tieteen päivät 2005 Pekka Orponen 16

WWW-verkon ominaisuuksia (jatk.) Rusettirakenne (Broder et al. 1999): Tieteen päivät 2005 Pekka Orponen 17

Verkostojen haavoittuvuus Skaalattomissa verkoissa ovat harvalukuiset korkea-asteiset solmut ( hubs ) keskeisessä asemassa kommunikoinnin kannalta. Albert et al. (2000): keskim. solmuetäisyyden piteneminen AS-Internetissä kun solmuja poistetaan (a) satunnaisesti, (b) asteluvun mukaisessa järjestyksessä: Keskim. solmuetäisyys 15 10 5 1% 2% Poist. solmujen osuus Tieteen päivät 2005 Pekka Orponen 18

Virusepidemiat verkostoissa Epidemiologiset mallit: SIR: Susceptible -> Infective -> Recovered SIS: Susceptible -> Infective -> Susceptible Perinteisissä epidemiologisissa tarkasteluissa saadaan yl. epidemian ekstensiiviselle leviämiselle (SIR) tai pysyydelle (SIS) kynnysarvo, joka riippuu taudin tarttuvuus- ja parantuvuusnopeuksista. Skaalattomissa verkostoissa tällaista kynnysarvoa ei kuitenkaan ole (jos α < 3), vaan epidemia leviää aina ekstensiiviseen osuuteen solmuista (Pastor-Satorras & Vespignani 2001). Tieteen päivät 2005 Pekka Orponen 19

Virusepidemiat (jatk.) Syynä epidemioiden leviämiseen ovat jälleen verkon korkea-asteiset napasolmut ( hubit ). Toisaalta voidaan osoittaa, että epidemiat voidaan myös tehokkaasti estää/pysäyttää immunisoimalla juuri napasolmut (Pastor- Satorras & Vespignani 2001). Miten napasolmut löydetään isosta ja/tai tuntemattomasta verkosta? Tieteen päivät 2005 Pekka Orponen 20

Napasolmujen määrittäminen Void. todeta, että (suuntaamattomassa, yhtenäisessä) verkossa suoritettu pitkä satunnaiskävely viettää kussakin verkon solmussa u ajan, joka on verrannollinen u:n astelukuun. Napasolmujen rokottamiseksi suoritetaan siis vain pitkä satunnaiskävely ja rokotetaan joka N:s solmu. Yksinkertaistettu versio: valitaan satunnaisesti jokin solmu ja rokotetaan sen kaikki naapurit. Toistetaan riittävän monta kertaa. Tieteen päivät 2005 Pekka Orponen 21

Tiedonhaku verkostoissa Rakenteeltaan tuntemattomasta P2P-verkostosta pitää löytää tietty tiedosto. Miten menetellä? Useimpien solmujen naapurustossa on jokin napasolmu -> Jos kukin solmu tietää omien tiedostojensa lisäksi kaikkien naapureiden tiedostot, niin napasolmuista tulee luonnostaan verkoston indeksejä. Tiedoston hakemiseksi käynnistetään verkossa satunnaiskävely. Kun jokin kohdattu solmu kertoo, että tiedosto löytyy sen naapurista, käydään noutamassa sieltä. Tieteen päivät 2005 Pekka Orponen 22

Arvokkaiden solmujen määrittäminen Google: PageRank-algoritmi (Page & Brin 1998) Suuntaamattomille verkoille; yleistys suunnatuille verkoille HITS (Kleinberg 1999) Idea: solmu on arvokas jos sillä on paljon arvokkaita naapureita -> kunkin solmun i arvo 0 u i 1 on verrannollinen sen naapureiden painotettuun arvosummaan: u i = (1-ε)(u i1 /k i1 + + u ik /k ik ) + ε/n, missä ε on solmujen yhteinen tasapainotusparametri. Tieteen päivät 2005 Pekka Orponen 23

Arvokkaat solmut (jatk.) Voidaan osoittaa, että jos verkko on yhtenäinen, niin yhtälöryhmällä: u 1 = (1-ε)( u 11 /k 11 + + u 1k /k ) + ε/n 1k 1 u 2 = (1-ε)( u 21 /k 21 + + u 2k /k ) + ε/n 2k 2 : u n = (1-ε)( u n1 /k n1 + + u nk /k ) + ε/n nk n on yksikäsitteinen positiivinen ratkaisu. (Matemaattisin termein verkon yhteysmatriisin Perron-Frobenius - ominaisvektori). Tämä voidaan laskea tunnetuin numeerisin menetelmin ja antaa siis verkon solmujen Google-arvot. Tieteen päivät 2005 Pekka Orponen 24

Tutkimushaasteita WWW-verkon ja muiden kiinnostavien verkostojen ominaisuuksien luonteva mallinnus (esim. skaalattomuus + klusteroituminen; aikakehitys ja sen vaikutukset) Mallien ominaisuuksien analyyttinen ratkaiseminen (esim. kuinka nopeasti epidemiat leviävät skaalattomissa verkostoissa) Verkostojen rakenteen hyödyntäminen algoritmeissa (reititys, klusterointi, otanta) Tieteen päivät 2005 Pekka Orponen 25