MALLEJA JA MITTAREITA EPÄUNIFORMEILLE VERKOILLE SATU ELISA SCHAEFFER Tietojenkäsittelyteorian laboratorio, TKK elisa.schaeffer@tkk.fi INF-0.3100 VERKOSTOJEN PERUSTEET
UNIFORMIT SATUNNAISVERKOT Gilbert (1959): kiinnitetään solmujen lukumäärä n sekä todennäköisyys p. Käydään läpi kaikki ( n 2) solmuparia ja lisätään kutakin vastaava kaari joukkoon E riippumattomasti todennäköisyydellä p. Merkitään näin syntyneiden verkkojen perhettä G n,p ja yksittäistä näin luotua verkkoa G n,p. Kaikki perheen verkot ovat yhtä todennäköisiä.
ERDŐS-RÉNYI -MALLI (ER) Kiinnitetään solmujen lukumäärä n sekä kaarten lukumäärä m. Valitaan satunnaisesti jokin m:n kaaren osajoukko ( n 2) mahdollisen kaaren joukosta. Perhettä merkitään G n,m, verkkoa G n,m. Lyhennettä ER käytetään usein myös Gilbertin mallista, sillä nämä kaksi uniformien satunnaisverkkojen mallia ovat monin tavoin yhtäläiset.
UNIFORMIN VERKON ASTEJAKAUMA Yksittäisen solmun asteluku verkossa G n,p on binomijakautunut: deg (v) Binom(n 1, p). Merkitään k-asteisten solmujen lukumäärää X k :lla. X k noudattaa asymptoottisesti Poisson-jakaumaa: Pr[X k = r] Poisson(λ k ) = λr k r! e λ k, jossa λ k = ( ) n 1 k p k (1 p) (n 1) k. Verkon tiheyden odotusarvo on p.
VERKON SOVITTAMINEN ASTEJAKAUMAAN Jos halutaan muunlainen astejakauma kuin Poissonilainen, ei kaaria voida asettaa puhtaan satunnaisesti. Molloy & Reed: kiinnitetään astesekvenssi d = (d 1,...,d n ) siten, että solmun v i asteluku on d i. Astelukujen summan on oltava parillinen. Astesekvenssi kiinnittää verkkoperheen. Yksittäinen verkko voidaan luoda seuraavasti: liitetään solmuun v i d i kaarenpuolikasta kun kuhunkin solmuun on liitetty kaarenpuolikkaat, yhdistetään näistä kokonaisia kaaria satunnaisesti ja riippumattomasti Mihail et al.: Markovin ketjuun perustuva menetelmä.
PIENI MAAILMA Milgram: kaikki yhdysvaltalaiset ovat tuttuja keskenään kuuden ihmisen ketjujen kautta (myytti). Watts & Strogatz: luonnolliset verkot ovat klusteroituneempia ja keskimääräiset etäisyydet ovat pienempiä kuin uniformeissa verkkomalleissa. Solmun klusterointikerroin: solmun naapuruston indusoiman aliverkon tiheys. Verkon klusterointikerroin: solmujen kertoimien keskiarvo.
WS-MALLIN PERIAATE Laitetaan n solmua kehälle. Kytketään kukin k/2:een lähimpään solmuun kummallakin puolella. Todennäköisyydellä p, vaihdetaan kunkin kaaren toinen päätepiste satunnaisesti.
WS-VERKON LUONTI
WS-MALLIN ONGELMA Verkosta saattaa tulla kaarien uudelleenreitityksen seurauksena epäyhtenäinen. Newman et al.: kaarien siirtelyn sijaan lisätään uusia kaaria Gilbertin mallin tavoin. Monia muitakin parannusehdotuksia on esitetty.
TRANSITIIVISUUS WS-mallin julkistamisaikoihin yleisesti sekoitettiin verkon kolmioluku ja klusterointikerroin. Kolmiolukua kutsutaan nykyään transitiivisuudeksi. Merkitään solmun v naapuruston Γ (v) indusoimaa aliverkkoa G(S):lla, G(S):n sisältämien 3-klikkien lukumäärää k:lla, ja G(S):n sisältämien 3-polkujen lukumäärää p:llä. Solmun v transitiivisuus on k p ja verkon G transitiivisuus sen solmujen transitiivisuuden keskiarvo.
PIENI MAAILMA -VERKOT Verkkoja, joissa keskimääräinen etäisyys kasvaa enintään lineaarisesti solmujen lukumäärään nähden ja klusterointikerroin on havaittavasti suurempi kuin verkon tiheys, sanotaan pieni maailma -verkoiksi. ER-verkolle: kunkin solmun naapuruston indusoiman aliverkon tiheyden odotusarvo on sama kuin koko verkon tiheys keskimääräinen etäisyys kasvaa logaritmisesti suhteessa solmujen lukumäärään, distg lnn lnm lnn
1 0.8 0.6 C L 0.4 0.2 0 0.0001 0.001 0.01 0.1 1 Rewiring probability p Klusterointikerroin ja keskimääräinen etäisyys normalisoituna WS-mallin vastaavilla eri uudelleenreititysarvoilla.
ESIMERKKIVERKKOJA Verkko n m KM Et. (ER) Klust. (ER) C. elegans 202 1954 2.28 2.04 0.30 0.096 C. elegans 282 1974 2.65 2.25 0.28 0.05.edu 11000 4.06 4.05 0.16 0.0012 IMDb 225226 6869393 3.65 2.99 0.79 0.00027 Internet AS 12709 27384 3.62 3.64 0.46 0.0014 Sähköverkko 4941 6596 18.7 12.4 0.08 0.005 Synonyymit 30244 3.16 2.5 0.53 0.002
KLEINBERGIN HILAMALLI Kleinberg halusi kehittää mallin joka vastaisi paremmin Milgramin koeasetelmaa. Mallissa pitäisi olla helppoa etsiä lyhyitä polkuja paikallisen tiedon perustella, mikä ei onnistu WS-mallilla. Kleinbergin verkkomalli pohjautuu s s-kokoiseen hilaan, jossa solmuilla on koordinaatit (i, j), i, j {1,...,s}. Jokaisen solmun hilanaapurustoon kuuluvat kaikki ne solmut, joiden Manhattan-etäisyys ko. solmusta on alle p:n (p 1). dist M ( (i, j), (k, l) ) = k i + l j
KAUKAISET TUTTAVAT Hilanaapureiden lisäksi, Kleinbergin mallissa luodaan kullekin solmulle vakiomäärä q 0 kaukotuttavuuksia suunnatuilla kaarilla. Suunnatun kaaren päätepisteet valitaan satunnaisesti ja riippumattomasti todennäköisyydellä, joka on kääntäen verrannollinen solmujen väliseen etäisyyteen: Pr[(i, j) ja (k, l) kytketään] dist ( (i, j), (k, l) ) ) r, jossa r 0 on vakio. Kahden solmun välillä voi olla enintään yksi kaari.
KLEINBERG-VERKKOJA Vasemmalla s = 4, p = 2 ja q = 0. Oikealla s = 5 ja p = q = 1.
KLEINBERGIN HAVAINTOJA Kokeissaan Kleinberg havaitsi, että vain arvolla r = 2 paikalliseen tietoon perustuva haku löytää reitit kulkemalla O (log n) solmun kautta, muulloin haku kestää pidempään. Hän yleistää tuloksen d-ulotteisiin hiloihin, joissa r:n optimaalinen arvo on d ja toteaa kaukotuttavuuksien olevan keskeisessä asemassa luonnollisten verkkojen navigoituvuudessa.
LUOLAMIESVERKOT Sosiologien käyttämä varhainen malli tuttavapiiriverkoille. Klusterointikerroin on korkea ja polkupituudet matalahkoja.
LUENTOTAUKO Muistakaa palauttaa edellisen kerran lisäpistetehtävät Elisalle heti ellette jo palauttaneet. Jos niissä oli jotain epäselvyyksiä, kysykää samantien tai laittakaa sähköpostia. Irkkaamista suositellaan ajatusten vaihtoon ja selvittämiseen tehtäviä tehdessä. INF-0.3100 VERKOSTOJEN PERUSTEET
ASTEJAKAUMISTA ER-malli WS-malli Kleinberg Aito verkko
VAPAASKAALAISET VERKOT Monien luonnollisten verkkojen astejakauma on vapaasti skaalautuva: Pr [deg (v) = k] k γ. Tällaisia muotoa f(x) cx γ olevia potenssilakeja sanotaan vapaaskaalaisiksi, koska vaikka x kerrottaisiin vakiolla, jakauman muoto ei muutu. Tarkasteluskaalaa voi siis vaihtaa vapaasti.
LUONNOLLISTEN VERKKOJEN γ-arvoja Verkko n m γ γ in γ out Lähdeviitteet 783339 6716198 3 IMDb 212250 3054278 2.3 ± 0.1 Internet AS 8613 18346 1.115 Sähköverkko 4941 6596 4 Synonyymit 182853 317658 3.25 www.nd.edu 325729 889240 2.1 ± 0.1 www.nd.edu 325729 1497135 2.1 2.45 WWW 200 miljoonaa 1,5 miljardia 2.09 2.72
BARABÁSI-ALBERT -VERKOT Havaittava ristiriita luonnolisten verkkojen ja aiemmin käsiteltyjen pieni maailma ja ER-mallien välillä laukaisi uuden mallinkehittelyaallon. Barabási & Albert: kasvatetaan verkko solmu solmulta ja asetetaan kaaret preferoiden suuriasteisia solmuja.
BA-MENETELMÄ Aloitetaan pienestä siemenverkosta G 0 = (V 0, E 0 ). Askeleella t, uusi solmu v t lisätään verkkoon. Solmuun v t liitetään d kaarta siten, että Pr [(v, w) E t ] = deg(w) deg(u). u V Asymptoottisesti γ = 2.9 ± 0.1.
KLUSTEROIDUT BA-VERKOT Holme & Kim: WS-mallissa klusterointi luonnollinen, BA-menetelmässä astelukujakauma havaitun kaltainen. Lisätään BA-menetelmään klusterointiaskel : lisättäessä kaarta solmuun v, todennäköisyydellä p ei haetakaan preferentiaalisesti päätepistettä vaan muodostetaan kolmio valitsemalla ensin satunnaisesti w Γ (v) ja sitten uuden kaaren päätepiste satunnaisesti joukosta Γ (w) \ Γ (v).
MUKAELMIA Bollobás hermoistui BA-menetelmän matemaattisesta epämääräisyydestä. Yhdessä Riordanin kanssa he ehdottivat omaa malliaan, jolla saavutetaan haluttu astelukujakauma. Dorogovtsev et al. ehdottivat solmujen viehättävyyteen perustuvaa menetelmää, jossa solmun iän lisäksi myös siihen aluksi liitetty ominaisuus vaikuttaa kaarten haalimiseen.
DETERMINISTISET MALLIT Kaikki luennolla tähän saakka esitetyt verkkomallit ja generointimenetelmät perustuvat satunnaisuuteen. Verkkoja, joilla on samat ominaisuudet kuin luonnollisilla verkoilla, voi myös kasvattaa erilaisilla sääntökokoelmilla ilman satunnaisuutta. Näin tuotetut verkot käyttäytyvät hieman fraktaalimaisesti: jotain verkon osiota kopioidaan systemaattisesti suuremman verkon aikaansaamiseksi.
PUUMAINEN MONISTUSMALLI
MONISTAVA KLUSTERIMALLI
KAARIKOLMIOMALLI
KAARIKOLMIOMALLIN OMINAISUUKSIA 5 1e+06 4 3 2 DGM L DGM C DGM d 10000 1 100 0 0 2 4 6 8 10 12 10 100 1000 10000 Vasemmalla polkupitudet, klusterointikertoimet ja tiheys. Oikealla astejakauma.
VIKASIETOISUUS Verkko on vikasietoinen mikäli sen toiminta ei keskeisesti kärsi yksittäisten solmujen tai kaarien (toistetuista) poistoista. Vikojen yleensä ajatellan kohdistuvan satunnaisiin verkon osiin; mikäli jollakin tavalla valikoidut (esim. korkea-asteiset) solmut kuolevat, puhutaan (hyökkäyksen) vastustuskyvystä. Pitkään oletetiin luonnollisten verkkojen vikasietoisuuden johtuvan verkkojen redundanssista. On kuitenkin havaittu, että nimenomaan vapaaskaalaiset verkot ovat hyvin vikasietoisia, mutta niillä on huono vastustuskyky. Esimerkiksi Internet pystyy hyvin laajalti toiminnallisena satunnaisten virheiden alaisena, mutta on varsin haavoittuvainen systemaattisessa hyökkäyksessä.
LISÄPISTETEHTÄVÄ Suunnittele ja piirrä verkko, jossa on 15 solmua ja 50 kaarta siten, että verkko on mielestäsi erittäin kestävä hyökkäyksiä vastaan. Selitä miten määrittelet kestävyyden (vaihtoehtoja ovat esimerkiksi verkon yhtenäisyyden tai halkaisijan käyttäytyminen solmuja ja/tai kaaria poistettaessa). Perustele miksi suunnittelemasi verkko on tässä mielessä erityisen kestävä. Määrittele lisäksi mielestäsi hyvä hyökkäysstrategia, jolla voisit aiheuttaa mahdollisimman paljon vahinkoa 15-solmuisessa ja 50-kaarisessa verkossa, mikäli saisit eliminoida tasan viisi solmua (joiden mukana poistuvat niihin liittyneet kaaret) ja lisäksi tasan kymmenen kaarta. Perustele strategiavalintasi. Palautus ja arvostelu hoituvat samoin kuin edellisellä kerralla.