MALLEJA JA MITTAREITA

Samankaltaiset tiedostot
MALLEJA JA MITTAREITA EPÄUNIFORMEILLE VERKOILLE

VERKKORAKENTEEN VAIKUTUKSIA KAIKKI SOLMUT EIVÄT OLE SAMANLAISIA

Internet ja muut informaatioverkostot

isomeerejä yhteensä yhdeksän kappaletta.

Wattsin ja Strogatzin satunnaisverkkomallin klusteroituneisuus

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

Kompleksisten verkostojen fysiikkaa Johdanto Verkostojen lyhyt historia

Induktiotodistus: Tapaus n = 0 selvä; ol. väite pätee kun n < m.

Suomen rautatieverkoston robustisuus

Demonstraatiot Luento

5. laskuharjoituskierros, vko 8, ratkaisut

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

D ( ) E( ) E( ) 2.917

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

KÄYTÄNNÖN JÄRJESTELYJÄ

Reitinhaku pienissä maailmoissa

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Datatähti 2019 loppu

= 5! 2 2!3! = = 10. Edelleen tästä joukosta voidaan valita kolme särmää yhteensä = 10! 3 3!7! = = 120

verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari

4. laskuharjoituskierros, vko 7, ratkaisut

Esimerkki: Tietoliikennekytkin

Algoritmit 2. Luento 13 Ti Timo Männikkö

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

= k 0 NTIME(n k + k) Siis polynomisessa ajassa epädeterministisellä Turingin koneella tunnistettavien kielten joukko

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

7. Satunnaisalgoritmit (randomized algorithms)

V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen

Algoritmit 1. Luento 8 Ke Timo Männikkö

Kanta ja dimensio 1 / 23

3. laskuharjoituskierros, vko 6, ratkaisut

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

Tietorakenteet, laskuharjoitus 10, ratkaisuja. 1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

C C. x 2. x 3 x 3. Lause 3SAT p m VC Todistus. Olk. φ = C 1 C 2 C m 3-cnf-kaava, jossa esiintyvät muuttujat. φ toteutuva:

Tehtävät 1/11. TAMPEREEN YLIOPISTO Informaatiotieteiden tiedekunta Valintakoe Matematiikka ja tilastotiede. Sukunimi (painokirjaimin)

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Liikenneongelmien aikaskaalahierarkia

Algoritmit 1. Luento 10 Ke Timo Männikkö

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Jatkuvia jakaumia

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Martingaalit ja informaatioprosessit

Oikeasta tosi-epätosi -väittämästä saa pisteen, ja hyvästä perustelusta toisen.

Sovellettu todennäköisyyslaskenta B

D ( ) Var( ) ( ) E( ) [E( )]

Algoritmit 1. Demot Timo Männikkö

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

a) Sievennä lauseke 1+x , kun x 0jax 1. b) Aseta luvut 2, 5 suuruusjärjestykseen ja perustele vastauksesi. 3 3 ja

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

LASKENNALLISEN TIETEEN OHJELMATYÖ: Diffuusion Monte Carlo -simulointi yksiulotteisessa systeemissä

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Elisa Yritysnumeropalvelun tavoitettavuuspalvelu Pääkäyttäjän ohjeet

A-osa. Ratkaise kaikki tämän osan tehtävät. Tehtävät arvostellaan pistein 0-6. Taulukkokirjaa saa käyttää apuna, laskinta ei.

58131 Tietorakenteet (kevät 2009) Harjoitus 11, ratkaisuja (Topi Musto)

811120P Diskreetit rakenteet

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

0 v i v j / E, M ij = 1 v i v j E.

Verkon värittämistä hajautetuilla algoritmeilla

Normaalijakaumasta johdettuja jakaumia

Satunnaismuuttujien muunnokset ja niiden jakaumat

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Kuva 1: Funktion f tasa-arvokäyriä. Ratkaisu. Suurin kasvunopeus on gradientin suuntaan. 6x 0,2

Johdatus verkkoteoriaan 4. luento

Sovellettu todennäköisyyslaskenta B

Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A)

Elisa Puheratkaisu Vakio Pääkäyttäjän ohjeet

58131 Tietorakenteet ja algoritmit (syksy 2015) Toinen välikoe, malliratkaisut

MATEMATIIKAN PERUSKURSSI I Harjoitustehtäviä syksy Millä reaaliluvun x arvoilla. 3 4 x 2,

Kombinatorinen optimointi

Eulerin verkkojen karakterisointi

jens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Kansainväliset matematiikkaolympialaiset 2008

l 1 2l + 1, c) 100 l=0 AB 3AC ja AB AC sekä vektoreiden AB ja

Suunnatut, etumerkilliset ja arvotetut graafit Sosiaalisten verkostojen analysoinnin näkökulmalla

Tentissä on viisi tehtävää, jotka arvosteellaan asteikolla 0-6. Tehtävien alakohdat ovat keskenään samanarvoisia ellei toisin mainita.

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

Todistamisessa on tärkeää erottaa tapaukset, kun sääntö pätee joillakin tai kun sääntö pätee kaikilla. Esim. On olemassa reaaliluku x, jolle x = 5.

Johdatus todennäköisyyslaskentaan Satunnaismuuttujien muunnokset ja niiden jakaumat. TKK (c) Ilkka Mellin (2004) 1

Avaruuden R n aliavaruus

Valitaan alkio x 1 A B ja merkitään A 1 = A { x 1 }. Perinnöllisyyden nojalla A 1 I.

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

v 1 v 2 v 3 v 4 d lapsisolmua d 1 avainta lapsen v i alipuun avaimet k i 1 ja k i k 0 =, k d = Sisäsolmuissa vähint. yksi avain vähint.

b) Olkoon G vähintään kaksi solmua sisältävä puu. Sallitaan verkon G olevan

Erilaisia Markov-ketjuja

Algoritmit 2. Luento 12 To Timo Männikkö

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Markov-ketjut pitkällä aikavälillä

11. laskuharjoituskierros, vko 15, ratkaisut

MS-A0004/A0006 Matriisilaskenta

Harjoitus 2: Matlab - Statistical Toolbox

BM20A5840 Usean muuttujan funktiot ja sarjat Harjoitus 7, Kevät 2018

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Transkriptio:

MALLEJA JA MITTAREITA EPÄUNIFORMEILLE VERKOILLE SATU ELISA SCHAEFFER Tietojenkäsittelyteorian laboratorio, TKK elisa.schaeffer@tkk.fi INF-0.3100 VERKOSTOJEN PERUSTEET

UNIFORMIT SATUNNAISVERKOT Gilbert (1959): kiinnitetään solmujen lukumäärä n sekä todennäköisyys p. Käydään läpi kaikki ( n 2) solmuparia ja lisätään kutakin vastaava kaari joukkoon E riippumattomasti todennäköisyydellä p. Merkitään näin syntyneiden verkkojen perhettä G n,p ja yksittäistä näin luotua verkkoa G n,p. Kaikki perheen verkot ovat yhtä todennäköisiä.

ERDŐS-RÉNYI -MALLI (ER) Kiinnitetään solmujen lukumäärä n sekä kaarten lukumäärä m. Valitaan satunnaisesti jokin m:n kaaren osajoukko ( n 2) mahdollisen kaaren joukosta. Perhettä merkitään G n,m, verkkoa G n,m. Lyhennettä ER käytetään usein myös Gilbertin mallista, sillä nämä kaksi uniformien satunnaisverkkojen mallia ovat monin tavoin yhtäläiset.

UNIFORMIN VERKON ASTEJAKAUMA Yksittäisen solmun asteluku verkossa G n,p on binomijakautunut: deg (v) Binom(n 1, p). Merkitään k-asteisten solmujen lukumäärää X k :lla. X k noudattaa asymptoottisesti Poisson-jakaumaa: Pr[X k = r] Poisson(λ k ) = λr k r! e λ k, jossa λ k = ( ) n 1 k p k (1 p) (n 1) k. Verkon tiheyden odotusarvo on p.

VERKON SOVITTAMINEN ASTEJAKAUMAAN Jos halutaan muunlainen astejakauma kuin Poissonilainen, ei kaaria voida asettaa puhtaan satunnaisesti. Molloy & Reed: kiinnitetään astesekvenssi d = (d 1,...,d n ) siten, että solmun v i asteluku on d i. Astelukujen summan on oltava parillinen. Astesekvenssi kiinnittää verkkoperheen. Yksittäinen verkko voidaan luoda seuraavasti: liitetään solmuun v i d i kaarenpuolikasta kun kuhunkin solmuun on liitetty kaarenpuolikkaat, yhdistetään näistä kokonaisia kaaria satunnaisesti ja riippumattomasti Mihail et al.: Markovin ketjuun perustuva menetelmä.

PIENI MAAILMA Milgram: kaikki yhdysvaltalaiset ovat tuttuja keskenään kuuden ihmisen ketjujen kautta (myytti). Watts & Strogatz: luonnolliset verkot ovat klusteroituneempia ja keskimääräiset etäisyydet ovat pienempiä kuin uniformeissa verkkomalleissa. Solmun klusterointikerroin: solmun naapuruston indusoiman aliverkon tiheys. Verkon klusterointikerroin: solmujen kertoimien keskiarvo.

WS-MALLIN PERIAATE Laitetaan n solmua kehälle. Kytketään kukin k/2:een lähimpään solmuun kummallakin puolella. Todennäköisyydellä p, vaihdetaan kunkin kaaren toinen päätepiste satunnaisesti.

WS-VERKON LUONTI

WS-MALLIN ONGELMA Verkosta saattaa tulla kaarien uudelleenreitityksen seurauksena epäyhtenäinen. Newman et al.: kaarien siirtelyn sijaan lisätään uusia kaaria Gilbertin mallin tavoin. Monia muitakin parannusehdotuksia on esitetty.

TRANSITIIVISUUS WS-mallin julkistamisaikoihin yleisesti sekoitettiin verkon kolmioluku ja klusterointikerroin. Kolmiolukua kutsutaan nykyään transitiivisuudeksi. Merkitään solmun v naapuruston Γ (v) indusoimaa aliverkkoa G(S):lla, G(S):n sisältämien 3-klikkien lukumäärää k:lla, ja G(S):n sisältämien 3-polkujen lukumäärää p:llä. Solmun v transitiivisuus on k p ja verkon G transitiivisuus sen solmujen transitiivisuuden keskiarvo.

PIENI MAAILMA -VERKOT Verkkoja, joissa keskimääräinen etäisyys kasvaa enintään lineaarisesti solmujen lukumäärään nähden ja klusterointikerroin on havaittavasti suurempi kuin verkon tiheys, sanotaan pieni maailma -verkoiksi. ER-verkolle: kunkin solmun naapuruston indusoiman aliverkon tiheyden odotusarvo on sama kuin koko verkon tiheys keskimääräinen etäisyys kasvaa logaritmisesti suhteessa solmujen lukumäärään, distg lnn lnm lnn

1 0.8 0.6 C L 0.4 0.2 0 0.0001 0.001 0.01 0.1 1 Rewiring probability p Klusterointikerroin ja keskimääräinen etäisyys normalisoituna WS-mallin vastaavilla eri uudelleenreititysarvoilla.

ESIMERKKIVERKKOJA Verkko n m KM Et. (ER) Klust. (ER) C. elegans 202 1954 2.28 2.04 0.30 0.096 C. elegans 282 1974 2.65 2.25 0.28 0.05.edu 11000 4.06 4.05 0.16 0.0012 IMDb 225226 6869393 3.65 2.99 0.79 0.00027 Internet AS 12709 27384 3.62 3.64 0.46 0.0014 Sähköverkko 4941 6596 18.7 12.4 0.08 0.005 Synonyymit 30244 3.16 2.5 0.53 0.002

KLEINBERGIN HILAMALLI Kleinberg halusi kehittää mallin joka vastaisi paremmin Milgramin koeasetelmaa. Mallissa pitäisi olla helppoa etsiä lyhyitä polkuja paikallisen tiedon perustella, mikä ei onnistu WS-mallilla. Kleinbergin verkkomalli pohjautuu s s-kokoiseen hilaan, jossa solmuilla on koordinaatit (i, j), i, j {1,...,s}. Jokaisen solmun hilanaapurustoon kuuluvat kaikki ne solmut, joiden Manhattan-etäisyys ko. solmusta on alle p:n (p 1). dist M ( (i, j), (k, l) ) = k i + l j

KAUKAISET TUTTAVAT Hilanaapureiden lisäksi, Kleinbergin mallissa luodaan kullekin solmulle vakiomäärä q 0 kaukotuttavuuksia suunnatuilla kaarilla. Suunnatun kaaren päätepisteet valitaan satunnaisesti ja riippumattomasti todennäköisyydellä, joka on kääntäen verrannollinen solmujen väliseen etäisyyteen: Pr[(i, j) ja (k, l) kytketään] dist ( (i, j), (k, l) ) ) r, jossa r 0 on vakio. Kahden solmun välillä voi olla enintään yksi kaari.

KLEINBERG-VERKKOJA Vasemmalla s = 4, p = 2 ja q = 0. Oikealla s = 5 ja p = q = 1.

KLEINBERGIN HAVAINTOJA Kokeissaan Kleinberg havaitsi, että vain arvolla r = 2 paikalliseen tietoon perustuva haku löytää reitit kulkemalla O (log n) solmun kautta, muulloin haku kestää pidempään. Hän yleistää tuloksen d-ulotteisiin hiloihin, joissa r:n optimaalinen arvo on d ja toteaa kaukotuttavuuksien olevan keskeisessä asemassa luonnollisten verkkojen navigoituvuudessa.

LUOLAMIESVERKOT Sosiologien käyttämä varhainen malli tuttavapiiriverkoille. Klusterointikerroin on korkea ja polkupituudet matalahkoja.

LUENTOTAUKO Muistakaa palauttaa edellisen kerran lisäpistetehtävät Elisalle heti ellette jo palauttaneet. Jos niissä oli jotain epäselvyyksiä, kysykää samantien tai laittakaa sähköpostia. Irkkaamista suositellaan ajatusten vaihtoon ja selvittämiseen tehtäviä tehdessä. INF-0.3100 VERKOSTOJEN PERUSTEET

ASTEJAKAUMISTA ER-malli WS-malli Kleinberg Aito verkko

VAPAASKAALAISET VERKOT Monien luonnollisten verkkojen astejakauma on vapaasti skaalautuva: Pr [deg (v) = k] k γ. Tällaisia muotoa f(x) cx γ olevia potenssilakeja sanotaan vapaaskaalaisiksi, koska vaikka x kerrottaisiin vakiolla, jakauman muoto ei muutu. Tarkasteluskaalaa voi siis vaihtaa vapaasti.

LUONNOLLISTEN VERKKOJEN γ-arvoja Verkko n m γ γ in γ out Lähdeviitteet 783339 6716198 3 IMDb 212250 3054278 2.3 ± 0.1 Internet AS 8613 18346 1.115 Sähköverkko 4941 6596 4 Synonyymit 182853 317658 3.25 www.nd.edu 325729 889240 2.1 ± 0.1 www.nd.edu 325729 1497135 2.1 2.45 WWW 200 miljoonaa 1,5 miljardia 2.09 2.72

BARABÁSI-ALBERT -VERKOT Havaittava ristiriita luonnolisten verkkojen ja aiemmin käsiteltyjen pieni maailma ja ER-mallien välillä laukaisi uuden mallinkehittelyaallon. Barabási & Albert: kasvatetaan verkko solmu solmulta ja asetetaan kaaret preferoiden suuriasteisia solmuja.

BA-MENETELMÄ Aloitetaan pienestä siemenverkosta G 0 = (V 0, E 0 ). Askeleella t, uusi solmu v t lisätään verkkoon. Solmuun v t liitetään d kaarta siten, että Pr [(v, w) E t ] = deg(w) deg(u). u V Asymptoottisesti γ = 2.9 ± 0.1.

KLUSTEROIDUT BA-VERKOT Holme & Kim: WS-mallissa klusterointi luonnollinen, BA-menetelmässä astelukujakauma havaitun kaltainen. Lisätään BA-menetelmään klusterointiaskel : lisättäessä kaarta solmuun v, todennäköisyydellä p ei haetakaan preferentiaalisesti päätepistettä vaan muodostetaan kolmio valitsemalla ensin satunnaisesti w Γ (v) ja sitten uuden kaaren päätepiste satunnaisesti joukosta Γ (w) \ Γ (v).

MUKAELMIA Bollobás hermoistui BA-menetelmän matemaattisesta epämääräisyydestä. Yhdessä Riordanin kanssa he ehdottivat omaa malliaan, jolla saavutetaan haluttu astelukujakauma. Dorogovtsev et al. ehdottivat solmujen viehättävyyteen perustuvaa menetelmää, jossa solmun iän lisäksi myös siihen aluksi liitetty ominaisuus vaikuttaa kaarten haalimiseen.

DETERMINISTISET MALLIT Kaikki luennolla tähän saakka esitetyt verkkomallit ja generointimenetelmät perustuvat satunnaisuuteen. Verkkoja, joilla on samat ominaisuudet kuin luonnollisilla verkoilla, voi myös kasvattaa erilaisilla sääntökokoelmilla ilman satunnaisuutta. Näin tuotetut verkot käyttäytyvät hieman fraktaalimaisesti: jotain verkon osiota kopioidaan systemaattisesti suuremman verkon aikaansaamiseksi.

PUUMAINEN MONISTUSMALLI

MONISTAVA KLUSTERIMALLI

KAARIKOLMIOMALLI

KAARIKOLMIOMALLIN OMINAISUUKSIA 5 1e+06 4 3 2 DGM L DGM C DGM d 10000 1 100 0 0 2 4 6 8 10 12 10 100 1000 10000 Vasemmalla polkupitudet, klusterointikertoimet ja tiheys. Oikealla astejakauma.

VIKASIETOISUUS Verkko on vikasietoinen mikäli sen toiminta ei keskeisesti kärsi yksittäisten solmujen tai kaarien (toistetuista) poistoista. Vikojen yleensä ajatellan kohdistuvan satunnaisiin verkon osiin; mikäli jollakin tavalla valikoidut (esim. korkea-asteiset) solmut kuolevat, puhutaan (hyökkäyksen) vastustuskyvystä. Pitkään oletetiin luonnollisten verkkojen vikasietoisuuden johtuvan verkkojen redundanssista. On kuitenkin havaittu, että nimenomaan vapaaskaalaiset verkot ovat hyvin vikasietoisia, mutta niillä on huono vastustuskyky. Esimerkiksi Internet pystyy hyvin laajalti toiminnallisena satunnaisten virheiden alaisena, mutta on varsin haavoittuvainen systemaattisessa hyökkäyksessä.

LISÄPISTETEHTÄVÄ Suunnittele ja piirrä verkko, jossa on 15 solmua ja 50 kaarta siten, että verkko on mielestäsi erittäin kestävä hyökkäyksiä vastaan. Selitä miten määrittelet kestävyyden (vaihtoehtoja ovat esimerkiksi verkon yhtenäisyyden tai halkaisijan käyttäytyminen solmuja ja/tai kaaria poistettaessa). Perustele miksi suunnittelemasi verkko on tässä mielessä erityisen kestävä. Määrittele lisäksi mielestäsi hyvä hyökkäysstrategia, jolla voisit aiheuttaa mahdollisimman paljon vahinkoa 15-solmuisessa ja 50-kaarisessa verkossa, mikäli saisit eliminoida tasan viisi solmua (joiden mukana poistuvat niihin liittyneet kaaret) ja lisäksi tasan kymmenen kaarta. Perustele strategiavalintasi. Palautus ja arvostelu hoituvat samoin kuin edellisellä kerralla.