Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Samankaltaiset tiedostot
Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Arvostus Verkostoissa: PageRank. Idea.

Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen

Etsintä verkosta (Searching from the Web) T Datasta tietoon Jouni Seppänen

Luku 9. Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa

Tämän luvun sisältö. Luku 9. Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa. Webin lyhyt historia 1992: ensimmäisiä selaimia

Algoritmit 1. Luento 9 Ti Timo Männikkö

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

Harjoitus 3 ( )

Matematiikka ja teknologia, kevät 2011

Johdatus graafiteoriaan

Algoritmit 1. Luento 8 Ke Timo Männikkö

Ratkaisuehdotukset LH 3 / alkuvko 45

Rakenteellinen tasapaino ja transitiivisyys

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

Harjoitus 3 ( )

Lineaarikuvauksen R n R m matriisi

ax + y + 2z = 0 2x + y + az = b 2. Kuvassa alla on esitetty nesteen virtaus eräässä putkistossa.

Ominaisvektoreiden lineaarinen riippumattomuus

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

Johdatus graafiteoriaan

Matriisit. Määritelmä 1 Reaaliluvuista a ij, missä i = 1,..., k ja j = 1,..., n, muodostettua kaaviota a 11 a 12 a 1n a 21 a 22 a 2n A =

Ratkaisuehdotukset LH 10 / vko 48

Iteratiiviset ratkaisumenetelmät

Markov-ketjut pitkällä aikavälillä

Graafit ja verkot. Joukko solmuja ja joukko järjestämättömiä solmupareja. eli haaroja. Joukko solmuja ja joukko järjestettyjä solmupareja eli kaaria

Johdatus tekoälyn taustalla olevaan matematiikkaan

v 8 v 9 v 5 C v 3 v 4

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

5 Ominaisarvot ja ominaisvektorit

Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen

1.1. Määritelmiä ja nimityksiä

Yleinen paikallinen vakautuva synkronointialgoritmi

(0 desimaalia, 2 merkitsevää numeroa).

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset. 3.2 Matriisien laskutoimitukset

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen

Lineaarinen optimointitehtävä

Ennakkotehtävän ratkaisu

Neliömatriisi A on ortogonaalinen (eli ortogonaalimatriisi), jos sen alkiot ovat reaalisia ja

Matematiikka B2 - TUDI

1 Ominaisarvot ja ominaisvektorit

10. Painotetut graafit

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

1 Matriisit ja lineaariset yhtälöryhmät

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

Ominaisarvo ja ominaisvektori

5.1. Normi ja suppeneminen Vektoriavaruus V on normiavaruus, jos siinä on määritelty normi : V R + = [0, ) jolla on ominaisuudet:

Lineaarialgebra ja matriisilaskenta I, HY Kurssikoe Ratkaisuehdotus. 1. (35 pistettä)

BM20A0700, Matematiikka KoTiB2

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

811312A Tietorakenteet ja algoritmit V Verkkojen algoritmeja Osa 2 : Kruskalin ja Dijkstran algoritmit

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Sisätuloavaruudet. 4. lokakuuta 2006

Käänteismatriisin ominaisuuksia

Markov-ketjut pitkällä aikavälillä

Ominaisarvo ja ominaisvektori

isomeerejä yhteensä yhdeksän kappaletta.

2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio

Lineaarikuvaukset. 12. joulukuuta F (A r ) = F (A r ) r .(3) F (s) = s. (4) Skalaareille kannattaa määritellä lisäksi seuraavat tulot:

Malliratkaisut Demot

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

Matematiikka B2 - Avoin yliopisto

Malliratkaisut Demot

A TIETORAKENTEET JA ALGORITMIT

(1.1) Ae j = a k,j e k.

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 4 / vko 47

Algoritmit 1. Luento 13 Ti Timo Männikkö

ImageRecognition toteutus

j n j a b a c a d b c c d m j b a c a d a c b d c c j

JANNE LIUTTU ARVOSTUSALGORITMIT VERKOSTOANALYYSISSA. Diplomityö

MS-A0004/A0006 Matriisilaskenta

3.1 Lineaarikuvaukset. MS-A0004/A0006 Matriisilaskenta. 3.1 Lineaarikuvaukset. 3.1 Lineaarikuvaukset

Ville Turunen: Mat Matematiikan peruskurssi P1 1. välikokeen alueen teoriatiivistelmä 2007

Determinantti 1 / 30

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1

Ortogonaalisen kannan etsiminen

6 MATRIISIN DIAGONALISOINTI

Insinöörimatematiikka D

1 Kertaus. Lineaarinen optimointitehtävä on muotoa:

0 v i v j / E, M ij = 1 v i v j E.

Numeeriset menetelmät

Algoritmit 1. Luento 2 Ke Timo Männikkö

4.6 Matriisin kääntäminen rivioperaatioilla

Insinöörimatematiikka D

Induktiotodistus: Tapaus n = 0 selvä; ol. väite pätee kun n < m.

58131 Tietorakenteet ja algoritmit (kevät 2013) Kurssikoe 2, , vastauksia

Matemaattinen Analyysi / kertaus

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

MS-A0003/A0005 Matriisilaskenta Laskuharjoitus 3 /

Esimerkki: Tietoliikennekytkin

Osoita, että täsmälleen yksi vektoriavaruuden ehto ei ole voimassa.

14. Luennon sisältö. Kuljetustehtävä. Verkkoteoria ja optimointi. esimerkki. verkkoteorian optimointitehtäviä verkon virittävä puu lyhimmät polut

Algoritmi on periaatteellisella tasolla seuraava:

Insinöörimatematiikka D

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

Esimerkki 19. Esimerkissä 16 miniminormiratkaisu on (ˆx 1, ˆx 2 ) = (1, 0).

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Transkriptio:

Roolit Tommi Perälä Department of Mathematics, Hypermedia Laboratory Tampere University of Technology 25.3.2011

J. Kleinberg kehitti -algoritmin (Hypertext Induced Topic Search) hakukoneen osaksi. n taustalla on ajatus siitä, että solmulla on kaksi pääasiallista tehtävää tai roolia: informaation lähde osoittaa muihin informaation lähteinä toimiviin solmuihin Solmua pidetään auktoriteettina, jos se tarjoaa relevanttia informaatiota tietystä aiheesta. Hubiksi kutsumme solmua, joka osoittaa solmuihin, jotka ovat hyviä auktoriteetteja aiheessa. -algoritmi on iteratiivinen algoritmi, joka on kehitetty web-sivun auktoriteetti- ja hub-arvojen kvantifioimiseksi.

Olkoon I i solmuun v i osoittavien solmujen joukko, ja O i niiden solmujen joukko johon v i osoittaa. Solmun v i auktoriteetti-arvo a i määritellään siihen osoittavien solmujen hub-arvojen h j, j I i summana a i = c j I i h j = c N b ji h j, j=1 missä b ji on sosiomatriisin B alkio ja c vakio. Vastaavasti solmun v i hub-arvo määritellään niiden solmujen auktoriteetti-arvojen summana, joihin v i osoittaa h i = d j O i a j = d N b ij a j j=1 jollekin vakiolle d.

Kerätään solmujen auktoriteetti- ja hub-arvot vektoreihin a ja h. Huomataan, että a = cb T h h = dba Yhdistämällä ylläolevat saadaan missä λ = 1 cd a = cdb T Ba λa = B T Ba h = cdbb T h λh = BB T h

Aloitetaan jostain alkuarvauksesta a (0) ja h (0). a (k) = B T h (k 1) h (k) = Ba (k) Normalisoidaan ja toistetaan tarvittaessa. Jos tämä menetelmä suppenee, on a matriisin B T B suurinta ominaisarvoa vastaava ominaisvektori ja vastaavasti h matriisin BB T suurinta ominaisarvoa vastaava ominaisvektori

Välittömästi huomataan ongelmaksi tapaukset, joissa kyseiseten matriisien suurinta ominaisarvoa vastaa useampi kuin yksi ominaisvektori. -algoritmi voi myös antaa auktoriteetti-arvoksi nollan solmuille, joiden tuloaste on positiivinen. Näissä tapauksissa sanomme, että -algoritmi on huonosti käyttäytyvä.

: esimerkki 6 2 3 4 5 1

: esimerkki 6 2 3 4 5 1 a 1 = (0, 0, 0, 0, 0, 1) a 2 = (0, 1 4, 1 4, 1 4, 1 4, 0) h 1 = (0, 1 4, 1 4, 1 4, 1 4, 0) h 2 = (1, 0, 0, 0, 0, 0)

Jotta voisimme identifioida verkostot, joille -algoritmin antaa yksikäsitteisiä ja järkeviä ratkaisuja, määrittelemme auktoriteettigraafin seuraavasti. : Olkoon G = (V, E) suunnattu graafi. auktoriteettigraafi G = (V, E ) on suuntaamaton graafi, jonka solmut V ovat ne V :n solmut, joiden tuloaste on positiivinen. Kaaret E määritellään siten, että (v i, v j ) E, jos on olemassa v k V siten, että < v k, v i > E ja < v k, v j > E.

: esimerkki Alkuperäinen graafi G: 1 2 3 4

: esimerkki Alkuperäinen graafi G: 1 2 3 4 -auktoriteettigraafi G : 2 3 4

-algoritmi on huonosti käyttäytyvä, jos ja vain jos auktoriteettigraafi G on ei-yhtenäinen. Olkoon B sosiomatriisi ja C = B T B, jos järjestetään solmut siten, että tuloasteen nolla solmut laitetaan viimeiseksi, niin [ ] C 0 C = 0 0 Jos suurin ominaisarvo ei ole yksinkertainen, on C redusoituva. Huomataan, että C on redusoimaton, jos ja vain jos G on yhtenäinen.

Alkuperäinen graafi G: 1 3 2 4 a = (0, 0.20, 0.44, 0.36) h = (0.36, 0.44, 0.20, 0)

Exponentiated Input Sosiomatriisin B alkiot kertovat yhden askeleen polkujen lukumäärän solmujen välillä. Vastaavasti B m kertoo m askeleen polkujen lukumäärän. Farahat et al. esittivät algoritmista muunnoksen, jossa otetaan huomioon myös pidemmät polut. Ajatus on, että lyhyemmät polut ovat kuitenkin merkityksellisempiä kuin pitkät, joten päädyttiin käyttämään seuraavaa matriisia sosiomatriisin sijaan. B + B 2 /2! + B 3 /3! + = e B I Tällä on tiettyjä etuja, mutta periaate on sama. Kunhan vain muutettiin algoritmin sisääntuloa.

Yhtä lailla voisimme käyttää esimerkiksi matriiseja: B + B 2 /2! tai B + B 2 /2! + + B k /k! jollekin k > 2.

Osoittautuu, että käytettäessä -modifikaatiota, algoritmi käyttäytyy hyvin yhdistetyille verkostoille. Sama pätee myös, jos käytetään matriisia B + B 2 /2. Miksi?

käyttöasteen mukaan -algoritmista on myös muunnos, jossa sosiomatriisin sijaan käytetään painotettua sosiomatriisia, jossa painot määräytyvät sen mukaan kuinka monta kertaa käyttäjät tiettyä nuolta ovat seuranneet. Tätä varten tarvitaan tietysti menetelmä, jolla kerätä tällaista tietoa helposti. Näin saadun sosiomatriisin ei tarvitse vastata verkon rakennetta täydellisesti. Nollaasta poikkeavia alkioita on vain niiden nuolien kohdalla, joita käyttäjät ovat tarkasteluaikana seurailleet.

Samalla tavoin kuin PageRank-algoritmin yhteydessäkin, voidaan -algoritmi pakottaa antamaan yksikäsitteisiä ratkaisuja. Mikä tahansa verkosto voidaan muuttaa yhtenäiseksi lisäämällä pienipainoiset yhteydet kaikista solmuista kaikkiin solmuihin. Muunnettu sosiomatriisi olisi tällöin B = B + ɛu, jollekin pienelle ɛ, ja U = 1 N eet sekä e ykkösvektori.

3 1 2 4 a G = (0, 0.20, 0.44, 0.36) a Exp = (0, 0.16, 0.38, 0.45) a G2 = (0, 0.16, 0.39, 0.44) a G*,1% = (0.001, 0.20, 0.44, 0.36) h G = (0.36, 0.44, 0.20, 0) h Exp = (0.46, 0.38, 0.16, 0) h G2 = (0.44, 0.39, 0.16, 0) h G*,1% = (0.36, 0.44, 0.20, 0.001)

6 2 3 4 5 1 a Exp = (0.44, 0.14, 0.14, 0.14, 0.14, 0) a G2 = (0.44, 0.14, 0.14, 0.14, 0.14, 0) a G*,1% = (0.33, 0.17, 0.17, 0.17, 0.17, 0.001) h Exp = (0, 0.14, 0.14, 0.14, 0.14, 0.44) h G2 = (0, 0.14, 0.14, 0.14, 0.14, 0.44) h G*,1% = (0.001, 0.17, 0.17, 0.17, 0.17, 0.33)

[1] J. M. Kleinberg, Authoritative sources in a hyperlinked environment, JOURNAL OF THE ACM, vol. 46, no. 5, 1999. [2] A. Farahat, T. Lofaro, J. C. Miller, G. Rae, and L. A. Ward, Authority rankings from hits, pagerank, and salsa: Existence, uniqueness, and effect of initialization, SIAM JOURNAL ON SCIENTIFIC COMPUTING, vol. 27, no. 4, 2006. [3] J. C. Miller, G. Rae, F. Schaefer, L. A. Ward, T. LoFaro, and A. Farahat, Modifications of kleinbergs hits algorithm using matrix exponentiation and web log records, in Proceedings of the 24th annual international ACM SIGIR conference on Research and development in information retrieval, ser. SIGIR 01., 2001. [4] L. Li, Y. Shang, and W. Zhang, Improvement of hits-based algorithms on web documents, in Proceedings of the 11th international conference on World Wide Web, ser. WWW 02., 2002.