Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Arvostus Verkostoissa: PageRank. Idea.

Samankaltaiset tiedostot
Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen

Etsintä verkosta (Searching from the Web) T Datasta tietoon Jouni Seppänen

MS-A0003/A Matriisilaskenta Laskuharjoitus 6

Matematiikka ja teknologia, kevät 2011

Ominaisarvo ja ominaisvektori

Social Network Analysis Centrality And Prestige

MS-A0004/MS-A0006 Matriisilaskenta Laskuharjoitus 6 / vko 42

Inversio-ongelmien laskennallinen peruskurssi Luento 2

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

Harjoitus 3 ( )

Lineaarikuvauksen R n R m matriisi

Harjoitus 3 ( )

Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Iteratiiviset ratkaisumenetelmät

3.2.2 Tikhonovin regularisaatio

Ortogonaalisen kannan etsiminen

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

ax + y + 2z = 0 2x + y + az = b 2. Kuvassa alla on esitetty nesteen virtaus eräässä putkistossa.

Käänteismatriisi 1 / 14

Matriisit, kertausta. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

MS-C1340 Lineaarialgebra ja

Luku 9. Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

1 Kannat ja kannanvaihto

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

Ominaisarvo ja ominaisvektori

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

Tämän luvun sisältö. Luku 9. Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa. Webin lyhyt historia 1992: ensimmäisiä selaimia

Vektoreiden virittämä aliavaruus

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Numeeriset menetelmät TIEA381. Luento 5. Kirsi Valjus. Jyväskylän yliopisto. Luento 5 () Numeeriset menetelmät / 28

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

Sisätuloavaruudet. 4. lokakuuta 2006

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

LU-hajotelma. Esimerkki 1 Matriisi on yläkolmiomatriisi ja matriisi. on alakolmiomatriisi. 3 / 24

Numeeriset menetelmät

Insinöörimatematiikka D

Johdatus tekoälyn taustalla olevaan matematiikkaan

MS-A0004/A0006 Matriisilaskenta

Numeeriset menetelmät

Esimerkki: Tietoliikennekytkin

Numeeriset menetelmät

Inversio-ongelmien laskennallinen peruskurssi Luento 3

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Johdatus graafiteoriaan

5 Lineaariset yhtälöryhmät

Kantavektorien kuvavektorit määräävät lineaarikuvauksen

Ratkaisuehdotukset LH 7 / vko 47

Insinöörimatematiikka D

Katsaus konepellin alle - iteratiivisia menetelmiä ominaisarvotehtävälle

Matematiikan tukikurssi

MS-C1340 Lineaarialgebra ja

Ortogonaaliset matriisit, määritelmä 1

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

1 Matriisit ja lineaariset yhtälöryhmät

Lineaarisen kokonaislukuoptimointitehtävän ratkaiseminen

Johdatus verkkoteoriaan 4. luento

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Inversio-ongelmien laskennallinen peruskurssi Luento 7 8

(0 desimaalia, 2 merkitsevää numeroa).

Lineaarialgebra ja matriisilaskenta I

Luento 5: Suurten lineaaristen yhtälöryhmien ratkaiseminen iteratiivisilla menetelmillä

Lineaariset kongruenssiyhtälöryhmät

Ortogonaalinen ja ortonormaali kanta

Ville Turunen: Mat Matematiikan peruskurssi P1 1. välikokeen alueen teoriatiivistelmä 2007

Ratkaisuehdotukset LH 3 / alkuvko 45

Vapaus. Määritelmä. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee:

Algoritmit 1. Luento 9 Ti Timo Männikkö

Shorin algoritmin matematiikkaa Edvard Fagerholm

Ennakkotehtävän ratkaisu

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

Numeeriset menetelmät

Koodausteoria, Kesä 2014

Malliratkaisut Demot

Lineaarialgebra ja matriisilaskenta I, HY Kurssikoe Ratkaisuehdotus. 1. (35 pistettä)

1.1. Määritelmiä ja nimityksiä

Ominaisvektoreiden lineaarinen riippumattomuus

Matriisilaskenta Luento 8: LU-hajotelma

Ellipsoidimenetelmä. Samuli Leppänen Kokonaislukuoptimointi. S ysteemianalyysin Laboratorio

Markov-ketjut pitkällä aikavälillä

Johdatus tekoälyn taustalla olevaan matematiikkaan

Epälineaaristen yhtälöiden ratkaisumenetelmät

Päättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1

Tehtäväsarja I Seuraavat tehtävät liittyvät kurssimateriaalin lukuun 7 eli vapauden käsitteeseen ja homogeenisiin

Similaarisuus. Määritelmä. Huom.

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

Lineaarialgebra ja matriisilaskenta I

Esimerkki 19. Esimerkissä 16 miniminormiratkaisu on (ˆx 1, ˆx 2 ) = (1, 0).

Matematiikka B2 - Avoin yliopisto

2.8. Kannanvaihto R n :ssä

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

Linkit webbihauissa / PageRank

Matriisilaskenta Luento 16: Matriisin ominaisarvot ja ominaisvektorit

Lineaarialgebra ja matriisilaskenta I

3.1 Lineaarikuvaukset. MS-A0004/A0006 Matriisilaskenta. 3.1 Lineaarikuvaukset. 3.1 Lineaarikuvaukset

Transkriptio:

Arvostus Tommi Perälä Department of Mathematics, Hypermedia Laboratory Tampere University of Technology 8..0

in idea on määrittää verkoston solmuille arvostusta kuvaavat tunnusluvut. Voidaan ajatella taustalla oleva verkosto arvostusverkostoksi, jossa Nuoli solmusta toiseen osoittaa yksipuolista arvostusta Nuolet ovat painotettuja, jolloin arvostuksen määrä riippuu painotuksesta Esim. hyperlinkin olemassaolo kertoo siitä, että linkin luoja kokee linkin kohteen tärkeäksi.

in taustalta voidaan havaita seuraavia ajatuksia solmun arvostuksen mallintamiseen: Solmun tulisi olla sitä arvostetumpi mitä arvostetummat solmut siitä arvostavat Yhdellä solmulla voi olla vain äärellinen määrä arvostusta jaettavana muille solmuille Luotu hakukoneen osaksi, joten solmujen lukumäärä valtava. n kompleksisuus tärkeä mallinnusnäkökulma.

Olkoot G = (E, V ) suunnattu yhtenäinen graafi. Graafin -vektori r määritellään alkioittain seuraavasti: r i = j I i r j d + j Solmun i arvostus on siten siihen osoittavien solmujen arvostusten painotettu summa, jossa painona solmujen lähtöasteen d + j käänteisluku. Solmujen arvostukset ovat siten riippuvaisia toisistaan ja yhteyksien lukumäärästä.. Miten ratkaistaan r i?

Olkoot q i vektori, jonka alkio q ij on tai 0 riippuen siitä d + j onko solmusta v j :stä nuoli solmuun v i vai ei. r i = N q ik r k = qi T r k= Jos kasataan vektorit matriisiin Q = [q, q,..., q N ] T, voidaan -ongelma muotoilla seuraavasti: r = Qr Verkoston topologia näyttäisi siis määrittävän solmujen arvostuksen.

Olkoon verkoston sosiomatriisi A = 0 0 0 0 0 0 0 0 0 vastaava matriisi olisi Q A = 0 0 0 0 0 0 0 0 0 Huomataan, että matriiseilla Q A ja A on sama rakenne, ja Q A voidaan laskea suoraan sosiomatriisin A avulla. 4

-ongelma voidaan kirjoittaa myös r = Qr (Q I)r = 0 Eli -vektori kuuluu matriisin Q I nolla-avaruuteen. Ei ole itsestään selvää, että tällainen vektori olisi olemassa. Toisin sanoen tämä tarkottaisi sitä, että vektori r olisi matriisin Q ominaisarvoa vastaava ominaisvektori. Osoittautuu, että sarake-stokastisille matriiseille (column-stochastic) löydetään tällainen vektori. Seuraavaksi selvitämme minkälaisille verkostoille (jos millekään), matriisi Q on sarake-stokastinen.

: Sarake-stokastisen matriisin alkiot ovat ei-negatiivisia, ja matriisin sarakesummat ovat. -matriisin alkiot ovat määritelmänsä mukaan ei-negatiivisia. Jotta i. sarakesumma voi olla, täytyy sosiomatriisissa i:nnellä sarakkeella olla ainakin yksi nollasta poikkeava alkio. Eli jokaisesta solmusta on oltava nuoli johonkin solmuun. Umpikujia (dangling nodes) ei siis sovi verkostosta löytyä.

On olemassa sarake-stokastisia matriiseja, joille ominaisarvoa vastaa useampi kuin yksi ominaisvektori. : Q B = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Q B :llä kaksi ominaisarvoa vastaavaa ominaisvektoria (,, 0, 0, 0) ja (0, 0, 0,, ). Kumpi valitaan? 4 5 Jotta ratkaisu olisi yksikäsitteinen, tulee sosiomatriisin olla redusoimaton (yhtenäinen verkosto).

Motivaatio Aiemmin määritellyn -vektorin käyttökelpoisuus alkaa epäilyttää tiukkojen vaatimusten takia. Hakukoneen löytämät WWW-sivujen linkkiverkostot voidaan hyvinkin olettaa sisältävän sekä umpikujia että olevan ei-yhtenäisiä. Miten algoritmia voitaisiin muuttaa, että tämä ei olisi ongelma?

vaatii siis, että jokainen solmu arvostaa. Jos näin ei jollekin solmulle ole, niin solmulle voidaan pakottaa keinotekoisesti nuolet kaikkiin muihin verkoston solmuihin. Näin solmu siis jakaa arvostuksensa tasan koko muun verkoston kesken, ja -matriisista saadaan sarake-stokastinen. Voitaisiin ainakin päätellä, että solmujen lukumäärän kasvaessa, yksittäisen umpikujan vaikutus muun verkoston arvostuksiin lähestyy nollaa.

Olkoon a vektori, jonka i. alkio on, jos v i on umpikuja ja muussa tapauksessa nolla. Olkoon lisäksi e vektori, jonka kaikki alkiot ovat ykkösiä. Q = Q + N eat On helppo nähdä, että näin saatu matriisi Q on sarake-stokastinen.

: Q A = Q A = 0 0 0 0 0 0 0 0 0 0 0 4 0 0 4 0 4 4 Nyt käyttäen matriisia QA saadaan -vektoriksi 4 r Q = (0.7, 0.65, 0.47, 0.7)

Yleensä sosiogrammeissa ei sallita silmukoita, joten -matriisia voitaisiin muokata seuraavasti QA = 0 0 0 0 0 0 Koko verkostolle käyttäen matriisia Q A 4 saadaan r Q = (0.8, 0.8, 0.7, 0.07)

: Kuten todettu on hyvin määritelty yhtenäiseille verkostoille. Jos verkosto on umpikujia lukuunottamatta yhtenäinen. Voidaan -vektori laskea yhtenäisen alkioille, jonka jälkeen umpikujien voidaan laskea näiden avulla. Jos lasketaan verkoston A yhtenäiselle komponentille (v, v, v ), saadaan ratkaisuksi r Y = ( 5, 5, 5 ) Nyt umpikujan v 4 on myös määritelty (miksi?). Normeerattuna -vektori on nyt r Y = ( 4, 6 4, 4, 4 )

: Yhteenvetona vielä eri tavoin lasketut -vektorit: r Q = (0.7, 0.65, 0.47, 0.7) r Q = (0.8, 0.8, 0.7, 0.07) r Y = (0.79, 0.40, 0.79, 0.0) Minkä valitsisit?

Määritellään -matriisi uudelleen ja merkataan sitä P:llä P = ( α)q + αm, missä M on matriisi, jonka jokainen alkio on N, ja 0 < α <. Helposti nähdään, että P on sarake-stokastinen. Näin saadussa arvostusverkostossa kaikki solmut jakavat osan arvostuksestaan tasaisesti koko verkon kesken. Esim. Web: surffaajalla pieni todennäköisyys siirtyä satunnaiselle sivulle linkkirakenteesta riippumatta (teleportaatio).

: Olkoot α = 0. P B = Q B = 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0 0.9 0.0 0.0 0.0 0.9 0.0 0.47 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.47 0.0 0.9 0.0 0.0 0.0 0.9 0.0 r P = (0.4, 0.47, 0.0, 0.47, 0.4) vrt. r Q = (0.5, 0.5, 0, 0, 0) tai r Q = (0, 0, 0, 0.5, 0.5)

Power Method Yllämainittu ominaisarvo-ongelma on laskennallisesti vaativa isoille verkostoille kaikenlaisten hajotelmien avulla laskettuna. Tätä varten lasketaan yleensä iteratiivisesti r (k+) = Pr (k) aloittaen jostain alkuarvauksesta r (0), jolle r (0) =. Yhtenäisen verkoston tapauksessa iteraatio suppenee suurinta ominaisarvoa (=) vastaavaan yksikäsitteiseen ominaisvektoriin. Suppenemisnopeuden määrää toisiksi suurin ominaisarvo.

-matriisi Koska M = N eet ja Q = Q + N eat, voidaan -matriisi kirjoittaa muotoon P = ( α)(q + N eat ) + α N eet = ( α)q + N e(( α)at + αe T )

Implementaatio Iteraatiot voidaan nyt kirjoittaa seuraavasti: r (k+) = Pr (k) = (( α)q + N ( )) e ( α)a T + αe T r (k) = ( α)qr (k) + ( N e ( α)a T r (k) + αe T r (k)) = ( α)qr (k) + ) (( N e α)a T r (k) + α Nähdään, että algoritmin kompleksisuus riippuu matriisin Q rakenteesta. Onneksi tämä on yleensä harva matriisi joten iteraatio vaatii luokkaa nnz(q) flopsia. Muistivaatimukset myös pienet (Q,r (k) ). n on huomattu myös suppenevan nopeasti (Google: n iter 50).

[] L. Page, S. Brin, R. Motwani, and T. Winograd, The pagerank citation ranking: Bringing order to the web. Stanford InfoLab, Technical Report 999-66, November 999 [] A. N. Langville and C. D. Meyer, Deeper inside pagerank, Internet Mathematics, vol., p. 004, 004. [] K. Bryan and T. Leise, The $5,000,000,000 eigenvector: The linear algebra behind google, SIAM Rev., vol. 48, pp. 569 58, March 006. [4] M. Bianchini, M. Gori, and F. Scarselli, Inside pagerank, ACM Trans. Internet Technol., vol. 5, pp. 9 8, February 005.