Suunnatut, etumerkilliset ja arvotetut graafit Sosiaalisten verkostojen analysoinnin näkökulmalla Hypermedian jatko-opintoseminaari 2008-2009 12.12.2008 Jaakko Salonen jaakko.salonen@tut.fi TTY / Hypermedialaboratorio 1
Sisältö ja tavoitteet Oletuksena on, että (suuntaamattomien) graafien perusteet ovat lukijalle tuttuja Sisällöllisesti käymme läpi perusteita 1. suunnattuista sekä 2. etumerkillistä ja arvotettuista graafeista Perustuu pääosin teoksen Wasserman & Faust (2004) lukuihin 4.3-4.8 (s. 121-149) Tavoitteena ymmärtää suunnattujen graafien teoriaa sekä sen soveltamista sosiaalisen verkostojen analysiin TTY / Hypermedialaboratorio 2
1. Suunnatut graafit Kuva: Wikimedia Commons TTY / Hypermedialaboratorio 3
Suunnattu graafi (digraafi) Suunnattu graafi (digraafi) G d N, L koostuu kahdesta alkioiden joukosta: Solmujen joukosta N ={n 1, n 2,..., n g } sekä L={l 1, l 2,..., l L } Kaarien joukosta Jokainen kaari on järjestetty pari solmuja, ts. l k = n i,n j Suunnatussa graafissa kaarilla on suunta, siis n i, n j n j, n i, josn i n j Kaaren ensimmäinen solmu on lähettäjä ja toinen kaaren vastaanottava solmu Digraafien visualisoinneissa nuolen suunta merkintään vastaanottavan solmun suuntaan TTY / Hypermedialaboratorio 4
Johtuvuus ja naapuruus Solmu n x,1 x g on kaaren L y,1 y L suhteen johtuva (engl. incident), jos n x L y Digraafissa kaaren solmujen järjestys on merkityksellinen naapuruuden määrittäminen ei ole yhtä yksiselitteistä kuin suuntaamattomilla graafeilla Naapuruus määrittyy kaaren suunnan perusteella: Solmu n i on solmun n j naapuri jos n i,n j L (ja sama toisinpäin) Naapuruus on siis asymmetrinen (yksisuuntainen) ominaisuus Esimerkkejä digraafeista SNAssa: suunnattu ystävyyssuhteiden verkosto, kansainvälinen tuonti/vienti TTY / Hypermedialaboratorio 5
Aligraafit; dyadit Dyadi on yksinkertaisin täydellinen aligraafi, koostuen kahdesta solmusta ja niiden välille määritellyistä kaarista Digraafissa dyadille voidaan määrittää kolme erityyppistä (isomorfista) tilaa: Nolla-dyadi (null): ei kaaria kumpaakaan suuntaan Asymmetrinen: kaari vain toiseen suuntaan (2 vaihtoehtoa) Vastavuoroinen (engl. mutual): kaaret molempiin suuntiin TTY / Hypermedialaboratorio 6
Solmujen asteluvut Solmun asteluku määräytyy sen naapurien summana Koska digraafissa naapurusto on asymmetrinen, asteluvut määritellään erikseen saapuville- ja lähteville kaarille: Solmun tuontiluku d I n i (engl. nodal indegree) = solmuun tuovien kaarien lukumäärä Solmun vientiluku d O n i (engl. nodal outdegree) = solmusta lähtevien kaarien lukumäärä TTY / Hypermedialaboratorio 7
Solmujen luokittelu asteluvuilla Astelukujen perusteella graafin solmut voidaan luokitella neljään tyyppiin: Solmu on eristynyt jos d I n i =d O n i =0, Lähettäjä jos d I n i =0 ja d O n i 0, Vastaanottaja jos d I n i 0 ja d O n i =0, Tavallinen tai kuljettaja jos d I n i 0 ja d O n i 0, Kuljettaja (engl. carrier) on tavallisen solmun erikoistapaus. Siinä d I n i =d O n i =1 TTY / Hypermedialaboratorio 8
Asteluvut SNAssa SNAssa asteluvuilla on mielekkäitä sovelluskohteita Vientiluvulla voidaan mitata solmun laajentuvuutta, vastaavasti tuontiluvulla vastaanottavuutta tai suosiota Koko verkoston tunnusluvuiksi voidaan laskea astelukujen tilastollisia muuttujia, erityisesti niiden keskiarvo ja keskihajonta TTY / Hypermedialaboratorio 9
Tiheys Digraafissa tiheys lasketaan graafiin määriteltyjen kaarien suhteena kaikkiin mahdollisiin kaariin: Tiheys = L g g 1,0 1 L = kaarien lkm g = solmujen lkm TTY / Hypermedialaboratorio 10
Kulku, reitti ja polku Suunnattu kulku tai lyhyemmin kulku on solmujen jono, joka noudattaa määriteltyjä kaaria niiden suuntaisesti Esimerkkikulku: W =n 5 n 1 n 2 n 3 n 4 n 2 n 3 Kulku sallii saman solmun käytön useamminkin kerran Puolikulussa ei välttämättä noudateta kaarien suuntia Reitti on kulku, jossa kukin kaari esiintyy vain kerran, Polussa kukin solmu ja kaari esiintyvät vain kerran Vastaavasti määritellään myös puolireitti ja puolipolku TTY / Hypermedialaboratorio 11
Solmujen väliset suhteet Kaikkien graafin solmujen välisiä suhteita voidaan määritellä polkujen avulla. Graafin kaksi mielivaltaista solmua ja ovat: n i n j (i) Heikosti yhdistetyt, jos niitä yhdistää puolipolku (ii) Yksipuolisesti yhdistetyt, jos niitä yhdistää polku n i n j tai polku n j n i (iii) Vahvasti yhdistetyt, jos on olemassa polku n i :stä n j :n ja toisinpäin siten, että erisuuntaiset polut voivat sisältää eri kaaria (iv) Rekursiivisesti yhdistetyt, jos ne ovat vahvasti yhdistetyt ja lisäksi polku n i :stä n j :n käyttää täsmälleen samoja solmuja ja kaaria, kuin vastakkaissuuntainen polku Yleistämällä yksittäisen dyadin välisiä suhteita, voidaan vastaavasti määritellä koko digraafin liitännäisyys Tällöin vastaavien kohtien i-iv pädettävä kaikille solmupareille TTY / Hypermedialaboratorio 12
Geodeesi, etäisyys ja halkaisija Digraafissa geodeesi on suuntaamattoman graafin tavoin lyhin polku kahden graafin solmun välillä Etäisyys d n i,n j kahden mielivaltaisen solmun n i ja n j välillä on asymmetrinen. Ei siis välttämättä päde d n i,n j =d n j,d i Halkaisija on koko graafin pisin geodeesi. Digraafin halkaisija voidaan määritellä ainoastaan, jos graafi on vahvasti tai rekursiivisesti yhdistetty Tämä sen takia, että heikosti tai yksipuolisesti yhdistetyssä digraafissa n i N, n j N : d n i,n j =d n j,n i = TTY / Hypermedialaboratorio 13
2. Etumerkilliset ja arvotetut graafit TTY / Hypermedialaboratorio 14
Etumerkillinen graafi, arvotettu graafi Arvotetussa graafissa kaareen liitetään sen arvotusta kuvaavaa informaatiota (kaarien valenssit) Solmujen joukosta N ={n 1, n 2,..., n g } Kaarien joukosta L={l 1, l 2,...,l L }, sekä Valenssien joukosta V ={v 1, v 2,...,v L } Etumerkillinen graafi voidaan käsittää arvotetun graafin erikoistapaukseksi. Siinä arvojen (valenssien) joukkona käytetään ainoastaan etumerkkejä +/- Laskennallisesti voidaan ajatella, että v i {-1,+1},1 i L TTY / Hypermedialaboratorio 15
Etumerkillinen digraafi, arvotettu digraafi Etumerkillisiin ja arvotettuihin graafeihin voidaan lisätä digraafien tavoin tieto arvotuksen suunnasta Tällöin jokainen kaari on järjestetty pari solmuja, ts. l k = n i, n j,1 k L Esimerkki suunnatun, arvotetun graafin sovelluksesta: Ihmisten välisten ystävyys- ja vihasuhteiden ilmaiseminen suunnattujen, etumerkillisten graafien avulla TTY / Hypermedialaboratorio 16
Dyadi ja kierto Etumerkillisessä, suuntaamattomassa graafissa dyadilla on kolme mahdollista tilaa: Positiivinen (+) Negatiivinen (-) Ei suhdetta Tilat voidaan vastaavasti määrittää etumerkillisen graafin triadille sekä yleistää mille tahansa arvotetulla graafille kombinatorisesti, mutta tämä ei aina ole mielekästä Kierto etumerkillisessä. graafissa kuvaa suljettua kulkua siten, että ainoastaan alku- ja loppupiste on sama solmu Kierron etumerkki lasketaan kulun kaarien etumerkkien tulona TTY / Hypermedialaboratorio 17
Polut ja polkujen arvotus Kulut ja polut määritellään vastaavasti kuin graafeissa (ja digraafeissa). Lisäksi voidaan arvotusten perusteella laskea erilaisia suureista polusta Polun arvo Polun kaarien pienin arvo eli Polku-käsitteen tulkintaesimerkki: viestinkulku ihmisten välillä on juuri niin tehokasta kuin yksittäinen, rajatuin viestiyhteys Polun arvoa ja sen ominaisuuksia käytetään hyväksy mm. kohesiivisia osajoukkoja tutkittaessa Saavutettavuus (engl. reachability) Määräytyy suhteellisesti polun arvoon (=tasoon) Polun saavutettavuuden taso = polun arvo TTY / Hypermedialaboratorio 18
Arvotettujen graafien sovelluksia Erityisesti yleistetyillä, arvotetuilla graafeilla ja digraafeilla on runsaasti mielekkäitä sovelluksia: Niiden avulla voidaan kuvata käytännössä mitä tahansa suunnattua tai suuntaamatonta vuorovaikutusta Esim. maiden välisiä tuonti- ja vientisuhteita (esim. suhteiden arvotukset euromääräisinä) Ystävyyssuhteita niiden subjektiivisen arvotuksen perusteella ( parempi kaveri suurempi arvotus kaaressa) Erityisenä sovelluskohteena arvotettujen graafien tulkinta (bayesilaisina) todennäköisyyksinä, ts. graafien tulkinta stokastisina markovin ketjuina TTY / Hypermedialaboratorio 19
Kohti yleisempiä graafirakenteita Esitetyt yksinkertaiset graafirakenteet soveltuvat sosiaalisten verkostojen analysointiin, erityisesti kun halutaan mitata ainoastaan yhtä suuretta Eesim. toimijoiden välisten ystävyyssuhteiden läheisyyden tunnusluku Poistamalla rajoitus yhden kaaren (per suunta) määrittelylle, saadaan monigraafi, joka mahdollistaa mm. usean yhtäaikaisen suureen mittaamisen verkostosta Esim. ystävyyssuhteiden läheisyyden ja keston tunnusluvut Vaihtoehtona yksinkertaisille graafille SNAssa voivat olla myös matemaattiset relaatiot TTY / Hypermedialaboratorio 20
Lopuksi Suunnattujen, arvotettujen ja digraafien soveltaminen sosiaalisten verkostojen analysointiin ml. visualisointiin Selvästi epätyypillisempää erityisesti visualisoinnissa kuin yksinkertaisempia graafirakenteiden käyttö Graafien esittäminen graafisesti hankaloituu erityisesti monigraafien ja suunnattujen graafien osalta. TTY / Hypermedialaboratorio 21
Lähteet Wasserman, S. & Faust, K. 1994. Social Network Analysis: Methods and Applications. New York: Cambridge University Press Lopuksi-sivun kuva: jaycross / flickr.com. Joitain oikeuksia pidätetään. TTY / Hypermedialaboratorio 22