Hypermedian jatko-opintoseminaari 2008 2009 1 Graphs in Social Network Analysis And Modeling Graafit sosiaalisten verkostojen mallintamisessa 28.11.2008 Thumas Miilumäki thumas.miilumaki@tut.fi
Sisältö 2 Perusteluja graafiteoreettisten menetelmien käytön soveltuvuudesta sosiaalisten verkostojen kvantitatiivisen tutkimuksen välineinä Sosiaalisten verkostojen analyysissä käytettävän graafiteorian perusteita Esimerkkejä SNA-visualisoinneista eri ohjelmistoilla Taustalla pääosin Wassermanin ja Faustin (1994) kirjassaan esittämät suuntaamattomien graafien teoriat Laajennuksia Ruohosen Graafiteoria (2006) opetusmonisteesta Termistön suomennokset pohjautuvat Ruohosen (2006) ja Johanssonin et al. (1995) teoksissa käytettyihin suomennoksiin Kuvat tehty Pajek ohjelmistolla ellei muuta ole mainittu
Tavoitteet 3 Graafiteoreettisten peruskäsitteiden ymmärtäminen Graafien tärkeyden korostaminen sosiaalisten verkostojen mallintamisessa Graafiteoreettisen ajatuspohjan luominen matriisilaskennan avulla toteutettavan sosiaalisten verkostojen kvantitatiivisen analyysin tueksi
Taustaa 4 Tapoja sosiaalisten verkostojen mallintamiseen on useita Käytettävät menetelmät riippuvat mallinnuksen kohteesta, näkökulmasta ja tavoitteesta Esimerkiksi monet tilastolliset mallinnusmenetelmät ovat sovellettavissa sosiaalisten verkostojen mallinnuksessa, mikäli verkostodata on valittuun tarkoitukseen relevanttia Edelleen monet diagrammit ja kaaviot ovat sovellettavissa sosiaalisen verkoston datan käsittelyyn Graafeilla pyritään luomaan mahdollisimman todenmukainen visualisointi, ikään kuin valokuva, tarkasteltavasta verkostosta, jossa toimijat ja niiden väliset yhteydet on esitetty selkeästi Graafin ja todellisuuden yhteensovittaminen on haasteellista, sillä graafi luodaan usein diskreetistä ja rajallisesta määrästä verkostodataa
Perusteluja graafien käytölle 5 SNA:ssa (Social Network Analysis) graafien käytölle on useita perusteita Graafiteoreettinen sanasto soveltuu sosiaalisten rakenteiden kuvaamiseen ja merkitsemiseen Useimmat sosiaalisten rakenteiden ja ominaisuuksien kvantitatiiviset tunnusluvut ovat laskettavissa graafiteoreorian sisältämien matemaattisten menetelmien avulla Graafiteoreettinen notaatio ja sanasto sekä sen sisältämä matematiikka tarjoavat mahdollisuuden erilaisten graafeja koskevien teoreemien todistamiseen, ja siten myös sosiaalisia rakenteita koskevat väitteet ovat todistettavissa (Wasserman & Faust 1994, 93.) Graafiteoria tarjoaa mahdollisuuden sosiaalisen verkoston mallintamiseen Graafi on esitys tarkasteltavasta verkosta Reaalimaailman toimijat esitetään graafissa solmuina / (kärki)pisteinä (a node, nodes / a vertex, vertices) ja niiden väliset yhteydet solmuja yhdistävinä kaarina (an edge, edges) tai nuolina (an arc, arcs)
Historiaa graafeista ja niiden käytöstä SNA:ssa 6 Jacob Levy Moreno esitteli 1930-luvulla sosiogrammin (sociogram), joka on edelleen pohjana graafiteoreettisessa SNA:ssa ja verkostojen visualisoinnissa Graafiteoria on ollut voimakkaasti käytössä Antropologiassa Kommunikaatiotutkimuksissa Elinkeino- ja liiketaloustutkimuksissa Organisaatiotutkimuksissa Maantieteissä (Wasserman & Faust 1994, 94.) Piiriteoriassa ja -analyysissa Kaikissa em. tieteen- ja tutkimuksenaloilla on aina jollain tapaa ja jollain asteella mukana ihmisten muodostama sosiaalinen verkosto, jota graafiteoreettisin menetelmin on hyvä lähestyä ja analysoida
Graafit 7 Seuraavassa esitellään suuntaamaton (undirected) ja kaksiarvoinen (dichotomous) graafi verkoston mallina Suuntaamattomassa graafissa verkoston toimijoiden väliset yhteydet ovat aina kaksisuuntaisia Kaksiarvoisessa graafissa yhteyksien voimakkuutta ei oteta huomioon vaan ainoastaan yhteyden olemassaoloon otetaan kantaa, ts. yhteys joko on olemassa tai ei ole
Suuntaamaton graafi 8 Suuntaamaton graafi G Toimijoita kuvaava solmujen joukko N koostuu kahdesta joukosta: Yhteyksiä kuvaava kaarien (viivojen) joukko L = {n 1,n 2,,n g } (a set of nodes) = {l 1,l 2,,l L } (a set of lines) Graafissa G (N, L ) on siis yhteensä g solmua ja solmuja yhdistäviä kaaria yhteensä L kappaletta Suuntaamattomassa graafissa jokainen kaari on kahden erillisen solmun n i ja n j ei-järjestetty pari, ts. kaari l k = (n i,n j ) = (n j,n i ) Kaarta, jonka alku- ja päätepisteenä on yksi ja sama solmu n i, sanotaan silmukaksi (a loop) tai sisä-/refleksiivisidokseksi (a reflexive tie) Silmukoita ei useinkaan käytetä sosiogrammeissa Sosiogrammit yksinkertaisia (simple) graafeja Arvotetuilla/painotetuilla (valued, weighted) graafeilla silmukoita voidaan hyödyntää kuvaamaan itseisiä toimintoja ja niiden määriä Voidaan merkitä graafiin kaaren sijasta solmun kokoa muuttaen
Perusmääritelmiä 9 Kaksi solmua n i ja n j ovat vierekkäiset (adjacent), jos kaari l k =(n i,n j ) on joukossa L ts. l k = (n i,n j ) L Solmu n i on liittynyt (incident) kaareen l k, jos se on toinen solmuista, jotka muodostavat kaaren l k määrittelevän järjestämättömän parin l k =(n i,n j ) Graafia, jossa on vain yksi solmu, sanotaan triviaaliksi (trivial) Tyhjässä (empty) graafissa ei ole yhtään kaarta solmujen välissä, ts. G (N, L ): N ={n 1,n 2,,n g }, L =Ø
Aligraafit 10 Graafi G s (N s, L s ) on graafin G (N, L ) aligraafi (subgraph), jos N, L s L N s Graafin G (N, L ) solmugeneroitu aligraafi (node-generated subgraph) on graafi G s (N s, L s ) se., kaarijoukko L s sisältää kaikki ne kaarijoukon L kaaret, jotka yhdistävät solmuja joukossa N s Graafin G (N, L ) viivageneroitu aligraafi (line-generated subgraph) on graafi G s (N s, L s ) se., solmujoukko N s sisältää kaikki ne solmujoukon N solmut, jotka ovat liittyneitä joukon L s kaariin
Aligraafit 11 Graafi G (N, L ) Viivageneroitu aligraafi G s1 (N s1, L s1 ) Solmugeneroitu aligraafi G s2 (N s2, L s2 )
Dyadit ja triadit 12 Dyadi (a dyad, dyads) on solmugeneroitu aligraafi, joka koostuu solmuparista ja mahdollisesta solmuja yhdistävästä kaaresta Triadi (a triad, triads) on myöskin solmugeneroitu aligraafi, jossa Solmuja on kolme Solmuja yhdistäviä kaaria voi olla 0 3 kappaletta 0 kaarta 1 kaari 2 kaarta 3 kaarta
Solmun aste 13 Suuntaamattomassa graafissa solmun aste (degree) d(n i ) kertoo solmuun n i liittyneiden kaarien lukumäärän Kun graafissa G on g solmua, kullakin solmulla on aste, joka voi olla Minimissään 0, jolloin solmuun n i ei ole liittynyt yhtään kaarta Maksimissaan g-1, jolloin kaikki muut graafin solmut ovat liittyneet suoraan erillisillä kaarilla solmuun n i Graafin G, jossa on g solmua ja L kaarta, solmujen asteiden keskiaste (mean degree) määritellään g i= 1 d( ni ) 2L d = = g g Edelleen astelukujen varianssi (variance of degrees) S ( d( ni ) d g g 2 2 i= 1 ) D =
Säännöllisyys 14 Graafi on säännöllinen (regular), kun sen jokaisen solmun aste on yhtä suuri, ts. d(n i ) = d, i {1, 2,, L}, d {0, 1,, g}, g {0, Z + }, L {0, 1,, g(g-1)/2} Tällaisen d-säännöllisen (d-regular) graafin astelukujen varianssi S 2 D = 0 5-säännöllinen graafi (K 6 -graafi)
Graafin tiheys 15 Graafin G (N, L ) tiheys (density) on graafin kaarien osuus graafin kaikista mahdollisista kaarista Yksinkertaisessa (ei silmukoita, eikä rinnakkaisia (parallel) kaaria) graafissa, jossa on g solmua, on kaaria maksimissaan g = 2 g ( g 1) 2 Jos graafissa G (N, L ) on L kaarta, saadaan graafin tiheydelle määritelmä Δ = L 2L = g( g 1) / 2 g( g 1) Tiheys voi olla Minimissään 0, jos graafissa ei ole lainkaan kaaria (L = 0) Maksimissaan 1, jos graafi on täydellinen (complete) eli graafin kaikki mahdolliset kaaret ovat edustettuina (L = g(g-1)/2) Täydellistä graafia, jossa on g solmua, merkitään K g
Graafin tiheys 16 Suuntaamattomassa g solmun graafissa kaikkien solmujen asteiden summa on 2L, mikä antaa keskiasteeksi 2L/g Täten tiheys voidaan kirjoittaa muodossa 2L d Δ = = g( g 1) ( g 1) Tiheyden määritelmä pätee myös aligraafeille G s (N s, L s ) 2Ls Δ = g ( g 1) s s
Kulku, reitti ja polku 17 Kulku (a walk, walks) on graafin G (N, L ) solmujen ja kaarien äärellinen jakso W = n i0, l j0, n i1, l j1,, l jk, n ik Kulku alkaa aina solmusta ja päättyy solmuun Mikäli kulun alkusolmu n i0 ja loppusolmu n ik ovat yksi ja sama solmu n, on kulku suljettu (closed) Kulku voi sisältää saman kaaren ja solmun useammin kuin kerran jaksossa Kulun pituus (length) on kulun sisältämien kaarien lukumäärä Jos jokin kaari on kulussa useampaan kertaan lasketaan ne erillisinä kaarina kulun pituuteen Kulun vastakulku W -1 on itse kulku käänteisessä järjestyksessä Reitti (a trail, trails) on kulku, jossa kukin kaari esiintyy vain kerran Polku (a path, paths) on kulku, jossa kukin solmu ja kaari esiintyy vain kerran
Piiri ja kierto 18 Piiri (a cycle, cycles) on suljettu kulku, jossa On vähintään kolme solmua, joista kaikki muut solmut paitsi alku- ja loppusolmu ovat erillisiä Kulun sisältämät kaaret ovat erillisiä Hamiltonin (Hamiltonian) piirin kulkuun sisältyy graafin jokainen kaari ja solmu ainoastaan kerran (pl. alku- ja loppusolmu, joka on yksi ja sama solmu) Kierto (a tour, tours) on suljettu kulku, jossa jokainen graafin kaari on kuljettu vähintään kerran
Yhtenäiset graafit ja graafin komponentit 19 Graafi on yhtenäinen (connected), jos sen jokaisen solmuparin välillä on polku Yhtenäisessä graafissa jokainen solmu on saavutettavissa (reachable) toisesta solmusta Jos graafi ei ole yhtenäinen, se on epäyhtenäinen (disconnected) Epäyhtenäisen graafin maksimaalisia yhtenäisiä aligraafeja sanotaan graafin komponenteiksi (a component, components) Yhtenäinen graafi Epäyhtenäinen graafi (Kaksi komponenttia)
Geodeesi, etäisyys, halkaisija ja eksentrisyys 20 Geodeesi (a geodesic, geodesics) on lyhin polku graafin kahden solmun välillä Geodeettinen etäisyys (geodesic distance), yksinkertaisemmin etäisyys (distance), kahden solmun välillä määritellään solmujen geodeesin pituutena Etäisyyttä solmujen n i ja n j välillä merkitään d(i,j) Solmujen n i ja n j välinen etäisyys on minkä tahansa geodeesin pituus ko. solmujen välillä Mikäli solmuparin välillä ei ole polkua, on ko. solmujen välinen etäisyys ääretön (tai määrittämätön) Suuntaamattomilla graafeilla d(i,j) = d(j,i) Graafin halkaisija (diameter) on yhtä suuri kuin graafin minkä tahansa solmuparin suurin geodeettinen etäisyys Solmun n i eksentrisyys (eccentricity) eli epäkeskisyys (myös ns. suhdeluku (association number)) on suurin geodeettinen etäisyys solmun n i ja minkä tahansa graafin muun solmun n j kanssa
Irrotuspiste ja silta 21 Graafin solmu n i on irrotuspiste (a cutpoint, cutpoints), jos graafissa, joka sisältää n i :n, on vähemmän komponentteja, kuin graafissa, josta n i ja siihen liittyneet kaaret on poistettu n i Graafin kaari l i on silta (a bridge, bridges), jos graafissa, joka sisältää l i :n, on vähemmän komponentteja, kuin graafissa, josta kaari l i on poistettu l i
Graafien yhtenäisyydestä 22 Graafin G piste- tai solmuyhtenäisyys (point-/node-connectivity) κ (G ) on pienin luku κ, jolla graafissa on κ-pisteirrotus κ -pisteirrotuksella tarkoitetaan pienintä graafin G solmujen lukumäärää, mikä tulisi poistaa graafista, jotta saataisiin epäyhtenäinen graafi tai triviaali graafi Jos graafi on valmiiksi epäyhtenäinen κ = 0 Jos graafissa on irrotuspiste n i, niin κ = 1 Jos graafista pitää poistaa n solmua, jotta graafi olisi epäyhtenäinen, niin κ = n Jos graafi on täydellinen K g -graafi, niin κ = g-1 Mille tahansa luvulle k < κ graafin sanotaan olevan k-solmuyhtenäinen (k-node connected) Graafin G viiva- tai kaariyhtenäisyys (line-/edge-connectivity) λ (G ) on pienin luku λ, jolla graafissa on λ-viivairrotus λ-viivairrotuksella tarkoitetaan pienintä graafin G kaarien lukumäärää, mikä tulisi poistaa graafista, jotta saataisiin epäyhtenäinen graafi tai triviaali graafi Jos graafi on valmiiksi epäyhtenäinen λ = 0 Jos graafissa on silta l i, niin λ = 1 Jos graafista pitää poistaa m kaarta, jotta graafi olisi epäyhtenäinen, niin λ = m Jos graafi on täydellinen K g -graafi, niin λ = g-1 Mille tahansa luvulle l < λ graafin sanotaan olevan l-viivayhtenäinen (l-line connected)
Isomorfiset graafit 23 Kaksi graafia G ja G * ovat isomorfisia (isomorphic), jos on olemassa yksi yhteen kuvaus G :n solmuilta G *:n solmuille se., solmujen vierekkäisyydet säilyvät Yksi yhteen kuvauksella tarkoitetaan, että jokainen G :n solmu kuvautuu yhteen (ja vain yhteen) G *:n solmuun ja päinvastoin Toisin sanoen, jos graafien G (N, L ) ja G *(N *, L *) solmujoukkojen välillä on yksi yhteen kuvaus ɸ, niin tällöin ɸ (n i ) = n k *, ja sen käänteiskuvaus ɸ -1 toteuttaa ehdon ɸ -1 (n k *) = n i Formaalisti graafit ovat isomorfisia, jos n i, n j N, n k *, n l * N * ɸ (n i ) = n k *, ɸ (n j ) = n l * : l m = (n i, n j ) L l 0 = (n k *, n l *) L *
Erityiset graafit: komplementti, puu ja kaksijakoinen graafi 24 Graafin G, jossa on g solmua, komplementissa (complement) G on sama solmujoukko kuin G :ssä, mutta sen kaarijoukkoon kuuluvat ainoastaan ne kaaret, jotka eivät esiinny G :ssä, mutta esiintyisivät täydellisessä K g -graafissa Puu (a tree, trees) on asyklinen (acyclic) eli piiritön yhtenäinen graafi Piiritön epäyhtenäinen graafi on metsä (a forest, forests) Kaksijakoisessa graafissa solmujoukko N voidaan jakaa kahteen alisolmujoukkoon N 1 ja N 2 se., jokainen joukon L kaari lk on järjestetty pari se., l k = (n i,n j ), n i N 1, n j N 2 Täydellistä kaksijakoista graafia, jonka solmujoukossa N 1 on yhteensä g 1 solmua ja solmujoukossa N 2 yhteensä g 2 solmua, merkitään K g1,g2
Graafit visualisoinnin työkaluina 25 Monet matematiikkaohjelmistot tarjoavat hyvät mahdollisuudet erilaisten kuvaajien ja graafienkin piirtämiseen Matlab -ohjelmistolla voidaan suorittaa tehokkaasti graafiteoreettisiin matriiseihin perustuvaa laskentaa Maple -ohjelmistossa on itsessään kattava graafiteoriapaketti (GraphTheory) Petersenin graafi Maple -ohjelmistolla piirrettynä Pajek -ohjelmisto on puhtaasti SNA -työkalu, joka tarjoaa mm. monipuoliset visualisointimahdollisuudet erilaisin graafinladonta-algoritmein Esimerkkinä sosiaalisen verkkoyhteisön evoluution visualisointi Pajek -ohjelmistolla OPAALS 2008 Community Evolution Visualization (Miilumäki 2008) http://matriisi.ee.tut.fi/~miilumak/opaals
Lähteet 26 Johansson, J-E., Mattila, M. & Uusikylä, P. 1995. Johdatus verkostoanalyysiin. Helsinki: Kuluttajatutkimuskeskus. http://www.valt.helsinki.fi/vol/kirja/ (Viitattu 27.11.2008) Miilumäki, T. 2008. OPAALS 2008 Community Evolution Visualization. http://matriisi.ee.tut.fi/~miilumak/opaals/ (Viitattu 27.11.2008) Ruohonen, K. 2006. Graafiteoria. Tampere: Tampereen teknillisen yliopiston opetusmoniste no. 5, uusi sarja. Wasserman, S. & Faust, K. 1994. Social Network Analysis: Methods and Applications. New York: Cambridge University Press, 92 121.