Verkostoanalyysin peruskäsitteitä ja visualisointia. Graafit ja matriisit, keskeisyys ja arvostus

Samankaltaiset tiedostot
Social Network Analysis Centrality And Prestige

Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten verkostojen mallintamisessa

Hypermedian jatko-opintoseminaari

Centrality and Prestige Keskeisyys ja arvostus

Suunnatut, etumerkilliset ja arvotetut graafit Sosiaalisten verkostojen analysoinnin näkökulmalla

Jäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä

Sosiaalisten verkostojen datan notaatio. Notation for Social Network Data

Koheesiiviset alaryhmät

0 v i v j / E, M ij = 1 v i v j E.

Algoritmit 1. Luento 9 Ti Timo Männikkö

Rakenteellinen tasapaino ja transitiivisyys

A TIETORAKENTEET JA ALGORITMIT

Jäsenyysverkostot ominaisuudet, toimijoiden ja tapahtumien samanaikainen analyysi. Sisältö ja tavoitteet. Osallistujien ja tapahtumien ominaisuudet

Jarno Marttila Datalähtöinen sosiaalisten verkostojen analyysi: tapaus Suomen Lasten Parlamentti. Diplomityö

Johdatus graafiteoriaan

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Arvostus Verkostoissa: PageRank. Idea.

Johdatus verkkoteoriaan 4. luento

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

6.4. Järjestyssuhteet

Algoritmit 1. Luento 8 Ke Timo Männikkö

Graafit ja verkot. Joukko solmuja ja joukko järjestämättömiä solmupareja. eli haaroja. Joukko solmuja ja joukko järjestettyjä solmupareja eli kaaria

Insinöörimatematiikka D

BM20A0700, Matematiikka KoTiB2

Johdatus graafiteoriaan

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Diskreetit rakenteet

Hypermedian jatko-opintoseminaari. MATHM-6750x. 2-6 op. Sosiaalisten verkostojen tutkimusmenetelmät

Malliratkaisut Demot

Insinöörimatematiikka D

Johdatus verkkoteoriaan luento Netspace

v 8 v 9 v 5 C v 3 v 4

keskenään isomorfiset? (Perustele!) Ratkaisu. Ovat. Tämän näkee indeksoimalla kärjet kuvan osoittamalla tavalla: a 1 b 3 a 5

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

Induktiotodistus: Tapaus n = 0 selvä; ol. väite pätee kun n < m.

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Graafiteoria matematiikkaako?

Totaalisesti unimodulaariset matriisit voidaan osoittaa olevan rakennettavissa oleellisesti verkkomalleihin liittyvistä matriiseista

4. Kokonaislukutehtävän ja LP:n yhteyksiä

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

14. Luennon sisältö. Kuljetustehtävä. Verkkoteoria ja optimointi. esimerkki. verkkoteorian optimointitehtäviä verkon virittävä puu lyhimmät polut

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Lineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila

Sosiaalisten verkostojen tutkimusmenetelmät - historiallisia ja teoreettisia perusteita sekä peruskäsitteitä

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

Insinöörimatematiikka D

Graafin 3-värittyvyyden tutkinta T Graafiteoria, projektityö (eksakti algoritmi), kevät 2005

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

T : Max-flow / min-cut -ongelmat

Määritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

PARITUS KAKSIJAKOISESSA

MS-A0402 Diskreetin matematiikan perusteet Yhteenveto, osa I

Rinnakkaistietokoneet luento S

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

Lineaarialgebra ja matriisilaskenta I

TIE Tietorakenteet ja algoritmit 261

Keskeiset ladonta-algoritmit verkostoanalyysityössä

Johdatus tekoälyn taustalla olevaan matematiikkaan

Harjoitus 1 ( )

Verkostoanalyysi 2011 Jatko-opintoseminaari Case: Verkostot ja muutos Statsterverkkopalvelussa

Johdatus graafiteoriaan

Sisätuloavaruudet. 4. lokakuuta 2006

isomeerejä yhteensä yhdeksän kappaletta.

T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet )

Tarkennamme geneeristä painamiskorotusalgoritmia

verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari

Johdatus verkkoteoriaan luento Netspace

Königsbergin sillat. Königsberg 1700-luvulla. Leonhard Euler ( )

9. Graafit Graafin abstrakti tietotyyppi

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 5. marraskuuta 2015

811312A Tietorakenteet ja algoritmit V Verkkojen algoritmeja Osa 2 : Kruskalin ja Dijkstran algoritmit

Ratkaisu. Tulkitaan de Bruijnin jonon etsimiseksi aakkostossa S := {0, 1} sanapituudelle n = 4. Neljän pituisia sanoja on N = 2 n = 16 kpl.

Latinalaiset neliöt ja taikaneliöt

Silmukkaoptimoinnista

Numeeriset menetelmät

Algoritmi on periaatteellisella tasolla seuraava:

TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 12. tammikuuta 2012

8.5. Järjestyssuhteet 1 / 19

VERKKOTEORIAN ALKEITA. Martti E. Pesonen

Kysymys: Voidaanko graafi piirtää tasoon niin, että sen viivat eivät risteä muualla kuin pisteiden kohdalla?

Algoritmit 2. Luento 11 Ti Timo Männikkö

Ratkaisuehdotukset LH 3 / alkuvko 45

811120P Diskreetit rakenteet

Tietojenkäsittelytieteen ja tilastotieteen matematiikkaa 1/137

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

Pertti Koivisto ja Riitta Niemistö. Graafiteoriaa

Sosiaalisten verkostojen data

Verkoston muutoksen mallinnus ja visualisointi

Yhtenäisyydestä. Johdanto. Lähipisteavaruus. Tuomas Korppi

Diskreetin matematiikan perusteet Laskuharjoitus 2 / vko 9

7 Vapaus. 7.1 Vapauden määritelmä

Rinnakkaistietokoneet luento S

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Matematiikka ja teknologia, kevät 2011

Lineaariset Lien ryhmät / Ratkaisut 6 D 381 klo

Suomen rautatieverkoston robustisuus

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Matriisit, kertausta. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Voidaanko verkkoteoriaa opettaa lukiolaisille?

Transkriptio:

Verkostoanalyysi 2011, TTY 1 Verkostoanalyysin peruskäsitteitä ja visualisointia Graafit ja matriisit, keskeisyys ja arvostus Thumas Miilumäki thumas.miilumaki@tut.fi Tampereen teknillinen yliopisto Hypermedialaboratorio Matematiikan laitos

Sisältö 2 SNA-graafit ja niiden ominaisuudet SNA-matriisit ja niiden ominaisuudet Suuntaamattomien verkostojen keskeisyyden tunnusluvut Suunnattujen verkostojen toimijoiden arvostuksen tunnusluvut Taustalla pääosin Wassermanin ja Faustin Social Network Analysis: Methods and Applications (1994) teokessa esitetyt SNA-teoriat Laajennuksia Ruohosen Graafiteoria (2006) opetusmonisteesta sekä Knoken ja Yangin (2008) ja Scottin (2000) teoksista Termistön suomennokset pohjautuvat Ruohosen (2006), Johanssonin et al. (1995) ja Miilumäki (2010) teoksissa käytettyihin suomennoksiin Esitysaineisto noudattaa sisällöltään pitkälti aiempia seminaariesityksiä (Miilumäki, 2008; 2009a ; 2009b)

3 SNA-graafit Taustat Määritelmät Ominaisuudet

Taustaa 4 Tapoja sosiaalisten verkostojen mallintamiseen on useita Käytettävät menetelmät riippuvat mallinnuksen kohteesta, näkökulmasta ja tavoitteesta Esimerkiksi monet tilastolliset mallinnusmenetelmät ovat sovellettavissa sosiaalisten verkostojen mallinnuksessa, mikäli verkostodata on valittuun tarkoitukseen relevanttia Edelleen monet diagrammit ja kaaviot ovat sovellettavissa sosiaalisen verkoston datan käsittelyyn Graafeilla pyritään luomaan mahdollisimman todenmukainen visualisointi, ikään kuin valokuva, tarkasteltavasta verkostosta, jossa toimijat ja niiden väliset yhteydet on esitetty selkeästi Graafin ja todellisuuden yhteensovittaminen on haasteellista, sillä graafi luodaan usein diskreetistä ja rajallisesta määrästä verkostodataa

Perusteluja graafien käytölle 5 SNA:ssa (Social Network Analysis) graafien käytölle on useita perusteita Graafiteoreettinen sanasto soveltuu sosiaalisten rakenteiden kuvaamiseen ja merkitsemiseen Useimmat sosiaalisten rakenteiden ja ominaisuuksien kvantitatiiviset tunnusluvut ovat laskettavissa graafiteoreorian sisältämien matemaattisten menetelmien avulla Graafiteoreettinen notaatio ja sanasto sekä sen sisältämä matematiikka tarjoavat mahdollisuuden erilaisten graafeja koskevien teoreemien todistamiseen, ja siten myös sosiaalisia rakenteita koskevat väitteet ovat todistettavissa (Wasserman & Faust 1994, 93.) Graafiteoria tarjoaa mahdollisuuden sosiaalisen verkoston mallintamiseen Graafi on esitys tarkasteltavasta verkosta Reaalimaailman toimijat esitetään graafissa solmuina / (kärki)pisteinä (a node, nodes / a vertex, vertices) ja niiden väliset yhteydet solmuja yhdistävinä kaarina (an edge, edges) tai nuolina (an arc, arcs)

Historiaa graafeista ja niiden käytöstä SNA:ssa 6 Jacob Levy Moreno esitteli jo 1930-luvulla sosiogrammin (sociogram), joka on edelleen pohjana graafiteoreettisessa SNA:ssa ja verkostojen visualisoinnissa (Moreno, 1953) Graafiteoria on ollut voimakkaasti käytössä Antropologiassa Kommunikaatiotutkimuksissa Elinkeino- ja liiketaloustutkimuksissa Organisaatiotutkimuksissa Maantieteissä (Wasserman & Faust 1994, 94.) Piiriteoriassa ja -analyysissa Kaikissa em. tieteen- ja tutkimuksenaloilla on aina jollain tapaa ja jollain asteella mukana ihmisten muodostama sosiaalinen verkosto, jota graafiteoreettisin menetelmin on hyvä lähestyä ja analysoida

Graafit 7 Seuraavassa esitellään suuntaamaton (undirected) ja kaksiarvoinen (dichotomous) graafi verkoston mallina Suuntaamattomassa graafissa verkoston toimijoiden väliset yhteydet ovat aina kaksisuuntaisia Kaksiarvoisessa graafissa yhteyksien voimakkuutta ei oteta huomioon vaan ainoastaan yhteyden olemassaoloon otetaan kantaa, ts. yhteys joko on olemassa tai ei ole

Suuntaamaton graafi 8 Suuntaamaton graafi G Toimijoita kuvaava solmujen joukko N koostuu kahdesta joukosta: Yhteyksiä kuvaava kaarien (viivojen) joukko L = {n 1,n 2,,n g } (a set of nodes) = {l 1,l 2,,l L } (a set of lines) Graafissa G (N, L ) on siis yhteensä g solmua ja solmuja yhdistäviä kaaria yhteensä L kappaletta Suuntaamattomassa graafissa jokainen kaari on kahden erillisen solmun n i ja n j ei-järjestetty pari, ts. kaari l k = (n i,n j ) = (n j,n i ) Kaarta, jonka alku- ja päätepisteenä on yksi ja sama solmu n i, sanotaan silmukaksi (a loop) tai sisä-/refleksiivisidokseksi (a reflexive tie) Silmukoita ei useinkaan käytetä sosiogrammeissa Sosiogrammit yksinkertaisia (simple) graafeja Arvotetuilla/painotetuilla (valued, weighted) graafeilla silmukoita voidaan hyödyntää kuvaamaan itseisiä toimintoja ja niiden määriä Voidaan merkitä graafiin kaaren sijasta solmun kokoa muuttaen

Perusmääritelmiä 9 Kaksi solmua n i ja n j ovat vierekkäiset (adjacent), jos kaari l k =(n i,n j ) on joukossa L ts. l k = (n i,n j ) L Solmu n i on liittynyt (incident) kaareen l k, jos se on toinen solmuista, jotka muodostavat kaaren l k määrittelevän järjestämättömän parin l k =(n i,n j ) Graafia, jossa on vain yksi solmu, sanotaan triviaaliksi (trivial) Tyhjässä (empty) graafissa ei ole yhtään kaarta solmujen välissä, ts. G (N, L ): N ={n 1,n 2,,n g }, L =Ø

Solmun aste 10 Suuntaamattomassa graafissa solmun aste (degree) d(n i ) kertoo solmuun n i liittyneiden kaarien lukumäärän Kun graafissa G on g solmua, kullakin solmulla on aste, joka voi olla Minimissään 0, jolloin solmuun n i ei ole liittynyt yhtään kaarta Maksimissaan g-1, jolloin kaikki muut graafin solmut ovat liittyneet suoraan erillisillä kaarilla solmuun n i Graafin G, jossa on g solmua ja L kaarta, solmujen asteiden keskiaste (mean degree) määritellään g i= 1 d( ni ) 2L d = = g g Edelleen astelukujen varianssi (variance of degrees) S ( d( ni ) d g g 2 2 i= 1 ) D =

Graafin tiheys 11 Graafin G (N, L ) tiheys (density) on graafin kaarien osuus graafin kaikista mahdollisista kaarista Yksinkertaisessa (ei silmukoita, eikä rinnakkaisia (parallel) kaaria) graafissa, jossa on g solmua, on kaaria maksimissaan g = 2 g ( g 1) 2 Jos graafissa G (N, L ) on L kaarta, saadaan graafin tiheydelle määritelmä Δ = L 2L = g( g 1) / 2 g( g 1) Tiheys voi olla Minimissään 0, jos graafissa ei ole lainkaan kaaria (L = 0) Maksimissaan 1, jos graafi on täydellinen (complete) eli graafin kaikki mahdolliset kaaret ovat edustettuina (L = g(g-1)/2) Täydellistä graafia, jossa on g solmua, merkitään K g

Graafin tiheys 12 Suuntaamattomassa g solmun graafissa kaikkien solmujen asteiden summa on 2L, mikä antaa keskiasteeksi 2L/g Täten tiheys voidaan kirjoittaa muodossa Δ = 2L g( g 1) = d ( g 1)

Suunnattu graafi eli digraafi 13 Jos verkoston yhteydet tulkitaan suunnatuiksi, on nuoli (an arc) l k kahden solmun n i ja n j järjestetty pari se., l k = <n i,n j > <n j,n i > (Wasserman & Faust, 1994.) Mikäli yhteys tomijaparin välillä vaikuttaa molempiin suuntiin, on digraafissa tällöin rinnakkaiset vastakkaissuuntaiset nuolet solmuparin välillä Digraafilla on käytännössä samat perusominaisuudet kuin graafilla Muistettava on kuitenkin, että digraafissa nuolia voi olla kaksi kertaa enemmän verrattuna vastaavan toimijajoukon graafin kaarien lukumäärään Yhteyden tulkinnassa on ero Yksityiskohtaisemmat määritelmät esim. digraafin tiheydelle on esitetty teoksessa Miilumäki (2010) Thumas Miilumäki Keskeisyys ja arvostus, matriisit ja graafit

Kulku, reitti ja polku 14 Kulku (a walk, walks) on graafin G (N, L ) solmujen ja kaarien äärellinen jakso W = n i0, l j0, n i1, l j1,, l jk, n ik Kulku alkaa aina solmusta ja päättyy solmuun Mikäli kulun alkusolmu n i0 ja loppusolmu n ik ovat yksi ja sama solmu n, on kulku suljettu (closed) Kulku voi sisältää saman kaaren ja solmun useammin kuin kerran jaksossa Kulun pituus (length) on kulun sisältämien kaarien lukumäärä Jos jokin kaari on kulussa useampaan kertaan lasketaan ne erillisinä kaarina kulun pituuteen Kulun vastakulku W -1 on itse kulku käänteisessä järjestyksessä Reitti (a trail, trails) on kulku, jossa kukin kaari esiintyy vain kerran Polku (a path, paths) on kulku, jossa kukin solmu ja kaari esiintyy vain kerran

Geodeesi, etäisyys, halkaisija ja eksentrisyys 15 Geodeesi (a geodesic, geodesics) on lyhin polku graafin kahden solmun välillä Geodeettinen etäisyys (geodesic distance), yksinkertaisemmin etäisyys (distance), kahden solmun välillä määritellään solmujen geodeesin pituutena Etäisyyttä solmujen n i ja n j välillä merkitään d(i,j) Solmujen n i ja n j välinen etäisyys on minkä tahansa geodeesin pituus ko. solmujen välillä Mikäli solmuparin välillä ei ole polkua, on ko. solmujen välinen etäisyys ääretön (tai määrittämätön) Suuntaamattomilla graafeilla d(i,j) = d(j,i) Graafin halkaisija (diameter) on yhtä suuri kuin graafin minkä tahansa solmuparin suurin geodeettinen etäisyys Solmun n i eksentrisyys (eccentricity) eli epäkeskisyys (myös ns. suhdeluku (association number)) on suurin geodeettinen etäisyys solmun n i ja minkä tahansa graafin muun solmun n j kanssa

16 SNA-matriisit Määritelmät Ominaisuudet

Sosiomatriisi 17 Verkoston toimijat ja eri toimijaparien väliset suunnatut / suuntaamattomat yhteydet voidaan esittää yhtenä matriisina Jos verkosto koostuu g toimijasta, joiden välillä joko on yhteys tai yhteys puuttuu, voidaan toimijoiden väliset yhteydet kuvata taulukkona, jossa kullekin toimijalle on merkitty oma vaakarivi ja vastaava pystysarake Taulukkoon merkitään binääriluvuilla 0 ja 1 toimijoiden välisen yhteyden olemassa olo se., alkio saa arvon 0, jos yhteyttä ei ole, ja arvon 1, jos toimijoiden välillä on yhteys Koska silmukoita ei sallita verkostossa, taulukon lävistäjän alkiot jätetään määrittelemättä n 1 n 2 n 3 n 4 n 1-1 0 1 n 2 1-1 0 n 3 0 1-1 n 4 0 1 0 -

Sosiomatriisi 18 Taulukko on g x g vieruspistematriisi (an adjacency matrix) X, joka alkiot x ij määritellään 0, lk = ( ni, n j ) ei ole olemassa xij = 1, lk = ( ni, n j ) on olemassa Tätä vieruspistematriisia nimitetään SNA:ssa sosiomatriisiksi (a sociomatrix, sociomatrices) Edellä esitetystä taulukosta saadaan siis sosiomatriisi X n 1 n 2 n 3 n 4 1 0 1 n 1-1 0 1 n 2 1-1 0 1 1 0 X = n 3 0 1-1 n 4 0 1 0-0 1 1 0 1 0

Sosiomatriisin ominaisuuksia 19 Sosiomatriisi on yleisesti asymmetrinen (asymmetric) suuntaamattomille graafeille, mutta aina symmetrinen (symmetric) suuntaamattomille graafeille Täydellisen K g -graafin sosiomatriisin jokainen diagonaalialkiosta poikkeava alkio on arvoltaan 1 Vastaavasti tyhjää graafia vastaa sosiomatriisi, jossa jokainen (diagonaalialkiosta poikkeava) alkio on arvoltaan 0 Arvotetuille graafeille sosiomatriisin alkiot ovat reaalilukuja, jotka vastaavat toimijoiden välisten yhteyksien arvoja v k

Insidenssimatriisi 20 Insidenssimatriisissa (an incidence matrix) on esitetty tieto siitä, mitkä graafin (verkoston) solmut ovat johtuvia (incident) minkin graafin (verkoston) kaaren suhteen Insidenssimatriisissa kutakin solmua vastaa yksi matriisin rivi ja kutakin kaarta yksi sarake Jos siis verkostossa on g solmua ja L kaarta, on insidenssimatriisi I g x L matriisi Insidenssimatriisin alkiot I ij ovat binäärisiä se., jos solmu n i on liittynyt kaareen l j, on I ij = 1, ja mikäli taas solmu n i ei ole liittynyt kaareen l j, on I ij = 0 Insidenssimatriisin jokaisessa sarakkeessa on täsmälleen kaksi ykköstä niillä riveillä, jotka edustavat kyseisen kaaren päätepisteitä

Insidenssimatriisi 21 l 1 l 2 l 3 l 4 l 5 n 1 1 1 0 0 1 n 2 1 0 1 0 0 n 3 0 1 1 1 0 n 4 0 0 0 1 1 I = 1 1 0 0 1 0 1 0 0 1 1 0 0 0 1 1 1 0 0 1 Insidenssimatriisia I vastaava graafi

Kulku 22 Sosiomatriisin X alkiot x ij kertovat, onko solmujen n i ja n j välillä kulku n i n j Sosiomatriisin X neliön X 2 alkio x ij määritellään x [ 2] ij = k = Tämän summan yksi termi x ik x kj = 1 vain, jos molemmat yhteydet (n i,n k ) ja (n k,n j ) ovat olemassa Summa laskee siis kulkujen, joiden pituus on kaksi, lukumäärän solmusta n i solmuun n j g 1 x ik x kj Sosiomatriisin X neliön X 2 alkiot ilmoittavat verkostossa olevien kulkujen, joiden pituus on kaksi, lukumäärän solmusta n i solmuun n j Edelleen matriisin X p alkiot ilmoittavat solmujen välisien kulkujen, joiden pituus on p, lukumäärän x ij [ 2]

Saavutettavuus 23 Saavutettavuudella (reachability) tarkoitetaan sitä, että onko joidenkin verkoston kahden solmun välillä kulku Saavutettavuusmatriisissa (a reachability matrix) [ R] alkio X on yksi, jos solmujen n i ja n j välillä on kulku, nolla muulloin Verkostossa kulku voi olla pituudeltaan korkeintaan g-1 Sosiomatriisin X potenssit X 2, X 3,, X g-1 ilmoittavat solmujen välisten erimittaisten kulkujen lukumäärät [ Σ] Näiden summamatriisi X [ Σ] g 1 i 2 3 g 1 X = X = X + X + X +... + X i= 1 ilmoittaa kaikkien erimittaisten kulkujen lukumäärät solmuparien välillä [ Σ] Tästä summamatriisista X saadaan saavutettavuusmatriisi [ R] [ Σ] X, kun matriisin X nollasta poikkeavat alkiot merkitään ykkösiksi Saavutettavuusmatriisi on määritettävissä myös Warshallin algoritmilla laskentatehokkaammin suurille verkostoille [ R] x ij

Geodeesi ja etäisyys 24 Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein etäisyysmatriisin (a distance matrix) avulla Etäisyysmatriisin alkiot d(i,j) ilmoittavat solmujen n i ja n j välisen lyhimmän etäisyyden pituuden Lyhimmät etäisyydet löytyvät tarkastelemalla sosiomatriisia X ja sen potenssimatriiseja X 2, X 3,, X g-1 se., d [ ] ( i, j p ) = min > 0 p x ij Verkoston halkaisija on yhtä suuri kuin suurin verkostosta löytyvä geodeettinen etäisyys, eli ts. halkaisijan arvo on yhtä suuri kuin etäisyysmatriisin alkioiden maksimi (max [d(i,j)])

Solmujen asteluvut 25 Suuntaamattomille verkostoille solmujen asteluvut ovat helposti laskettavissa sosiomatriisin X tai insidenssimatriisin I avulla Insidenssimatriisissa rivillä on merkitty 1:llä, jos kaari on liittynyt solmuun ja 0:lla, jos kaari ei ole liittynyt solmuun Nyt siis solmun n i asteluku d(n i ) saadaan insidenssimatriisin rivisummana, eli L d( n i ) = I ij j= 1 Sosiomatriisissa rivillä on merkitty 1:llä, jos saraketta vastaava solmu on liittynyt kaarella riviä vastaavaan solmuun Nyt siis solmun n i asteluku d(n i ) saadaan sosiomatriisin rivisummana tai sarakesummana, koska matriisi on symmetrinen, eli ts. g g d ( ni ) = xij = xij = xi+ = x+ j j= 1 i= 1

Solmujen vienti- ja tuontiluvut 26 Suunnatuille verkostoille solmujen vienti- ja tuontiluvut (outdegree, indegree) ovat helposti laskettavissa sosiomatriisin X avulla Sosiomatriisissa rivillä on merkitty 1:llä, jos riviä vastaavasta solmusta lähtee nuoli saraketta vastaavaan solmuun Nyt siis solmun n i vientiluku d O (n i ) saadaan sosiomatriisin rivisummana, eli d O i g ( n ) = x = xi j= 1 ij Sosiomatriisissa sarakkeessa on merkitty 1:llä, jos saraketta vastaavaan solmuun tulee nuoli riviä vastaavasta solmusta + Nyt siis solmun n i tuontiluku d I (n i ) saadaan sosiomatriisin sarakesummana, eli g d I ( ni ) = x ji = x+ i j= 1

Tiheys 27 Verkoston tiheys määriteltiin verkostossa olemassa olevien solmujen välisten yhteyksien summan ja verkoston kaikkien mahdollisten solmujen välisten yhteyksien summan välisenä suhteena Verkostossa, jossa on g toimijaa, voi olla enintään g(g-1) toimijaparien välistä suoraa yhteyttä Verkoston sosiomatriisissa on merkitty 1:llä, mikäli toimijaparin välillä vallitsee yhteys ja 0:lla, jos toimiparin väliltä puuttuu yhteys Nyt siis olemassa olevien yhteyksien summa saadaan yksinkertaisesti sosiomatriisin kaikkien alkioiden summana, eli tiheys määritellään g g Σi= 1Σ j= 1x Δ = ij g( g 1) Tämä tiheyden määritelmä pätee myös arvotetuille verkostoille

28 SNA-tunnusluvut Keskeisyys Arvostus

Yleisesti keskeisyydestä ja arvostuksesta 29 Suuntaamattomille verkostoille ja sen toimijoille voidaan määrittää erilaisia keskeisyyden (centrality) tunnuslukuja Keskeisyys ei riipu verkoston yhteyksien suunnasta, vaan ainoastaan tarkasteltavasta toimijasta ja siihen liittyneistä yhteyksistä ja/tai koko verkostosta yleensä Suunnatuissa verkostoissa keskeisyyden tilalla käytetään käsitettä arvostus (prestige), joka huomioi yhteyksien suunnan Erotetaan toisistaan käsitteet olla arvostettu ja arvostaa Arvostuksen tunnusluvuissa tarkastellaan nimenomaan yhteyksien vastaanottamista eli arvostuksen kohteena olemista

Keskeisyys 30 Keskeisyyden käsite määritellään suuntaamattomille verkostoille Keskeisyyttä voidaan kuvata seuraavilla tunnusluvuilla Keskeisyysaste (degree centrality) Läheisyys (closeness centrality) Välillisyys (betweenness centrality) Informaatiokeskeisyys (information centrality) Suuntaamattomissa verkostoissa keskeinen toimija on osallisena monissa yhteyksissä Keskeisyyden kannalta ei ole väliä, onko toimija lähettänyt vai vastaanottanut yhteyden Keskeisyys on verkoston toimijaa n i kuvaava tunnusluku, kun taas koko verkostolle yhteisesti voidaan määrittää keskittyneisyys (centralization), joka on verkostosta toiseen vertailtava tunnusluku Keskittyneisyyden avulla voidaan kuvata, missä määrin yksittäiset toimijat hallitsevat muiden välistä kanssakäymistä yleisesti koko verkoston tasolla

Keskeisyysaste 31 Toimijan n i keskeisyysaste C D (n i ) kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin (= asteluku d(n i )) Toimijan aste ei itsessään ole kuitenkaan yleisesti vertailtava tunnusluku Kun asteluku skaalataan verkoston tasolla, voidaan toimijoiden keskeisyysasteita vertailla eri verkostojen välillä Normeerattu keskeisyysaste C D(n i ) määritellään d(n C D(n i ) = i ), missä g on verkoston toimijoiden lukumäärä g 1 Keskeisyysaste määritellään myös suunnatuille verkostoille, jolloin käsitellään erikseen vientikeskeisyyttä (outdegree centrality) ja tuontikeskeisyyttä (indegree centrality)

Läheisyys ja välillisyys 32 Läheisyys on toimijan n i lyhyimpien polkujen (geodeesien) summa c i kaikkiin verkoston muihin toimijoihin n j Itsessään summa ei ole vertailtava tunnusluku eri verkostojen välillä Verkostojen kesken vertailukelpoinen normeerattu läheisyys määritellään g 1 C C(n i ) =, missä g on verkoston toimijoiden lukumäärä c i Toimijan välillisyys puolestaan mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu Toimijan välillisyys on merkityksellinen tunnusluku mm. tutkittaessa verkoston toiminnan tehokkuutta

Arvostus 33 Kuten keskeisyyttä, niin myös arvostusta voidaan tarkastella eri tavoin Verkoston toimijoille voidaan määrittää seuraavat arvostukset Arvostusaste (actor degree prestige) Arvostusläheisyys (actor proximity prestige) Arvoasema (actor status prestige, actor rank prestige) Koko verkoston tasolla voidaan määrittää verkostoa kuvaavia arvostuksen tunnuslukuja arvioimalla kunkin arvostuksen keskiarvoja ja variansseja Näistä keskiarvostusläheisyys ja arvostusläheisyyden varianssi ovat mielekkäimpiä tarkasteltavia verkostoanalyysin kannalta

Arvostusaste 34 Toimijan n i arvostusaste P D (n i ) määritellään yksinkertaisesti toimijaan kohdistuneiden yhteyksien summana Vertaa suuntaamattoman verkoston toimijan n i keskeisyysaste, joka määritellään toimijaa kuvaavan solmun astelukuna d(n i ) Arvostusaste määritellään formaalisti P D (n i ) = d I (n i ) = Σ j x ij = x +i, missä d I (n i ) on solmun n i tuontiluku ja x +i on verkoston sosiomatriisin X sarakesumma sarakkeesta i Jotta arvostusasteet eri verkostojen välillä olisivat verrattavissa keskenään, määritellään normeerattu arvostusaste P D(n i ) x +i P D(n i ) =, missä g on verkoston toimijoiden lukumäärä g 1

Arvostusläheisyys 35 Toimijalle n i voidaan määrittää luku I i, joka ilmoittaa, kuinka moni toimija n j voi saavuttaa toimijan n i Tämän toimijan n i vaikutusjoukon toimijoiden lukumäärän I i avulla voidaan määrittää vaikutusjoukon toimijoiden keskimääräinen etäisyys toimijasta n i Toimijan n i arvostusläheisyys P P (n i ) määritellään vaikutusjoukon osuuden koko verkoston toimijajoukosta suhteena vaikutusjoukon toimijoiden keskimääräiseen etäisyyteen toimijasta n i Arvostusläheisyys saa muiden normeerattujen tunnuslukujen tavoin arvoja välillä [0,1] Jos toimijalla n i on suora yhteys jokaiseen verkoston muuhun toimijaan, saa arvostusläheisyys arvon yksi Jos toimija n i on isolaatti (an isolate, isolates), vaikutusjoukon toimijoiden lukumäärä I i nolla, ja arvostusläheisyys määritellään nollaksi

Arvoasema 36 Edellä esitellyt arvostuksen tunnusluvut huomioivat vain toimijoita ja niihin kohdistuvia yhteyksiä Toimijan n i arvoasema P R (n i ) on riippuvainen häneen päin yhteydessä olevien toimijoiden n j arvoasemista P R (n j ) Edelleen taas toimijoiden n j arvoasemat ovat riippuvaisia näihin päin yhteydessä olevien toimijoiden n k arvoasemista jne. Arvoaseman määrittelyn taustalla on ajatus siitä, että toimijan n i arvoasema on häneen päin suoraan yhteydessä olevien toimijoiden arvoasemien funktio Verkostossa, jossa on g toimijaa, toimijan n i arvoasema voidaan esittää sosiomatriisin X toimijaa kuvaavan sarakkeen alkioiden ja niitä vastaavien toimijoiden arvoasemien lineaarikombinaationa, ts. P R (n i ) = x 1i P R (n 1 ) + x 2i P R (n 2 ) + + x gi P R (n g ) Arvoaseman määrittäminen vaatii syvällisempää ymmärrystä mm. matriisin ominaisarvoprobleeman ratkaisusta Myöhemmissä esityksissä perehdytään algoritmeihin, joilla verkoston toimijoiden arvoasemat voidaan määrittää erilaisissa verkostoissa

Esimerkki Valtioiden kauppaverkosto 37 Seuraavassa on esitetty 24 valtion kauppaverkosto (Wasserman & Faust 1994) http://matriisi.ee.tut.fi/~miilumak/sna/

Esimerkki Valtioiden kauppaverkosto 38 Verkostosta määritetyt arvostuksen tunnusluvut (g = 24) i VALTIO d I (n i ) d O (n i ) P ' (n i ) P ' (n i ) P ' (n i ) D P R 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Algeria Argentina Brazil China Czechoslovakia Ecuador Egypt Ethiopia Finland Honduras Indonesia Israel Japan Liberia Madagascar New Zealand Pakistan Spain Switzerland Syria Thailand United Kingdom United States Yugoslavia 13 10 11 15 13 9 12 10 15 9 14 10 17 9 6 14 14 17 15 12 15 16 19 15 4 13 21 21 21 2 9 2 21 1 14 11 23 0 1 11 13 22 23 0 14 22 23 18 0,565 0,435 0,478 0,652 0,565 0,391 0,522 0,435 0,652 0,391 0,609 0,435 0,739 0,391 0,261 0,609 0,609 0,739 0,652 0,522 0,652 0,696 0,826 0,652 0,661 0,599 0,619 0,710 0,661 0,581 0,639 0,599 0,710 0,581 0,685 0,599 0,767 0,601 0,533 0,685 0,685 0,767 0,710 0,658 0,710 0,738 0,834 0,710 0,222 0,805 1,000 0,711 0,818 0,183 0,482 0,131 0,758 0,072 0,617 0,682 0,680 0,000 0,106 0,461 0,525 0,673 0,765 0,000 0,589 0,633 0,644 0,680 MEAN VARIANCE 12,917 9,993 13,292 67,955 0,562 0,018 0,668 0,005 0,510 0,085

Huomioitavaa 39 On selvää, että keskeisyyden ja arvostuksen tunnusluvut tuovat verkostosta esiin seikkoja, joita ei tulisi huomanneeksi pelkästään verkoston graafia, matriisia tai muunlaista mallia tarkastelemalla Keskeisyyden ja arvostuksen tunnusluvut tarjoavat monipuolista tietoa verkoston toiminnasta ja antavat viitteitä siitä, kuinka verkostoa tulisi kehittää, oli sitten kyse tehokkuuden lisäämisestä tai esim. rakenteen parantamisesta Tunnuslukuja ei saa kuitenkaan pitää ainoina mittareina verkoston toiminnasta Graafit visualisointeina tarjoavat paljon hyödyllistä tietoa verkoston rakenteesta ja toiminnasta (aikasarjat, DNA Dynamic Network Analysis) Toimijoiden keskeisyydet ja arvostukset ovat vain osa suurempaa kuvaa Muutosten jälkeen tulee tarkastella verkostoa uudelleen, tulkita tunnusluvut uudelleen ja tarkastella oliko muutos hyvä vai huono

Lähteet 40 Johansson, J-E., Mattila, M. & Uusikylä, P. (1995). Johdatus verkostoanalyysiin. Helsinki: Kuluttajatutkimuskeskus. http://www.valt.helsinki.fi/vol/kirja/ (Viitattu 10.3.2011) Knoke, D. & Yang, S. 2008. Social Network Analysis. Second Edition. Los Angeles: Sage Publications. Miilumäki, T. (2008). Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/miilumaki_- _Graafit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011) Miilumäki, T. (2009a). Matrices in Social Network Analysis And Modeling. Matriisit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/miilumaki_- _Matriisit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011) Miilumäki, T. (2009b). Social Network Analysis Centrality And Prestige. Sosiaalisten verkostojen analyysi Keskeisyys ja arvostus. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/miilumaki_keskeisyys-jaarvostus.pdf (Viitattu 10.3.2011) Miilumäki, T. (2010). Web-pohjaisten sosiaalisten verkostojen analyysimenetelmät. Diplomityö. Tampere: Tampereen teknillinen yliopisto. http://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/6635/miilumaki.pdf. Moreno, J.L. (1953). Who Shall Survive? Beacon, New York: Beacon House Inc. Ruohonen, K. (2006). Graafiteoria. Tampere: Tampereen teknillisen yliopiston opetusmoniste no. 5, uusi sarja. Scott, J. (2000). Social Network Analysis. A Handbook. Second Edition. London: Sage Publications. Wasserman, S. & Faust, K. (1994). Social Network Analysis: Methods and Applications. New York: Cambridge University Press.

Verkostoanalyysi 2011, TTY 41 Kiitos mielenkiinnostanne. Kysymyksiä? thumas.miilumaki@tut.fi