Centrality and Prestige Keskeisyys ja arvostus

1 Hypermedian jatko-opintoseminaari 2008-2009 Centrality and Prestige Keskeisyys ja arvostus 21.1.2009 Jari Jussila jari.j.jussila@tut.fi

2 Tärkeys Yksi graafiteorian pääkäyttökohteista sosiaalisten verkostojen analyysissa on sosiaalisen verkoston tärkeimpien toimijoiden tunnistaminen. Tärkeyden (importance, prominence) määritelmiä on useita, mutta yhteistä niille on, että ne yrittävät kuvata ja mitata toimijan sijainnin ominaisuuksia sosiaalisessa verkostossa. Varhaisempia esimerkkejä Morenon (1934) tähdet ja eristäytyneet. Käydään läpi käsitteet: keskeisyysaste (degree) closeness (läheisyys) välisyys (betweenes) informaation keskeisyys (information)

3 Toimijan keskeisyys Tärkeät toimijat ovat laajasti osallisia yhteyksiin toisten toimijoiden kanssa. Osallisuus tekee toimijoista enemmän näkyviä muille toimijoille. Toimijan keskeisyydessä ei ole väliä, onko toimija lähettänyt vai vastaanottanut yhteyden. Soveltuu hyvin suuntaamattomille verkostoille, joissa ei tehdä eroa lähettämisen ja vastaanottamisen välille. Suuntaamattomissa verkostoissa keskeinen toimija on siis sellainen, joka on osallisena monissa yhteyksissä. Toimijan keskeisyys soveltuu esimerkiksi resurssien hallinnan ja pääsyn sekä informaation välittämisen mittaamiseen (Knoke & Burt, 1983). Freeman (1977, 1979) on esittänyt seuraavaan notaation toimijan keskeisyyden mitaksi: C on keskeisyyden mitta n i :n funktiona, jonka alaindeksi C A ilmaisee mittauksen tyypin. Indeksi i saa arvot 1 g.

4 Toimijan arvostus Suunnatuissa verkostoissa erotetaan toisistaan yhteyksien lähettäminen ja vastaanottaminen. Arvostettuja toimija on sellainen, joka on useampien yhteyksien vastaanottaja. Toisin sanottuna arvostettu toimija on sellainen, jolla on suuri tuontiluku (indegree). Huomaa, että jos tarkastellaan negatiivisia suhteita, kuten vihaa tai ei halua olla ystävä, niin tällöin arvostetut toimijat eivät ole vertaistensa kovasti arvostamia. Toimijan arvostusta on myös kutsuttu statukseksi (Moreno, 1934; Zeleny, 1940, 1941, 1960; Proctor & Loomis, 1951; Katz, 1953; Harary, 1959). Wasserman & Faust (1994) sen sijaan puhuvat mielummin sijasta (rank). Olkoon, P, arvostuksen mittaus, joka määritellään toimijalle n i.

Kertaus: Vienti- ja tuontiluvut (Miilumäki 2009) 5 Suunnatuille verkoistoille solmujen vienti- (outdegree) ja tuontiluvut (indegree) ovat helposti laskettavissa sosiomatriisin X avulla. d O = solmun vientiluku d I = solmun tuontiluku Arvostetut toimijat ovat yleensä niitä, joilla on suuret tuontiluvut, tai joihin kohdistuu suuri määrä vastaanotettuja valintoja.

6 Tärkeyden mitta Hubbelin (1965) ja Friedkinin (1991) mukaan tärkeyden mittauksessa pitää ottaa huomioon suorien (direct) ja viereisten (adjacent) yhteyksien lisäksi epäsuorat polut. Esim. LinkedIn:

7 Keskeisyys ja keskittyneisyys Keskeisyys (centrality) on toimijan ominaisuus Keskittyneisyys (centralisation) on koko verkoston ominaisuus Keskittyneisyys mittaa koko verkoston tasolla, missä määrin yksittäiset toimijat hallitsevat muiden välistä kanssakäymistä. Tähti on kaikkein keskittynein verkosto ja pyörä kaikkein vähiten keskittynyt. Siivonen 2003

Kolme havainnollista verkostoa keskeisyyden (keskittyneisyyden) ja arvostuksen tutkimiseen 8 Tähti Maksimaalisen keskittynyt, kaikki solmut jäsentyvät yhden keskeisen solmun ympärille 0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 Pyörä Keskittyneisyys äärimmäisen vähäinen, solmut kytkeytyvät toisiinsa ilman, että yksikään solmu olisi keskeisempi kuin toinen 0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 1 0 Ketju Löyhempi kuin tähti, mutta keskittyneempi kuin pyörä 0 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0

9 Näkyvyys ja tärkeys -käsitteet Knoke and Burt 1983 Visibility (superordinate concept) = Wasserman & Faust 1994 Prominence (superordinate concept) CAN BE STUDIED BY CAN BE STUDIED BY Centrality (level two concept) Prestige (level two concept) Centrality (level two concept) Prestige (level two concept) Käsitekartta: Novak 1998

10 Prominence: Centrality and Prestige Prominence Centrality Prestige Degree Centrality Closeness Centrality Betweeness Centrality Information Centrality Degree Prestige Proximity Prestige Status or Rank Prestige Wasserman & Faust 1994

11 Tärkeys: keskeisyys ja arvostus Tärkeys Keskeisyys Arvostus Keskeisyysaste Läheisyys Välillisyys Informaation Degree keskeisyys Prestige Proximity Prestige Status or Rank Prestige Wasserman & Faust 1994

12 Keskeisyysaste Keskeisyysaste (degree) Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin Jos verkostoaineisto on suunnattu, voidaan laskea erikseen lähettäjäkeskeisyys (outdegree) ja vastaanottajakeskeisyys (indegree) Keskeisyysastetta läheinen indeksi on ego tiheys (ego density) (Burt 1982, Knoke & Kuklinski 1982). Ego tiheys on suhdeluku toimijan suorista yhteyksistä kaikkiin mahdollisiin yhteyksiin suuntaamattomissa verkostoissa.

13 Keskeisyysasteen mitta Standardi mittana Wasserman & Faust (1994) esittävät seuraavan kaavan: ' d( ni ) CD ( ni ) = g 1 Joka kuvaa osuutta solmuja jotka ovat viereisiä n i. C D (n i ) on itsenäinen g:stä, jolloin sitä voidaan verrata eri kokoisiin verkostoihin. Esimerkiksi asteluku seitsemälle toimijalle tähtigraafissa ovat 6 (n i :lle) ja 1 (n 2 -n 7 ). Jolloin jakaja standardoidulle toimija indeksille C D (n i ) on g-1=6. Standardoitu indeksi saa arvot {1.0, 0.167, 0.167, 0.167, 0.167, 0.167, 0.167). Pyörägraafille asteluku on kaikille d(n i )=2, joten kaikki indeksit ovat yhtäsuuria: C D (n i ) = 0.333. Vastaavasti ketjugraafissa n 1 -n 5 on kaikilla : C D (n i ) = 0.333, mutta kaksi viimeistä toimijaa C D (n 6 ) = C D (n 7 ) = 0.167 ovat vähemmän keskeisiä.

14 Keskeisyys indeksit Florentine perheille With g = 16 actors With g = 15 actors C D (n i ) C B (n i )* C D (n i )* C C (n i )* C B (n i )* C I (n i )* Acciaiuoli 0.067 0.000 0.071 0.368 0.000 0.049 Albizzi 0.200 0.184 0.214 0.483 0.212 0.074 Barbadori 0.133 0.081 0.143 0.438 0.093 0.068 Bischeri 0.200 0.090 0.214 0.400 0.104 0.074 Castellani 0.200 0.048 0.214 0.389 0.055 0.070 Ginori 0.067 0.000 0.071 0.333 0.000 0.043 Guadagni 0.267 0.221 0.286 0.467 0.255 0.081 Lamberteschi 0.067 0.000 0.071 0.326 0.000 0.043 Medici 0.400 0.452 0.429 0.560 0.522 0.095 Pazzi 0.067 0.000 0.071 0.286 0.000 0.033 Peruzzi 0.200 0.019 0.214 0.368 0.022 0.069 Pucci- 0.000 0.000 - - - - Ridolfi 0.200 0.098 0.214 0.500 0.114 0.080 Salvati 0.133 0.124 0.143 0.389 0.143 0.050 Strozzi 0.267 0.089 0.286 0.438 0.103 0.070 Tornabuoni 0.200 0.079 0.214 0.483 0.092 0.080 Centralization 0.267 0.383 0.257 0.322 0.437 -

15 Läheisyys Ideana on, että toimija on keskeinen jos se kykenee nopeasti vuorovaikutukseen muiden kanssa Läheisyys (closeness) on toimijan lyhyimpien polkujen summa kaikkiin verkoston muihin toimijoihin d ij on lyhyimmän polun pituus i:n ja j:n välillä n c i = d ij j= i Huomaa tulkinnassa, että pieni arvo tarkoittaa keskeistä pistettä

16 Läheisyyden mitta Sabidussin (1966) esittämä läheisyys: C C ( n i ) = [ g j= 1 d( n 1 i, n j )] ja Beauchamp (1965) esittämä standardi läheisyys: C ' C ( n i ) = ( g 1) C C ( n i ) Tämä standardoitu indeksi saa arvot välillä 0 ja 1, ja se voidaan ajatella käänteisenä etäisyynä toimija i:stä muihin toimijoihin.

Kertaus: Geodeesit ja etäisyys (Miilumäki 2009) 17 Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein etäisyysmatriisin (distance matrix) avulla Etäisyysmatriisin alkiot d(i, j) ilmoittavat solmujen n i ja n j välisemmän lyhimmän etäisyyden pituuden

18 Välillisyys Välillisyys (betweenness) mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu Jos piste sijaitsee useiden muiden pisteiden välillä, se pystyy säätelemään esim. tiedon kulkua näiden välillä (portinvartijat) Piste voi olla (lokaalisti) hyvin epäkeskeinen, mutta sen välillisyys voi silti olla hyvin suuri

19 Välillisyyden mitta Esimerkiksi solmujen lyhimmät etäisyydet (geodeesi) toimijoiden n 2 ja n 3 välillä on n 2 n 1 n 4 n 3 eli lyhyn polku näiden kahden toimijan välillä kulkee kahden toimijan n 1 ja n 4 kautta- voidaan sanoa, että n 1 ja n 4 on vaikutusta n 2 ja n 3 välisessä vuorovaikutuksessa. Toimija on siis keskeinen jos sen on useiden toimijoiden ja niiden geodeesien välissä, jolloin toimijalla on suuri keskeisyys välillisyys. Välillisyyden mitta voidaan pukea seuraavaan kaavaan: B i C ( n ) = g ( n ) / g j< k jk i jossa g jk on j ja k toimijoiden yhdistävien geodeesien lukumäärä. Koska mikä tahansa geodeesi on yhtä todennäköinen, niin todennäköisyys minkä tahansa geodeesin kautta on 1 / g jk (Freeman) joka on standardoituna: C ' B ( n i ) = C ( n ) /[( g 1)( g B i jk 2) / 2]

Kritiikkiä Freemanin (1979) välillisyydelle 20 Freeman (1979) olettaa, että kaikki geodeesit ovat yhtä todennäköisiä, huomioimatta toimijoita. Jotkut toimijat saattavat kuintenkin olla keskeisempiä keskeisyysasteeltaan, esim. jonkun toimijan keskeisyysaste voi olla 10 kun toisen toimijan 3, tällöin yleensä sellainen toimija valitaan todennäköisemmin joka on keskeisempi. Freeman (1979) olettaa myös, että aina mennään lyhintä reittiä pitkin, eli keskitityyn vain geodeeseihin, vaikka jossain tapauksissa pidemmän reitit tai polut saattavat olla todennäköisempiä.

21 Informaation keskeisyys Stephensonin ja Zelenin (1989) keskeisyyden indeksi vastaa tähän kritiikiin, ja huomioi kaikki polut sekä niiden painoarvot. Geodeeseille yleensä annetaan painoarvoina niiden yhteneväisyydet. Kun taas poluille joiden pituus on pidempi kuin geodeesin pituus annetaan pienemmät painoarvot sen mukaan mitä informaatiota ne sisältävät. Polun informaatio on yksinkertaisesti määritelty sen pituuden inverssinä.

22 Informaation keskeisyyden mitta Informaatio keskeisyyden laskemiseksi tarvitaan kaksi välillistä arvoa. Nämät ovat summa-arvoja: g g ja C : T = i = c R = 1 ii j = T on yksinkertaisesti summa kaikista matriisin diagonaalisista arvoista, ja R on joku rivi summista (kaikki rivi summat ovat yhtäsuuria). Näiden kahden arvojen avulla voidaan vihdoin laskea informaation keskeisyys indeksi toimijalle i: C ( n ) = I 1 + ( T 2R) / g Tämä indeksi mittaa kuinka paljon informaatiota sisältyy polkuihin jotka alkavat (ja päättyvät) tiettyyn toimijaan. Indeksin minimiarvo on 0, mutta sillä ei ole maksimiarvoa; jos T = 2R, ja C ii = 0, niin indeksi on ääretön. Stephenson ja Zelen (1989) suosittelevat että käytetään suhteellista informaatio indeksi, joka saadaan jakamalla jokainen indeksi (C I (n i ) kaikilla indekseillä: C ' I i ( ni) = c ii CI ( ni ) C ( n ) i I i 1 c ij

23 Lähteet Johanson, J-E., Mattila, M., Uusikylä, P. 1995. Johdatus verkostoanalyysiin. http://www.valt.helsinki.fi/vol/kirja/. Novak, J.D. 1998. Learning, Creating and Using Knowledge: Concept Maps as Facilitative Tools in Schools and Corporations. New York, Lawrence Erlbaum Associates. Miilumäki, T. 2009. Matriisit verkostojen mallintamisessa. Siivonen, V. 2003. Johdatus verkostoanalyysiin. http://www.valt.helsinki.fi/blogs/ville.siivonen/luento%202.pdf Wasserman, S., Faust, K. 1994. Social Network Analysis, Methods and Applications.