Hypermedian jatko-opintoseminaari 2008 2009 1 Social Network Analysis Centrality And Prestige Sosiaalisten verkostojen analyysi Keskeisyys ja arvostus 6.2.2009 Thumas Miilumäki thumas.miilumaki@tut.fi
Sisältö 2 Suunnattujen verkostojen toimijoiden arvostuksen tunnusluvut Erilaisten arvostusta kuvaavien tunnuslukujen vertailua esimerkin kautta Taustalla pääosin Wassermanin ja Faustin (1994) kirjassaan esittämät keskeisyyden ja arvostuksen teoriat Laajennuksia Knoken ja Yangin (2008) teoksesta Kuvat tehty Pajek ohjelmistolla ellei muuta ole mainittu
Tavoitteet 3 Syvennetään keskeisyyden käsitettä kattamaan suuntaamattomien verkostojen lisäksi myös suunnatut verkostot Pyritään ymmärtämään verkoston rakennetta ja sen toimijoita paremmin tunnuslukujen avulla Tiedetään, kuinka tunnusluvut voidaan määrittää verkostodatasta luodusta sosiomatriisista matriisilaskennan avulla
Taustaa 4 Suuntaamattomille verkostoille ja sen toimijoille voidaan määrittää erilaisia keskeisyyksiä (centrality) Keskeisyysaste (degree centrality) Läheisyys (closeness centrality) Välillisyys (betweenness centrality) Informaatiokeskeisyys (information centrality) Keskeisyys ei riipu verkoston yhteyksien suunnasta, vaan ainoastaan tarkasteltavasta toimijasta ja siihen liittyneistä yhteyksistä ja/tai koko verkostosta yleensä Suunnatuissa verkostoissa keskeisyyden tilalla käytetään käsitettä arvostus (prestige), joka huomioi yhteyksien suunnan Erotetaan toisistaan käsitteet olla arvostettu ja arvostaa Arvostuksen tunnusluvuissa tarkastellaan nimenomaan yhteyksien vastaanottamista eli arvostuksen kohteena olemista
Arvostus 5 Kuten keskeisyyttä, niin myös arvostusta voidaan tarkastella eri tavoin Verkoston toimijoille voidaan määrittää seuraavat arvostukset Arvostusaste (actor degree prestige) Arvostusläheisyys (actor proximity prestige) Arvoasema (actor status prestige, actor rank prestige) Koko verkoston tasolla voidaan määrittää verkostoa kuvaavia arvostuksen tunnuslukuja arvioimalla kunkin arvostuksen keskiarvoja ja variansseja Näistä keskiarvostusläheisyys ja arvostusläheisyyden varianssi ovat mielekkäimpiä tarkasteltavia verkostoanalyysin kannalta
Arvostusaste 6 Toimijan n i arvostusaste P D (n i ) määritellään yksinkertaisesti toimijaan kohdistuneiden yhteyksien summana Vertaa suuntaamattoman verkoston toimijan n i keskeisyysaste, joka määritellään toimijaa kuvaavan solmun astelukuna d(n i ) Arvostusaste määritellään formaalisti P D (n i ) = d I (n i ) = Σ j x ij = x +i, missä d I (n i ) on solmun n i tuontiluku ja x +i on verkoston sosiomatriisin X sarakesumma sarakkeesta i Jotta arvostusasteet eri verkostojen välillä olisivat verrattavissa keskenään, määritellään normeerattu arvostusaste P D (n i ) x +i P D (n i ) =, missä g on verkoston toimijoiden lukumäärä g 1 Normeerattu arvostusaste saa arvoja väliltä [0,1] Sitä arvostetumpi toimija on, mitä suurempi on sen arvostusaste
Vaikutusjoukko 7 Toimijan n i vaikutusjoukko (influence domain) koostuu niistä toimijoista n j, joista toimija n i on saavutettavissa Saavutettavuudella (reachability) tarkoitetaan sitä, että onko joidenkin verkoston kahden solmun välillä kulku Saavutettavuusmatriisissa (a reachability matrix) X [R] [R] alkio x on ij yksi, jos solmujen n i ja n j välillä on kulku, nolla muulloin Sosiomatriisin X potenssit X 2, X 3,, X g-1 ilmoittavat solmujen välisten erimittaisten kulkujen lukumäärät Näiden summamatriisi X [Σ] ilmoittaa kaikkien erimittaisten kulkujen lukumäärät solmuparien välillä Tästä summamatriisista X [Σ] saadaan saavutettavuusmatriisi X [R], kun matriisin X [Σ] nollasta poikkeavat alkiot merkitään ykkösiksi (Miilumäki 2009, 13.) Toimijalle n i voidaan määrittää luku I i, joka ilmoittaa, kuinka moni toimija n j voi saavuttaa toimijan n i Luku I i saadaan toimijalle n i yksinkertaisesti saavutettavuusmatriisin X [R] sarakesummana sarakkeesta i
Arvostusläheisyys 8 Toimijan n i vaikutusjoukon toimijoiden lukumäärän I i avulla voidaan määrittää vaikutusjoukon toimijoiden keskimääräinen etäisyys toimijasta n i d(n j,n i ) ave = Σ j d(n j,n i ) / I i Toimijan n i arvostusläheisyys P P (n i ) määritellään vaikutusjoukon osuuden koko verkoston toimijajoukosta suhteena vaikutusjoukon toimijoiden keskimääräiseen etäisyyteen toimijasta n i, eli ts. I i / (g 1) P P (n i ) = Σ j d(n j,n i ) / I i Arvostusläheisyys saa arvoja välillä [0,1] Jos toimijalla n i on suora yhteys jokaiseen verkoston muuhun toimijaan, saa arvostusläheisyys arvon yksi Jos toimijaan n i ei kohdistu yhtään suoraa yhteyttä, vaikutusjoukon toimijoiden lukumäärä on I i nolla ja arvostusläheisyys määritellään nollaksi
Verkoston arvostusläheisyys 9 Yleisesti erilaisia arvostusindeksejä on vaikea yleistää kuvaamaan koko verkostoa, eli sitä millä tasolla toimijoiden välinen arvostus verkoston sisällä on Arvostusläheisyydestä voidaan kuitenkin yksinkertaisesti määrittää verkostotason tunnuslukuja arvostukseen liittyen Keskiarvostusläheisyys kuvaa yleisesti sitä, kuinka läheisesti toimijat arvostavat toinen toistaan verkoston sisällä Verkostossa, jossa on g toimijaa, keskiarvostusläheisyys P P määritellään P P = Edelleen verkoston arvostusläheisyyksien varianssi on koko verkostoa kuvaava tunnusluku 2 S = P g P P (n i ) Σ i=1 g g (P P (n i ) P P ) Σ 2 i=1 g
Arvoasema 10 Edellä esitellyt arvostuksen tunnusluvut huomioivat vain toimijoita ja niihin kohdistuvia yhteyksiä Toimijan n i arvoasema on riippuvainen häneen päin yhteydessä olevien toimijoiden n j arvoasemista Edelleen taas toimijoiden n j arvoasemat ovat riippuvaisia näihin päin yhteydessä olevien toimijoiden n k arvoasemista jne. Arvoaseman määrittelyn taustalla on ajatus siitä, että toimijan n i arvoasema on häneen päin suoraan yhteydessä olevien toimijoiden arvoasemien funktio Sosiomatriisin X sarakkeessa on merkitty luvulla yksi, jos riviä kuvaava toimija on yhteydessä saraketta kuvaavaan toimijaan, ja nollalla, jos yhteyttä ei ole Täten verkostossa, jossa on g toimijaa, toimijan n i arvoasema voidaan esittää sosiomatriisin X toimijaa kuvaavan sarakkeen alkioiden ja niitä vastaavien toimijoiden arvoasemien lineaarikombinaationa, ts. P R (n i ) = x 1i P R (n 1 ) + x 2i P R (n 2 ) + + x gi P R (n g )
Arvoasema 11 Matemaattisesti koko verkoston toimijoiden arvoasemat voidaan esittää matriisiyhtälönä p = X p, missä p = (P R (n 1 ), P R (n 2 ),, P R (n g )) (pystyvektori) ja X on sosiomatriisi (ja X sen transpoosi) Tästä matriisiyhtälöstä tulee siis ratkaista arvoasemavektori p Matriisiyhtälö voidaan esittää muodossa (I X ) p = 0, missä I on identiteettimatriisi ja 0 g -pituinen vakio pystyvektori, jonka alkiot ovat nollia Tämä yhtälö on identtinen nk. karakteristisen yhtälön kanssa Karakteristista yhtälöä käytetään matriisien ominaisarvojen etsimiseen Yhtälön ratkaisu vaatii syvempää tietämystä ominaisarvoongelman ratkaisemisesta matriisilaskennan avulla Ratkaisumalleja on useita, eikä niitä tässä esitellä tarkemmin
Esimerkki Valtioiden kauppaverkosto 12 Seuraavassa on esitetty 24 valtion kauppaverkosto http://matriisi.ee.tut.fi/~miilumak/sna/
Esimerkki Valtioiden kauppaverkosto 13 Verkostosta määritetyt arvostuksen tunnusluvut (g = 24) i COUNTRY d I (n i ) d O (n i ) P ' (n i ) P ' (n i ) P ' (n i ) D P R 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Algeria Argentina Brazil China Czechoslovakia Ecuador Egypt Ethiopia Finland Honduras Indonesia Israel Japan Liberia Madagascar New Zealand Pakistan Spain Switzerland Syria Thailand United Kingdom United States Yugoslavia 13 10 11 15 13 9 12 10 15 9 14 10 17 9 6 14 14 17 15 12 15 16 19 15 4 13 21 21 21 2 9 2 21 1 14 11 23 0 1 11 13 22 23 0 14 22 23 18 0,565 0,435 0,478 0,652 0,565 0,391 0,522 0,435 0,652 0,391 0,609 0,435 0,739 0,391 0,261 0,609 0,609 0,739 0,652 0,522 0,652 0,696 0,826 0,652 0,661 0,599 0,619 0,710 0,661 0,581 0,639 0,599 0,710 0,581 0,685 0,599 0,767 0,601 0,533 0,685 0,685 0,767 0,710 0,658 0,710 0,738 0,834 0,710 0,222 0,805 1,000 0,711 0,818 0,183 0,482 0,131 0,758 0,072 0,617 0,682 0,680 0,000 0,106 0,461 0,525 0,673 0,765 0,000 0,589 0,633 0,644 0,680 MEAN VARIANCE 12,917 9,993 13,292 67,955 0,562 0,018 0,668 0,005 0,510 0,085
Lopuksi 14 On siis selvää, että arvostuksen tunnusluvut tuovat verkostosta esiin seikkoja, joita ei tulisi huomanneeksi pelkästään verkoston graafia tai muunlaista mallia tarkastelemalla Keskeisyyden ja arvostuksen tunnusluvut tarjoavat monipuolista tietoa verkoston toiminnasta ja antavat viitteitä siitä, kuinka verkostoa tulisi kehittää, oli sitten kyse tehokkuuden lisäämisestä tai esim. rakenteen parantamisesta Tunnuslukuja ei saa kuitenkaan pitää ainoina mittareina verkoston toiminnasta Toimijoiden keskeisyydet ja arvostukset ovat vain osa suurempaa kuvaa Muutosten jälkeen tulee tarkastella verkostoa uudelleen, tulkita tunnusluvut uudelleen ja tarkastella oliko muutos hyvä vai huono
Lähteet 15 Knoke, D. & Yang, S. 2008. Social Network Analysis. Second Edition. Los Angeles: Sage Publications. Miilumäki, T. 2009. Matrices in Social Network Analysis And Modeling. Matriisit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. Wasserman, S. & Faust, K. 1994. Social Network Analysis: Methods and Applications. New York: Cambridge University Press, 198 219.