Centrality and Prestige Keskeisyys ja arvostus

Samankaltaiset tiedostot
Social Network Analysis Centrality And Prestige

Verkostoanalyysin peruskäsitteitä ja visualisointia. Graafit ja matriisit, keskeisyys ja arvostus

Suunnatut, etumerkilliset ja arvotetut graafit Sosiaalisten verkostojen analysoinnin näkökulmalla

Jäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä

Koheesiiviset alaryhmät

Johdatus verkkoteoriaan 4. luento

Hypermedian jatko-opintoseminaari. MATHM-6750x. 2-6 op. Sosiaalisten verkostojen tutkimusmenetelmät

Rakenteellinen tasapaino ja transitiivisyys

v 8 v 9 v 5 C v 3 v 4

Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten verkostojen mallintamisessa

Johdatus graafiteoriaan

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

Sosiaalisten verkostojen datan notaatio. Notation for Social Network Data

Hypermedian jatko-opintoseminaari

Jäsenyysverkostot ominaisuudet, toimijoiden ja tapahtumien samanaikainen analyysi. Sisältö ja tavoitteet. Osallistujien ja tapahtumien ominaisuudet

Königsbergin sillat. Königsberg 1700-luvulla. Leonhard Euler ( )

Jarno Marttila Datalähtöinen sosiaalisten verkostojen analyysi: tapaus Suomen Lasten Parlamentti. Diplomityö

Algoritmit 1. Luento 9 Ti Timo Männikkö

58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Sosiaalisten verkostojen data

Luku 8. Aluekyselyt. 8.1 Summataulukko

isomeerejä yhteensä yhdeksän kappaletta.

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48

0 v i v j / E, M ij = 1 v i v j E.

811312A Tietorakenteet ja algoritmit V Verkkojen algoritmeja Osa 2 : Kruskalin ja Dijkstran algoritmit

Verkostoanalyysi 2011 Jatko-opintoseminaari Case: Verkostot ja muutos Statsterverkkopalvelussa

A TIETORAKENTEET JA ALGORITMIT

Suomen rautatieverkoston robustisuus

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Kuinka määritellään 2 3?

1 Kertaus. Lineaarinen optimointitehtävä on muotoa:

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

keskenään isomorfiset? (Perustele!) Ratkaisu. Ovat. Tämän näkee indeksoimalla kärjet kuvan osoittamalla tavalla: a 1 b 3 a 5

j n j a b a c a d b c c d m j b a c a d a c b d c c j

Kriteeri 1: Oppija on aktiivinen ja ottaa vastuun oppimistuloksista (aktiivisuus)

VERKOSTOANALYYSI raportti

Matemaatiikan tukikurssi

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Arvostus Verkostoissa: PageRank. Idea.

Lokikirjojen käyttö arviointimenetelmänä

Datatähti 2019 loppu

= 5! 2 2!3! = = 10. Edelleen tästä joukosta voidaan valita kolme särmää yhteensä = 10! 3 3!7! = = 120

Johdatus matematiikkaan

Inversio-ongelmien laskennallinen peruskurssi Luento 2

Matematiikan tukikurssi

Cantorin joukon suoristuvuus tasossa

Induktiotodistus: Tapaus n = 0 selvä; ol. väite pätee kun n < m.

BM20A5800 Funktiot, lineaarialgebra ja vektorit Harjoitus 4, Syksy 2016

Algoritmit 1. Luento 8 Ke Timo Männikkö

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

Tehtävä 1. Arvioi mitkä seuraavista väitteistä pitävät paikkansa. Vihje: voit aloittaa kokeilemalla sopivia lukuarvoja.

Toimivan verkoston rakentaminen ja verkoston toimintamallit. Mikä on verkosto? Mikä on verkosto? Miksi verkostot kiinnostavat?

Kvanttimekaniikan tulkinta

Talousmatematiikan perusteet: Luento 10. Lineaarikuvaus Matriisin aste Determinantti Käänteismatriisi

Verkostoanalyysi yritysten verkostoitumista tukevien EAKRhankkeiden arvioinnin menetelmänä. Tamás Lahdelma ja Seppo Laakso

Injektio. Funktiota sanotaan injektioksi, mikäli lähtöjoukon eri alkiot kuvautuvat maalijoukon eri alkioille. Esim.

Johdatus graafiteoriaan

Graafit ja verkot. Joukko solmuja ja joukko järjestämättömiä solmupareja. eli haaroja. Joukko solmuja ja joukko järjestettyjä solmupareja eli kaaria

Harjoitus 1 ( )

Lukujonon raja-arvo 1/7 Sisältö ESITIEDOT: lukujonot

Lineaarinen optimointitehtävä

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

s = 11 7 t = = 2 7 Sijoittamalla keskimmäiseen yhtälöön saadaan: k ( 2) = 0 2k = 8 k = 4

MS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 1: Moniulotteiset integraalit

Oikeasta tosi-epätosi -väittämästä saa pisteen, ja hyvästä perustelusta toisen.

Äärellisten mallien teoria

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

1 Aritmeettiset ja geometriset jonot

Diskreetin matematiikan perusteet Esimerkkiratkaisut 3 / vko 10

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Johdatus tekoälyn taustalla olevaan matematiikkaan

BM20A0700, Matematiikka KoTiB2

Matriisilaskenta Laskuharjoitus 5 - Ratkaisut / vko 41

1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.

ja λ 2 = 2x 1r 0 x 2 + 2x 1r 0 x 2

Matematiikan tukikurssi

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

Matematiikan tukikurssi

Maksimit ja minimit 1/5 Sisältö ESITIEDOT: reaalifunktiot, derivaatta

Suorista ja tasoista LaMa 1 syksyllä 2009

Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen

Rinnakkaistietokoneet luento S

Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

Matematiikan tukikurssi

4. Luennon sisältö. Lineaarisen optimointitehtävän ratkaiseminen Simplex-menetelmä

Monikulmiot 1/5 Sisältö ESITIEDOT: kolmio

13 Lyhimmät painotetut polut

Kenguru 2013 Student sivu 1 / 7 (lukion 2. ja 3. vuosi)

verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

Polkuintegraali yleistyy helposti paloitain C 1 -poluille. Määritelmä Olkoot γ : [a, b] R m paloittain C 1 -polku välin [a, b] jaon

Yhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

6.4. Järjestyssuhteet

1 Peruslaskuvalmiudet

Sosiaalisten verkostojen tutkimusmenetelmät - historiallisia ja teoreettisia perusteita sekä peruskäsitteitä

1. Esitä rekursiivinen määritelmä lukujonolle

Transkriptio:

1 Hypermedian jatko-opintoseminaari 2008-2009 Centrality and Prestige Keskeisyys ja arvostus 21.1.2009 Jari Jussila jari.j.jussila@tut.fi

2 Tärkeys Yksi graafiteorian pääkäyttökohteista sosiaalisten verkostojen analyysissa on sosiaalisen verkoston tärkeimpien toimijoiden tunnistaminen. Tärkeyden (importance, prominence) määritelmiä on useita, mutta yhteistä niille on, että ne yrittävät kuvata ja mitata toimijan sijainnin ominaisuuksia sosiaalisessa verkostossa. Varhaisempia esimerkkejä Morenon (1934) tähdet ja eristäytyneet. Käydään läpi käsitteet: keskeisyysaste (degree) closeness (läheisyys) välisyys (betweenes) informaation keskeisyys (information)

3 Toimijan keskeisyys Tärkeät toimijat ovat laajasti osallisia yhteyksiin toisten toimijoiden kanssa. Osallisuus tekee toimijoista enemmän näkyviä muille toimijoille. Toimijan keskeisyydessä ei ole väliä, onko toimija lähettänyt vai vastaanottanut yhteyden. Soveltuu hyvin suuntaamattomille verkostoille, joissa ei tehdä eroa lähettämisen ja vastaanottamisen välille. Suuntaamattomissa verkostoissa keskeinen toimija on siis sellainen, joka on osallisena monissa yhteyksissä. Toimijan keskeisyys soveltuu esimerkiksi resurssien hallinnan ja pääsyn sekä informaation välittämisen mittaamiseen (Knoke & Burt, 1983). Freeman (1977, 1979) on esittänyt seuraavaan notaation toimijan keskeisyyden mitaksi: C on keskeisyyden mitta n i :n funktiona, jonka alaindeksi C A ilmaisee mittauksen tyypin. Indeksi i saa arvot 1 g.

4 Toimijan arvostus Suunnatuissa verkostoissa erotetaan toisistaan yhteyksien lähettäminen ja vastaanottaminen. Arvostettuja toimija on sellainen, joka on useampien yhteyksien vastaanottaja. Toisin sanottuna arvostettu toimija on sellainen, jolla on suuri tuontiluku (indegree). Huomaa, että jos tarkastellaan negatiivisia suhteita, kuten vihaa tai ei halua olla ystävä, niin tällöin arvostetut toimijat eivät ole vertaistensa kovasti arvostamia. Toimijan arvostusta on myös kutsuttu statukseksi (Moreno, 1934; Zeleny, 1940, 1941, 1960; Proctor & Loomis, 1951; Katz, 1953; Harary, 1959). Wasserman & Faust (1994) sen sijaan puhuvat mielummin sijasta (rank). Olkoon, P, arvostuksen mittaus, joka määritellään toimijalle n i.

Kertaus: Vienti- ja tuontiluvut (Miilumäki 2009) 5 Suunnatuille verkoistoille solmujen vienti- (outdegree) ja tuontiluvut (indegree) ovat helposti laskettavissa sosiomatriisin X avulla. d O = solmun vientiluku d I = solmun tuontiluku Arvostetut toimijat ovat yleensä niitä, joilla on suuret tuontiluvut, tai joihin kohdistuu suuri määrä vastaanotettuja valintoja.

6 Tärkeyden mitta Hubbelin (1965) ja Friedkinin (1991) mukaan tärkeyden mittauksessa pitää ottaa huomioon suorien (direct) ja viereisten (adjacent) yhteyksien lisäksi epäsuorat polut. Esim. LinkedIn:

7 Keskeisyys ja keskittyneisyys Keskeisyys (centrality) on toimijan ominaisuus Keskittyneisyys (centralisation) on koko verkoston ominaisuus Keskittyneisyys mittaa koko verkoston tasolla, missä määrin yksittäiset toimijat hallitsevat muiden välistä kanssakäymistä. Tähti on kaikkein keskittynein verkosto ja pyörä kaikkein vähiten keskittynyt. Siivonen 2003

Kolme havainnollista verkostoa keskeisyyden (keskittyneisyyden) ja arvostuksen tutkimiseen 8 Tähti Maksimaalisen keskittynyt, kaikki solmut jäsentyvät yhden keskeisen solmun ympärille 0 1 1 1 1 1 1 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 Pyörä Keskittyneisyys äärimmäisen vähäinen, solmut kytkeytyvät toisiinsa ilman, että yksikään solmu olisi keskeisempi kuin toinen 0 1 0 0 0 0 1 1 0 1 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 1 1 0 0 0 0 1 0 Ketju Löyhempi kuin tähti, mutta keskittyneempi kuin pyörä 0 1 1 0 0 0 0 1 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 0

9 Näkyvyys ja tärkeys -käsitteet Knoke and Burt 1983 Visibility (superordinate concept) = Wasserman & Faust 1994 Prominence (superordinate concept) CAN BE STUDIED BY CAN BE STUDIED BY Centrality (level two concept) Prestige (level two concept) Centrality (level two concept) Prestige (level two concept) Käsitekartta: Novak 1998

10 Prominence: Centrality and Prestige Prominence Centrality Prestige Degree Centrality Closeness Centrality Betweeness Centrality Information Centrality Degree Prestige Proximity Prestige Status or Rank Prestige Wasserman & Faust 1994

11 Tärkeys: keskeisyys ja arvostus Tärkeys Keskeisyys Arvostus Keskeisyysaste Läheisyys Välillisyys Informaation Degree keskeisyys Prestige Proximity Prestige Status or Rank Prestige Wasserman & Faust 1994

12 Keskeisyysaste Keskeisyysaste (degree) Kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin Jos verkostoaineisto on suunnattu, voidaan laskea erikseen lähettäjäkeskeisyys (outdegree) ja vastaanottajakeskeisyys (indegree) Keskeisyysastetta läheinen indeksi on ego tiheys (ego density) (Burt 1982, Knoke & Kuklinski 1982). Ego tiheys on suhdeluku toimijan suorista yhteyksistä kaikkiin mahdollisiin yhteyksiin suuntaamattomissa verkostoissa.

13 Keskeisyysasteen mitta Standardi mittana Wasserman & Faust (1994) esittävät seuraavan kaavan: ' d( ni ) CD ( ni ) = g 1 Joka kuvaa osuutta solmuja jotka ovat viereisiä n i. C D (n i ) on itsenäinen g:stä, jolloin sitä voidaan verrata eri kokoisiin verkostoihin. Esimerkiksi asteluku seitsemälle toimijalle tähtigraafissa ovat 6 (n i :lle) ja 1 (n 2 -n 7 ). Jolloin jakaja standardoidulle toimija indeksille C D (n i ) on g-1=6. Standardoitu indeksi saa arvot {1.0, 0.167, 0.167, 0.167, 0.167, 0.167, 0.167). Pyörägraafille asteluku on kaikille d(n i )=2, joten kaikki indeksit ovat yhtäsuuria: C D (n i ) = 0.333. Vastaavasti ketjugraafissa n 1 -n 5 on kaikilla : C D (n i ) = 0.333, mutta kaksi viimeistä toimijaa C D (n 6 ) = C D (n 7 ) = 0.167 ovat vähemmän keskeisiä.

14 Keskeisyys indeksit Florentine perheille With g = 16 actors With g = 15 actors C D (n i ) C B (n i )* C D (n i )* C C (n i )* C B (n i )* C I (n i )* Acciaiuoli 0.067 0.000 0.071 0.368 0.000 0.049 Albizzi 0.200 0.184 0.214 0.483 0.212 0.074 Barbadori 0.133 0.081 0.143 0.438 0.093 0.068 Bischeri 0.200 0.090 0.214 0.400 0.104 0.074 Castellani 0.200 0.048 0.214 0.389 0.055 0.070 Ginori 0.067 0.000 0.071 0.333 0.000 0.043 Guadagni 0.267 0.221 0.286 0.467 0.255 0.081 Lamberteschi 0.067 0.000 0.071 0.326 0.000 0.043 Medici 0.400 0.452 0.429 0.560 0.522 0.095 Pazzi 0.067 0.000 0.071 0.286 0.000 0.033 Peruzzi 0.200 0.019 0.214 0.368 0.022 0.069 Pucci- 0.000 0.000 - - - - Ridolfi 0.200 0.098 0.214 0.500 0.114 0.080 Salvati 0.133 0.124 0.143 0.389 0.143 0.050 Strozzi 0.267 0.089 0.286 0.438 0.103 0.070 Tornabuoni 0.200 0.079 0.214 0.483 0.092 0.080 Centralization 0.267 0.383 0.257 0.322 0.437 -

15 Läheisyys Ideana on, että toimija on keskeinen jos se kykenee nopeasti vuorovaikutukseen muiden kanssa Läheisyys (closeness) on toimijan lyhyimpien polkujen summa kaikkiin verkoston muihin toimijoihin d ij on lyhyimmän polun pituus i:n ja j:n välillä n c i = d ij j= i Huomaa tulkinnassa, että pieni arvo tarkoittaa keskeistä pistettä

16 Läheisyyden mitta Sabidussin (1966) esittämä läheisyys: C C ( n i ) = [ g j= 1 d( n 1 i, n j )] ja Beauchamp (1965) esittämä standardi läheisyys: C ' C ( n i ) = ( g 1) C C ( n i ) Tämä standardoitu indeksi saa arvot välillä 0 ja 1, ja se voidaan ajatella käänteisenä etäisyynä toimija i:stä muihin toimijoihin.

Kertaus: Geodeesit ja etäisyys (Miilumäki 2009) 17 Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein etäisyysmatriisin (distance matrix) avulla Etäisyysmatriisin alkiot d(i, j) ilmoittavat solmujen n i ja n j välisemmän lyhimmän etäisyyden pituuden

18 Välillisyys Välillisyys (betweenness) mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu Jos piste sijaitsee useiden muiden pisteiden välillä, se pystyy säätelemään esim. tiedon kulkua näiden välillä (portinvartijat) Piste voi olla (lokaalisti) hyvin epäkeskeinen, mutta sen välillisyys voi silti olla hyvin suuri

19 Välillisyyden mitta Esimerkiksi solmujen lyhimmät etäisyydet (geodeesi) toimijoiden n 2 ja n 3 välillä on n 2 n 1 n 4 n 3 eli lyhyn polku näiden kahden toimijan välillä kulkee kahden toimijan n 1 ja n 4 kautta- voidaan sanoa, että n 1 ja n 4 on vaikutusta n 2 ja n 3 välisessä vuorovaikutuksessa. Toimija on siis keskeinen jos sen on useiden toimijoiden ja niiden geodeesien välissä, jolloin toimijalla on suuri keskeisyys välillisyys. Välillisyyden mitta voidaan pukea seuraavaan kaavaan: B i C ( n ) = g ( n ) / g j< k jk i jossa g jk on j ja k toimijoiden yhdistävien geodeesien lukumäärä. Koska mikä tahansa geodeesi on yhtä todennäköinen, niin todennäköisyys minkä tahansa geodeesin kautta on 1 / g jk (Freeman) joka on standardoituna: C ' B ( n i ) = C ( n ) /[( g 1)( g B i jk 2) / 2]

Kritiikkiä Freemanin (1979) välillisyydelle 20 Freeman (1979) olettaa, että kaikki geodeesit ovat yhtä todennäköisiä, huomioimatta toimijoita. Jotkut toimijat saattavat kuintenkin olla keskeisempiä keskeisyysasteeltaan, esim. jonkun toimijan keskeisyysaste voi olla 10 kun toisen toimijan 3, tällöin yleensä sellainen toimija valitaan todennäköisemmin joka on keskeisempi. Freeman (1979) olettaa myös, että aina mennään lyhintä reittiä pitkin, eli keskitityyn vain geodeeseihin, vaikka jossain tapauksissa pidemmän reitit tai polut saattavat olla todennäköisempiä.

21 Informaation keskeisyys Stephensonin ja Zelenin (1989) keskeisyyden indeksi vastaa tähän kritiikiin, ja huomioi kaikki polut sekä niiden painoarvot. Geodeeseille yleensä annetaan painoarvoina niiden yhteneväisyydet. Kun taas poluille joiden pituus on pidempi kuin geodeesin pituus annetaan pienemmät painoarvot sen mukaan mitä informaatiota ne sisältävät. Polun informaatio on yksinkertaisesti määritelty sen pituuden inverssinä.

22 Informaation keskeisyyden mitta Informaatio keskeisyyden laskemiseksi tarvitaan kaksi välillistä arvoa. Nämät ovat summa-arvoja: g g ja C : T = i = c R = 1 ii j = T on yksinkertaisesti summa kaikista matriisin diagonaalisista arvoista, ja R on joku rivi summista (kaikki rivi summat ovat yhtäsuuria). Näiden kahden arvojen avulla voidaan vihdoin laskea informaation keskeisyys indeksi toimijalle i: C ( n ) = I 1 + ( T 2R) / g Tämä indeksi mittaa kuinka paljon informaatiota sisältyy polkuihin jotka alkavat (ja päättyvät) tiettyyn toimijaan. Indeksin minimiarvo on 0, mutta sillä ei ole maksimiarvoa; jos T = 2R, ja C ii = 0, niin indeksi on ääretön. Stephenson ja Zelen (1989) suosittelevat että käytetään suhteellista informaatio indeksi, joka saadaan jakamalla jokainen indeksi (C I (n i ) kaikilla indekseillä: C ' I i ( ni) = c ii CI ( ni ) C ( n ) i I i 1 c ij

23 Lähteet Johanson, J-E., Mattila, M., Uusikylä, P. 1995. Johdatus verkostoanalyysiin. http://www.valt.helsinki.fi/vol/kirja/. Novak, J.D. 1998. Learning, Creating and Using Knowledge: Concept Maps as Facilitative Tools in Schools and Corporations. New York, Lawrence Erlbaum Associates. Miilumäki, T. 2009. Matriisit verkostojen mallintamisessa. Siivonen, V. 2003. Johdatus verkostoanalyysiin. http://www.valt.helsinki.fi/blogs/ville.siivonen/luento%202.pdf Wasserman, S., Faust, K. 1994. Social Network Analysis, Methods and Applications.