1
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Verkostoanalyysi 2011, TTY – 11.3.2011
Verkostoanalyysin peruskäsitteitä ja visualisointia
Graafit ja matriisit, keskeisyys ja arvostus
11.3.2011
Thumas Miilumä[email protected]
Tampereen teknillinen yliopistoHypermedialaboratorioMatematiikan laitos
2
11.3.2011
Sisältö
• SNA-graafit ja niiden ominaisuudet• SNA-matriisit ja niiden ominaisuudet• Suuntaamattomien verkostojen keskeisyyden tunnusluvut• Suunnattujen verkostojen toimijoiden arvostuksen tunnusluvut
• Taustalla pääosin Wassermanin ja Faustin Social Network Analysis: Methods and Applications (1994) teokessa esitetyt SNA-teoriat
• Laajennuksia Ruohosen Graafiteoria (2006) opetusmonisteesta sekä Knoken ja Yangin (2008) ja Scottin (2000) teoksista
• Termistön suomennokset pohjautuvat Ruohosen (2006), Johanssonin et al. (1995) ja Miilumäki (2010) teoksissa käytettyihin suomennoksiin
• Esitysaineisto noudattaa sisällöltään pitkälti aiempia seminaariesityksiä (Miilumäki, 2008; 2009a ; 2009b)
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
SNA-graafit
TaustatMääritelmät
Ominaisuudet
3
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
4Taustaa
• Tapoja sosiaalisten verkostojen mallintamiseen on useita• Käytettävät menetelmät riippuvat mallinnuksen kohteesta,
näkökulmasta ja tavoitteesta• Esimerkiksi monet tilastolliset mallinnusmenetelmät ovat
sovellettavissa sosiaalisten verkostojen mallinnuksessa, mikäli verkostodata on valittuun tarkoitukseen relevanttia
• Edelleen monet diagrammit ja kaaviot ovat sovellettavissa sosiaalisen verkoston datan käsittelyyn
• Graafeilla pyritään luomaan mahdollisimman todenmukainen visualisointi, ikään kuin valokuva, tarkasteltavasta verkostosta, jossa toimijat ja niiden väliset yhteydet on esitetty selkeästi
• Graafin ja todellisuuden yhteensovittaminen on haasteellista, sillä graafi luodaan usein diskreetistä ja rajallisesta määrästä verkostodataa
11.3.2011Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus
5Perusteluja graafien käytölle
• SNA:ssa (Social Network Analysis) graafien käytölle on useita perusteita
• Graafiteoreettinen sanasto soveltuu sosiaalisten rakenteiden kuvaamiseen ja merkitsemiseen
• Useimmat sosiaalisten rakenteiden ja ominaisuuksien kvantitatiiviset tunnusluvut ovat laskettavissa graafiteoreorian sisältämien matemaattisten menetelmien avulla
• Graafiteoreettinen notaatio ja sanasto sekä sen sisältämä matematiikka tarjoavat mahdollisuuden erilaisten graafeja koskevien teoreemien todistamiseen, ja siten myös sosiaalisia rakenteita koskevat väitteet ovat todistettavissa (Wasserman & Faust 1994, 93.)
• Graafiteoria tarjoaa mahdollisuuden sosiaalisen verkoston mallintamiseen
• Graafi on esitys tarkasteltavasta verkosta• Reaalimaailman toimijat esitetään graafissa solmuina / (kärki)pisteinä (a
node, nodes / a vertex, vertices) ja niiden väliset yhteydet solmuja yhdistävinä kaarina (an edge, edges) tai nuolina (an arc, arcs)
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
6Historiaa graafeista ja niiden käytöstä SNA:ssa
• Jacob Levy Moreno esitteli jo 1930-luvulla sosiogrammin (sociogram), joka on edelleen pohjana graafiteoreettisessa SNA:ssa ja verkostojen visualisoinnissa (Moreno, 1953)
• Graafiteoria on ollut voimakkaasti käytössä• Antropologiassa• Kommunikaatiotutkimuksissa• Elinkeino- ja liiketaloustutkimuksissa• Organisaatiotutkimuksissa• Maantieteissä (Wasserman & Faust 1994, 94.)• Piiriteoriassa ja -analyysissa
• Kaikissa em. tieteen- ja tutkimuksenaloilla on aina jollain tapaa ja jollain asteella mukana ihmisten muodostama sosiaalinen verkosto, jota graafiteoreettisin menetelmin on hyvä lähestyä ja analysoida
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
7Graafit
• Seuraavassa esitellään suuntaamaton (undirected) ja kaksiarvoinen (dichotomous) graafi verkoston mallina
• Suuntaamattomassa graafissa verkoston toimijoiden väliset yhteydet ovat aina kaksisuuntaisia
• Kaksiarvoisessa graafissa yhteyksien voimakkuutta ei oteta huomioon vaan ainoastaan yhteyden olemassaoloon otetaan kantaa, ts. yhteys joko on olemassa tai ei ole
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
8Suuntaamaton graafi
• Suuntaamaton graafi G koostuu kahdesta joukosta:• Toimijoita kuvaava solmujen joukko N = {n1,n2,…,ng} (a set of nodes)• Yhteyksiä kuvaava kaarien (viivojen) joukko L = {l1,l2,…,lL} (a set of lines)
• Graafissa G (N , L ) on siis yhteensä g solmua ja solmuja yhdistäviä kaaria yhteensä L kappaletta
• Suuntaamattomassa graafissa jokainen kaari on kahden erillisen solmun ni ja nj ei-järjestetty pari, ts. kaari
lk = (ni,nj) = (nj,ni)• Kaarta, jonka alku- ja päätepisteenä on yksi ja sama solmu ni,
sanotaan silmukaksi (a loop) tai sisä-/refleksiivisidokseksi (a reflexive tie)
• Silmukoita ei useinkaan käytetä sosiogrammeissa• Sosiogrammit yksinkertaisia (simple) graafeja
• Arvotetuilla/painotetuilla (valued, weighted) graafeilla silmukoita voidaan hyödyntää kuvaamaan itseisiä toimintoja ja niiden määriä
• Voidaan merkitä graafiin kaaren sijasta solmun kokoa muuttaen
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
9Perusmääritelmiä
• Kaksi solmua ni ja nj ovat vierekkäiset (adjacent), jos kaari lk=(ni,nj) on joukossa L ts.
lk = (ni,nj) ∈ L
• Solmu ni on liittynyt (incident) kaareen lk, jos se on toinen solmuista, jotka muodostavat kaaren lk määrittelevän järjestämättömän parin lk=(ni,nj)
• Graafia, jossa on vain yksi solmu, sanotaan triviaaliksi (trivial)• Tyhjässä (empty) graafissa ei ole yhtään kaarta solmujen
välissä, ts.G (N , L ): N = {n1,n2,…,ng}, L = Ø
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
10Solmun aste
• Suuntaamattomassa graafissa solmun aste (degree) d(ni) kertoo solmuun ni liittyneiden kaarien lukumäärän
• Kun graafissa G on g solmua, kullakin solmulla on aste, joka voi olla
• Minimissään 0, jolloin solmuun ni ei ole liittynyt yhtään kaarta• Maksimissaan g-1, jolloin kaikki muut graafin solmut ovat liittyneet
suoraan erillisillä kaarilla solmuun ni
• Graafin G , jossa on g solmua ja L kaarta, solmujen asteiden keskiaste (mean degree) määritellään
• Edelleen astelukujen varianssi (variance of degrees)gL
gnd
d igi 2)(1 =
∑= =
gdnd
S igi
D
212 ))(( −∑
= =
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
11Graafin tiheys
• Graafin G (N , L ) tiheys (density) on graafin kaarien osuus graafin kaikista mahdollisista kaarista
• Yksinkertaisessa (ei silmukoita, eikä rinnakkaisia (parallel) kaaria) graafissa, jossa on g solmua, on kaaria maksimissaan
• Jos graafissa G (N , L ) on L kaarta, saadaan graafin tiheydelle ∆ määritelmä
• Tiheys voi olla• Minimissään 0, jos graafissa ei ole lainkaan kaaria (L = 0)• Maksimissaan 1, jos graafi on täydellinen (complete) eli graafin
kaikki mahdolliset kaaret ovat edustettuina (L = g(g-1)/2)• Täydellistä graafia, jossa on g solmua, merkitään Kg
( )2
12
−=⎟⎟
⎠
⎞⎜⎜⎝
⎛ ggg
)1(2
2/)1( −=
−=Δ
ggL
ggL
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
12Graafin tiheys
• Suuntaamattomassa g solmun graafissa kaikkien solmujen asteiden summa on 2L, mikä antaa keskiasteeksi 2L/g
• Täten tiheys voidaan kirjoittaa muodossa
)1()1(2
−=
−=Δ
gd
ggL
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Suunnattu graafi eli digraafi
• Jos verkoston yhteydet tulkitaansuunnatuiksi, on nuoli (an arc) lk kahdensolmun ni ja nj järjestetty pari se., lk = <ni,nj> ≠ <nj,ni> (Wasserman & Faust, 1994.)
• Mikäli yhteys tomijaparin välillävaikuttaa molempiin suuntiin, on digraafissa tällöin rinnakkaisetvastakkaissuuntaiset nuolet solmuparinvälillä
• Digraafilla on käytännössä samatperusominaisuudet kuin graafilla
• Muistettava on kuitenkin, ettädigraafissa nuolia voi olla kaksikertaa enemmän verrattunavastaavan toimijajoukon graafinkaarien lukumäärään
– Yhteyden tulkinnassa on ero• Yksityiskohtaisemmat määritelmät
esim. digraafin tiheydelle on esitettyteoksessa Miilumäki (2010)
13
11.3.2011Thumas Miilumäki – Keskeisyys ja arvostus, matriisit ja graafit
14Kulku, reitti ja polku
• Kulku (a walk, walks) on graafin G (N , L ) solmujen ja kaarien äärellinen jakso
W = ni0, lj0, ni1, lj1, … , ljk, nik• Kulku alkaa aina solmusta ja päättyy solmuun
• Mikäli kulun alkusolmu ni0 ja loppusolmu nik ovat yksi ja sama solmu n, on kulku suljettu (closed)
• Kulku voi sisältää saman kaaren ja solmun useammin kuin kerran jaksossa
• Kulun pituus (length) on kulun sisältämien kaarien lukumäärä• Jos jokin kaari on kulussa useampaan kertaan lasketaan ne erillisinä
kaarina kulun pituuteen• Kulun vastakulku W -1 on itse kulku käänteisessä järjestyksessä
• Reitti (a trail, trails) on kulku, jossa kukin kaari esiintyy vain kerran• Polku (a path, paths) on kulku, jossa kukin solmu ja kaari esiintyy vain
kerran
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
15Geodeesi, etäisyys, halkaisija ja eksentrisyys
• Geodeesi (a geodesic, geodesics) on lyhin polku graafin kahden solmun välillä
• Geodeettinen etäisyys (geodesic distance), yksinkertaisemmin etäisyys (distance), kahden solmun välillä määritellään solmujen geodeesin pituutena
• Etäisyyttä solmujen ni ja nj välillä merkitään d(i,j)• Solmujen ni ja nj välinen etäisyys on minkä tahansa geodeesin pituus ko.
solmujen välillä• Mikäli solmuparin välillä ei ole polkua, on ko. solmujen välinen etäisyys
ääretön (tai määrittämätön)• Suuntaamattomilla graafeilla d(i,j) = d(j,i)
• Graafin halkaisija (diameter) on yhtä suuri kuin graafin minkä tahansa solmuparin suurin geodeettinen etäisyys
• Solmun ni eksentrisyys (eccentricity) eli epäkeskisyys (myös ns. suhdeluku (association number)) on suurin geodeettinen etäisyys solmun ni ja minkä tahansa graafin muun solmun nj kanssa
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
SNA-matriisit
MääritelmätOminaisuudet
16
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
17Sosiomatriisi
• Verkoston toimijat ja eri toimijaparien väliset suunnatut / suuntaamattomat yhteydet voidaan esittää yhtenä matriisina
• Jos verkosto koostuu g toimijasta, joiden välillä joko on yhteys tai yhteys puuttuu, voidaan toimijoiden väliset yhteydet kuvata taulukkona, jossa kullekin toimijalle on merkitty oma vaakarivi ja vastaava pystysarake
• Taulukkoon merkitään binääriluvuilla 0 ja 1 toimijoiden välisen yhteyden olemassa olo se., alkio saa arvon 0, jos yhteyttä ei ole, ja arvon 1, jos toimijoiden välillä on yhteys
• Koska silmukoita ei sallita verkostossa,taulukon lävistäjän alkiot jätetäänmäärittelemättä
n1 n2 n3 n4
n1 - 1 0 1
n2 1 - 1 0
n3 0 1 - 1
n4 0 1 0 -
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
18Sosiomatriisi
• Taulukko on g x g vieruspistematriisi (an adjacency matrix) X, joka alkiot xij määritellään
• Tätä vieruspistematriisia nimitetään SNA:ssa sosiomatriisiksi (a sociomatrix, sociomatrices)
• Edellä esitetystä taulukosta saadaan siis sosiomatriisi X
⎩⎨⎧
==
=olemassaonnnl
olemassaoleeinnlx
jik
jikij ),(,1
),(,0
n1 n2 n3 n4
n1 - 1 0 1
n2 1 - 1 0
n3 0 1 - 1
n4 0 1 0 - ⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
−−
−−
=
010110011101
X
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
19Sosiomatriisin ominaisuuksia
• Sosiomatriisi on yleisesti asymmetrinen (asymmetric) suuntaamattomille graafeille, mutta aina symmetrinen (symmetric) suuntaamattomille graafeille
• Täydellisen Kg -graafin sosiomatriisin jokainen diagonaalialkiosta poikkeava alkio on arvoltaan 1
• Vastaavasti tyhjää graafia vastaa sosiomatriisi, jossa jokainen (diagonaalialkiosta poikkeava) alkio on arvoltaan 0
• Arvotetuille graafeille sosiomatriisin alkiot ovat reaalilukuja, jotka vastaavat toimijoiden välisten yhteyksien arvoja vk
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
20Insidenssimatriisi
• Insidenssimatriisissa (an incidence matrix) on esitetty tieto siitä, mitkä graafin (verkoston) solmut ovat johtuvia (incident) minkin graafin (verkoston) kaaren suhteen
• Insidenssimatriisissa kutakin solmua vastaa yksi matriisin rivi ja kutakin kaarta yksi sarake
• Jos siis verkostossa on g solmua ja L kaarta, on insidenssimatriisi I g x L matriisi
• Insidenssimatriisin alkiot Iij ovat binäärisiä se., jos solmu ni on liittynyt kaareen lj, on Iij = 1, ja mikäli taas solmu ni ei ole liittynyt kaareen lj, on Iij = 0
• Insidenssimatriisin jokaisessa sarakkeessa on täsmälleen kaksi ykköstä niillä riveillä, jotka edustavat kyseisen kaaren päätepisteitä
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
21Insidenssimatriisi
l1 l2 l3 l4 l5n1 1 1 0 0 1
n2 1 0 1 0 0
n3 0 1 1 1 0
n4 0 0 0 1 1⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
=
11000011100010110011
I
Insidenssimatriisia Ivastaava graafi
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
22Kulku
• Sosiomatriisin X alkiot xij kertovat, onko solmujen ni ja njvälillä kulku ninj
• Sosiomatriisin X neliön X2 alkio xij määritellään
• Tämän summan yksi termi xikxkj = 1 vain, jos molemmat yhteydet (ni,nk) ja (nk,nj) ovat olemassa
Summa laskee siis kulkujen, joiden pituus on kaksi, lukumäärän solmusta ni solmuun nj
• Sosiomatriisin X neliön X2 alkiot ilmoittavat verkostossa olevien kulkujen, joiden pituus on kaksi, lukumäärän solmusta ni solmuun nj
• Edelleen matriisin Xp alkiot ilmoittavat solmujen välisien kulkujen, joiden pituus on p, lukumäärän
[ ] ∑ ==
g
k kjikij xxx1
2
[ ]2ijx
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
23Saavutettavuus
• Saavutettavuudella (reachability) tarkoitetaan sitä, että onko joidenkin verkoston kahden solmun välillä kulku
• Saavutettavuusmatriisissa (a reachability matrix) alkio on yksi, jos solmujen ni ja nj välillä on kulku, nolla muulloin
• Verkostossa kulku voi olla pituudeltaan korkeintaan g-1• Sosiomatriisin X potenssit X2, X3, …, Xg-1 ilmoittavat
solmujen välisten erimittaisten kulkujen lukumäärät• Näiden summamatriisi
ilmoittaa kaikkien erimittaisten kulkujen lukumäärät solmuparien välillä
• Tästä summamatriisista saadaan saavutettavuusmatriisi, kun matriisin nollasta poikkeavat alkiot merkitään
ykkösiksi• Saavutettavuusmatriisi on määritettävissä myös Warshallin
algoritmilla laskentatehokkaammin suurille verkostoille
[ ]RX [ ]Rijx
[ ]RX
[ ]ΣX
[ ]ΣX[ ]ΣX
[ ] 1321
1... −−
=Σ ++++==∑ gg
ii XXXXXX
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
24Geodeesi ja etäisyys
• Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein etäisyysmatriisin (a distance matrix) avulla
• Etäisyysmatriisin alkiot d(i,j) ilmoittavat solmujen ni ja njvälisen lyhimmän etäisyyden pituuden
• Lyhimmät etäisyydet löytyvät tarkastelemalla sosiomatriisia Xja sen potenssimatriiseja X2, X3, …, Xg-1 se.,
• Verkoston halkaisija on yhtä suuri kuin suurin verkostosta löytyvä geodeettinen etäisyys, eli ts. halkaisijan arvo on yhtä suuri kuin etäisyysmatriisin alkioiden maksimi (max [d(i,j)])
[ ] 0min),( >= pijp xjid
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
25Solmujen asteluvut
• Suuntaamattomille verkostoille solmujen asteluvut ovat helposti laskettavissa sosiomatriisin X tai insidenssimatriisin I avulla
• Insidenssimatriisissa rivillä on merkitty 1:llä, jos kaari on liittynyt solmuun ja 0:lla, jos kaari ei ole liittynyt solmuun
• Nyt siis solmun ni asteluku d(ni) saadaan insidenssimatriisin rivisummana, eli
• Sosiomatriisissa rivillä on merkitty 1:llä, jos saraketta vastaava solmu on liittynyt kaarella riviä vastaavaan solmuun
• Nyt siis solmun ni asteluku d(ni) saadaan sosiomatriisin rivisummana tai sarakesummana, koska matriisi on symmetrinen, eli ts.
∑=
=L
jiji Ind
1)(
ji
g
iij
g
jiji xxxxnd ++
==
==== ∑∑11
)(
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
26Solmujen vienti- ja tuontiluvut
• Suunnatuille verkostoille solmujen vienti- ja tuontiluvut (outdegree, indegree) ovat helposti laskettavissa sosiomatriisin X avulla
• Sosiomatriisissa rivillä on merkitty 1:llä, jos riviä vastaavasta solmusta lähtee nuoli saraketta vastaavaan solmuun
• Nyt siis solmun ni vientiluku dO(ni) saadaan sosiomatriisin rivisummana, eli
• Sosiomatriisissa sarakkeessa on merkitty 1:llä, jos saraketta vastaavaan solmuun tulee nuoli riviä vastaavasta solmusta
• Nyt siis solmun ni tuontiluku dI(ni) saadaan sosiomatriisin sarakesummana, eli
+=
==∑ i
g
jijiO xxnd
1)(
i
g
jjiiI xxnd +
=
==∑1
)(
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
27Tiheys
• Verkoston tiheys määriteltiin verkostossa olemassa olevien solmujen välisten yhteyksien summan ja verkoston kaikkien mahdollisten solmujen välisten yhteyksien summan välisenä suhteena
• Verkostossa, jossa on g toimijaa, voi olla enintään g(g-1) toimijaparien välistä suoraa yhteyttä
• Verkoston sosiomatriisissa on merkitty 1:llä, mikäli toimijaparin välillä vallitsee yhteys ja 0:lla, jos toimiparin väliltä puuttuu yhteys
• Nyt siis olemassa olevien yhteyksien summa saadaan yksinkertaisesti sosiomatriisin kaikkien alkioiden summana, eli tiheys ∆ määritellään
• Tämä tiheyden määritelmä pätee myös arvotetuille verkostoille)1(
11
−ΣΣ
=Δ ==
ggxij
gj
gi
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
SNA-tunnusluvut
KeskeisyysArvostus
28
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
29
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Yleisesti keskeisyydestä ja arvostuksesta
• Suuntaamattomille verkostoille ja sen toimijoille voidaan määrittää erilaisia keskeisyyden (centrality) tunnuslukuja
• Keskeisyys ei riipu verkoston yhteyksien suunnasta, vaan ainoastaan tarkasteltavasta toimijasta ja siihen liittyneistä yhteyksistä ja/tai koko verkostosta yleensä
• Suunnatuissa verkostoissa keskeisyyden tilalla käytetään käsitettä arvostus (prestige), joka huomioi yhteyksien suunnan
• Erotetaan toisistaan käsitteet ”olla arvostettu” ja ”arvostaa”• Arvostuksen tunnusluvuissa tarkastellaan nimenomaan yhteyksien
vastaanottamista eli arvostuksen kohteena olemista
Keskeisyys
• Keskeisyyden käsite määritellään suuntaamattomille verkostoille• Keskeisyyttä voidaan kuvata seuraavilla tunnusluvuilla
• Keskeisyysaste (degree centrality)• Läheisyys (closeness centrality)• Välillisyys (betweenness centrality)• Informaatiokeskeisyys (information centrality)
• Suuntaamattomissa verkostoissa keskeinen toimija on osallisena monissa yhteyksissä
• Keskeisyyden kannalta ei ole väliä, onko toimija lähettänyt vai vastaanottanut yhteyden
• Keskeisyys on verkoston toimijaa ni kuvaava tunnusluku, kun taas koko verkostolle yhteisesti voidaan määrittää keskittyneisyys (centralization), joka on verkostosta toiseen vertailtava tunnusluku
• Keskittyneisyyden avulla voidaan kuvata, missä määrin yksittäiset toimijat hallitsevat muiden välistä kanssakäymistä yleisesti koko verkoston tasolla
30
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Keskeisyysaste
• Toimijan ni keskeisyysaste CD(ni) kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin (= asteluku d(ni))
• Toimijan aste ei itsessään ole kuitenkaan yleisesti vertailtava tunnusluku
• Kun asteluku skaalataan verkoston tasolla, voidaan toimijoiden keskeisyysasteita vertailla eri verkostojen välillä
• Normeerattu keskeisyysaste C´D(ni) määritellään
C´D(ni) = , missä g on verkoston toimijoiden lukumäärä
• Keskeisyysaste määritellään myös suunnatuille verkostoille, jolloin käsitellään erikseen vientikeskeisyyttä (outdegree centrality) ja tuontikeskeisyyttä (indegree centrality)
31
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
d(ni)g – 1
Läheisyys ja välillisyys
• Läheisyys on toimijan ni lyhyimpien polkujen (geodeesien) summa ci kaikkiin verkoston muihin toimijoihin nj
• Itsessään summa ei ole vertailtava tunnusluku eri verkostojen välillä
• Verkostojen kesken vertailukelpoinen normeerattu läheisyys määritellään
C´C(ni) = , missä g on verkoston toimijoiden lukumäärä
• Toimijan välillisyys puolestaan mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu
• Toimijan välillisyys on merkityksellinen tunnusluku mm. tutkittaessa verkoston toiminnan tehokkuutta
32
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
g – 1ci
33
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Arvostus
• Kuten keskeisyyttä, niin myös arvostusta voidaan tarkastella eri tavoin
• Verkoston toimijoille voidaan määrittää seuraavat arvostukset• Arvostusaste (actor degree prestige)• Arvostusläheisyys (actor proximity prestige)• Arvoasema (actor status prestige, actor rank prestige)
• Koko verkoston tasolla voidaan määrittää verkostoa kuvaavia arvostuksen tunnuslukuja arvioimalla kunkin arvostuksen keskiarvoja ja variansseja
• Näistä keskiarvostusläheisyys ja arvostusläheisyyden varianssi ovat mielekkäimpiä tarkasteltavia verkostoanalyysin kannalta
34
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Arvostusaste
• Toimijan ni arvostusaste PD(ni) määritellään yksinkertaisesti toimijaan kohdistuneiden yhteyksien summana
• Vertaa suuntaamattoman verkoston toimijan ni keskeisyysaste, joka määritellään toimijaa kuvaavan solmun astelukuna d(ni)
• Arvostusaste määritellään formaalistiPD(ni) = dI(ni) = Σj xij = x+i , missä dI(ni) on solmun ni tuontiluku
ja x+i on verkoston sosiomatriisin Xsarakesumma sarakkeesta i
• Jotta arvostusasteet eri verkostojen välillä olisivat verrattavissa keskenään, määritellään normeerattu arvostusaste P´D(ni)
P´D(ni) = , missä g on verkoston toimijoiden lukumääräx+i
g – 1
35
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Arvostusläheisyys
• Toimijalle ni voidaan määrittää luku Ii, joka ilmoittaa, kuinka moni toimija nj voi saavuttaa toimijan ni
• Tämän toimijan ni vaikutusjoukon toimijoiden lukumäärän Iiavulla voidaan määrittää vaikutusjoukon toimijoiden keskimääräinen etäisyys toimijasta ni
• Toimijan ni arvostusläheisyys PP(ni) määritellään vaikutusjoukon osuuden koko verkoston toimijajoukosta suhteena vaikutusjoukon toimijoiden keskimääräiseen etäisyyteen toimijasta ni
• Arvostusläheisyys saa muiden normeerattujen tunnuslukujen tavoin arvoja välillä [0,1]
• Jos toimijalla ni on suora yhteys jokaiseen verkoston muuhun toimijaan, saa arvostusläheisyys arvon yksi
• Jos toimija ni on isolaatti (an isolate, isolates), vaikutusjoukon toimijoiden lukumäärä Ii nolla, ja arvostusläheisyys määritellään nollaksi
36
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Arvoasema
• Edellä esitellyt arvostuksen tunnusluvut huomioivat vain toimijoita ja niihin kohdistuvia yhteyksiä
• Toimijan ni arvoasema PR(ni) on riippuvainen häneen päin yhteydessä olevien toimijoiden nj arvoasemista PR(nj)
• Edelleen taas toimijoiden nj arvoasemat ovat riippuvaisia näihin päin yhteydessä olevien toimijoiden nk arvoasemista jne.
• Arvoaseman määrittelyn taustalla on ajatus siitä, että toimijan niarvoasema on häneen päin suoraan yhteydessä olevien toimijoiden arvoasemien funktio
• Verkostossa, jossa on g toimijaa, toimijan ni arvoasema voidaan esittää sosiomatriisin X toimijaa kuvaavan sarakkeen alkioiden ja niitä vastaavien toimijoiden arvoasemien lineaarikombinaationa, ts.
PR(ni) = x1i PR(n1) + x2i PR(n2) + … + xgi PR(ng)• Arvoaseman määrittäminen vaatii syvällisempää ymmärrystä mm.
matriisin ominaisarvoprobleeman ratkaisusta• Myöhemmissä esityksissä perehdytään algoritmeihin, joilla verkoston toimijoiden
arvoasemat voidaan määrittää erilaisissa verkostoissa
Esimerkki – Valtioiden kauppaverkosto 37
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
• Seuraavassa on esitetty 24 valtion kauppaverkosto (Wasserman & Faust 1994)http://matriisi.ee.tut.fi/~miilumak/sna/
Esimerkki – Valtioiden kauppaverkosto 38
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
• Verkostosta määritetyt arvostuksen tunnusluvut (g = 24)
i VALTIO dI (ni) dO (ni) P (ni) P (ni) P (ni)123456789101112131415161718192021222324
AlgeriaArgentinaBrazilChinaCzechoslovakiaEcuadorEgyptEthiopiaFinlandHondurasIndonesiaIsraelJapanLiberiaMadagascarNew ZealandPakistanSpainSwitzerlandSyriaThailandUnited KingdomUnited StatesYugoslavia
13101115139121015914101796141417151215161915
4132121212922111411230111132223014222318
0,5650,4350,4780,6520,5650,3910,5220,4350,6520,3910,6090,4350,7390,3910,2610,6090,6090,7390,6520,5220,6520,6960,8260,652
0,6610,5990,6190,7100,6610,5810,6390,5990,7100,5810,6850,5990,7670,6010,5330,6850,6850,7670,7100,6580,7100,7380,8340,710
0,2220,8051,0000,7110,8180,1830,4820,1310,7580,0720,6170,6820,6800,0000,1060,4610,5250,6730,7650,0000,5890,6330,6440,680
MEANVARIANCE
12,9179,993
13,29267,955
0,5620,018
0,6680,005
0,5100,085
'D
'P
'R
39
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Huomioitavaa
• On selvää, että keskeisyyden ja arvostuksen tunnusluvut tuovat verkostosta esiin seikkoja, joita ei tulisi huomanneeksi pelkästään verkoston graafia, matriisia tai muunlaista mallia tarkastelemalla
• Keskeisyyden ja arvostuksen tunnusluvut tarjoavat monipuolista tietoa verkoston toiminnasta ja antavat viitteitä siitä, kuinka verkostoa tulisi kehittää, oli sitten kyse tehokkuuden lisäämisestä tai esim. rakenteen parantamisesta
• Tunnuslukuja ei saa kuitenkaan pitää ainoina mittareina verkoston toiminnasta
• Graafit visualisointeina tarjoavat paljon hyödyllistä tietoa verkoston rakenteesta ja toiminnasta (aikasarjat, DNA – Dynamic NetworkAnalysis)
• Toimijoiden keskeisyydet ja arvostukset ovat vain osa suurempaa kuvaa
• Muutosten jälkeen tulee tarkastella verkostoa uudelleen, tulkita tunnusluvut uudelleen ja tarkastella oliko muutos hyvä vai huono
40
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011
Lähteet
Johansson, J-E., Mattila, M. & Uusikylä, P. (1995). Johdatus verkostoanalyysiin. Helsinki: Kuluttajatutkimuskeskus. http://www.valt.helsinki.fi/vol/kirja/ (Viitattu 10.3.2011)
Knoke, D. & Yang, S. 2008. Social Network Analysis. Second Edition. Los Angeles: SagePublications.
Miilumäki, T. (2008). Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_-_Graafit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2009a). Matrices in Social Network Analysis And Modeling. Matriisit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_-_Matriisit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2009b). Social Network Analysis – Centrality And Prestige. Sosiaalisten verkostojen analyysi – Keskeisyys ja arvostus. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_Keskeisyys-ja-arvostus.pdf (Viitattu 10.3.2011)
Miilumäki, T. (2010). Web-pohjaisten sosiaalisten verkostojen analyysimenetelmät. Diplomityö. Tampere: Tampereen teknillinen yliopisto. http://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/6635/miilumaki.pdf.
Moreno, J.L. (1953). Who Shall Survive? Beacon, New York: Beacon House Inc.Ruohonen, K. (2006). Graafiteoria. Tampere: Tampereen teknillisen yliopiston opetusmoniste no. 5,
uusi sarja.Scott, J. (2000). Social Network Analysis. A Handbook. Second Edition. London: Sage Publications.Wasserman, S. & Faust, K. (1994). Social Network Analysis: Methods and Applications. New York:
Cambridge University Press.
Verkostoanalyysi 2011, TTY – 11.3.2011
Kiitos mielenkiinnostanne.
Kysymyksiä?
41
Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011