thumas miilumäki: verkostoanalyysin peruskäsitteitä ja visualisointia - graafit ja matriisit,...

41
1 Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011 Verkostoanalyysi 2011, TTY – 11.3.2011 Verkostoanalyysin peruskäsitteitä ja visualisointia Graafit ja matriisit, keskeisyys ja arvostus 11.3.2011 Thumas Miilumäki [email protected] Tampereen teknillinen yliopisto Hypermedialaboratorio Matematiikan laitos

Upload: thumas-miilumaeki

Post on 19-Jun-2015

881 views

Category:

Documents


3 download

DESCRIPTION

Verkostoanalyysi 2011 seminaarin avausluennon materiaali.

TRANSCRIPT

Page 1: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

1

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Verkostoanalyysi 2011, TTY – 11.3.2011

Verkostoanalyysin peruskäsitteitä ja visualisointia

Graafit ja matriisit, keskeisyys ja arvostus

11.3.2011

Thumas Miilumä[email protected]

Tampereen teknillinen yliopistoHypermedialaboratorioMatematiikan laitos

Page 2: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

2

11.3.2011

Sisältö

• SNA-graafit ja niiden ominaisuudet• SNA-matriisit ja niiden ominaisuudet• Suuntaamattomien verkostojen keskeisyyden tunnusluvut• Suunnattujen verkostojen toimijoiden arvostuksen tunnusluvut

• Taustalla pääosin Wassermanin ja Faustin Social Network Analysis: Methods and Applications (1994) teokessa esitetyt SNA-teoriat

• Laajennuksia Ruohosen Graafiteoria (2006) opetusmonisteesta sekä Knoken ja Yangin (2008) ja Scottin (2000) teoksista

• Termistön suomennokset pohjautuvat Ruohosen (2006), Johanssonin et al. (1995) ja Miilumäki (2010) teoksissa käytettyihin suomennoksiin

• Esitysaineisto noudattaa sisällöltään pitkälti aiempia seminaariesityksiä (Miilumäki, 2008; 2009a ; 2009b)

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus

Page 3: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

SNA-graafit

TaustatMääritelmät

Ominaisuudet

3

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 4: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

4Taustaa

• Tapoja sosiaalisten verkostojen mallintamiseen on useita• Käytettävät menetelmät riippuvat mallinnuksen kohteesta,

näkökulmasta ja tavoitteesta• Esimerkiksi monet tilastolliset mallinnusmenetelmät ovat

sovellettavissa sosiaalisten verkostojen mallinnuksessa, mikäli verkostodata on valittuun tarkoitukseen relevanttia

• Edelleen monet diagrammit ja kaaviot ovat sovellettavissa sosiaalisen verkoston datan käsittelyyn

• Graafeilla pyritään luomaan mahdollisimman todenmukainen visualisointi, ikään kuin valokuva, tarkasteltavasta verkostosta, jossa toimijat ja niiden väliset yhteydet on esitetty selkeästi

• Graafin ja todellisuuden yhteensovittaminen on haasteellista, sillä graafi luodaan usein diskreetistä ja rajallisesta määrästä verkostodataa

11.3.2011Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus

Page 5: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

5Perusteluja graafien käytölle

• SNA:ssa (Social Network Analysis) graafien käytölle on useita perusteita

• Graafiteoreettinen sanasto soveltuu sosiaalisten rakenteiden kuvaamiseen ja merkitsemiseen

• Useimmat sosiaalisten rakenteiden ja ominaisuuksien kvantitatiiviset tunnusluvut ovat laskettavissa graafiteoreorian sisältämien matemaattisten menetelmien avulla

• Graafiteoreettinen notaatio ja sanasto sekä sen sisältämä matematiikka tarjoavat mahdollisuuden erilaisten graafeja koskevien teoreemien todistamiseen, ja siten myös sosiaalisia rakenteita koskevat väitteet ovat todistettavissa (Wasserman & Faust 1994, 93.)

• Graafiteoria tarjoaa mahdollisuuden sosiaalisen verkoston mallintamiseen

• Graafi on esitys tarkasteltavasta verkosta• Reaalimaailman toimijat esitetään graafissa solmuina / (kärki)pisteinä (a

node, nodes / a vertex, vertices) ja niiden väliset yhteydet solmuja yhdistävinä kaarina (an edge, edges) tai nuolina (an arc, arcs)

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 6: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

6Historiaa graafeista ja niiden käytöstä SNA:ssa

• Jacob Levy Moreno esitteli jo 1930-luvulla sosiogrammin (sociogram), joka on edelleen pohjana graafiteoreettisessa SNA:ssa ja verkostojen visualisoinnissa (Moreno, 1953)

• Graafiteoria on ollut voimakkaasti käytössä• Antropologiassa• Kommunikaatiotutkimuksissa• Elinkeino- ja liiketaloustutkimuksissa• Organisaatiotutkimuksissa• Maantieteissä (Wasserman & Faust 1994, 94.)• Piiriteoriassa ja -analyysissa

• Kaikissa em. tieteen- ja tutkimuksenaloilla on aina jollain tapaa ja jollain asteella mukana ihmisten muodostama sosiaalinen verkosto, jota graafiteoreettisin menetelmin on hyvä lähestyä ja analysoida

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 7: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

7Graafit

• Seuraavassa esitellään suuntaamaton (undirected) ja kaksiarvoinen (dichotomous) graafi verkoston mallina

• Suuntaamattomassa graafissa verkoston toimijoiden väliset yhteydet ovat aina kaksisuuntaisia

• Kaksiarvoisessa graafissa yhteyksien voimakkuutta ei oteta huomioon vaan ainoastaan yhteyden olemassaoloon otetaan kantaa, ts. yhteys joko on olemassa tai ei ole

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 8: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

8Suuntaamaton graafi

• Suuntaamaton graafi G koostuu kahdesta joukosta:• Toimijoita kuvaava solmujen joukko N = {n1,n2,…,ng} (a set of nodes)• Yhteyksiä kuvaava kaarien (viivojen) joukko L = {l1,l2,…,lL} (a set of lines)

• Graafissa G (N , L ) on siis yhteensä g solmua ja solmuja yhdistäviä kaaria yhteensä L kappaletta

• Suuntaamattomassa graafissa jokainen kaari on kahden erillisen solmun ni ja nj ei-järjestetty pari, ts. kaari

lk = (ni,nj) = (nj,ni)• Kaarta, jonka alku- ja päätepisteenä on yksi ja sama solmu ni,

sanotaan silmukaksi (a loop) tai sisä-/refleksiivisidokseksi (a reflexive tie)

• Silmukoita ei useinkaan käytetä sosiogrammeissa• Sosiogrammit yksinkertaisia (simple) graafeja

• Arvotetuilla/painotetuilla (valued, weighted) graafeilla silmukoita voidaan hyödyntää kuvaamaan itseisiä toimintoja ja niiden määriä

• Voidaan merkitä graafiin kaaren sijasta solmun kokoa muuttaen

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 9: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

9Perusmääritelmiä

• Kaksi solmua ni ja nj ovat vierekkäiset (adjacent), jos kaari lk=(ni,nj) on joukossa L ts.

lk = (ni,nj) ∈ L

• Solmu ni on liittynyt (incident) kaareen lk, jos se on toinen solmuista, jotka muodostavat kaaren lk määrittelevän järjestämättömän parin lk=(ni,nj)

• Graafia, jossa on vain yksi solmu, sanotaan triviaaliksi (trivial)• Tyhjässä (empty) graafissa ei ole yhtään kaarta solmujen

välissä, ts.G (N , L ): N = {n1,n2,…,ng}, L = Ø

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 10: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

10Solmun aste

• Suuntaamattomassa graafissa solmun aste (degree) d(ni) kertoo solmuun ni liittyneiden kaarien lukumäärän

• Kun graafissa G on g solmua, kullakin solmulla on aste, joka voi olla

• Minimissään 0, jolloin solmuun ni ei ole liittynyt yhtään kaarta• Maksimissaan g-1, jolloin kaikki muut graafin solmut ovat liittyneet

suoraan erillisillä kaarilla solmuun ni

• Graafin G , jossa on g solmua ja L kaarta, solmujen asteiden keskiaste (mean degree) määritellään

• Edelleen astelukujen varianssi (variance of degrees)gL

gnd

d igi 2)(1 =

∑= =

gdnd

S igi

D

212 ))(( −∑

= =

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 11: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

11Graafin tiheys

• Graafin G (N , L ) tiheys (density) on graafin kaarien osuus graafin kaikista mahdollisista kaarista

• Yksinkertaisessa (ei silmukoita, eikä rinnakkaisia (parallel) kaaria) graafissa, jossa on g solmua, on kaaria maksimissaan

• Jos graafissa G (N , L ) on L kaarta, saadaan graafin tiheydelle ∆ määritelmä

• Tiheys voi olla• Minimissään 0, jos graafissa ei ole lainkaan kaaria (L = 0)• Maksimissaan 1, jos graafi on täydellinen (complete) eli graafin

kaikki mahdolliset kaaret ovat edustettuina (L = g(g-1)/2)• Täydellistä graafia, jossa on g solmua, merkitään Kg

( )2

12

−=⎟⎟

⎞⎜⎜⎝

⎛ ggg

)1(2

2/)1( −=

−=Δ

ggL

ggL

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 12: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

12Graafin tiheys

• Suuntaamattomassa g solmun graafissa kaikkien solmujen asteiden summa on 2L, mikä antaa keskiasteeksi 2L/g

• Täten tiheys voidaan kirjoittaa muodossa

)1()1(2

−=

−=Δ

gd

ggL

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 13: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

Suunnattu graafi eli digraafi

• Jos verkoston yhteydet tulkitaansuunnatuiksi, on nuoli (an arc) lk kahdensolmun ni ja nj järjestetty pari se., lk = <ni,nj> ≠ <nj,ni> (Wasserman & Faust, 1994.)

• Mikäli yhteys tomijaparin välillävaikuttaa molempiin suuntiin, on digraafissa tällöin rinnakkaisetvastakkaissuuntaiset nuolet solmuparinvälillä

• Digraafilla on käytännössä samatperusominaisuudet kuin graafilla

• Muistettava on kuitenkin, ettädigraafissa nuolia voi olla kaksikertaa enemmän verrattunavastaavan toimijajoukon graafinkaarien lukumäärään

– Yhteyden tulkinnassa on ero• Yksityiskohtaisemmat määritelmät

esim. digraafin tiheydelle on esitettyteoksessa Miilumäki (2010)

13

11.3.2011Thumas Miilumäki – Keskeisyys ja arvostus, matriisit ja graafit

Page 14: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

14Kulku, reitti ja polku

• Kulku (a walk, walks) on graafin G (N , L ) solmujen ja kaarien äärellinen jakso

W = ni0, lj0, ni1, lj1, … , ljk, nik• Kulku alkaa aina solmusta ja päättyy solmuun

• Mikäli kulun alkusolmu ni0 ja loppusolmu nik ovat yksi ja sama solmu n, on kulku suljettu (closed)

• Kulku voi sisältää saman kaaren ja solmun useammin kuin kerran jaksossa

• Kulun pituus (length) on kulun sisältämien kaarien lukumäärä• Jos jokin kaari on kulussa useampaan kertaan lasketaan ne erillisinä

kaarina kulun pituuteen• Kulun vastakulku W -1 on itse kulku käänteisessä järjestyksessä

• Reitti (a trail, trails) on kulku, jossa kukin kaari esiintyy vain kerran• Polku (a path, paths) on kulku, jossa kukin solmu ja kaari esiintyy vain

kerran

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 15: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

15Geodeesi, etäisyys, halkaisija ja eksentrisyys

• Geodeesi (a geodesic, geodesics) on lyhin polku graafin kahden solmun välillä

• Geodeettinen etäisyys (geodesic distance), yksinkertaisemmin etäisyys (distance), kahden solmun välillä määritellään solmujen geodeesin pituutena

• Etäisyyttä solmujen ni ja nj välillä merkitään d(i,j)• Solmujen ni ja nj välinen etäisyys on minkä tahansa geodeesin pituus ko.

solmujen välillä• Mikäli solmuparin välillä ei ole polkua, on ko. solmujen välinen etäisyys

ääretön (tai määrittämätön)• Suuntaamattomilla graafeilla d(i,j) = d(j,i)

• Graafin halkaisija (diameter) on yhtä suuri kuin graafin minkä tahansa solmuparin suurin geodeettinen etäisyys

• Solmun ni eksentrisyys (eccentricity) eli epäkeskisyys (myös ns. suhdeluku (association number)) on suurin geodeettinen etäisyys solmun ni ja minkä tahansa graafin muun solmun nj kanssa

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 16: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

SNA-matriisit

MääritelmätOminaisuudet

16

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 17: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

17Sosiomatriisi

• Verkoston toimijat ja eri toimijaparien väliset suunnatut / suuntaamattomat yhteydet voidaan esittää yhtenä matriisina

• Jos verkosto koostuu g toimijasta, joiden välillä joko on yhteys tai yhteys puuttuu, voidaan toimijoiden väliset yhteydet kuvata taulukkona, jossa kullekin toimijalle on merkitty oma vaakarivi ja vastaava pystysarake

• Taulukkoon merkitään binääriluvuilla 0 ja 1 toimijoiden välisen yhteyden olemassa olo se., alkio saa arvon 0, jos yhteyttä ei ole, ja arvon 1, jos toimijoiden välillä on yhteys

• Koska silmukoita ei sallita verkostossa,taulukon lävistäjän alkiot jätetäänmäärittelemättä

n1 n2 n3 n4

n1 - 1 0 1

n2 1 - 1 0

n3 0 1 - 1

n4 0 1 0 -

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 18: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

18Sosiomatriisi

• Taulukko on g x g vieruspistematriisi (an adjacency matrix) X, joka alkiot xij määritellään

• Tätä vieruspistematriisia nimitetään SNA:ssa sosiomatriisiksi (a sociomatrix, sociomatrices)

• Edellä esitetystä taulukosta saadaan siis sosiomatriisi X

⎩⎨⎧

==

=olemassaonnnl

olemassaoleeinnlx

jik

jikij ),(,1

),(,0

n1 n2 n3 n4

n1 - 1 0 1

n2 1 - 1 0

n3 0 1 - 1

n4 0 1 0 - ⎥⎥⎥⎥

⎢⎢⎢⎢

−−

−−

=

010110011101

X

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 19: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

19Sosiomatriisin ominaisuuksia

• Sosiomatriisi on yleisesti asymmetrinen (asymmetric) suuntaamattomille graafeille, mutta aina symmetrinen (symmetric) suuntaamattomille graafeille

• Täydellisen Kg -graafin sosiomatriisin jokainen diagonaalialkiosta poikkeava alkio on arvoltaan 1

• Vastaavasti tyhjää graafia vastaa sosiomatriisi, jossa jokainen (diagonaalialkiosta poikkeava) alkio on arvoltaan 0

• Arvotetuille graafeille sosiomatriisin alkiot ovat reaalilukuja, jotka vastaavat toimijoiden välisten yhteyksien arvoja vk

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 20: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

20Insidenssimatriisi

• Insidenssimatriisissa (an incidence matrix) on esitetty tieto siitä, mitkä graafin (verkoston) solmut ovat johtuvia (incident) minkin graafin (verkoston) kaaren suhteen

• Insidenssimatriisissa kutakin solmua vastaa yksi matriisin rivi ja kutakin kaarta yksi sarake

• Jos siis verkostossa on g solmua ja L kaarta, on insidenssimatriisi I g x L matriisi

• Insidenssimatriisin alkiot Iij ovat binäärisiä se., jos solmu ni on liittynyt kaareen lj, on Iij = 1, ja mikäli taas solmu ni ei ole liittynyt kaareen lj, on Iij = 0

• Insidenssimatriisin jokaisessa sarakkeessa on täsmälleen kaksi ykköstä niillä riveillä, jotka edustavat kyseisen kaaren päätepisteitä

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 21: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

21Insidenssimatriisi

l1 l2 l3 l4 l5n1 1 1 0 0 1

n2 1 0 1 0 0

n3 0 1 1 1 0

n4 0 0 0 1 1⎥⎥⎥⎥

⎢⎢⎢⎢

=

11000011100010110011

I

Insidenssimatriisia Ivastaava graafi

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 22: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

22Kulku

• Sosiomatriisin X alkiot xij kertovat, onko solmujen ni ja njvälillä kulku ninj

• Sosiomatriisin X neliön X2 alkio xij määritellään

• Tämän summan yksi termi xikxkj = 1 vain, jos molemmat yhteydet (ni,nk) ja (nk,nj) ovat olemassa

Summa laskee siis kulkujen, joiden pituus on kaksi, lukumäärän solmusta ni solmuun nj

• Sosiomatriisin X neliön X2 alkiot ilmoittavat verkostossa olevien kulkujen, joiden pituus on kaksi, lukumäärän solmusta ni solmuun nj

• Edelleen matriisin Xp alkiot ilmoittavat solmujen välisien kulkujen, joiden pituus on p, lukumäärän

[ ] ∑ ==

g

k kjikij xxx1

2

[ ]2ijx

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 23: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

23Saavutettavuus

• Saavutettavuudella (reachability) tarkoitetaan sitä, että onko joidenkin verkoston kahden solmun välillä kulku

• Saavutettavuusmatriisissa (a reachability matrix) alkio on yksi, jos solmujen ni ja nj välillä on kulku, nolla muulloin

• Verkostossa kulku voi olla pituudeltaan korkeintaan g-1• Sosiomatriisin X potenssit X2, X3, …, Xg-1 ilmoittavat

solmujen välisten erimittaisten kulkujen lukumäärät• Näiden summamatriisi

ilmoittaa kaikkien erimittaisten kulkujen lukumäärät solmuparien välillä

• Tästä summamatriisista saadaan saavutettavuusmatriisi, kun matriisin nollasta poikkeavat alkiot merkitään

ykkösiksi• Saavutettavuusmatriisi on määritettävissä myös Warshallin

algoritmilla laskentatehokkaammin suurille verkostoille

[ ]RX [ ]Rijx

[ ]RX

[ ]ΣX

[ ]ΣX[ ]ΣX

[ ] 1321

1... −−

=Σ ++++==∑ gg

ii XXXXXX

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 24: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

24Geodeesi ja etäisyys

• Geodeesit eli solmujen lyhimmät etäisyydet esitetään usein etäisyysmatriisin (a distance matrix) avulla

• Etäisyysmatriisin alkiot d(i,j) ilmoittavat solmujen ni ja njvälisen lyhimmän etäisyyden pituuden

• Lyhimmät etäisyydet löytyvät tarkastelemalla sosiomatriisia Xja sen potenssimatriiseja X2, X3, …, Xg-1 se.,

• Verkoston halkaisija on yhtä suuri kuin suurin verkostosta löytyvä geodeettinen etäisyys, eli ts. halkaisijan arvo on yhtä suuri kuin etäisyysmatriisin alkioiden maksimi (max [d(i,j)])

[ ] 0min),( >= pijp xjid

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 25: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

25Solmujen asteluvut

• Suuntaamattomille verkostoille solmujen asteluvut ovat helposti laskettavissa sosiomatriisin X tai insidenssimatriisin I avulla

• Insidenssimatriisissa rivillä on merkitty 1:llä, jos kaari on liittynyt solmuun ja 0:lla, jos kaari ei ole liittynyt solmuun

• Nyt siis solmun ni asteluku d(ni) saadaan insidenssimatriisin rivisummana, eli

• Sosiomatriisissa rivillä on merkitty 1:llä, jos saraketta vastaava solmu on liittynyt kaarella riviä vastaavaan solmuun

• Nyt siis solmun ni asteluku d(ni) saadaan sosiomatriisin rivisummana tai sarakesummana, koska matriisi on symmetrinen, eli ts.

∑=

=L

jiji Ind

1)(

ji

g

iij

g

jiji xxxxnd ++

==

==== ∑∑11

)(

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 26: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

26Solmujen vienti- ja tuontiluvut

• Suunnatuille verkostoille solmujen vienti- ja tuontiluvut (outdegree, indegree) ovat helposti laskettavissa sosiomatriisin X avulla

• Sosiomatriisissa rivillä on merkitty 1:llä, jos riviä vastaavasta solmusta lähtee nuoli saraketta vastaavaan solmuun

• Nyt siis solmun ni vientiluku dO(ni) saadaan sosiomatriisin rivisummana, eli

• Sosiomatriisissa sarakkeessa on merkitty 1:llä, jos saraketta vastaavaan solmuun tulee nuoli riviä vastaavasta solmusta

• Nyt siis solmun ni tuontiluku dI(ni) saadaan sosiomatriisin sarakesummana, eli

+=

==∑ i

g

jijiO xxnd

1)(

i

g

jjiiI xxnd +

=

==∑1

)(

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 27: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

27Tiheys

• Verkoston tiheys määriteltiin verkostossa olemassa olevien solmujen välisten yhteyksien summan ja verkoston kaikkien mahdollisten solmujen välisten yhteyksien summan välisenä suhteena

• Verkostossa, jossa on g toimijaa, voi olla enintään g(g-1) toimijaparien välistä suoraa yhteyttä

• Verkoston sosiomatriisissa on merkitty 1:llä, mikäli toimijaparin välillä vallitsee yhteys ja 0:lla, jos toimiparin väliltä puuttuu yhteys

• Nyt siis olemassa olevien yhteyksien summa saadaan yksinkertaisesti sosiomatriisin kaikkien alkioiden summana, eli tiheys ∆ määritellään

• Tämä tiheyden määritelmä pätee myös arvotetuille verkostoille)1(

11

−ΣΣ

=Δ ==

ggxij

gj

gi

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 28: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

SNA-tunnusluvut

KeskeisyysArvostus

28

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 29: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

29

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Yleisesti keskeisyydestä ja arvostuksesta

• Suuntaamattomille verkostoille ja sen toimijoille voidaan määrittää erilaisia keskeisyyden (centrality) tunnuslukuja

• Keskeisyys ei riipu verkoston yhteyksien suunnasta, vaan ainoastaan tarkasteltavasta toimijasta ja siihen liittyneistä yhteyksistä ja/tai koko verkostosta yleensä

• Suunnatuissa verkostoissa keskeisyyden tilalla käytetään käsitettä arvostus (prestige), joka huomioi yhteyksien suunnan

• Erotetaan toisistaan käsitteet ”olla arvostettu” ja ”arvostaa”• Arvostuksen tunnusluvuissa tarkastellaan nimenomaan yhteyksien

vastaanottamista eli arvostuksen kohteena olemista

Page 30: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

Keskeisyys

• Keskeisyyden käsite määritellään suuntaamattomille verkostoille• Keskeisyyttä voidaan kuvata seuraavilla tunnusluvuilla

• Keskeisyysaste (degree centrality)• Läheisyys (closeness centrality)• Välillisyys (betweenness centrality)• Informaatiokeskeisyys (information centrality)

• Suuntaamattomissa verkostoissa keskeinen toimija on osallisena monissa yhteyksissä

• Keskeisyyden kannalta ei ole väliä, onko toimija lähettänyt vai vastaanottanut yhteyden

• Keskeisyys on verkoston toimijaa ni kuvaava tunnusluku, kun taas koko verkostolle yhteisesti voidaan määrittää keskittyneisyys (centralization), joka on verkostosta toiseen vertailtava tunnusluku

• Keskittyneisyyden avulla voidaan kuvata, missä määrin yksittäiset toimijat hallitsevat muiden välistä kanssakäymistä yleisesti koko verkoston tasolla

30

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Page 31: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

Keskeisyysaste

• Toimijan ni keskeisyysaste CD(ni) kertoo, kuinka monta suoraa yhteyttä toimijalla on muihin toimijoihin (= asteluku d(ni))

• Toimijan aste ei itsessään ole kuitenkaan yleisesti vertailtava tunnusluku

• Kun asteluku skaalataan verkoston tasolla, voidaan toimijoiden keskeisyysasteita vertailla eri verkostojen välillä

• Normeerattu keskeisyysaste C´D(ni) määritellään

C´D(ni) = , missä g on verkoston toimijoiden lukumäärä

• Keskeisyysaste määritellään myös suunnatuille verkostoille, jolloin käsitellään erikseen vientikeskeisyyttä (outdegree centrality) ja tuontikeskeisyyttä (indegree centrality)

31

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

d(ni)g – 1

Page 32: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

Läheisyys ja välillisyys

• Läheisyys on toimijan ni lyhyimpien polkujen (geodeesien) summa ci kaikkiin verkoston muihin toimijoihin nj

• Itsessään summa ei ole vertailtava tunnusluku eri verkostojen välillä

• Verkostojen kesken vertailukelpoinen normeerattu läheisyys määritellään

C´C(ni) = , missä g on verkoston toimijoiden lukumäärä

• Toimijan välillisyys puolestaan mittaa, kuinka monen toimijaparin välisen lyhyimmän polun varrelle toimija sijoittuu

• Toimijan välillisyys on merkityksellinen tunnusluku mm. tutkittaessa verkoston toiminnan tehokkuutta

32

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

g – 1ci

Page 33: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

33

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Arvostus

• Kuten keskeisyyttä, niin myös arvostusta voidaan tarkastella eri tavoin

• Verkoston toimijoille voidaan määrittää seuraavat arvostukset• Arvostusaste (actor degree prestige)• Arvostusläheisyys (actor proximity prestige)• Arvoasema (actor status prestige, actor rank prestige)

• Koko verkoston tasolla voidaan määrittää verkostoa kuvaavia arvostuksen tunnuslukuja arvioimalla kunkin arvostuksen keskiarvoja ja variansseja

• Näistä keskiarvostusläheisyys ja arvostusläheisyyden varianssi ovat mielekkäimpiä tarkasteltavia verkostoanalyysin kannalta

Page 34: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

34

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Arvostusaste

• Toimijan ni arvostusaste PD(ni) määritellään yksinkertaisesti toimijaan kohdistuneiden yhteyksien summana

• Vertaa suuntaamattoman verkoston toimijan ni keskeisyysaste, joka määritellään toimijaa kuvaavan solmun astelukuna d(ni)

• Arvostusaste määritellään formaalistiPD(ni) = dI(ni) = Σj xij = x+i , missä dI(ni) on solmun ni tuontiluku

ja x+i on verkoston sosiomatriisin Xsarakesumma sarakkeesta i

• Jotta arvostusasteet eri verkostojen välillä olisivat verrattavissa keskenään, määritellään normeerattu arvostusaste P´D(ni)

P´D(ni) = , missä g on verkoston toimijoiden lukumääräx+i

g – 1

Page 35: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

35

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Arvostusläheisyys

• Toimijalle ni voidaan määrittää luku Ii, joka ilmoittaa, kuinka moni toimija nj voi saavuttaa toimijan ni

• Tämän toimijan ni vaikutusjoukon toimijoiden lukumäärän Iiavulla voidaan määrittää vaikutusjoukon toimijoiden keskimääräinen etäisyys toimijasta ni

• Toimijan ni arvostusläheisyys PP(ni) määritellään vaikutusjoukon osuuden koko verkoston toimijajoukosta suhteena vaikutusjoukon toimijoiden keskimääräiseen etäisyyteen toimijasta ni

• Arvostusläheisyys saa muiden normeerattujen tunnuslukujen tavoin arvoja välillä [0,1]

• Jos toimijalla ni on suora yhteys jokaiseen verkoston muuhun toimijaan, saa arvostusläheisyys arvon yksi

• Jos toimija ni on isolaatti (an isolate, isolates), vaikutusjoukon toimijoiden lukumäärä Ii nolla, ja arvostusläheisyys määritellään nollaksi

Page 36: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

36

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Arvoasema

• Edellä esitellyt arvostuksen tunnusluvut huomioivat vain toimijoita ja niihin kohdistuvia yhteyksiä

• Toimijan ni arvoasema PR(ni) on riippuvainen häneen päin yhteydessä olevien toimijoiden nj arvoasemista PR(nj)

• Edelleen taas toimijoiden nj arvoasemat ovat riippuvaisia näihin päin yhteydessä olevien toimijoiden nk arvoasemista jne.

• Arvoaseman määrittelyn taustalla on ajatus siitä, että toimijan niarvoasema on häneen päin suoraan yhteydessä olevien toimijoiden arvoasemien funktio

• Verkostossa, jossa on g toimijaa, toimijan ni arvoasema voidaan esittää sosiomatriisin X toimijaa kuvaavan sarakkeen alkioiden ja niitä vastaavien toimijoiden arvoasemien lineaarikombinaationa, ts.

PR(ni) = x1i PR(n1) + x2i PR(n2) + … + xgi PR(ng)• Arvoaseman määrittäminen vaatii syvällisempää ymmärrystä mm.

matriisin ominaisarvoprobleeman ratkaisusta• Myöhemmissä esityksissä perehdytään algoritmeihin, joilla verkoston toimijoiden

arvoasemat voidaan määrittää erilaisissa verkostoissa

Page 37: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

Esimerkki – Valtioiden kauppaverkosto 37

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

• Seuraavassa on esitetty 24 valtion kauppaverkosto (Wasserman & Faust 1994)http://matriisi.ee.tut.fi/~miilumak/sna/

Page 38: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

Esimerkki – Valtioiden kauppaverkosto 38

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

• Verkostosta määritetyt arvostuksen tunnusluvut (g = 24)

i VALTIO dI (ni) dO (ni) P (ni) P (ni) P (ni)123456789101112131415161718192021222324

AlgeriaArgentinaBrazilChinaCzechoslovakiaEcuadorEgyptEthiopiaFinlandHondurasIndonesiaIsraelJapanLiberiaMadagascarNew ZealandPakistanSpainSwitzerlandSyriaThailandUnited KingdomUnited StatesYugoslavia

13101115139121015914101796141417151215161915

4132121212922111411230111132223014222318

0,5650,4350,4780,6520,5650,3910,5220,4350,6520,3910,6090,4350,7390,3910,2610,6090,6090,7390,6520,5220,6520,6960,8260,652

0,6610,5990,6190,7100,6610,5810,6390,5990,7100,5810,6850,5990,7670,6010,5330,6850,6850,7670,7100,6580,7100,7380,8340,710

0,2220,8051,0000,7110,8180,1830,4820,1310,7580,0720,6170,6820,6800,0000,1060,4610,5250,6730,7650,0000,5890,6330,6440,680

MEANVARIANCE

12,9179,993

13,29267,955

0,5620,018

0,6680,005

0,5100,085

'D

'P

'R

Page 39: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

39

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Huomioitavaa

• On selvää, että keskeisyyden ja arvostuksen tunnusluvut tuovat verkostosta esiin seikkoja, joita ei tulisi huomanneeksi pelkästään verkoston graafia, matriisia tai muunlaista mallia tarkastelemalla

• Keskeisyyden ja arvostuksen tunnusluvut tarjoavat monipuolista tietoa verkoston toiminnasta ja antavat viitteitä siitä, kuinka verkostoa tulisi kehittää, oli sitten kyse tehokkuuden lisäämisestä tai esim. rakenteen parantamisesta

• Tunnuslukuja ei saa kuitenkaan pitää ainoina mittareina verkoston toiminnasta

• Graafit visualisointeina tarjoavat paljon hyödyllistä tietoa verkoston rakenteesta ja toiminnasta (aikasarjat, DNA – Dynamic NetworkAnalysis)

• Toimijoiden keskeisyydet ja arvostukset ovat vain osa suurempaa kuvaa

• Muutosten jälkeen tulee tarkastella verkostoa uudelleen, tulkita tunnusluvut uudelleen ja tarkastella oliko muutos hyvä vai huono

Page 40: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

40

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011

Lähteet

Johansson, J-E., Mattila, M. & Uusikylä, P. (1995). Johdatus verkostoanalyysiin. Helsinki: Kuluttajatutkimuskeskus. http://www.valt.helsinki.fi/vol/kirja/ (Viitattu 10.3.2011)

Knoke, D. & Yang, S. 2008. Social Network Analysis. Second Edition. Los Angeles: SagePublications.

Miilumäki, T. (2008). Graphs in Social Network Analysis And Modeling. Graafit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_-_Graafit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)

Miilumäki, T. (2009a). Matrices in Social Network Analysis And Modeling. Matriisit sosiaalisten verkostojen mallintamisessa. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_-_Matriisit_sosiaalisten_verkostojen_mallintamisessa.pdf (Viitattu 10.3.2011)

Miilumäki, T. (2009b). Social Network Analysis – Centrality And Prestige. Sosiaalisten verkostojen analyysi – Keskeisyys ja arvostus. Tampere: Tampereen teknillinen yliopisto, luentoesitys. http://matriisi.ee.tut.fi/hmopetus/hmjatko-opintosemma/2008/Miilumaki_Keskeisyys-ja-arvostus.pdf (Viitattu 10.3.2011)

Miilumäki, T. (2010). Web-pohjaisten sosiaalisten verkostojen analyysimenetelmät. Diplomityö. Tampere: Tampereen teknillinen yliopisto. http://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/6635/miilumaki.pdf.

Moreno, J.L. (1953). Who Shall Survive? Beacon, New York: Beacon House Inc.Ruohonen, K. (2006). Graafiteoria. Tampere: Tampereen teknillisen yliopiston opetusmoniste no. 5,

uusi sarja.Scott, J. (2000). Social Network Analysis. A Handbook. Second Edition. London: Sage Publications.Wasserman, S. & Faust, K. (1994). Social Network Analysis: Methods and Applications. New York:

Cambridge University Press.

Page 41: Thumas Miilumäki: Verkostoanalyysin peruskäsitteitä ja visualisointia - Graafit ja matriisit, keskeisyys ja arvostus

Verkostoanalyysi 2011, TTY – 11.3.2011

Kiitos mielenkiinnostanne.

Kysymyksiä?

[email protected]

41

Thumas Miilumäki – Graafit ja matriisit, keskeisyys ja arvostus11.3.2011