2011-07-23 popong politician network analysis

28
POPONG Politician Network Analysis 2011-07-23 Eunjeong L. Park Jooseoung Park

Upload: team-popong

Post on 25-Jan-2017

131 views

Category:

Government & Nonprofit


10 download

TRANSCRIPT

Page 1: 2011-07-23 popong politician network analysis

POPONGPolitician Network Analysis

2011-07-23

Eunjeong L. ParkJooseoung Park

Page 2: 2011-07-23 popong politician network analysis

2popong

Contents

1. 의안 정보 분석2. 의원 정보 분석

Page 3: 2011-07-23 popong politician network analysis

3popong

실험용 Raw data► 국회 의안 정보 시스템 - 제 18 대 국회 의안 중 처리 의안 1)

1.1. 의안 정보 설명

1) http://likms.assembly.go.kr/bill/jsp/main.jsp

Page 4: 2011-07-23 popong politician network analysis

4popong

► 의원 별 참여 의안에 대한 participation binary matrix 구성

• 단 , 의안 이름이 같은데 발의자 구성이 같은 경우 하나의 record 로 간주

► Case 분류 및 중복제거 : 총 6 가지 case 에 대한 분석 • 의원수 (n): 328 명• 의안수 (m):

1.2. 의안 정보 전처리

  의안 1 의안 2 의안 3 … 의안 m의원 1 1 0 0 … 1의원 2 1 0 1 … 0

… … … … … …의원 n 0 1 0 … 1

  전체 의안 노이즈제거 후 의안 1)

전체 3262 2856Accepted ( 원안가결 , 수정가결 ) 505 472Rejected ( 대안폐기 , 폐기 , 철회 ) 2757 2384상임위원회 2510 2497특별위원회 752 359본 회의 53 23

1) 공동발의자수가 150 명 이상인 경우를 제외

P(n,m) =

Page 5: 2011-07-23 popong politician network analysis

5popong

Similarity calculation: 세 가지 set similarity measure 사용

► 의원 간의 상관계수를 계산하여 그들간의 비유사성 (dissimilarity) 계산• Dissimilarity = 1 - Abs(Similarity)

► 위에서 계산된 비유사성을 이용하여 계층군집 알고리즘 적용• Single linkage(minimum distance) 사용

1.3. 데이터 분석

※ 계층군집 알고리즘• 각 개체 간의 비유사도를 기반으로 가장 가까운 것 두 개를 묶는다 .

• 묶은 개체 둘은 다시 하나의 개체로 간주하여 다시 앞 과정을 반복한다 .

• 앞 두 과정을 전체가 하나로 묶일 때까지 반복한다 .

Page 6: 2011-07-23 popong politician network analysis

popong 6

1.3. 데이터 분석

322326321320325317316311323312315295296304303302298297299301319324288289 3 77133 84128129168132206131248265237 64 19 22 45164 82260183160268283191224281192234200277278226193263256204 93195 79165171 86264244211262199205189 89127 75178 32197181217169100101238276 85152 23 98170187172 87 92273 99 81240 76 28 78 97279282184 90182233207 34 33257 94235210146130214 55 40294300 96159290 31307308 4 27 95253218145 80126 91313314318 1 2 9 16 70 74 6 13136 44140116185137196225255208201254186270153231194161158104 72 65232259243163251 62173 60220120 48250142 58216 67280167 83143223 71229245272269236179 69156144 29106246241188117202180258 50 20215162 61 63261110242177108141252239198139 49154112203 56 25209115 41285287 47174 54150113105266 35175166249103274190 53 42213 38149 46157 68228219122 37 52 12 21107222119 51267 26286109118 17135284176 11 24 73221102227111212155 5 30 43 39 7 18 8 15147247 57 36 10 66 14138275151230148271124134114327121125292291123305328306293310309 59 880

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Jaccard Similarity based Hierarchical Clustering Dendrogram (D9)

322326321320318315314313307300255325317316311186295265225196296304298324303302319310297299301208140137 44291221116185159328323312201254309 31290305 72270231161153 65 60308294293121125292259249131248237128129168132206214130 13136 62232166288104163243143167158 29 67194 22238 32197181 75199 33257191224281160268283 82260192200183234277 45164278263256193226 79204 93282171264 86195165244189211178169101127 98262 87 89100 94217205276 99 28152 85 97279182240 23 76 92273 78172210 34 90207170187 3 77133233123 81235120 71229245223251220184327 50 58216106 61 56280173117 19 84 64272269236 63102 53 48250142144180239252241267289 73246 41287141 6110242179261 20 49 69174306188105156202162258222139113198228108112203285 96 42103 25 46 51190 35177 54115227 21157 83215 68 30 5119122274146150154 91 47149175 1 2 9 16 70 74 43 39 8 7 15 10284 37 40266118 24107 17109 11 12 88 26209219135111247286213 38 18 59 36 57155212 52176147 66 55 4 14126134138275151230148271 27 95253124 802181451140

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Jaccard Similarity based Hierarchical Clustering Dendrogram (D10)

327328310309306293 31 59291292305126121125123 88313314318 1 24257 80 73102214159 96221227290 2 7287 9 11 17 18 13 20 21 14 5 25 26 16286285284280275274272 35271 37 38270269 41267266 44261 46 47 48 49 50 51 52 53 54259 56 57 58258 60 61 62 63255 65 66 67 68 69 70 71 72254 74252251250246245243242241 83239236232231230229228225223222220219213212209208203202201103104105106107108198110111112113114115116117118119120196122194124190188186185180179177176174173135136137138139140163142143144158157147148149150151156 19283152 22 23171172 27 28160 32169178281278181182277184273164187165189268191192193 45195264197263199262256 76 75204205253 78101100 79211 99 98 81244 82217218 85240 86 95238224 93226 87 92234 90 89170260276 97183153215 39216154161 6 8247 10155 15 29 36 43162 42175141167109127200 3168265237133 84131132129128145 64248206 77279 12166134249207282 30 94210235233 4289 40 55 34288295296302303304297299301298146319324315311312316317320321322323325326 33130 913083072943000

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5Jaccard Similarity based Hierarchical Clustering Dendrogram (D11)

327328326 1 2 3325 5 6 7 8 9 10 11 12 13 14 15 16 17 18323 20 21322321 24 25 26320318 29317 31316315314 35 36 37 38313312 41 42 43 44311 46 47 48 49 50 51 52 53 54310 56 57 58309 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74308307 77306300 80295293 83 84290288287 88286285 91284280275274272271270269267266102103104105106107108265110111112113114115116117118119120261122259124258257255128129254131132133134135136137138139140141142143144145252147148149150151251250248155156157158159247246162163245243166167168242241239237173174175176177236179180233232231230185186229188228190225223222194221196220198219214201202203213212206209208 4 19324 22207211204 23 28217218205199197195200224193226 27191189192187184 33234319182178238181240172171169244 32165164160 34 40 45152253146 76256 55127125 59123262263264121 75126268101100 99 98273 79 96 78277278 82 95281282283305 92 93 89 90289 87291292 86304 85296297298299 81301302303210183294 94276 97235279170260216154249 30 391301531612272151090

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

Jaccard Similarity based Hierarchical Clustering Dendrogram (D12)

314318313 1 2 6 7 9 13 48 65158201232255259161229254249225196270274231 71186280 67185116269137241143104188284 72287 83208103173166179110107198 16105272167 60153216 41250194215245221144 37108246180140 44 49150243 69222 35 63220261162239136117 74251 30142 68120236258 73 70 8177163156 56 58252242267 50 5141 20266 15106227102111115113285174213190109202 39203286 61 53 29154228175 47 62112119209157 10 24139219 46223 43 54 25149 17118 52 12155 26 11176135212 42 21147247 38122 51 18 36 57 14134275138151230271148124114 66 4 27 95253218126 80145 3128 77129132133206237248265131 32100204256 98 79 82191192224260276164183200283234262 86160264165278 93240170281257207263 85197195 33 90268168211217130233199238 84295296303298302324319205226304 92273244189282127297299301 22 76182 64 99152171214 75169181277193 87 19 97279311312315320321322326316323325317101 45210187 23178 89 94 81172 28 78235184290288 34300289 96159 55121123125292291305 40146294 59 91307308 31 882933093103283063270

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Jaccard Similarity based Hierarchical Clustering Dendrogram (D1)

318322314313300328315321320255316326307201159 3128 77133130129132214233206168131 84 64237248265232259158 4 14 95134275138151253230271126218148 80124 27145114121123125292291305311 96 1 18 57122 59 66 36 40 21 50 56239 61252106118 58216269176247 53267155 6 44251156116221119243 83231254194113198284228266115272 42 7 16 9 70 74 37 43109111274 47149179 10 19 32100204256 98 90197 76182281210238 75169181 92273244282189127171268 87178 33 82191192257224260276164200183234264160283 86262165 93240195207263278199211217 79 85170205193 97279 22152 99 45277 94101187290 23 89 78 28226172 81235 34184296298302319303317323325324304 13173 17 25 46104144136140 29236163209112141157 62150142120137186220147227108139203 8 15 2 51 52 38153 71105117143167208162219241 54261 91212 39 72250 88110 26312310 67288 11 12223177294 24285190 69 41287175 31215 65146306 30135202174196225 5213102180229245161293280 73309249 63 60107327 49185103222154 48188258286242289 68308 20166246 35 552972993012702950

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Jaccard Similarity based Hierarchical Clustering Dendrogram (D2)

323326322320325321317316312311315295296298304303302297301299319324 3 7 9 16 74 70 22 82234276191192160283278224260240254255164 84237248265206201196165 85281232259280269263186 48216199231132129131270161 93 71187 45 99 86 79 67274185183158 72 83262 75204225 60229 63110100200105268 97277250193107101 32 56 65120137104239173172169238 58143241261116 49156198205181 98272195144287170140284264 41194217256 69215211189108246 44208142 81 37243 28207285150233117 92273244 89 23 77136 64128179220115152180168153188252197226106103162190163127171167209 62 39 50202245258236279251174286213 87 11141182 13222178177111 78 68249 76 61154 35 90288 5 6267 52 53242 20 17 15228157266113 8 46 21184 2282223 55 43175 10133109219118176 47149119 94166146203139112135 29212289 54 18 25210 19122 26155 51247147235 40 42 57 34 33 96159257214221130 30 38 36 12 66 24294300 73 31307309310308313314318327328293305121292123125291290102227 1 88 4 14 27 95253218138275230151271124145134148 80126114306 91 590

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

Jaccard Similarity based Hierarchical Clustering Dendrogram (D3)

326327323322320318315314313300248328325321191317316312307310309257255303 82234276159192311237308160283298304296295293278265224260240294164207 31324319305302297301299291259280254232201169125123 84206 96268 85 79 22199181216269165 99185161205 93187200101 48 67 92273244127217170105 45 98 32100121292204281277263233274158195197 86132 75 77129131290231214210193 71173256225189282 58 89262196 83 37243 28172238107 76 90182 33 7 9 16 74 70 39198 78264110183 24104140144120137249136142 65141143 63 97229 10241239 81284 1162208152180 43 87171186272270 11167 62163209150221116 44 94 3168 69279117194211 34146219178 50252 64226190236 49 72250 23 56 2128130133 41287156202154188115 20306 15 61 13245235 68111179 8 30177215 60251 6 17 46 53267113228 25 42118 88149 47 29223153266103 19220285157108261139122 5106174 18112 26135147166212 21109288 55175286 66247176 40 91289 59258246184242 51 38119 52102203 35 54155213222 57 36 12 73227 4 27 95126253218275138230134151 80271145124 141481140

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Jaccard Similarity based Hierarchical Clustering Dendrogram (D4)

314318313328322321315320316326300311307312 1 2 6 7 9 13 16 48 65158232255259201161249229274225254231270196 71 67186104280185116166137188221143269284287241103167208179173 83 72272110144245198153 41107105 60140 30136 73194180222 37250215216 35243108246 44150 74227251 69142 49220162 68102 8117236261258 63120177239 70267242141163 20 15266 5156 56 50252 58111113106115 39109203174 29213285202112154190286 53 61 47228 62175119 10209 24139 43157223 25219 54149 46118 12 26 17155 52 42176135212 11 14134275138151230271148124114 38147247 21122 51 18 36 57 66 4 27 80 95253218126145121123125292291305 3128 77133129132214130206233168 84 64237248265131 19 32100204256 98197 90 76182210281238 75169171 87 92273244189282127181 33 82191192257224260164276183200264283234 86262160207165 93240 79211217195263170278290 94178205152268 85193199 97279277226 99 45 23 22101187 89 78 81172 28235 34184296303323325298302319317324304 59 31294 91 96159 40146308 88327306297299301293310309295289288 550

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Jaccard Similarity based Hierarchical Clustering Dendrogram (D5)

318322314313328300321315255320307232316326265237248259158 3128 77133129132214130206233168 84 64131327311201312296323325303317298302319324 4 14 95134275138151253230271126218148 80124 27145114121123125292291305 19 32100204256 98197 90 76182210281238 75169171 87 33 82191192257224260164276183200264283234 86262160207165 93290240170195278 79211217263 94 92273244189282127181205268178 85152193199 97279277226 99 45 23 22101187 89 81 78172235 28304 34184310159 96161 18 57 59 66122 36 21 50 56239 61252106118 58216176269306 40 1155108139203 47149 31309297299301 53267250110247147 72212 54 13173136 17 25 46227 30186220177 6 44251221156 83116231254119243153194113198284272115228266190 65 42 67105117143167208162219241261288 24 91308 43109111 51 52 38 11 12223 29236112141163209157215 71202285274294196225 26 60 7 9 16 70 74146245175 8 15280293 10 48213287179 62150 73188 37135 49174140 63 2142222229104144 5137249 69120180258185 41 88154286246270242107166 35295102103 68 55 20 392890

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Jaccard Similarity based Hierarchical Clustering Dendrogram (D6)

318328314313322315321320316326300312311327307309310 1 54 2 5 6 7 16 48158232259255201161229274249284280198 83231254116225 71270 65 67196 44251221272156216269185105117143167208241162 58153 56239 61252106107104144136140137219118186220194287142119243110 72250 30188103267 13173120261 50 53112141111179113 37115176180157 9109 74228266166177 69 17 25 46 29163236215209 62150245213 70 43 60202 41108139203 21 18 57122 66 59258222 36 49 42 8 26190 63 39 68 11 12223147174 47149 10247 15102155 24242 38 35 73227175212285154 3128 77133130132129233214131206168 84 64237248265 4 14 95134275138151253230271218126148 80124 27145114121123125292291305246 51 52135 40 20288 19 32 98100204256 90197 76182210281238 92273244282189127 75169171268178181 87 33 82191192257260224276164264183 86234200160283262240165 93207195290278263170152193 85 79199211217 99205277 45 23 94 97279 22 89101187226235 78172 81 28296303317323325298302319304184 34324 91286294308146 88 96159306293289295 31297299301 550

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Jaccard Similarity based Hierarchical Clustering Dendrogram (D7)

322328318314313300315321320255327316326307201 3128 77133130132129233214131206168 84 64237248158232265259 4 14 95134275253138151230218271126148 80124 27145114121123125292291305312311161 1 18 57122 59 66 21 36 50 56239 61252 58106118216269176 40 42 53267250 72113228266198284272 54247274139203155115 6 44251156119243116 83231254221194153108 47149 91 19 32 98100204256 90197 76182210281238 92273244282189127 75169171268178181 87 33 82191192257260224276164264183 86234290200160283240 93165262195207278263193152170 79199211217 99 85205277 23 45 97279 89 22101187 94235226 78172 28 81296303317323325298302319304184 34324 11 12223 13173 17 25 46147 29236163209 62150104144136140112141157142137110120186220 26 30 71105117208143162219167241261 43109111179 38212288213294215 69309310 88 65 63 24227306 51 52177135285202190 73196225146174102175245229 9 48280 10180 15 7 16270 2249 96159 70154308 49 60242289188222 37 74 39 67 41287293258 8 5 20 35185166107 31297299301286246 68 552951030

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Jaccard Similarity based Hierarchical Clustering Dendrogram (D8)

전체 Accepted

Rejected 상임위

특별위 본회의

Page 7: 2011-07-23 popong politician network analysis

7popong

Contents

1. 의안 정보 분석2. 의원 정보 분석

Page 8: 2011-07-23 popong politician network analysis

8popong

보유 데이터2. 의원 정보 분석

Page 9: 2011-07-23 popong politician network analysis

9popong

Network for members► Bills can be used

• After filtering bills having more than 150 proposers• The set of bills

– All bills – Accepted bills– Rejected bills

– 상임위원회 소관 bills– 특별위원회 소관 bills– 본회의 소관 bills

2.1. 의원 네트워크 구축

  전체 의안 노이즈제거 후 의안 1)

전체 3262 2856Accepted

bills 505 472Rejected

bills 2757 2384

상임위원회 2510 2497특별위원회 752 359

본 회의 53 23

Page 10: 2011-07-23 popong politician network analysis

10popong

Network for members

2.1. 의원 네트워크 구축

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

0 5 10 15 200

0.2

0.4

0.6

0.8

1

전체 Accepted

Rejected 상임위

특별위 본회의

Page 11: 2011-07-23 popong politician network analysis

11popong

Network for members► Using similarity matrix

• Calculated with all bills except having more than 150 proposers

► Using Spotfire

► Connected Component• Most simple clustering in network analysis

► Betweenness• Betweenness is a centrality measure of a vertex within a graph. Vertices that

occur on many shortest paths between other vertices have higher be-tweenness than those that do not.

2.1. 의원 네트워크 구축

Page 12: 2011-07-23 popong politician network analysis

12popong

2.1. 의원 네트워크 구축

Filter Settingsjacc_all_filtered- Column 3: (0.30 <= Column 3 <= 1.00) without empty values

Page 13: 2011-07-23 popong politician network analysis

13popong

2.2. “18 대 국회 한 눈에 보기” – 여러 의원에 대하여

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 180

50

100

150

200

250

300

350

0 0 0 0 0 0 0 0 1 1 2 3 7 1841

71

130

296

선거구 -18 대국회의원 상임위원회 -18 대국회의원

국토해양위원회국방위원회

법제사법위원회

국회운영위원회

지식경제위원회여성위원회

보건복지위원회

환경노동위원회0

10

20

30

40

50

60

5047 46 45 44 43

3532

28 2722

0 0 0 0

국회 회차 -18 대국회의원

경기 부산 경북 인천 전북 강원 충북 울산 비례0

10

20

30

40

50

6051

46

18 17 15 12 12 11 11 10 8 8 8 6 6 3

54

한나라당 민주당자유선진당

미래희망연대민주노동당

창조한국당국민중심연합

진보신당 무소속0

20406080

100120140160180 169

87

16 8 5 2 1 1 7

정당 -18 대국회의원

Page 14: 2011-07-23 popong politician network analysis

popong 14

2.2. “18 대 국회 한 눈에 보기” – 여러 의원에 대하여

1 2 3 40

50

100

150

200

250

66

194

32

4

1 2 3 4 5 6 70

50

100

150

200

250

143

80

42

206 4 1

참여 상임위원회 수 - 18 대국회의원 참여 상임위원회 수 - 18 대국회의원

Page 15: 2011-07-23 popong politician network analysis

15popong

Ex:

► 국토해양위원회 (?)

► 정무위원회 (?)

2.3. 상임위원회별 분석

중산층 시민 낙동강 국토 복지 4 대강 공사현황 영산강 … .

발의 의안 보기

발의 의안 보기

국무총리실 날치기 감사 저축은행 브리핑이상득 질의 동래구 …

해당 상임위원회의 역할을 간단히 설명

해당 상임위원회의발의 의안의 처리 현황을 한 눈에 볼 수 있게 정리

해당 상임위원회의발의 의안의 핵심어 (as if tag cloud)

해당 위원회의 핵심 인물들 ( 영향력 순 )

Page 16: 2011-07-23 popong politician network analysis

16popong

의원 i 의 발의 의안의 통과 확률► billPassMat(i) = P(i,:) x B(:, 4)

• Where P=(participation binary matrix), B=(bill matrix)

► 통과확률 = billPassMat {1,2}/billPassMat {1,2,3,4,5}

2.4. 의원별 분석 – 각 의원에 대하여

의결결과1: 원안가결2: 수정가결3: 대안폐기4: 폐기5: 철회

  의안 id 제안일자 의결일자 의결결과 IF …의안 1 181269

92011-05-

112011-07-22 1 0.45 …

의안 2 1246819

2011-04-24

2011-07-22 2 0.64 …

… … … … … … …의안 m 126662

62011-03-

222011-04-21 4 1.54 …

B(m,p) =

원안가결 수정가결 대안폐기 폐기 철회

Page 17: 2011-07-23 popong politician network analysis

17popong

Various Indices► Centrality, Prestige 등의 network influence measure

► Activity• 각 의안의 impact factor

► Diversity► Sociability► Tolerance► Durability or Recency (?) 등 시간을 고려한 index

2.4. 의원별 분석 – 각 의원에 대하여

Page 18: 2011-07-23 popong politician network analysis

18popong

► Network influence measures : ‘Centrality’• Degree Centrality: [0,1]

• Closeness Centrality: [0,1], xi is central if it can easily interact with all other actors (i.e., distance is short)

• Betweenness Centrality:

2.4. 의원별 분석 – 각 의원에 대하여

𝐶𝐷(𝑖)=¿ ¿¿

1

1( )( , )

C n

j

nC id i j

(measured as the no. of links in a shortest path)

( )( ) jk

Bj k jk

p iC i

p

𝑝 𝑗𝑘=𝑛𝑜.𝑜𝑓 h𝑠 𝑜𝑟𝑡𝑒𝑠𝑡 h𝑝𝑎𝑡 𝑠𝑏𝑡𝑤𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑗𝑎𝑛𝑑𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛𝑘𝑝 𝑗𝑘 (i )=𝑛𝑜 .𝑜𝑓 h𝑠 𝑜𝑟𝑡𝑒𝑠𝑡 h𝑝𝑎𝑡 𝑠𝑏𝑡𝑤𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛 𝑗 𝑎𝑛𝑑𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑖𝑎𝑛𝑘 h𝑡 𝑎𝑡 𝑝𝑎𝑠𝑠𝑖

[0, 1]

( ) 2' ( )( 1)( 2)

jkB

j k jk

p iC i

p n n

[0, (n-1)(n-2)/2]

Page 19: 2011-07-23 popong politician network analysis

19popong

► Recent Activity• IF(b) = 의안 b 의 impact factor 계산 : how? •

– Where =0.75 (?)

2.4. 의원별 분석 – 각 의원에 대하여

( ((18( )recency b

오늘날짜)- 발의일)대국회의전체기간(일))

( ) ( , ) ( ) ( )b B

Activity i P i b IF b recency b

(?)

Page 20: 2011-07-23 popong politician network analysis

20popong

Diversity► Calculate committee distribution based on

► Diversity is defined as the entropy of this distribution

2.4. 의원별 분석 – 각 의원에 대하여

A# of bills of A belong to committee comP (com) = # of all bills of A

A Acom all committee

Diversity(A) P (com)logP (com)

Page 21: 2011-07-23 popong politician network analysis

21popong

Sociability► The score of sociability is basically defined based on how many co-pro-

posers a representative proposer has

►  #co-billsc denotes the number of bills co-proposed between the repre-sentative proposer and the coproposer c

2.4. 의원별 분석 – 각 의원에 대하여

ceach co-proposer(c)

)Sociabilty(A) = 1 + ln(#co-bills

Page 22: 2011-07-23 popong politician network analysis

22popong

Tolerance► The measure of how strong belief a proposer has

► 자신의 소신에 따라 의안을 발의하는 것과 대표 발의 자와 다른 정당 소속인 것이 과연 연관성이 있는가 ?

► 발의 의안 자체의 수가 매우 작은 경우 tolerance 가 급격히 커질 수 있음• 발의 의안 수가 매우 작은 의원의 경우 tolerance 가 작아지도록 ?• 혹은 해당 의원의 발의 의안 수를 함께 보여줌으로써 사용자 판단에 ?

2.4. 의원별 분석 – 각 의원에 대하여

# of bills that the representative proposer belongs to other party# of all bills of A

Tolerance(A) =

Page 23: 2011-07-23 popong politician network analysis

23popong

Durability► The measure of how frequently a proposer keeps proposing► The number of proposed bills a day

• 날짜가 생각보다 연속적이지만 의원 별로 봤을 때는 어떻게 될 지 모르겠음

2.4. 의원별 분석 – 각 의원에 대하여

0

50

100

150

200

250

300

350

Page 24: 2011-07-23 popong politician network analysis

24popong

Durability► 의원 별 의안 발의 사이 기간 (interval) 에 대해 계산► Interval 의 분포를 이용하여 , 혹은 statistics 를 이용하여 durability 값을 설정

► 얼마나 꾸준히 의안 발의에 참여하는지에 대한 정보를 포함해야 함• Median• Average• Standard deviation• max – min

• Interval 의 분포의 average 혹은 median 을 계산하여 이를 exponential 의 모수로 설정

• 몇 % 의 확률로 며칠 후에 또 발의를 할 것인가 에 대한 계산도 가능할 것으로 사료됨

2.4. 의원별 분석 – 각 의원에 대하여

Page 25: 2011-07-23 popong politician network analysis

25popong

Et cetera► 최근 해당 의원의 관심사

• Do you want to see the change of his/her research interests?

► What else…?

2.4. 의원별 분석 – 각 의원에 대하여

Page 26: 2011-07-23 popong politician network analysis

26popong

이건 우리 전문은 아니지만… plan?► ‘ 열려라 국회’에서 크롤링된 데이터를 기반으로 하되 , 보다 table 로 깔끔하게

정리되어 일관된 데이터 형태를 추구• 향후 보다 다양하고 편리한 데이터 분석을 위함

► Meaningful Variables

• What else…?

2.5. 의원별 DB 구축

개인정보 의원번호 한문이름 출생지 홈페이지 재산내역 트위터 id

학력 고등학교 대학교 대학원 (n 개 )

정치활동 상임위 (16 개 ) 의원당선 (18회 ) 정당 선거구

의정활동 본회의출석 본회의발의기타경력 경력 (n 개 )

최근소식 관련뉴스네트워크 -

Page 27: 2011-07-23 popong politician network analysis

27popong

의원별 DB 구조► 의원번호 : 역대 국회의원 이름 크롤링 → 의원별 일련번호 지정

• 이름 중복을 처리하기 위한 key• Ex: 강기갑’ s id = 1024

► 학력• 고등학교 , 대학교 , 대학학과 DB 등 필요

► 정치활동• 선거구 : “ 성남시 분당구 갑” vs “ 광주시” 등 어떻게 저장할 것인지의 문제

► 기타경력• 활동분류 | 활동내용 | 시작일 | 마감일

2.5. 의원별 DB 구축

약간의 -_- 노가다 필요

Page 28: 2011-07-23 popong politician network analysis

28popong

어쨌든 결론► DB 는 분석하기 쉬워야하고 ► DB 에서 끌어낸 분석의 인터페이스는 ‘의미있는 정보만’ ‘한눈에 보기 쉽게’ 담아야 할 것

2.5. 의원별 DB 구축