박근혜 탄핵 촛불 빅데이터 분석

12

Upload: han-woo-park

Post on 19-Mar-2017

321 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Page 1: 박근혜 탄핵 촛불 빅데이터 분석

* 이 <한국자료분석학회> 논문과 관련하여 참고하세요.

동영상. 방송 인터뷰 https://www.youtube.com/watch?v=5U5We3kKzKg

신문 기고. 촛불 집회의 특징과 새로운 소통방식

http://m.yeongnam.com/jsp/view.jsp?nkey=20170124.010290811050001

2016년 촛불집회의 페이스북 댓글 데이터를 통해 본 하이브리드 미디어 현상

이연옥1, 박효찬2, 박한우3, Randy Kluver4

요 약

2016년 가을, 케이블방송의 종합편성채널 JTBC의 특종보도를 발단으로 ‘최순실 게이트’로 명

명된 정치 스캔들이 터지자 전례 없이 많은 수의 시민들이 박근혜 대통령의 퇴진을 요구하며 전

국 곳곳에서 촛불집회를 열었다. 본 논문은 JTBC 공식 페이스북 페이지에 올라온 라이브 뉴스와

이에 반응하여 시민들이 생성한 텍스트 데이터를 수집, 네트워크 분석, 시각화하였다. 댓글에 대

한 주목도, 댓글에 포함된 특정 단어의 사용 빈도, 댓글자의 프로파일, 시간의 경과에 따른 댓글

자들의 이동 현황을 추적하였다. 계량적 분석결과를 바탕으로 이번 촛불집회가 이전의 시민 정

치참여와 어떻게 달랐는지, 미디어의 위치와 역할은 무엇이었는지 그리고 그것이 시사하는 바가

무엇인지를 고찰하였다. 이를 통해 2016년 촛불집회는 온라인 공간과 오프라인 공간, 그리고 매

스 미디어와 소셜 미디어가 긴밀하게 얽힌 가운데 탄생한 것임을 실증적으로 확인할 수 있었다.

즉 이번 촛불집회는 전통적 뉴스매체와 소셜 미디어가 한쪽이 다른 쪽을 대체하는 관계가 아닌,

사안에 따라 경쟁하기도, 공조하기도 하면서, 그 과정에서 서로 협업하는 ‘하이브리드 미디어’

현상을 지녔다.

주요용어 : 촛불집회, 시민 참여, 페이스북, 하이브리드 미디어, 댓글, 네트워크 분석.

1. 서론

박근혜 대통령 주변의 이른바 ‘비선실세(秘線實勢)’에 대한 의혹은 제기되어 왔으나 사회적으로

크게 주목받지 않았다. 그러던 중 2016년 10월 24일 케이블 채널 JTBC의 간판 뉴스 프로그램 <뉴

스룸>에서 박 대통령의 최측근으로 알려진 최순실이 버리고 간 태블릿PC를 입수하여 국정에 개입

1영국 소아스 런던대학교 교육자문위원. E-mail : [email protected] 경북 경산시 대동 214-1, 영남대 사이버감성연구소 연구원. 디지털융합비지니스학과 석사과정. E-mail: [email protected](교신저자) 712-749 경북 경산시 대동 214-1, 영남대 사이버감성연구소 소장. 언론정보학과·디지털융합비지니스학과 교수. E-mail : [email protected]미국 텍사스 A&M대학교 커뮤니케이션학과 교수. E-mail : [email protected]

Page 2: 박근혜 탄핵 촛불 빅데이터 분석

한 증거를 포착, 단독보도하자 상황은 급격히 달라졌다. 대통령은 이례적으로 바로 다음날 대국민

사과문을 발표했으나 사안의 위중함을 무마하기에는 역부족이었다. 사회 각계각층에서 시국선언문

을 내놓았으며, 보도 후 첫 번째 토요일인 10월 29일에는 대통령의 퇴진을 촉구하는 촛불집회가

곳곳에서 열렸다. 집회는 매 주말로 이어졌고 참가인원의 규모는 점점 커졌다. 결국 12월 9일 국회

는 박 대통령 탄핵안을 가결하기에 이르렀다.

촛불집회는 한국사회에서 정치 의사를 표현하는 중요한 방식의 하나로 자리매김했다. 이러한 인

식에 결정적인 역할을 한 것은 2002년 여름 미군의 장갑차가 낸 사고에 목숨을 잃은 두 여중생을

추모하고 책임자의 처벌을 촉구하던 촛불집회였다. 이후 2004년 노무현 대통령 탄핵안 무효를 주

장하기 위해 모여든 시민들도, 2008년 광우병 위험이 있다고 알려진 미국 쇠고기의 수입을 반대하

며 모여든 시민들도 촛불을 들었다. 그리고 이제 다매체 시대의 도래와 함께 거듭된 진화의 모습

을 보이고 있다. 2016년의 집회는 무엇보다 기존의 메이저 언론이 시민들의 관심사와 핵심 의제에

제대로 대응하지 못하는 상황에서 새로운 소통방식의 경험을 제공한다는 점에서 이전의 경우와 차

별성을 갖는다(Won, 2016). 본 논문은 이 차이점을 보다 구체적으로 이해하고 나아가 그것이 시사

하는 바를 고찰하는 것을 목적으로 한다.

2. 이론적 분석틀

2016년의 촛불집회는 8, 90년대까지 이어지던 민주화 운동과 방향성은 공유할지언정 방식에 있

어서는 확연한 차이점을 보인다. 다양한 연령층과 사회계층을 아우를 수 있고 개개인의 참여와 철

수가 자유로운 방식을 추구하는 것은 촛불집회의 가장 큰 특성이다. 그리고 허브 없이 분산형 네

트워크를 기반으로 진행되는 것은 우리나라에 국한된 것이 아니라 21세기 시위 형태의 세계적 추

세이기도 하다. Bennett와 Segerberg는 이러한 추세를 ‘집단적 행동(collective action)’에서 ‘연결형 행

동(connective action)’으로의 변화라고 정리하였다(Bennett, Segerberg, 2012). 즉 과거에는 정체성을

공유하고 함께 움직이는 것이 핵심이었던 반면 이제는 개개인이 디지털 기술을 이용하여 본인들의

기호와 여건에 맞는 형태로 연대하는 것이 중요해졌다는 것이다. 구체적으로 스마트폰과 SNS의 출

현으로 관계 맺기와 말하기는 빨라지고 쉬워졌다. 다른 사람들과 만나서 대화하고 접촉하는 것은

태도와 행위의 변화에 모멘텀을 제공한다. 이번 촛불집회는 TV에서 만나는 기자, 연예인, 정치인뿐

만 아니라 옛 친구, 직장 동료, 이웃 주민과 만나는 채널이 되었다. ‘정치적 올바름’(politically

correctness)을 부담스럽게 생각하던 사람들이 ‘문화제’로 자리매김한 촛불집회에 상대적으로 편하게

나올 수 있었다.

연결형 행동을 가능케 하는 디지털 기술이라 함은 여러 장르와 도구를 아우르는 포괄적 개념이

지만 개인간 연결에 무엇보다 큰 역할을 하는 것은 소셜 미디어를 통한 콘텐츠의 발행과 공유이

다. 뉴스가 시민의 실시간 화젯거리에 포함되려면 ‘밈’(meme)이 필요하다. ‘밈’이란 누구나 쉽게 이

해하고, 변형하고, 복제하고, 퍼트릴 수 있는 문화적 요소이다. 예컨대 ‘강남 스타일’의 성공도 유

튜브 이용자들이 자발적으로 참여할 수 있는 ‘밈’이 있었기에 가능했다. 다수의 관심과 힘을 모으

는 과정에서 공유에 용이한 콘텐츠가 각광받는 이유이기도 하다(Jenkins, Ford, Green, 2013). 현 시

국에서도 청문회의 발언을 바탕으로 하는 패러디와 촛불집회 시민 연설 등이 편집되어 확대·재생

산 되고 있다. 또한 청문회에 네티즌의 제보가 실시간으로 반영됨으로써 이전과는 다른 양상이 펼

쳐지기도 했다.

이렇다 보니 정치 정보의 유통 과정에서 소셜 미디어의 역할이 과대평가되는 경우도 있다. 이에

대해 연구자들은 매스 미디어로 대표되는 구(舊)미디어와 소셜 미디어로 표현되는 신(新)미디어 간

Page 3: 박근혜 탄핵 촛불 빅데이터 분석

의 상호작용이야말로 우리 시대 미디어 환경을 이해하는 열쇠라고 보았다(Chadwick, 2013; Kim,

Lee, Park, 2016). Chadwick은 이를 ‘하이브리드 미디어’라는 용어로 표현하면서 전통적 뉴스매체와

소셜 미디어는 한쪽이 다른 쪽을 대체하는 관계가 아닌, 사안에 따라 경쟁하기도, 공조하기도 하는

관계이고 그 과정에서 서로를 닮아가기도 한다고 설명했다.

스마트폰을 통한 뉴스 소비와 이용이 보편화되면서, 사람들은 올드 미디어와 SNS가 복합된 하

이브리드 미디어 현상을 쉽게 체감하지 못할 수 있다. 하지만 그 이면을 해부해 보면, 스마트폰으

로 뉴스 접근과 유통이 일원화되면서 미디어 환경의 하이브리드화가 오히려 심화되어가고 있다.

올드 미디어는 지금까지 편지와 전화에서 웹 1.0 시대는 이메일과 게시판 등을 통한 비동시적 채

널을 이용하였다. 반면 웹 2.0 기술과 모바일 미디어가 통합되면서 SNS는 세분화되고 전문화된 기

능을 갖추게 되었다. 따라서 올드 미디어는 뉴스 이용자들과의 동시적 쌍방향 소통이 과거와 비교

할 수 없을 정도로 편리하게 되었다. 나아가 1인 1스마트폰의 시대에서 시민 누구나 뉴스의 생산

자와 평가자가 되면서, 기성 언론의 기자들도 뉴스룸을 벗어나 사건과 사고의 현장에서 뉴스의

(재)구성과 (재)선택을 수행할 수밖에 없는 상황을 만들었다. 한국의 2016년 촛불집회야말로 위의

묘사에 꼭 들어맞는 사례라고 할 수 있다. JTBC의 특종이 많은 사람들을 거리로 나오게 한 계기가

된 것은 사실이지만 그것만으로 촛불집회의 동력을 설명하는 데에는 한계가 있다. 따라서 본 논문

은 JTBC의 공식 페이스북 페이지 상에서 시민들이 생성한 데이터를 수집, 분석하여 그들의 정치참

여가 어떤 식으로 이루어졌는지 그 전개 과정을 다각도로 이해하고자 한다.

3. 연구방법: 데이터 수집과 분석 기법

이 논문에서는 ‘JTBC 사회부 소셜 스토리 페이스북’ 페이지 계정의 라이브 뉴스와 관련 댓글을

수집대상으로 하였다(Figure 1). JTBC는 이번 촛불 집회의 도화선이 된 최순실 게이트를 심층 보도

한 종합뉴스편성 케이블 채널이다. TV 시청자들이 뉴스 등을 보면서 동시에 그 프로그램에 관한

의견을 온라인에 피력하고 토론하는 것은 ‘세컨드 스크린 시청’이란 용어가 생겨날 만큼 자연스러

운 현상으로 자리잡았다(Anstead, O’Loughlin, 2011; Han, Lee, 2013; Heo, Park, Kim, Park, 2016;

Kim, Lee, Park, 2015). 페이스북에서는 방송사 홈페이지나 블로그 형태의 토론 공간에서보다 다양

하고 많은 사람들이 실시간으로 상호작용할 수 있다는 강점이 있다(Park, Park, 2014, 2015). ‘촛불’

을 검색어로 구글에서 검색했을 때도 JTBC의 소셜스토리 페이지는 가장 첫 번째 결과로 등장하였

다. 단, 트위터와 다르게 페이스북 개인 계정에 게시된 포스팅과 댓글은 공개적 접근대상이 아니기

에 분석에서 제외하였다.

이 논문은 소프트웨어를 이용한 데이터 수집과 네트워크 분석을 바탕으로 하였다. 전통적 관찰

법과 비교하면, 소프트웨어를 이용한 네트워크 분석 기법은 연구자의 주관적 편견이 개입할 가능

성을 상대적으로 줄이면서 분석 대상들 사이에 존재하는 연계를 계량적으로 파악할 수 있는 장점

이 있다(Jang, Park, Park, 2014).

페이스북과 같은 소셜 미디어 플랫폼에서는 댓글로 남겨진 텍스트뿐만 아니라 이용자 개개인의

이용패턴 자체가 매우 중요한 피드백 데이터이다(Chadwick, 2009, Cho, Kim, Chun, 2016; Kim, Jin,

2013). 따라서 이 논문에서는 4가지 유형의 ‘N’데이터를 수집하였다. 첫째, 라이브 뉴스의 조회 수

를 파악하였다. 조회 수는 주목도(attentioN)를 측정할 수 있는 기본적 지표이다. 다음으로 라이브

뉴스의 댓글에 대한 반응도(reactioN)를 조사하였다. 페이스북에서 반응도는 ‘좋아요’ 수를 집계하여

평가할 수 있다. 셋째, 표현(expressioN) 행위를 알기 위해서 댓글과 댓글을 남긴 사람들을 살펴보

았다. 마지막으로 주최측과 경찰측이 추산한 촛불집회 참여자(participatioN) 수를 고려하였다. 주목

Page 4: 박근혜 탄핵 촛불 빅데이터 분석

도, 반응도, 표현, 참여 이 네 가지 ‘N’ 측면을 고려했다는 점이 특히 중요한데, 전통적 미디어를

통해서 생산된 뉴스가 하이브리드 미디어 공간상에서 어떻게 이동하는가를 분석할 때 그 뉴스의

출처, 뉴스 제공자의 권위, 그리고 뉴스를 제공하는 사이트가 네트워크 내에서 허브 역할을 하는

가, 이 세 가지를 모두 고려하는 모델을 제시한 것과 비교할 만하다(Weber, Monge, 2011).

댓글은 연구자의 편의성을 높여서 손쉽게 데이터를 수집할 수 있는 NodeXL을 이용하였다 (Park,

Park, 2014). 수집된 약 1만 5천여 건의 댓글 데이터는 한국어 분석 툴인 KrKwic을 통하여 정제하

고 주요어를 선정하였다. 네트워크 지표 분석은 UCINET을 사용하였고, 시각화에는 자매 소프트웨

어인 NetDraw를 사용하였다(Borgatti, Everett, Freeman, 2002).

Figure 1. JTBC Social Story Facebook Page Screenshot (https://www.facebook.com/JTBCstandbyyou)

3.1. 주목 (attention)

Table 1은 시기별 라이브 뉴스의 조회 수, 좋아요 수, 공유 수를 정리한 것이다. 1차에서는 첫

촛불집회에 대한 관심으로 조회 수, 좋아요 수, 그리고 공유 수가 높게 나온 것으로 나타났다. 특

히 JTBC는 자신의 매체 안에 그대로 머물러 있지 않았다. SNS 환경에 적극적으로 반응하기 위해

서 페이스북 이용자들에 맞춤화된 콘텐츠를 제작하여 실시간으로 유통했다. 이것은 지난 광우병

촛불집회에서 정부, 여당, 기성 언론이 미디어 융합으로 가능해진 정보호환 환경을 충분히 고려하

지 않고 전통적 미디어에만 의존한 정책홍보와 보도전략과 대조된다(Cho, Choi, Park, 2012). 그리고

촛불집회가 진행되면서 정치권에 탄핵 요구가 빗발치기 시작한 5차 촛불집회의 공유 수가 가장 높

은 것으로 나타났다. 탄핵이 가결된 이후로는 촛불집회가 일상화됨에 따라 전체적으로 주목도가

절반 이상 떨어진 모습을 확인할 수 있다.

Table 1. Number of views, likes, and shares

1 2 3 4 5 6 7

views 170000 200000 134000 183000 181000 123000 48000

likes 11000 6698 4533 8729 7263 6003 1923

shares 729 374 287 639 871 704 222

3.2. 반응 (reaction)

Table 2를 살펴보면, 댓글 중 ‘좋아요’ 버튼을 이용해서 반응을 받은 비율은 1~3차 전반기는 10

퍼센트를 내외로 저조했다. 그렇지만 후반기인 4차부터는 20퍼센트를 넘어선 반응률을 보였다. 특

히 탄핵 직전인 6차 촛불에서는 ‘좋아요’를 2개 이상 받은 사람의 비율이 가장 높았다. 전체적으로

시간이 경과할수록 반응이 활발히 일어나는 경향이 있었다. 댓글들의 내용을 검토해 보면, 처음에

Page 5: 박근혜 탄핵 촛불 빅데이터 분석

는 단순 응원형 댓글이 많았으나 집회가 진행되면서 구체적 메시지를 담은 댓글들이 늘어나면서

공감을 많이 얻은 것으로 평가된다. 그리고 현 시국에 대한 내용뿐만 아니라 뉴스 진행자이자 책

임자인 손석희와 현장에 나온 취재기자들과 직접적으로 소통하기 위한 용어들도 자주 출현했다.

클릭티비즘의 관점에서 보면, 페이스북의 ‘좋아요’와 ‘댓글’은 O2O(Online To Offline)의 매개자이자

하이브리드 미디어 현상을 추동하는 이용자들의 적극적 반응양식이다.

Table 2. Number of reactions per user comment

Rallies Comments Frequency(Percentage)

No Sum 0 1 2~10 11~20 21~30 31~

1 2654 2064(77.77) 330(12.43) 253(9.53) 6(0.23) 0 1(0.04)

2 1781 1439(54.22) 188(7.08) 137(5.16) 11(0.41) 0 6(0.23)

3 1105 654(24.64) 304(11.45) 143(5.39) 1(0.04) 0 3(0.11)

4 3387 2141(63.21) 776(22.91) 443(13.08) 15(0.44) 3(0.09) 9(0.27)

5 2268 1388(52.30) 545(20.54) 320(12.06) 9(0.34) 1(0.04) 5(0.19)

6 2839 1324(49.89) 772(29.09) 732(27.58) 5(0.19) 1(0.04) 5(0.19)

7 797 404(50.69) 209(26.22) 170(21.33) 8(1.00) 5(0.63) 1(0.13)

3.3. 표현 (expression)

Table 3에서 정리된 댓글의 총합(sum)은 라이브 뉴스라는 참여양식의 역동성을 뚜렷하게 보여준

다. 1차 댓글 2654개에 비교해 2차와 3차에는 1781개와 1105개로 현저히 줄어들었다. 댓글들을 검

토해보면 1차는 이슈를 점화하는 내용과 특징을 지니고 있었다. ‘최순실 게이트’라는 단어와 ‘박근

혜 하야’라는 단어가 댓글에서 동시에 출현하였다. 그리고 첫 집회와 관련하여 추운데 고생이 많

고, 직접 참여하지 못해 죄송하다는 댓글이 나왔다. 반면 2차와 3차에서는 온라인을 넘어선 공간적

확장을 통한 뉴스 참여라는 새로운 맥락을 갖게 되었다. 즉, 1차에는 시민들이 페이스북 공간에서

상대적으로 수동적인 뉴스 소비에 머물러 있었으나, 2차와 3차에서는 사이버 공간을 벗어나 외부

와의 접촉면 확장을 통한 실제적 상호작용을 선택했다고 볼 수 있다. 이후 댓글이 4차에서 다시

정점에 올랐다가 하강 국면을 보였다. 이것은 4차를 걸치면서 촛불집회가 뉴스의 가치사슬에서 지

배적 지위를 획득했다는 것이다. 한편 탄핵 이후 댓글이 급격하게 줄어든 것은 시민들의 뉴스 관

여도가 약화되었음을 보여준다.

Table 3. Number of online comments compared to that of offline participants

Rallies Replies Number of words Number of rally participants

No Sum (Unique no./Total no.)*100 According to police According to citizen coalition

1 2654 46.12% 12000 20000

2 1781 51.09% 48000 200000

3 1105 12.51% 260000 1000000

4 3387 11.64% 170000 600000

5 2268 11.47% 270000 1500000

6 2839 11.30% 430000 1900000

7 797 12.58% 120000 800000

Table 4. Political situation before candlelight protest

Page 6: 박근혜 탄핵 촛불 빅데이터 분석

Rally (date) Political events

1st (Oct 29)Oct 24: JTBC aired an exclusive about a tablet PC alleged to be Choi Soon-sil’s. The tablet

contained top classified information including drafts of presidential speeches.Oct 25: The president made a public apology for the first time.

2nd (Nov 5)

Oct 30: Choi returned to Korea.Oct 31: The prosecutors arrested Choi.Nov 3: Choi was taken into custody.

Nov 4: President Park made the second public apology.

3rd (Nov 12)Nov 7: Big corporations were questioned as part of the ongoing influence-meddling scandal

Nov 9: Chaum Hospital’s malpractice, in connections with Choi and President Park, wasrevealed. Three opposition parties decided to participate in the candlelight protest.

4th (Nov 19)

Nov 14: Special investigation into Choi’s case was approved.Nov 15: It was reported that the president had regularly received treatments at Chaum under

the alias Gil Ra-im.  Nov 17: Assemblyman of the conservative Saenuri Party Kim Jin-tae stated that the candles

would soon flame out.

5th (Nov 26)Nov 21: Three opposition parties agreed to impeach the president.

Nov 23: A scandal over the presidential office’s mass purchase of various pills broke out.  

6th (Dec 3)Nov 29: President Park made the third apology.

Nov 30: Parliamentary investigation began.Dec 2: The impeachment vote was postponed to Dec 9.

7th (Dec 10)Dec 6: The first parliamentary hearing of chaebols took place.

Dec 7: The second hearing took place.Dec 9: The impeachment motion was approved.

Figure 2에서는 댓글에서 가장 자주 언급된 이슈 단어 118개를 NetDraw - Layout - Principal

Component 옵션을 이용하여 시각화하였다. 1~3차, 4차, 5~6차, 7차가 뚜렷이 구분되어 있다. 이것은

전반부에서 사용된 주제어들 간 유사성이 가장 크며, 그 다음으로 5차와 6차 간 유사성이 높다는

것을 의미한다. 한편 4차 촛불에서는 ‘ㅋ’ (67.52%) ‘ㅠ’ (3.41%) ‘jtbc’ (3.21%) ‘ㅎ’ (2.69%) ‘박근혜’

(1.49%) ‘화이팅’ (1.36%) ‘기자’ (1.30%) ‘응원’ (1.18%), ‘방송’ (1.08%) ‘하야’ (1.04%) ‘힘’ (0.89%)

‘국민’ (0.85%) ‘박사모’ (0.85%)의 순서로 주제어가 많이 출현했다. 4차 기간에 박근혜를 사랑하는

모임(박사모)가 맞불 집회를 열었으며, 수학능력시험을 끝낸 학생들도 참여하였다. 4차 주제어들이

5차와 6차로부터 독립적 그룹을 형성하는 데 큰 영향을 미친 것으로 보인다.

Figure 2. Network diagram of connections between rallies and prominent words in online commentary

Page 7: 박근혜 탄핵 촛불 빅데이터 분석

Table 5는 피어슨 계수를 이용하여 1~7차까지의 주제어들 간 상관성을 검증한 것이다. 먼저 1~7

차까지의 주제어들 간 상관성은 통계적으로 유의한 것으로 나타났다. Figure 2와 유사하게 1차는 2

차와 3차와 상관성이 비교적 높게 나타났다. 그리고 탄핵 투표 직전인 5차와 6차의 상관성이 .976

으로 가장 높았다. 1차가 7차의 상관성이 꽤 높은 이유는 응원의 목적으로 올린 댓글이 많기 때문

이다. 하지만 강도를 보면, 1차와 4차 간 강도는 피어슨 계수에서 .204로 가장 약한 것으로 나타났

다. 이것은 4차에서 촛불집회 참가자들 중에 청소년들과 촛불 반대의 목적으로 모인 사람들도 있

으면서 1차와의 이질성이 높아졌기 때문이다.

Table 5. Pearson correlation

Rallies 1 2 3 4 5 6 7

1 .340** .504** .204* .334** .259** .445**

2 .751** .707** .728** .728** .446**

3 .887** .945** .903** .757**

4 .969** .971** .547**

5 .976** .667**

6 .619**

N=118, **Significant at p < 0.01, *Significant at p < 0.05

3.4. 행위자

Table 6에서 보면, 댓글로 자신의 의견과 감정을 표현한 사람들은 1차 촛불 때가 1895명으로 가

장 많았으며, 2차 촛불 시기가 그 뒤를 따랐다. 흥미롭게도 3차 촛불은 593명으로 그 전후 시기와

비교하면 절반에도 미치지 못했다. 그런데 3차에서는 지방에서 상경하는 인원까지 참여하면서 역

대 최대 규모인 약 100만 명이 모이게 되면서 외신에서도 크게 보도되었다. 촛불집회의 분수령이

었다. 그럼에도 댓글자가 눈에 띄게 감소한 이유는 JTBC 이외에도 페이스북 라이브 방송을 하는

곳이 생겨나면서 댓글자들이 분산되었기 때문이다. 또한 유명 연예인들이 집회장에서 공연을 하고

대권에 도전하는 정치인들도 동참하기 시작하였다. 이 역사적 현장을 남기기 위한 동영상 촬영이

퍼지면서, 유튜브를 이용하여 동영상을 게시하는 네티즌도 급속히 증가했다. 한편 2번 이상 댓글을

남긴 사람들의 비율은 1차와 2차는 20퍼센트에 채 미치지 못했다. 그렇지만 3차를 지나면서 30퍼

센트를 초과하기 시작했다. 탄핵이 통과된 7차 촛불에서는 댓글자가 325명으로 급락했다.

Table 6. Number of commenters across time periods

Rallies Commenters  Frequency(Percentage)

No Sum Once >= 2 times

1 1895 1535(81.00) 360(19.00)

2 1341 1102(82.18) 239(17.82)

3 593 419(70.66) 174(29.34)

4 1272 806(63.36) 466(36.64)

5 1032 661(64.05) 371(35.95)

6 1049 677(64.54) 372(35.46)

7 325 210(64.62) 115(35.38)

Figure 3은 시기별로 댓글자의 이동 현황을 네트워크의 형태로 표현하였다. 동심원의 크기는 앞

의 Table 6에 정리된 시기별 총 댓글자이다. 선의 굵기는 Table 7에 정리된 중복 댓글자의 백분율

이다. 중복 댓글자의 비율은 다음과 같이 계산하였다. 중복 댓글자/((직전 시기의 총 댓글자 + 이번

Page 8: 박근혜 탄핵 촛불 빅데이터 분석

시기의 총 댓글자) - (중복 댓글자)). 흥미롭게도 4차부터 6차까지는 삼각(triad) 네트워크를 형성하

고 있다. 이러한 뉴스 참여자의 유사성은 박사모의 맞불 집회가 본격화된 이후에 촛불 집회가 새

로운 국면으로 접어들었다는 것을 시사한다. 다시 말해 댓글은 이슈 공유와 의미 창출의 대인간

(interpersonal) 채널이라고 할 수 있다. 그런데 이 채널의 수용자들이 초기를 벗어나면서 정태적으

로 머물러 있는 것이 아니라 반복적 참여자를 통해서 공동체 집단으로 창출되고 있는 것이다.

Figure 3. Migration networks among commenters across time periods

Table 7. Number of overlapping commenters across time periods

RalliesFrequency(Percentage)

1 2 3 4 5 6 7

1 79(2.50%) 57(2.34%) 104(3.40%) 75(2.63%) 77(2.69%) 22(1.00%)

2 36(1.90%) 71(2.79%) 50(2.15%) 54(2.31%) 22(1.34%)

3 71(3.96%) 44(2.78%) 50(3.14%) 21(2.34%)

4 110(5.01%) 114(5.17%) 31(1.98%)

5 113(5.74%) 42(3.19%)

6 56(4.25%)

3.5. 행위자-이슈 네트워크의 상관성

Table 8에서는 중복 댓글자들 간 네트워크와 주제어들 간 네트워크의 상관성을 검증해 보았다.

QAP(quadratic assignment procedure) 결과에 따르면, 두 네트워크 간 상관성은 0.602로 통계적으로

유의한 것으로 나타났다. 이것은 ‘중복 댓글자’와 ‘주제어’의 네트워크가 유사하다는 것을 의미한

다. 이를 통해 촛불 집회가 진행됨에 따라 페이지에서 나타나는 중복 댓글자의 수와 주제어 등장

의 패턴의 변화를 확인할 수 있었다. 탄핵 국면으로 접어들면서 매주 댓글을 남기는 댓글자들이

점차 늘어났으며, 주제어 사용에 있어서 정치적 구호를 비슷하게 외치는 등 유사성이 높게 나타났

다.

Table 8. QAP correlations

Overlapped Rally word

Overlapped 0.602*

*Significant at p < 0.05

Page 9: 박근혜 탄핵 촛불 빅데이터 분석

3.6. 댓글 행위자 프로파일

Table 9. Profiles of frequent commenters and their comments

UserIDs

Numberof rallies

aboutwhichthey

comment

Profile characteristics

Totalno. ofcomme

nts

Content characteristics

D* K* 7 citizen that hardly posts on his/her timeline 104Criticism of the president, politicians,

and the government

O** 6 same as above 15 Support for news reporters

H* C* 5 citizen that posts about personal activities 32 Excited about Facebook live streaming

L* J* 5 same as above 17 Urging the resignation of the president

K** 5citizen that often links to news on current

political affairs12 Solidarity with others at the rallies

Y** 5 citizen that often links to JTBC 20 Criticism of the established press

C** 5citizen that tends to post about social andpolitical issues and expresses his/her own

opinion9

Support for participants at the anti-Parkrallies

*Asterisk marks used to anonymize the subjects

Table 9은 7번의 촛불 집회 중 5회의 집회 이상 댓글 활동에 참여한 행위자 프로필을 나타낸 것

이다. 프로필을 보면 모두 일반인이었다. 비공개 계정과 게시글 활동이 거의 없는 계정이 있긴 하

지만, 평소에 시국에 많은 관심을 보이고 링크 공유와 의견을 피력하는 행위자였다. 집회 하나 당

댓글 1개 이상 남김으로써 적극적인 댓글 활동 참여를 하고 있었다. 그리고 3차와 4차, 그리고 6차

집회 때는 순위권의 행위자 전원이 댓글에 참여한 모습이 나타나 사상 최대 인파 참여와 탄핵 정

국으로 이슈가 최고조일 때 적극적인 댓글 참여가 이루어졌음을 보여줬다. 댓글 내용을 살펴보면

전체적으로 응원의 댓글에서 시간이 지남에 따라 정치적인 구호로 변화하는 모습이 나타났다. 특

히 6차 촛불 때는 탄핵 표결을 눈앞에 두고 정권 퇴진이라는 한 목소리를 내고 있는 모습이었다.

반면, 지속적으로 JTBC 기자들과 집회 참가자를 응원하는 행위자도 있었다. 그리고 단순 댓글 참

여에서 실제 집회의 참여를 인증하는 능동적인 참여자도 눈에 띄었다. 참여도가 높은 행위자들을

살펴본 결과, 평소 정치와 시국에 관심이 많은 사용자이며, 집회 시간에 맞추어 의도적으로 게시글

을 찾아와 댓글을 다는 것으로 볼 수 있다.

4. 결론

JTBC의 특종 보도가 최순실 게이트와 촛불 정국의 도화선이 된 것은 사실이라 할지라도 이후에

7회에 걸쳐 이루어진 대규모 촛불집회의 동력을 설명하는 데에는 한계가 있다. 따라서 본 논문은

JTBC의 페이스북 페이지 상에서 시민들이 생성한 데이터를 수집·분석하여 그들의 정치참여가 어

떤 식으로 이루어졌는지 그 전개 과정을 다각도로 이해하고자 하였다. 촛불집회에 대한 기존 시각

은 ‘보수’ 대 ‘진보’이거나 ‘아날로그’ 대 ‘디지털’이었다. 양극화된 ‘진영 논리’는 해석의 편리성만

큼이나 위험하고 따라서 집회 참여자를 타자화하거나 정치 공학적으로 비평하는 해묵은 접근에서

탈피하여야 한다. 그렇지 않으면, ‘장님 코끼리 만지기’에 빠질 것이다.

시청자들이 의견을 표현하고 교환하는 공간은 여러 곳이 있을 수 있겠으나 페이스북에 주목한

Page 10: 박근혜 탄핵 촛불 빅데이터 분석

것은 TV 프로그램이 제공할 수 없는 쌍방향 커뮤니케이션 공간의 역할을 소셜 미디어가 하고 있

다는 ‘세컨드 스크린 시청’ 현상을 고려한 선택이었다. 여러 플랫폼 중 페이스북이 중요한 공간임

은 구글 검색을 통해서도 확인이 가능하였다. 데이터 수집은 텍스트로 된 댓글에 국한하지 않고

‘N4’로 축약되는 이용자들의 주목(attentioN) 정도, 반응(reactioN), 표현(expressioN), 그리고 참여

(participatioN)의 네 가지 측면에 해당하는 데이터를 모두 수집하였다. 그 결과 처음 3번의 촛불집

회가 일어나는 동안은 이용자들은 다소 수동적으로 콘텐츠를 소비하는 입장이었고 표현은 대부분

방송사의 노력에 대한 응원의 메시지였음을 확인할 수 있었다. 그러다 4차 집회가 터닝포인트가

되는데, 3차 집회에서 참여 시민의 수가 100만 명(주최 측 집계 기준)을 넘어가면서 시민들이 매스

미디어의 보도내용을 소비하는 입장에서 극의 흐름을 이끄는 주인공의 자리로 옮겨가게 된다. 이

때가 JTBC 페이스북 페이지에서 집중적으로 이루어지던 대인간 커뮤니케이션이 양적으로 줄어드

는 시기이기도 했는데, 이는 다른 뉴스매체와 개인들도 정치 정보의 유통 사이클에 들어오면서 비

슷한 역할을 하는 공간이 이곳저곳 늘어났기 때문이다. 반면 지속적으로 댓글을 달고 다른 이들과

소통하는 이용자들이 있었는데 이들에게 JTBC 페이지가 커뮤니티의 공론장의 역할을 함을 관찰할

수 있었다. 표현에 있어서도 4차 집회부터는 감성적 댓글이 최상위권을 차지하면서 표현들이 정치

적으로 더 자유로워졌다. 한편, 중복 단어를 제외한 순수한 단어의 비율은 3차 집회부터 대폭 감소

하였는데 특정한 주제어가 반복되면서 탄핵과 하야 촉구 이슈로 초점이 맞추어졌다.

본 연구는 2016년 촛불집회가 온라인 공간과 오프라인 공간, 그리고 매스 미디어와 소셜 미디어

가 긴밀하게 얽힌 가운데 탄생한 것임을 실증적으로 보여준다는 점에서 그 의의를 찾을 수 있을

것이다. 이러한 가치에도 불구하고 이 논문은 댓글과 관련된 데이터를 통계적으로 분석했기 때문

에 하이브리드 미디어의 작동 메커니즘의 정성적(定性的) 해석을 제공하는 데에는 한계가 있다. 예

컨대 JTBC 뉴스 책임자이자 진행자인 손석희가 방송뉴스에서 어떤 수사학적 표현으로 대중적 관

심을 끌었으며 사람들의 참여를 지속적으로 부추겼는지, JTBC 뉴스에 관여도가 높은 시민들이 동

료 시민들을 설득하고 이슈를 확산하는 과정에서 소셜 미디어를 어떻게 전술적으로 활용했는지를

파악하기 위해서 더 많은 종류의 데이터가 필요하다. 후에 영상분석과 같은 첨단 방법을 보완해서,

일반 이용자들이 주도한 특정한 이미지의 혼용과 편집이 하이브리드 미디어의 발현에 어떤 영향을

미치는지 등에 대한 연구가 이어지면 더욱 큰 의미가 있을 것이다.

Page 11: 박근혜 탄핵 촛불 빅데이터 분석

References

Anstead, N., O'Loughlin, B., (2011), The emerging viewertariat and BBC question time: television debate andreal-time commenting online, International Journal of Press/Politics, 16(4), 440-462.

Bennett, W. L., Segerberg, A. (2012). The logic of connective action, Information, Communication & Society, 15(5),739-768.

Borgatti, S. P., Everett, M. G., Freeman, L. C. (2002). UNICET 6 for Windows: software for social networkanalysis [computer program], Needham, MA: Analytic Technologies.

Chadwick, A. (2009). Web 2.0: New challenges for the study of e-democracy in an era of informational exuberance,I/S: A Journal of Law and Policy for the Information Society, 5(1), 9-41.

Chadwick, A. (2013). The hybrid media system: Politics and power, Oxford: Oxford University Press.

Cho, I. H., Kim, D. H., Chun, C. N. (2016). Web-based consumer involvement indices and vegetable consumption:The quantification of unstructured information and an exploration of a causal relationship, Journal of theKorean Data Analysis Society, 18(3A), 1259-1270.

Cho, S. E., Choi. M. G., Park, H. W. (2012). Government-civic group conflicts and communication strategies: Atext analysis of TV debates on Korea’s Import of U.S. Beef, Journal of Contemporary Eastern Asia, 11(1).1-20.

Han, S. H., Lee, H. S. (2013). Understanding the role of parasocial interaction on user behavior in social networksite (SNS): Focus on weak-tie relationship, Journal of the Korean Data Analysis Society, 15(4A), 2203-2217.(in Korean).

Heo, Y. C., Park, J. Y., Kim, J. Y., Park, H. W. (2016). The emerging viewertariat in South Korea: The Seoulmayoral TV debate on Twitter, Facebook, and Blogs, Telematics and Informatics, 33, 570-583.

Jang, A. R., Park, J. Y., Park, H. W. (2014). Global communication network analysis of Busan International FilmFestival (BIFF) 2014 using Twitter data, Journal of the Korean Data Analysis Society, 17(2)(B), 939-950. (inKorean).

Jenkins, H., Ford, S., Green, J. (2013). Spreadable media: Creating value and meaning in a networked culture, NewYork, New York University Press.

Kim, J. S. Jin, S. (2013). A study on the application of opinion mining based on big data, Journal of the KoreanData Analysis Society, 15, 101-113.

Kim, J. Y., Lee, Y. O., Park, H. W. (2016). Delineating the complex use of a political Podcast in South Korea byhybrid web indicators: The case of the Nakkomsu Twitter network, Technological Forecasting & SocialChange, 110, 42-50.

Park, J. W., Park, H. W. (2014). Social network analysis among Facebook fanpage co-commenters:Daegu-Gyeongbuk’s mayor·governor candidates, Journal of the Korean Data Analysis Society, 16(6),3243-3253. (in Korean).

Park, J. Y., Park. H. W. (2015). An exploratory semantic analysis in the dynamics of public opinion on Facebook:A case of the superintendent of Seoul office of education in South Korea, Journal of the Korean DataAnalysis Society, 17(3)(B), 1557-1571. (in Korean).

Weber, M. S., Monge, P. (2011). The flow of digital news in a network of sources, authorities, and hubs, Journalof Communication, 61(6), 1062-1081.

Won, Y. (2016). South Korea’s historic candle light protests bring down president Park, International Journal ofSocialist Renewal, http://links.org.au/south-korea-park-impeachment-candlelight-protests.

Page 12: 박근혜 탄핵 촛불 빅데이터 분석

The 2016 Candlelight Protest in a Hybrid Media System

Yeon Ok Lee1, Hyo Chan Park2, Han Woo Park3, Randy Kluver4

Abstract

Towards the end of 2016, the sitting president of South Korea found herself in the

center of a scandal involving allegations of corruption on a massive scale, as well as other

violations of the constitution. This was triggered by an exclusive report by a cable TV

channel JTBC. Soon after, hundreds of thousands citizens participated in candlelight rallies

on six consecutive Saturdays, pressurizing the National Assembly to vote for her

impeachment on Friday 9 December. The present study is a social network analysis of

conversation data generated by citizens on JTBC’s Facebook page alongside the development

of the candlelight protest. The results show that the 2016 candlelight protest was marked not

only by JTBC’s agenda setting but also by citizens' participation mediated via Facebook.

The findings of this study draw attention to the intersection of online and offline

expressions of contention, as well as the entanglement of mass and social media.

Keywords : Candlelight Protest, Citizen Participation, Facebook, Hybrid Media, Network

analysis.

1Doctoral Training Advisor, SOAS University of London, E-mail : [email protected] in Cyber Emotions Research Institute, Master student, Interdisciplinary Program of DigitalConvergence Business, YeungNam University, 214-1, Dae-dong, Gyeongsan-si, Gyeongsangbuk-do, SouthKorea, Zip Code 712-749, E-mail : [email protected](Corresponding Author) Director in n Cyber Emotions Research Institute, Professor, Dept of Media &Communication, Interdisciplinary Program of Digital Convergence Business, YeungNam University, 214-1,Dae-dong, Gyeongsan-si, Gyeongsangbuk-do, South Korea, Zip Code 712-749, E-mail : [email protected], Dept of Communication, Texas A&M University, E-mail : [email protected]