지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한...

29
지방자치단체의 빅데이터 도입을 위한 제언*Ⅰ. 서론 최근 정부는 정부3.0 비전 선포식을 하자마자 공공데이터 잠재력에 주목하고, 데이터 기 반의 새로운 성장 동력을 찾기 위해 지난 20136공공데이터 제공 및 이용 활성화에 관 한 법률을 제정했다. 공공데이터는 정부나 지방자치단체 또는 산하기관이 보유하고 있는 공 공목적으로 사용할 수 있는 데이터를 말한다(이만재, 2011). 공공부문에서의 빅데이터 분석 과 활용에 대한 수요가 크게 증가하고 있는 추세이다. 정부가 가진 데이터를 전면 개방해서 제공한다면 정부3.0에서 강조하는 투명한 정부, 서비스 정부를 국민의 자발적인 참여로 만들 어 낼 수 있다. *** 이 논문은 2013년도 광운대학교 교내학술연구비 지원에 의해 연구되었음. *** 1저자 *** 교신저자

Upload: others

Post on 06-Sep-2019

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

연구논단 한국지역정보화학회지 제16권 제3호(2013. 9): 13~41

13

지방자치단체의 빅데이터 도입을 위한 제언*1)

김신곤***

조재희***

<요 약>

세계적인 이슈로 떠오른 빅데이터가 기업 뿐 아니라 국가의 경쟁력에도 지대한 영향을 미칠 것이

므로 다양한 분야에서 빅데이터 활용 사례는 급속히 증가할 것으로 전망된다. 주요 국가의 정부 및

지자체는 국가 경쟁력 향상을 위하여 경쟁적으로 공공데이터의 개방과 활용 정책을 추진하고 있으며

빅데이터의 활용 방향은 크게 빅데이터 기반의 국가미래전략을 추진하고 있다는 점과 사회 현안 해

결을 위한 새로운 방법으로 활용함으로써 공공서비스의 효율을 높이고 있는 것으로 요약할 수 있다.

본고에서는 국내외의 사회, 의료 보건, 금융, 교통, 재난 국방 치안과 같이 다섯 가지 공공부문에 적

용된 대표적인 빅데이터 사례를 32개 선정하고 전반적인 동향과 시사점을 정리하였다. 지제체의 성

공적인 빅데이터 도입을 위하여는 사전 준비가 필요하다. 지자체의 빅데이터 도입 전략에 반드시 고

려해야 할 사항들과 지역정보화 관점에서 지자체의 준비 사항을 살펴보았다.

<주제어> 빅데이터, 빅데이터 활용 사례, 공공데이터, 지자체, 국가경쟁력

Ⅰ. 서론

최근 정부는 정부3.0 비전 선포식을 하자마자 공공데이터 잠재력에 주목하고, 데이터 기

반의 새로운 성장 동력을 찾기 위해 지난 2013년 6월 ‘공공데이터 제공 및 이용 활성화에 관

한 법률’을 제정했다. 공공데이터는 정부나 지방자치단체 또는 산하기관이 보유하고 있는 공

공목적으로 사용할 수 있는 데이터를 말한다(이만재, 2011). 공공부문에서의 빅데이터 분석

과 활용에 대한 수요가 크게 증가하고 있는 추세이다. 정부가 가진 데이터를 전면 개방해서

제공한다면 정부3.0에서 강조하는 투명한 정부, 서비스 정부를 국민의 자발적인 참여로 만들

어 낼 수 있다.

*** 이 논문은 2013년도 광운대학교 교내학술연구비 지원에 의해 연구되었음. *** 제1저자

*** 교신저자

Page 2: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

14 │ Journal of Korean Association for Regional Information Society

비단 우리만 공공데이터에 주목하는 것은 아니다. 미국・영국・EU 등 세계 각국도 정부 투

명성 제고와 경제 활성화를 위해 경쟁적으로 공공데이터 개방과 활용 정책을 추진하고 있다.

미국은 2013년 5월, 오바마 2기의 열린 정부를 완성할 오픈데이터 정책을 발표하였다. 이 정

책의 핵심은 정부에서 만든 모든 데이터의 무조건적인 개방이다. 또한 영국의 캐머런 수상은

활용도가 높은 공공데이터를 구체적으로 적시하고 각 부처가 빠르게 개방하라는 지시를 내렸

다. EU는 이미 2011년에 27개 회원국의 모든 공공데이터를 의무적으로 개방하라는 오픈데

이터 전략을 수립했고, 2013년 6월에 ‘공공정보 재활용 지침’을 개정하였다.

공공데이터를 더 많이 개방할수록 더 많은 가치를 발견할 가능성은 커진다. 공공데이터는

정부가 주어진 역할을 제대로 수행하고 있는지를 감시하는 데에도 활용할 수 있으며 국민생

활을 더 편리하게 하는 서비스를 개발하는 데에도 활용할 수 있다. 이에 따라 정부 차원의 빅

데이터 확보와 활용을 통해 신산업과 일자리 창출 등을 추구함으로써 국가의 산업경쟁력 향

상을 도모하고 있으며 재난방재, 질병 방지, 치안, 물가관리 등 공공 서비스 영역에서 예상하

지 못한 불규칙한 사건의 예측 및 예방 등 사회 현안을 해결하기 위한 빅데이터 활용이 증가

하는 추세이다(이응용, 2012).

미국정부는 빅데이터 이니셔티브를 통해 공공정책 각 분야에 빅데이터 분석을 전방위적

으로 확산해 국가적 난제해결에 나서고 있다. 우리 정부도 최근정부3.0 비전을 발표하면서 데

이터기반의 과학적 정책수립에 나서고 6대 분야에 걸쳐 21개의 시범사업을 추진할 예정이다.

하지만 국내 공공분야의 빅데이터 활용은 여전히 초기단계에 머물러 있다. 공공기관들은

경제, 일자리, 교통, 교육, 보건, 복지, 안전, 행정효율화 등 다양한 분야에서 빅데이터를 도입

해보고자 하는 의지는 강하지만 국내의 경우 주요 선진국에 비하여 기술격차가 존재하고, 아

이디어 및 데이터는 있으나 빅데이터 분석 환경 및 활용 경험이 부족하고 전문 인력도 부족한

실정이어서 서비스 도입에 어려움을 겪고 있는 상황이다.

본고에서는 주요 선진국의 빅데이터 추진 전략을 살펴보고 국내외의 사회, 의료・보건, 금

융, 교통, 재난・국방・치안과 같이 다섯 가지 공공부문에 적용된 대표적인 빅데이터 사례를

32개 선정하여 전반적인 동향과 시사점을 정리하였다. 지자체의 성공적인 빅데이터 도입을

위해서 사전 준비가 필요하다. 지자체의 빅데이터 도입 시 고려할 사항들과 지역정보화 관점

에서 지자체의 준비 사항을 살펴보았다.

Page 3: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

15

Ⅱ. 주요 선진국의 빅데이터 추진 전략

빅데이터는 기업 뿐 아니라 국가의 경쟁력에도 지대한 영향을 미친다. 주요 국가의 정부

및 지자체들은 빅데이터 분석을 향후 국민편익 향상, 공공서비스 효율화, 시민 복지 향상, 선

제적 정책, 미래전략 수립을 위한 중요한 수단으로 인식하고 있다. 세계 각국이 이처럼 공공

데이터의 빅데이터 활용에 주력하는 이유는 데이터가 가진 무한한 가치 때문이다. 주요 국가

의 정부 및 지자체가 빅데이터를 활용하는 방향은 크게 두가지로 볼 수 있다. 첫째는 빅데이

터 기반의 국가미래전략을 추진하고 있다는 점과 둘째로 빅데이터를 사회 현안 해결을 위한

새로운 방법으로 활용함으로써 공공서비스의 효율화를 추구하고 있다는 점이다.

미국, 영국, EU, 싱가포르와 같은 선진국들을 시작으로 빅데이터의 활용은 국가차원의 전

략으로 확산되고 있는데, 그 추진 현황을 살펴보면 다음과 같다(빅데이터 전략연구센터a,

2012).

1. 미국

미국은 범정부 차원의 빅데이터 거버넌스 체계를 구축하였다. 미국 대통령 과학기술자문

위원회(PCAST)1)는 2010년 12월 모든 연방정부는 빅데이터 전략 수립이 필요하고, 이를 위

해 연방 정부 수준에서의 빅데이터 관련 기술 투자의 필요성을 제시(Design a Digital Futur

e)2) 하였다. 이에 과학기술정책실(OSTP)3)은 2억 달러 규모의 ‘빅데이터 연구개발 이니셔티

브’(Big Data R&D Initiative)를 발표(2012.3) 하였다(빅데이터 전략연구센터c, 2013). 과학

기술정책실은 NITRD4) 빅데이터 협의체인 ‘빅데이터 고위운영그룹’(BDSSG)5)을 구성하였

고 이 그룹은 빅데이터 연구개발의 조정과 이니셔티브 목표의 확인 등 빅데이터 계획을 주도

1) President’s Council of Advisors on Science and Technology2) Every Federal agency needs to have a “big data” strategy.3) Office of Science and Technology Policy4) Federal Networking and IT R&D의 약자. 2002년부터 추진되고 있는 연방 정부 차원의 범부처 IT R&D

프로그램으로 대규모 네트워크, 고성능 컴퓨팅 시스템, 소프트웨어, 정보관리 등 기술 분야의 연구개발은

물론 신기술이 사회와 경제 및 노동에 미치는 영향 등을 분석하는 등 다양한 연구 영역이 상호 유기적으

로 연계되어 진행(한국인터넷진흥원, 2012)5) Big Data Senior Steering Group

Page 4: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

16 │ Journal of Korean Association for Regional Information Society

적으로 추진하고 있다.

미국 정부(data.gov)는 클라우드 기반의 개방형 데이터 플랫폼을 제공하여 개별 부처가

보유한 공공데이터를 쉽게 공유할 수 있도록 하고 있다. 또한 연방정부에서는 다양하고도 방

대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로 정부정책을 결정하고

제안하도록 하고 있다.

2. 영국

영국은 공공데이터에 쉽게 접근하도록 공개하여 데이터의 활용기회를 증대시키고 있다.

이를 위해 내각사무처는 ‘공개 데이터 연구소(Open Data Institute)’를 설립하고 공개 데이터

활용을 통해 비즈니스 모델 개발과 데이터 생태계 구축을 지원하고 있다.

영국의 기업혁신기술부(BIS)는 공공정보를 개방하고 접근성을 높여 데이터 기반의 가치

창출을 위해 ‘데이터 전략위원회(Data Strategy Board)’를 2012년 3월 설립하였다. 영국 정

부는 데이터 전략위원회를 통해 오픈 데이터 전략6)에 2013년 4월부터 700만 파운드를 지원

할 계획이며, 각 부처가 무료로 데이터를 공개할 수 있도록 적극 지원할 예정이다. 이에 기업

혁신기술부(BIS)를 비롯한 총 16개 부처7)는 부처별 특성에 맞는 ‘오픈 데이터 전략(Open

Data Strategy)’을 2012년 6월 발표하였다.

각 부처는 데이터 공유플랫폼(data.gov.uk)8)의 재정비를 통하여 검색기능 개선, 정보이용

방법의 단순화, GIS 데이터의 시각화 등 보유 목록에 대한 접근성 강화 및 서비스 활성화 방

안을 모색하고 있다. 또한 팀 버너스 리(Tim Berners-Lee)가 데이터 품질과 재이용성을 평가

하기 위해 개발한 평가방법을 기준으로 정부의 각 부처가 공개하는 오픈 데이터 평가를 도입

하였다.

3. EU

EU는 금융위기 극복과 사회의 복잡성을 이해하기 위한 FuturICT와 불확실한 미래탐구를

6) 상세내용은‘Ⅲ. 사회현안 해결을 위한 주요국의 빅데이터 추진전략’ 참조

7) 16개 부처는 내무부, 기업혁신기술부, 지역사회지방정부부, 노동연금부, 교육부, 국제개발부, 에너지기후

변화부, 외무부, 보건부, 국세청, 국방부, 법무부, 재무부, 교통부, 문화매체체육부, 환경식품농촌부 이다.8) 2012년 현재 Linked Data 형태로 8,400개의 데이터 세트 제공

Page 5: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

17

위한 iKnow 프로젝트를 추진하고 있다. FuturICT는 지구 신경망시스템, 전체 지구 시뮬레이

터와 글로벌 참여 플랫폼을 구현하여 세계 변화의 방향과 새로운 지식을 탐구하고 있다.

iKnow 프로젝트에서는 전세계의 약신호(weak signal)과 와일드 카드(wild cards)9)를 포착함

으로써, 미래의 전략적 이슈와 대응에 필요한 지식을 발굴하고 있다.

4. 싱가포르

싱가포르의 국가안보조정사무국(NSCS)은 국가안전의 위협요소에 대한 평가와 주변 환

경변화를 탐지하여 새로운 기회를 발굴하는 RAHS10) 프로그램을 2004년부터 운영하고 있

다. RAHS 프로그램은 싱가포르의 환경탐색을 통해 획득한 데이터를 분석하여 국가에 심각

한 영향을 미칠 수 있는 잠재적 위험요소와 불확실성 요소를 탐색하고 머지 않은 장래에 다가

올 주요 이슈들을 예측하고 발견하는 기능을 수행한다. RAHS 프로그램은 싱가포르 해안의

안전 확보를 위해 해상상황인식 프로젝트를 추진함으로써, 해상 테러, 해안침투 등 해안 영역

에서의 안전을 확보하고 조류독감이 싱가포르에 들어옴으로써 벌어질 수 있는 미래 시나리오

를 연구하고 대응 방안을 마련하는 등의 성과를 거두고 있다11).

5. 일본

일본 정부는 동일본 대지진을 계기로 데이터의 중요성을 재인식하고 빅데이터를 국제 경

쟁력 강화를 위한 전략적 자원으로 평가하고 있다. 수많은 데이터를 실시간으로 수집・전송・분석 등에 활용하여 과제해결에 연계하고 수십조 엔의 데이터 활용 시장의 창출을 목표로 하

고 있다.

문부과학성이 추진하는 ‘정보폭발(Info-plosion) 프로젝트(2005년∼2011년)’의 추진목

표는 폭증하는 다양한 정보로부터 필요정보를 추출하는 기술, 대량의 정보를 안전하고 안정

적으로 관리하고 운용하는 기술, 인간과 유연한 상호작용으로 쉽게 정보를 활용할 수 있는 기

술 등을 개발하여 선진적인 IT서비스를 인간사회에 적용하는 것이다. 경제산업성이 추진하

9) 약신호는 사회 변화의 시작을 가리키는 신호로서, 미래에 발생할 가능성이 있는 사건을 의미하고, 와일드

카드는 발생 가능성이 매우 낮으나, 발생했을 경우 엄청난 사회적 영향을 미칠 수 있는 사건을 의미한다.10) Risk Assessment Horizontal Scanning11) http://www.mindef.gov.sg/imindef/publications/pointer/journals/2007/v33n3/feature2.html

Page 6: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

18 │ Journal of Korean Association for Regional Information Society

는 ‘정보대항해(情報大航海) 프로젝트’의 추진 목표는 많은 정보 중에서 사용자가 원하는

정보를 정확하게 검색・ 분석하는 기술을 개발하는 것이다(조문래, 2012). 총무성은 차기 ICT

전략인 ‘액티브 재팬 전략(Active Japan ICT)’의 5대 중점영역12)에 ‘빅데이터 이용과 활용에

의한 사회・경제 성장’을 포함(2012.7)시키고, 빅데이터 및 오픈 데이터를 통한 신규시장 창출

을 위해 2013년 89.3억 엔의 예산을 투자할 계획이다(일본 총무성, 2012).

일본은 데이터 개방, 기반기술 연구개발, 표준화, 활용인재 확보, 사물 간 통신 촉진, 규제

개선 등 산학관이 제휴하여 위의 전략을 추진하고 성과평가 방법을 마련하는 등 민간분야를

고려하면서 빅데이터 활용 활성화 정책을 추진하고 있다.

6. 한국

한국정보화진흥원은 빅데이터를 기반으로 중장기 미래전략 수립을 지원하는 빅데이터 전

략연구센터를 개설(2012.4) 하였다. 여기서는 산・학・연・관이 협력할 수 있는 빅데이터 국가

전략 포럼13)을 지원하고 있으며, 빅데이터 기반 미래사회 대응전략 수립, 빅데이터 글로벌 선

진사례 연구, 공공부문 데이터 분석 및 활용 방안 등의 연구를 수행하고 있다.

국가정보화전략위원회는 빅데이터를 활용한 스마트정부 구현안을 제시하는 등 국가 차원

의 사업을 추진하고 있으며 빅데이터 활용추진단이 신설되어 빅데이터 경쟁력을 높이기 위한

국가・사회적 기반 확보에 나서고 있다.

7. 주요 선진국 빅데이터 추진전략의 시사점

앞서 살펴 본 주요 선진국의 빅데이터 추진 전략과 활용에 나타난 시사점을 요약하면 다

음과 같다.

12) 액티브 재팬 전략 실현을 위한 5대 추진 전략: 1) 액티브 데이터 전략 (빅데이터 이용과 활용에 의한 사회

경제 성장), 2) 액티브 라이프 전략 (적극적이고 쾌적한 생활환경 실현), 3) 리치 콘텐츠 전략 (풍부한 콘

텐츠 개발 및 플랫폼 실현), 4) 안심 안전 고신뢰 ICT 전략 (세계 최고 수준의 사이버보안 환경 실현), 5) 액티브 커뮤니케이션 전략 (견고하고 유연한 ICT 인프라 구축)

13) http://bigdataforum.or.kr

Page 7: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

19

1) 국가 미래전략과 선제적 정책 수립에 적극 활용

미국, 영국, 싱가포르는 2,000년대 중반부터 빅데이터 분석을 통해 자국의 안전과 새로운

기회를 포착하기 위한 수단으로 정부 차원의 노력을 집중하고 있다. 특히 국가 위기관리 등

범정부 차원의 분석과제를 발굴하고 여기에 빅데이터를 적용하고 있다. 그 밖에 빅데이터 협

력 체계를 범정부 차원에서 구축, 각 부처가 보유한 데이터의 연계・및 활용을 촉진하고 있으

며 의료, 복지, 교육 등 국민생활과 직결된 분야에 빅데이터를 적극 활용함으로써 다양한 국

민맞춤형 서비스 개발과 국가혁신을 주도하고 있다.

2) 기술개발 및 인력양성 등 빅데이터 활성화를 위한 연구개발에 주력

2000년대 후반, 스마트 기기가 본격적으로 보급되면서 개인 및 조직의 행태를 추론할 수

있는 비구조화된 데이터의 급속한 증가로 빅데이터의 중요성이 대두되었다. 이러한 대용량

데이터는 데이터간의 관계성을 통합하여 가시적으로 표현됨으로써 사실에 근거한 정책의사

결정을 지원하고 있다. 각국 정부는 비정형・대용량 데이터에 대하여 다양한 분석이 가능하도

록 정부 주도로 신기술을 개발하고, 빅데이터의 분석・활용을 위한 연구에 대학・민간 부문이

자발적으로 참여하도록 지원하고 있다. 또한 데이터 과학자에 대한 중요성을 인지하고 인재

확보와 내부 역량 강화에도 노력하고 있다.

3) 공공데이터의 개방과 공유 추진

공공데이터가 지닌 무한한 경제적 가치를 발굴하도록 하기 위하여 공공데이터의 개방과

공유는 필수적이다. 공공데이터의 개방·공유 환경 조성을 위하여 각국 정부는 정보 공개를 위

한 제도적 기반을 마련할 뿐 아니라 플랫폼 조성을 위한 오픈 API14), Linked Data(이만재,

2011) 등 기술적 기반도 제공하고 있으며 재난방재, 범죄 예방 및 치안, 테러, 보건·의료, 복지

향상 등 공공데이터 제공을 위한 플랫폼(예: data.gov)도 구축하고 있다. 각국의 개방된 공공

데이터를 살펴보면 2013년 1월 현재, 미국은 392,000종, 영국 8,000여종, 싱가포르 5,000여

종인데 반하여 한국은 400여종으로 미미한 상태이다(정보통신정책연구원, 2013).

EU는 공공데이터의 개방과 재이용을 통한 직간접적인 경제적 효과가 1,400억 유로에 달

14) 웹사이트 내부 데이터를 외부에서 활용할 수 있도록 공개된 프로그래밍 인터페이스

Page 8: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

20 │ Journal of Korean Association for Regional Information Society

할 것으로 예측했다. 영국 정부가 구축한 공공데이터 포털에 축적돼 있는 8,000개 남짓한 데

이터 셋의 경제적 가치는 160억 파운드로 추산되고 있다. 우리나라 역시 전문가에 따라 차이

는 있지만 공공데이터를 전면 개방해서 잘 활용하면 2017년까지 15∼52만 명의 일자리가 창

출된다고 예측하고 있다.

Ⅲ. 공공부문의 빅데이터 활용사례

문헌 연구를 통해 국내외 공공부문에 적용된 빅데이터 사례를 32가지 선정하였으며, 이는

사회, 의료・보건, 금융, 교통, 재난・국방・치안과 같이 다섯 가지 적용분야로 분류하였다. 먼

저 각 사례의 요점을 설명한 후 전반적인 동향과 시사점을 정리해 본다.

1. 사회 분야

빅데이터 분석은 주요 일간지, 소셜 데이터, 혹은 민원 센터의 로그 데이터를 이용하여 사

회이슈의 자동감지와 특정 주제에 대한 동향 분석을 통해 잠재적 정책 수요의 발굴이 가능하

다. 또한 지역별 이슈를 도출할 수 있으며 지역별 맞춤형 대국민 서비스 전략 수립에도 활용

할 수 있다.

① 사회통합을 위한 민원동향 분석 사례

한국 국민권익위원회에서는 연간 300만여 건의 민원을 분석, 민원동향분석시스템을 구축

해 민원 발생원인을 차단하고, 행정 서비스의 만족도를 제고시키고 있다(민원정보분석센터,

2013). 2011년에는 이 시스템을 기반으로 이민자 민원현황을 분석하여 신규정책 수립 및 제

도 개선을 지원하였다.

② 구제역 민원현황 분석 사례

한국 국민권익위원회는 2010년 안동 지역 구제역 민원현황을 분석하여 관련기관에 제공

하고, 이후 추가로 정책에 활용하기 위해 2011년 국민신문고 접수 민원을 대상으로 민원분석

보고서를 작성하였다. 이 보고서는 질병 및 전염병관리와 관련한 사회 이슈를 분석, 맞춤형

민원 서비스를 달성한 사례로 꼽히고 있다15).

Page 9: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

21

③ 자살 문제 해결을 위한 사례

서울의 모 종합병원과 소셜분석 전문기업이 공동으로 SNS 텍스트마이닝 기법을 사용하

여 자살 위험이 높은 시기를 예측하는 시스템을 세계 최초로 개발하였다. 연구팀은 2008년 1

월 1일부터 2009년 12월 31일까지 국가 자살통계와 SNS 상에서 자살이나 자살 관련 단어의

빈도를 비교하는 방식으로 블로그나 트위터 등에서 '힘들어 죽겠다'거나 '자살하고 싶다'는 등

의 용어가 많아지면 국내에서 자살률이 높아진다는 사실을 규명했다. 이 프로그램을 2010년

자살 통계에 적용한 결과, 정확률이 79%였다. 앞으로 SNS와 빅데이터 분석을 더 광범위하게

활용하면 정확도를 90%대까지 끌어올릴 수 있을 것으로 기대되며, 국가 차원에서 활용하면

좀 더 효율적인 자살 예방 사업을 펼칠 수 있을 것으로 기대된다(권정은 외 1인, 2012).

④ 미국 콜로라도주 교육부 통합자료 시스템 사례

미국 콜로라도주 교육부는 데이터 관리원칙을 바탕으로 주 전체에 걸쳐서 통합자료 시스

템을 개발하였고, 데이터에 쉽게 접근할 수 있도록 하였다. 이 시스템은 178개 초중고 학교지

구와 28개 공립대학들로부터 학생들의 복지, 소득, 인력 데이터를 수집해 하나의 통합 플랫폼

에 제공함으로써 학생들의 학업 성취도를 취학 전 시기부터 대학 졸업 전 단계까지 분석할 수

있게 해 준다16).

2. 의료 및 보건 분야

의료 및 복지 지출 데이터, 민원센터 로그, 소셜 데이터, 해당 기관 홈페이지 및 포털 게시

판, 주요 일간지 등을 통합 분석하면 의료보험 비용 분석을 통한 사업 최적화, 부당 청구방지,

복지정책 입안과 만족도 분석, 지역별 복지 불균형 해소 등의 문제를 해결할 수 있다.

공중보건 분야에서는 전국의 의료 데이터를 연계하여 전염병 발생과 같은 긴박한 순간에

빠른 의사결정을 할 수 있게 하여 준다.

15) “안동・예천 구제역 피해농가 36가구 보상”, 국민권익위원회블로그, 2011년 6월 30일, http://blog.daum.net/loveacrc/4063

16) 빅데이터 전략연구센터(2013), 새로운 미래를 여는 빅데이터 시대, p.194.

Page 10: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

22 │ Journal of Korean Association for Regional Information Society

⑤ 환자 임상정보 분석 사례

2011년 미국의 ‘세톤 헬스케어 패밀리’라는 병원이 IBM의 인공지능 슈퍼컴퓨터 왓슨

(Watson)의 ‘의료용 콘텐츠 및 예측 분석기술’을 이용하여 환자 데이터를 분석하였다. 이 기

술은 방대한 양의 환자 데이터에서 임상정보를 추출・분석해 미래를 예측하고 대비함으로써

환자의 재입원과 병원 방문횟수를 감소시킬 수 있었다17).

⑥ 1000 유전체 프로젝트 사례

1000개 유전체 프로젝트는 2008년 1월 영국, 미국, 중국이 합작하여 다양한 인종으로 구

성된 인간 1000명의 유전체를 3년 내 해독하는 국제 프로젝트로써 그 동안 데이터 용량이 너

무 커서 일부 연구자들만 사용할 수 있었으나, 향후 컴퓨팅 서비스에 대한 비용만 요구할 계

획이다18).

⑦ 단백질 데이터 은행 사례

미 국립보건원은 전 세계 단백질 구조 관련 데이터 저장 및 유통 촉진을 위해 ‘단백질 데

이터 은행’을 운영하고 있다. 미국, 영국, 일본이 공동 운영하는 이 사이트는 현재 8,000여 개

의 단백질 구조 데이터를 저장하고 있으며, 매달 1 테라 바이트 규모의 단백질 데이터가 축적

되고, 매달 140개국 21만 1,000여 명의 사용자가 방문하고 있다19).

⑧ Pillbox 프로젝트를 통한 의료개혁 사례

미국은 국립보건원 사이트를 통한 알약 검색 정보를 활용하는 ‘필박스(pillbox) 프로젝트’

를 수행하였다. 필박스를 통해 수집된 빅데이터를 통해 후천성면역결핍증(HIV) 등 관리대상

인 주요 질병의 분포, 연도별 증가 등에 대한 통계치 확보가 가능하게 되었고, 연간 약 560억

원을 절감할 수 있었다20).

17) 상게서, p.41818) 빅데이터 전략연구센터(2012), 빅데이터로 진화하는 세상: Big Data 글로벌 선진 사례, pp.68∼71.19) 상게서, p.16120) 상게서, pp.72∼75.

Page 11: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

23

⑨ 구글 검색어 분석을 통한 독감예보 서비스 사례

실시간으로 독감이 검색되고 있는 추이를 보여주고 있는 구글의 독감예보시스템은 독감,

인프루엔자 등 감기와 관련된 검색어 쿼리의 빈도를 조사, ‘구글 독감 동향(Google Flu

Trends)’이라는 독감확산 조기경보서비스를 만들었다. 이 서비스는 미국 보건당국보다 한발

앞서 시간 및 지역별 독감 유행정보를 제공하고 있다21).

⑩ LA 카운티 육아서비스 보조금 부당청구 적발 사례

LA 카운티는 증가하는 육아서비스 관련 사기범죄에 전문적인 사기단이 연루된 것으로

추정하여 빅데이터 분석을 통해 보조금 수령인과 서비스 공급자를 파악 후 사기 행위에 연루

될 가능성이 큰 대상과 기금의 대량 손실이 발생할 우려가 있는 분야를 예측하여 조사 우선순

위를 결정하고 있다. 육아서비스 부당 청구 적발로 연간 $7M∼ $31M 비용절감을 하였고 부

정거래 검출 정확도를 85%로 향상시켰다22).

⑪ 동식물 및 인체 전염병 확산 대응 사례

영국은 글로벌 차원의 동식물 및 인간의 전염병에 효과적으로 대응하기 위해 정책을 제시

하고, USN, 데이터마이닝, 유전공학, 생물정보학 등을 이용하여 HIV/AIDS, 말라리아 등 다

양한 전염병에 대한 전망과 대응방안을 마련하였다. 또한 위성으로부터 농작물의 색깔 분포

등 특징을 파악한 후, 농작물의 위치, 건강 상태에 대한 정보를 추가로 수집하여 풍향과 기타

지리적 요소를 근거로 농작물 전염병의 이동 경로를 파악한다. 이러한 정보를 바탕으로 전염

병 확산에 대응하기 위한 농작물 전염병 영향예측 시스템을 개발하였다(Steinberg and

Bowman, 2004).

⑫ 영국의 비만대책 수립 사례

영국 정부는 2050년까지 남자의 60%, 여자의 50%가 비만이 될 것임을 밝히고, 매년 499

억 파운드가 소요될 것으로 전망하였다. 따라서 비만 문제는 더 이상 개인의 문제가 아닌 사

회적 문제임을 선언하고, 향후 40년간 영국사회의 비만문제를 효과적으로 대응하기 위해서

빅데이터를 통한 과학적 근거를 기반으로 정부, 기업, 시민사회의 공조하여 지속가능한 비만

21) 상게서, pp.88∼89.22) 한국지역정보개발원(2012), 빅 데이터 시대의 데이터 활용과 전략, 지역정보화 동향분석 제3호, p.8

Page 12: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

24 │ Journal of Korean Association for Regional Information Society

대책을 수립하였다23).

⑬ 싱가포르 조류독감 시뮬레이션 사례

본 연구의 목적은 조류독감이 싱가포르에 전염됨으로써 벌어질 수 있는 미래 시나리오를

연구하고 대응방안을 마련하는 것이다. 조류 독감 상황에 대한 시스템 맵이 구축되어 분석가

들이 지역에서 벌어지는 독감 출현의 위협 수준들을 평가한다24).

⑭ 농축산물 유통정보 분석 사례

농축산물에 대한 이력정보부터 농축산물의 토질, 온도와 습도, 일조량, 농약 및 유통경로

등 유통정보를 분석함으로써 안전한 먹거리 시스템을 강화하는 데에도 빅데이터가 활용되고

있다25).

3. 금융 분야

조세, 금융 거래 데이터와 소셜 데이터의 통합 분석을 통하여, 금융 거래 이상 징후, 조세

회피와 탈세 등의 패턴 감지와 조기 대응력 확보, 금융 및 조세 정책에 대한 시민 인식과 지역

별, 기간별 동향에 대한 분석을 수행하는데 빅데이터 분석을 활용할 수 있다. 빅데이터 기반

탈세방지시스템은 세무분야에서도 큰 성과를 나타내고 있다. 최근 정부가 지하경제 양성화를

추진하는 것도 세원 확대 없이는 복지재원 마련이 어렵기 때문이다. 빅데이터를 탈세방지에

접목한 뉴욕주의 사례는 시사하는 바가 크다.

⑮ 탈세방지 시스템 통한 국가재정 강화 사례

미국 국세청(IRS: International Revenue Service)은 사기성 납세신고 및 환급에 의한 탈

세 유형 적발을 목적으로 운영하고 있는 RRP(Return Review Program)에 빅데이터 실시간

분석 기법을 적용하는 프로젝트를 추진하였다. 빅데이터 솔루션을 기반으로 빅데이터에서 이

상 징후를 찾아내고, 예측 모델링을 통해 과거 행동정보를 분석해 사기패턴과 유사한 행동을

23) 빅데이터 전략연구센터(2013), 새로운 미래를 여는 빅데이터 시대, p.6124) 빅데이터 전략연구센터(2013), 새로운 미래를 여는 빅데이터 시대, pp.42∼43.25) 상게서, p.49.

Page 13: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

25

파악하며, 소셜네트워크 분석에 기반 한 범죄네트워크 분석기능을 통해 문제점을 찾아낸

다26).

⑯ 탈세 방지 시스템 사례

미국의 뉴욕주는 빅데이터를 탈세방지에 접목한 탈세방지시스템인 CISS(Case

Identification & Selection System)를 개발하여 환급사기적발에 큰 성과를 거두었다. CISS

도입 이후 부양가족의 허위신고와 판매세 허위환급이 사라졌다. 빅데이터 기반 탈세방지시스

템은 세원이 한정된 반면 탈세나 탈루 수법은 갈수록 지능화되고 있는 한국 등 여러 국가에서

사기방지에 혁신을 일으킬 수 있을 것으로 기대된다27).

⑰ 미국 주 정부 세금 시스템 사례

미국 오하이오와 오클라호마 주 정부가 국세청 데이터와 고용데이터를 연동하여 신규 세

원, 미납세금 확인 등에 활용하고 있다(정용찬, 2012).

⑱ 금융감독원의 저축은행 여신상시 감시시스템 사례

2012년 12월 16일 금융감독원은 여신상시 감시시스템을 구축하여 2013년 1월부터 본격

가동하였다. 저축은행의 여신관련 정보를 이용하여 데이터마이닝 기법인 연관성 분석을 통해

불법 및 부실혐의 여신을 사전에 탐지 할 수 있다. 금융감독원은 심도 있는 현장 여신검사를

할 수 있게 되고, 저축은행 스스로 불법 및 부실여신 취급을 자제하도록 하는 예방효과를 기

대할 수 있다28).

⑲ 한국석유공사 국내 유가예보 서비스 사례

한국석유공사는 2011년 말, 데이터분석 전문회사와 협력하여 유가예보 시스템을 개발하

였다. 고유가에 따른 소비자 부담을 감소시키기 위해 유가의 단기 미래가격을 예측하여 제공

하는 오피넷 시스템을 구축한 것이다. 오피넷 웹서비스를 통해 국내 1,300여 개의 주유소로

26) 빅데이터 전략연구센터(2013), Big Data 글로벌 10대 선진 사례, pp.6∼8.27) “빅데이터! 세금도둑도 잡는다?”, 머니투데이, 2013년 7월 16일,

http://news.mt.co.kr/mtview.php?no=2013071511335624582&type=128) "정신 못차리는 저축은행", 서울경제, 2013년 9월 22일,

http://economy.hankooki.com/lpage/finance/201309/e20130922163311117490.htm

Page 14: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

26 │ Journal of Korean Association for Regional Information Society

부터 수집된 휘발유 가격정보를 제공한다29).

4. 교통 분야

도로 센서 네트워크, 사건사고 로그, 날씨, 명절 및 스포츠 등의 이벤트 데이터와 빅데이터

에 기반한 교통 흐름 모델링과 예측, 최적화 시스템 구현, 교통 신호 체계와 유지보수 정책에

반영이 가능하다.

⑳ 서울시 심야버스 노선 최적화

서울시는 시민들의 휴대폰 통화량을 기반으로 한 KT의 유동인구 데이터와 시가 보유한

교통 데이터를 융합・분석해 최적의 심야버스 노선을 구축했다. 시민들이 자정부터 새벽 5시

까지 심야 시간대에 사용한 휴대폰 콜 데이터 30억여 건과 시민들이 이용한 심야택시 승・하

차 데이터 500만 건의 빅데이터를 융합하여 분석한 결과가 반영되었다. 이어 기존의 버스노

선과 시간・요일별 유동인구 및 교통수요 패턴을 분석하고, 노선부근 유동인구 가중치를 계산

하는 등 재분석을 거쳐 최적의 노선과 배차간격을 도출했다. 이번 심야노선 구축은 행정 데이

터만 활용하던 과거의 시 정책에서 민・관이 구축한 빅데이터를 융합했다는 데 의미가 있으며

도시교통정책에 빅데이터를 활용한 사례이다30).

㉑ 센서데이터를 활용한 지능형 교통안내 시스템 사례

일본은 센서데이터를 활용한 지능형 교통안내 시스템은 실시간으로 GPS 데이터를 분석

하여 최적의 교통정보를 사용자에게 전달하는 서비스를 제공한다. 택시 및 정보 제공에 동의

한 내비게이터 사용자로부터 얻어진 교통상황과 관련된 데이터를 종합 분석하여 실시간으로

출발지에서 목적지까지의 최적경로를 안내한다. 사용자에게 최적의 교통상황 및 경로를 안내

함으로써 에너지 효율을 높이고, 교통체증을 감소시키는 효과를 거두었다31).

29) 빅데이터 전략연구센터(2012), 빅데이터로 진화하는 세상: Big Data 글로벌 선진 사례, pp.42∼45.30) “서울시, 빅데이터로 심야버스 노선 구축”, 중앙일보, 2013년 7월 2일,

http://article.joins.com/news/article/article.asp?total_id=11959173&ctg=121331) 빅데이터 전략연구센터(2013), Big Data 글로벌 10대 선진 사례, p.9.

Page 15: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

27

㉒ 밀라노 교통상황 예측 사례

교통흐름에 영향을 주는 다양한 정보들을 종합적으로 분석하여 최적의 교통안내 서비스

를 제공하고 있으며, 5분에서 15분 간격으로 수집된 데이터를 분석하여 향후 2∼24시간 후의

교통상황 예측이 가능하다32).

5. 재난 국방 치안 분야

센서 데이터, CCTV, 소셜 데이터로부터 도심 내의 문제를 조기 파악하거나 재난의 조기

감지하고 대응할 수 있으며 도시민과 재난 지역의 시민 목소리를 바르게 이해, 응급 시 활동

에 반영할 수 있는 정책 의제 발굴에 활용이 가능하다. 뿐만 아니라 국가 안보, 국방, 치안 분

야 업무에도 적용 가능하다.

㉓ 재난관리청 실시간 재난 모니터링 사례

미국의 공공기관인 재난관리청(FEMA)은 재난에 신속하게 대응할 수 있도록 소셜미디어

및 타 정부기관과 연계시스템을 구축하였다. 페이스북, 트위터 등의 소셜미디어를 통하여 위

기상황과 구조요청 정보를 획득하여 실시간으로 응답하거나 위기관리 담당자에게 긴급상황

메시지를 전달할 수 있게 되었다. 재난관리청은 약 3만 명의 팔로워를 거느린 트위터 페이지

를 운영하고 소셜미디어 글의 모니터링에 주력하였다(국가정보화기획단, 2010).

㉔ 수해관리 프로젝트 사례

영국 해안의 침식은 가정과 경제에 큰 위협을 가하고 있으며, 수백만 명이 이 위험에 노출

되고 있으며, 해마다 홍수에 대한 피해가 20배씩 증가하고 있다. 이처럼 영국을 순식간에 위

협할 수 있는 잠재적 위험에 대한 위험관리 프로젝트을 통해 30∼100년 이후를 대비한 위험

관리 대책을 마련하였다. 이 프로젝트를 통하여 기후변화, 강의 형태, 생태계의 변화 등 홍수

피해를 줄 수 있는 데이터 기반의 과학적 의사결정을 지원하고 있다33).

32) 빅데이터 전략연구센터(2012), 빅데이터로 진화하는 세상: Big Data 글로벌 선진 사례, pp.14∼15.33) 빅데이터 전략연구센터(2012), “선진국의 데이터기반 국가미래전략 추진현황과 시사점”, IT&Future

Strategy 제2호, p.21.

Page 16: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

28 │ Journal of Korean Association for Regional Information Society

㉕ 맨홀 안전관리 사례

뉴욕시는 오랫동안 맨홀 뚜껑이 폭발하는 사고가 이어져 왔다. 이에 미국의 통계학자 신

시아 루딘은 뉴욕시의 맨홀 5만1000개에 관련된 방대한 데이터로 예측 변수 106가지를 산출

하고, 이를 바탕으로 터질 위험이 있는 맨홀을 예측했다. 그리고 이후 심각한 사고를 일으킨

맨홀의 44%가, 루딘이 지목한 ‘위험성 상위 10%’에 포함된 것으로 나타나 분석의 유용성이

입증되었다34).

㉖ 테러 예측 시스템 사례

9.11 테러 이후, 국토안보부를 중심으로 테러 및 범죄방지가 주목을 받았다. 따라서 국토

안보부의 과학기술국에서 블로그, 소셜미디어, 수범사례 등 범정부적 빅데이터를 수집하고

분석하여 예측체계를 도입하였다. 특히, 사이버안보를 위해 빅데이터를 활용한 클라우드 보

안 인프라를 구축하였다35).

㉗ 해상 상황 인식 프로젝트 사례

싱가포르 국방부는 미국합동군사령부 그리고 북대서양조약기구와 공동으로 해상 안전 확

립을 위해 해상 상황인식 프로젝트를 추진하였다. 해상 테러, 해안침투 등 해상상황에 관한

의사결정을 지원하기 위해 위크시그널과 예상 시나리오 등 정보처리와 시각화를 수행하였다

(Lim, 2007).

㉘ 범죄 예방 시스템으로 안전 지역사회 구축 사례

샌프란시스코는 빅데이터 분석을 활용하여 과거 8년 동안 범죄가 발생했던 지역과 유형

을 세밀하게 분석하여 후속 범죄 가능성을 예측함으로써 범죄를 사전 예보하는 시스템을 구

축하였다. 이는 과거 범죄에 대한 통계 정보를 제공하는 것과 달리 새로운 범죄 가능성 정보

를 제공한다는 것에 큰 의미가 있다. 정책적 시사점은 과거 범죄자 및 범죄 유형을 소셜 네트

워크를 통해 지속적으로 관찰함으로써 그와 관련된 조직 및 범죄에 대한 예방이 가능하다는

것이다36).

34) “‘빅 데이터’ 세계를 꿰뚫다”, 시사인라이브, 2013년 7월 26일, http://www.sisainlive.com/news/articleView.html?idxno=17271

35) 빅데이터 전략연구센터(2013), “새로운 미래를 여는 빅데이터 시대”, pp.69∼70.

Page 17: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

29

㉙ 유전자 색인 시스템 사례

FBI는 유전자 감식 결과 도출된 고유한 패턴을 데이터베이스에 저장, 검색할 수 있도록

해당 법안을 개정하고 구축된 유전자 데이터베이스를 기초로 입력 대상, 활용범위 등을 지속

적으로 확장시켜 효율적인 범죄자 감식 시스템을 마련하였다. 유전자 정보은행 CODIS

(Combined DNA Index System)는 미제 사건 용의자 및 실종자에 대한 DNA 정보 1만 3,000

건을 포함한 12만 명의 범죄자 DNA 정보를 보유하고 있다37).

㉚ 소셜네트워킹 분석을 이용한 범죄예방 사례

미국 워싱턴주 노동산업부는 소셜네트워킹 분석을 통해 개인 범죄 연루자와 사기범죄 조

직을 파악함으로써 사기행각을 적발하고, 주변인들의 범죄 공모 여부, 범죄 조직과의 연관성

등을 파악하고 있다38).

㉛ 수배자 위치추적 프로그램 사례

위치추적 서비스 MetaCarta는 AI와 빅데이터를 접목하여 수천 개의 서류를 분석하고 그

결과를 대규모 지리 데이터베이스를 이용하여 상호 검증하도록 하여 위치를 정확히 제시해

준다. 즉, 수배 중인 사람의 이름이나 관련 키워드를 입력하면 그 사람의 소재위치를 정확하

게 지도에 맵핑해 주는 프로그램이다. 이 서비스는 범죄활동의 패턴을 추적하여 그 활동패턴

이 집중되는 위치를 찾아내는 데 활용이 가능하다39).

㉜ 스마트 CCTV를 이용한 사회안전망 사례

USN, CCTV 등 사회 전반에 IT 기기가 보급됨에 따라 데이터 분석에 의한 사회 안전망

서비스는 지속적으로 진화하고 있다. 특별한 움직임이 감지되었을 때만 움직이는 스마트

CCTV는 보안 관서에 정보를 제공함으로써 실시간으로 사회 안전을 확보하는데 기여하고 있

다. 또한 이른 새벽 낯선 사람들의 움직임 등 부자연스러운 행동 패턴을 탐지함으로써 경찰서

나 보안 서비스 업체에 경보를 발령하는 등 진화하고 있다40).

36) 빅데이터 전략연구센터(2013), Big Data 글로벌 10대 선진 사례, pp.40∼41.37) 빅데이터 전략연구센터(2013), Big Data 글로벌 10대 선진 사례, p.38.38) 빅데이터 전략연구센터(2013), 새로운 미래를 여는 빅데이터 시대, p.184.39) 상게서, p.419.

Page 18: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

30 │ Journal of Korean Association for Regional Information Society

적용분야

번호 사례 내용 / 효과데이터유형

지역범위

국가

사회

①민원동향분석시스템:

국민권익위원회 300만건 민원 분석

민원 발생원인 차단, 행정서비스 만족 제고

소셜 N 한국

②구제역 민원 현황 분석:

국민권익위원회질병 및 전염병 관리, 사회이슈

분석, 맞춤형 민원서비스소셜 N 한국

③ 자살 예측 시스템 SNS 1.5억건 실시간 분석 소셜 N 한국

④콜로라도주 교육부, 학업성취도 분석

중고 대학 학생들의 소득, 복지, 인력 데이터 수집

정형 R 미국

의료 ・

보건

⑤세톤헬스케어 패밀리병원,

환자 임상정보 분석재입원과 병원 방문횟수 감소 정형 R 미국

⑥ 국립보건원 게놈프로젝트 난치병치료, 신약개발 정형 G 미・영・중⑦ 단백질 데이터 은행 매달 140개국 21만명 방문 정형 G 미・영・일

⑧ Pillbox 프로젝트의료개혁, 알약 검색 정보, 연간

560억 원 절감정형 N 미국

<표 1> 공공부문 빅데이터 국내외 사례 32선

Ⅳ. 주요국의 공공부문 빅데이터 활용 사례 분석

III장에서 논의한 32개 국내외 공공부문의 빅데이터 활용사례를 <표 1>에 정리하였다. 마

지막 3개 열 가운데 ‘데이터유형’ 열은 분석대상인 소스 데이터의 형태 분류에 관한 것이며,

정형과 소셜(비정형 소셜미디어 데이터) 두 가지로 분류하였다. ‘지역범위‘ 열은 사례의 적용

지역 범위를 표시하며, 지자체(R: Regional), 전국(N: National), 그리고 전세계(G: Global)

세 가지로 분류하였다. 끝으로 사례가 적용된 국가명을 기재하였다.

32개 사례 중에서 ‘의료・보건’ 분야와 ‘재난・국방・치안’ 분야가 각각 10건으로 가장 많

고, 금융분야 5건, 사회분야 4건, 교통분야 3건 순이다. 데이터 형태는 정형 데이터 사례가 소

셜 데이터 사례보다 3배 이상 많았다. 즉, 네티즌들이 블로그, 트위터에 기재한 의견들을 텍스

트마이닝 기법에 의해 분석한 사례 보다는 이미 수집되어 있는 정형의 공공데이터를 분석한

사례가 더 많다는 의미이다. 아직은 소셜미디어 데이터 같은 비정형(텍스트) 데이터 분석내

용을 해석할 수 있는 인력이 부족하고, 크롤링이나 자연어처리 같은 기술적인 진입장벽이 존

재하기 때문이다.

40) 빅데이터 전략연구센터(2012), “선진국의 데이터기반 국가미래전략 추진현황과 시사점”, IT&Future Strategy 제2호, p.9.

Page 19: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

31

⑨ 구글 독감예보 감기 관련 검색어 쿼리 빈도 소셜 N 미국

⑩LA카운티 육아서비스

보조금 수령 사기 적발부당청구 적발 비용절감, 부정거래

검출정확도 향상정형 R 미국

⑪ 영국 전염병 대응책농산물 및 인간의 전염병 확산

대응정형 G 영국

⑫ 영국 비만대책 수립개인 문제가 아닌 사회적 문제로

인식정형 N 영국

⑬ 조류독감 시뮬레이션조류독감 미래 시나리오 연구하고

대응방안 마련정형 N

싱가포르

⑭ 안전한 먹거리 시스템 강화농축산물의 토질, 온도, 농약,

유통경로 분석정형 N 미국

금융

⑮ 국세청 탈세 방지 시스템 국가 재정 강화 정형 N 미국⑯ 뉴욕주 탈세 방지 시스템 환급 사기 적발 정형 R 미국

⑰ 국세청 데이터와 고용데이터 연동

오하이오주,오클라호마주 신규 세원, 미납

세금 확인정형 R 미국

⑱ 금융감독원 여신 상시 감시 시스템

연관성 분석을 통한 불법 및 부실 혐의 사전탐지

정형 N 한국

⑲ 석유공사 국내 유가 예보 서비스

오피넷 웹서비스(국내 1,300개 주유소 휘발유 가격 정보)

정형 N 한국

교통

⑳ 서울시 심야버스 노선 최적화

자정∼새벽 5시까지 사용한 휴대폰 콜 데이터와 심야 택시 승・하차

데이터 융합정형 R 한국

㉑ 지능형 교통안내 시스템 센서 데이터 활용 정형 R 일본

㉒ 밀라노 최적 교통안내 서비스

5∼15분 간격 교통정보 분석, 향후 2∼24시간 교통 상황 예측

정형 R이탈리아

재난・

국방・

치안

㉓ 재난관리청, 재해정보 알리미 서비스

소셜미디어 글 모니터링, 팔로워 3만 명

소셜 N 미국

㉔ 수해위험 관리프로젝트 해안침식, 홍수 정형 N 영국

㉕ 뉴욕시 맨홀 안전 관리맨홀 5만개 관련 데이터로 예측

변수 106가지 산출정형 R 미국

㉖ 국토안보부 테러 및 범죄 방지

테러 예측체계 구축 소셜 N 미국

㉗ 해상안전 시뮬레이션싱가포르 국방부, 미국합동군

사령부, NATO정형 G

싱가포르

㉘ 샌프란시스코 범죄예방 시스템

안전한 지역사회 구축 정형 R 미국

㉙ FBI 유전자 색인시스템 단시간 범인 검거 체계 정형 N 미국

㉚ 워싱턴주 노동산업부 소셜네트워크 분석

개인범죄 연루자와 사기범죄 조직 파악

소셜 R 미국

㉛ 위치추적 서비스 범죄활동 패턴추적, 위치추적 소셜 R 미국

㉜ 사회 안전망 서비스, 실시간

USN, CCTV 등 특별한 움직임 감지

소셜 N 미국

Page 20: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

32 │ Journal of Korean Association for Regional Information Society

빅데이터 적용의 지역범위를 살펴보면 전세계(G)에 적용된 사례 보다는 전국(N)과 지자체

(R)에 적용된 사례가 각각 서너 배씩 많이 출현하고 있다. 우선은 국가 단위나 지자체 단위 적용

에 집중되고 있다. 국가 분포를 보면 미국이 17개로 가장 많고, 다음으로 한국 6개, 영국 3개, 싱

가포르 2개, 그리고 일본과 이태리가 각각 1개 순이다. 그리고 미국, 영국, 중국이 공동 개발한

게놈프로젝트와 미국, 영국, 일본이 공동 개발한 단백질 데이터은행 사례가 각각 1개씩 있다.

또 다른 관점에서 전세계 공공부문 빅데이터 사례의 동향이나 패턴을 파악해 보기 위하여

<표 2>와 같이 가로축에는 데이터 유형을, 세로축에는 적용 지역범위를 설정하고 <표 1>에

정리된 내용에 맞게 각 사례를 배치하였다. 비록 32개의 사례에 불과하지만, <표 2>로부터

다양한 시사점을 도출할 수 있다고 판단된다. 이 표를 종합적으로 분석하기 위해 다음과 같이

세 가지 측면(전세계 일반 현황, 한국과 전세계 비교, 국내 현황 비교)에서 비교하였는데, 이

때 적용분야, 지역범위, 데이터유형, 국가라는 4가지 관점을 가미하여 분석하였다.

정형 소셜

지자체(R)

④ 콜로라도 교육부-학생관리⑤ 미국세톤헬스케어-환자진료⑩ LA카운티-육아보조금 사기⑯ 뉴욕주-탈세방지⑰ 주정부IRS-신규세원 발굴⑳ 서울시-심야버스 노선 결정㉑ 일본-지능형교통안내㉒ 밀라노-최적교통안내㉕ 뉴욕시-맨홀안전관리㉘ 샌프란시스코-범죄예방

㉚ 워싱턴주-사기범죄예방㉛ 미국-범죄패턴추적

전국(N)

⑧ 미국 Pillbox-의료개혁⑫ 영국-비만대책 수립⑬ 싱가포르-조류독감 대응⑭ 미국-농축산물유통정보⑮ 미국IRS-탈세방지⑱ 한국금융감독원-여신감시⑲ 한국석유공사 -유가 예보㉔ 영국-수해위험 관리㉙ 미국FBI-유전자 색인시스템

① 한국-민원 동향분석② 한국-구제역③ 한국-자살 예측⑨ 미국-구글 독감예보㉓ 미국재난관리청-재해정보㉖ 미국국토안보부-테러예측㉜ 미국-사회안전망

전세계(G)

⑥ 미영중-국립보건원게놈프로젝트⑦ 미영일-단백질 데이터은행⑪ 영국-전염병 대응㉗ 싱가포르-해상안전

<표 2> 데이터 유형과 적용 지역범위에 의한 분류

Page 21: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

33

첫째, 전세계 일반 현황은 (1) 정형데이터 사례가 소셜데이터 사례 보다 3배 가량 많다(데

이터유형). 소셜미디어가 급증하고 있으므로 향후 소셜분석 사례가 증가할 것으로 예상한다.

(2) 지자체(R)가 전국(N)보다 소셜데이터 사례 비중이 적다. 즉, 소셜데이터 분석은 지자체

보다는 국가 단위에서 진행되는 경향이 있다(지역범위/데이터유형). (3) 전세계 수준에서 진

행되는 빅데이터 사례가 상대적으로 적으며, 그나마 있는 4가지 사례도 모두 정형데이터 분

석 사례이다(지역범위/데이터유형). (4) 소셜데이터 분석은 사회 분야와 재난・국방・치안 분

야에만 적용되고 있다(적용분야/데이터유형).

둘째, 한국과 전세계 차이점은 (1) 한국은 미국과 비교해 볼 때 지자체 사례 비중이 적다

(국가/지역범위). (2) 미국은 교통 분야를 제외하고 4개 분야(총 17건)에 걸쳐서 고르게 적용

되고 있으며, 한국은 사회 분야(3건), 금융 분야(2건), 교통 분야(1건)에, 영국은 의료・보건 분

야(2건)와 재난분야(1건)에 적용되고 있다(적용분야/국가). (3) 한국은 전국적인 수준의 소셜

데이터 사례 비중은 높은 편이다(국가/지역범위/데이터유형).

마지막으로, 국내 비교는 (1) 지역범위 측면에서 보면 지자체(서울시 심야버스 노선결정

사례 1개) 사례보다는 전국 단위 사례(5개)가 더 많다는 점이 특징이고 (2) 적용분야 측면에

서 보면 5개 적용분야 중 사회, 교통, 금융 분야 사례는 있으나, 의료・보건 분야와 재난・국방・치안 분야는 없다. 북한과 대치하고 있는 한국으로서 국방 분야 빅데이터 사례가 없다는 것이

아쉬운데, 대북 감청 데이터를 텍스트마이닝 분석하면 북한의 동향에 대한 이해를 향상 시킬

수 있을 것이다.

이 밖에 잠재적 빅데이터 활용 부문은 학교폭력 예방, 지자체 기관 및 기관장 평판 분석,

국가 R&D 전략 분석, 맞춤형 민원 서비스, 내부 감사, 물가 관리 등 실로 헤아릴 수 없이 많

다. 정부 및 공공데이터의 공개의 폭이 넓어지고, 소셜미디어 데이터의 누적량 증가, 그리고

텍스트마이닝 기술이 더욱 발달하게 되어 비정형 소셜데이터에 기반 한 빅데이터 분석 사례

는 지속적으로 증가할 것으로 전망된다. 이메일, 게시판, 소셜데이터의 분석은 담합 등 악습

을 바로잡고 국가를 투명하게 운영하는 효과를 기대할 수 있다. 정부의 원활한 정책추진과 국

정운영을 위하여 다양한 사회갈등을 해소하고, 보다 효율적이고 효과적인 국가성장과 시민만

족도 향상을 위한 공공기관의 소셜 미디어 활용이 높아질 것을 기대해 본다.

Page 22: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

34 │ Journal of Korean Association for Regional Information Society

Ⅴ. 성공적인 빅데이터 추진을 위한 제언

전자정부를 통해 고도화된 시스템과 축적된 공공데이터를 빅데이터에 어떻게 활용하느냐

는 우리나라 차세대 정보화 정책의 핵심 과제이다. 일반적인 빅데이터 활용의 주요성공요소

는 데이터의 자원화, 데이터를 가공하고 분석・처리하는 기술, 데이터의 의미를 통찰하는 인

력 등 3가지로 볼 수 있다. 본 장에서는 우리나라 지자체의 빅데이터 추진 전략에 고려할 사항

들과 지역정보화 관점에서 지자체의 준비 사항을 살펴본다.

1. 지자체 보유 공공데이터에 대한 현황 분석

지자체 빅데이터 추진 전략에 고려할 첫 번째가 지자체 보유 데이터에 대한 현황 분석이

다. 데이터의 자원화를 위해서는 활용할 수 있는 빅데이터를 찾아내는 것이 우선이다. 이를

위하여 지자체는 어디에 어떤 데이터를 어느 정도 보유하고 있는가를 우선적으로 파악하여야

한다. 공공데이터에 대한 현황 분석이 선행되어야만 향후 필요한 인프라의 수준과 수집 가능

하지만 빠져 있는 의미 있는 데이터의 존재 여부 등을 파악할 수 있다. IV 장에서 언급한 한국

과 미국의 빅데이터 활용 현황을 비교해 볼 때 한국의 지자체 사례 비중이 상대적으로 적은

것은 지자체 보유 데이터에 대한 현황분석이 미흡한 것에 기인한 바가 적지 않다고 판단된다.

공공데이터의 효율적인 파악을 위해서는 지자체의 정형, 비정형 등 모든 데이터를 공공

DB로 구축하는 것이 가장 효율적이다.

지자체는 보유한 공공데이터를 수집・저장・보관・관리・분석・공유하는 측면과 함께 활용

할 수 있는 외부 빅데이터 자원을 발견하고 확보하는 노력도 중요하다. 또한 지자체는 공공과

민간 부분의 데이터 개방, 공유 및 ・활용을 촉진하기 위한 산・학・연・관 간의 제휴와 협력 기

반을 마련하여야 한다.

서울시 심야노선 구축은 행정 데이터만 활용하던 과거의 시 정책에서 민・관이 구축한 빅

데이터를 융합했다는 데 의미가 있다. 서울시는 KT와 MOU를 맺고, 외부 빅데이터 자원인

휴대전화 이력 데이터에서 유동인구 통계 정보를 얻을 수 있었다. KT 역시 휴대전화 이력 데

이터는 매우 가치 있지만 프라이버시 이슈 때문에 잘 활용되고 있지 못하는 데이터를 공익차

원에서 분석하고, 프라이버시를 침해하지 않는 수준에서 통계정보를 제공함으로써 데이터의

활용 가치를 높일 수 있었다. 서울시의 심야버스 노선 구축은 지자체가 공공과 민간 부분의

Page 23: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

35

데이터 개방, 공유 및 ・활용을 위하여 제휴와 협력 기반을 마련한 좋은 본보기이다.

중앙정부가 공공부문의 성공적인 빅데이터 활용을 위하여는 지방정부의 참여가 빅데이터

전략의 핵심 방향이 되어야 한다. 지방정부의 데이터 파악 및 확보는 국가 공공DB 구축에 기

초가 될 뿐만 아니라 빅데이터를 통해 지방정부의 실효성 있는 정책을 개발하는데 필요하기

때문이다. 지방정부에 어떤 데이터가 있는지, 특정 지역에 어떤 정책이 필요한지 등은 지방정

부가 가장 잘 알고 있다. 지방정부는 특정 지역의 기후와 경제활동 등 다양한 지역정보를 분

석해 지역 문제를 해결하고 실효성 있는 정책을 만들어 낼 수 있다.

2. 빅데이터 활용을 위한 인프라 구축

두 번째로는 지자체가 데이터를 축적하고 분석하기 위한 인프라 현황에 대한 분석도 필요

하다. 선행된 데이터 현황에 대한 분석 결과에 따라 어느 정도의 컴퓨팅 인프라가 필요한지,

현 수준의 인프라를 가지고 충분히 추진 가능한지 등에 대한 의사결정이 필요하기 때문이다.

인프라 현황에 대한 분석은 컴퓨팅 자원과 같은 기술적인 인프라 뿐만 아니라 빅데이터 관련

기술개발 및 활용에 요구되는 조직, 인력 등 소프트웨어적 인프라에 대한 현황 분석도 함께

이루어져야 한다. 기술적인 인프라 측면에서는 빅데이터를 지자체의 혁신 전략으로 활용할

수 있도록 빅데이터 플랫폼, 빅데이터 분석 기술 및 데이터 분석 기법에 대한 이해가 선행되

어야 한다. 즉 지방 정부의 실효성 있는 정책을 개발하는데 있어 빅데이터 관련 기술을 적극

적으로 활용하는 것이 중요하다.

빅데이터 프로젝트는 설계, 분석, 실행이라는 세 가지 주요 단계로 구성된다. 일반적으로

각 단계 중 어느 하나라도 자동화되거나 빅데이터를 처리하는 컴퓨터 알고리즘에 맡길 수 있

는 부분은 없다. 지자체에서 확보하여야 할 빅데이터 인력의 중요한 역할은 지방 정부가 가지

고 있는 의문이나 문제, 전략적 과제 등을 이해하고 분명히 표현할 수 있도록 도와주며 이를

빅데이터 분석 프로젝트의 설계에 반영하는 것이다. 빅데이터 분석으로부터 이제까지 몰랐던

의미를 추출해 내는 것은 아직까지 ‘사람’의 영역이다. 이를 위해서는 빅데이터를 관리하고

분석할 수 있는 데이터 과학자의 양성과 확보가 무엇보다 중요한 과제이다. 지자체는 내부 인

력을 데이터 과학자로 양성하는 지속적인 교육 정책뿐만 아니라 외부 전문가를 확보하기 위

한 노력도 병행되어야 한다.

Page 24: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

36 │ Journal of Korean Association for Regional Information Society

3. 공공 정보의 개방과 공유 문화 확산에 적극적 참여

II장의 주요 선진국의 빅데이터 추진 전략에서 공통적으로 발견되는 것은 공공데이터의

개방과 공유이다. 공공정보 개방 정책의 대표적 모범사례는 미국 정부의 ‘data.gov’이다. 이

것은 총 65만 여개의 데이터 세트를 다양한 형태로 제공하고 있어 공공정보 소비자의 의도와

취향에 맞게 사용이 가능하다. 미국 정부는 data.gov를 이루는 핵심 메커니즘과 코드 등을 인

터넷에 전격 공개(2011.12)하여 공공정보 관련 산업분야의 주도권을 강화하고 있다.

공공데이터의 공유와 개방의 문제는 비단 빅데이터 활용에만 해당되는 것이 아니라 효과

적인 대민 서비스를 개발하고 공공정보에 기반 한 빅데이터 생태계 구축 및 관련 산업 활성화

를 위해서도 필요한 사항이다. 지방정부가 공개한 데이터를 활용하는 민간기업의 활발한 참

여는 빅데이터의 개방과 도입을 통해 새로운 시장이 열림으로써 정체된 정보통신 시장을 활

성화하고 경쟁력 강화, 고용 창출 등의 경제 효과를 기대할 수 있다.

빅데이터를 위해 민간 기업이 보유하고 있는 데이터를 개방, 공유하는 것은 현실적으로

쉽지 않다. 그러나 공공기관 데이터의 개방, 공유의 활성화는 향후 민간기업의 데이터를 점진

적으로 개방하는 문화 조성도 가능할 수 있으므로 매우 중요한 의미를 갖는다.

지자체도 정부의 데이터 개방 정책에 적극적으로 참여하여야 한다. 우리나라 정부는 ‘공

유 자원 포털'을 통해 441종의 데이터를 제공하고 있다. 서울시도 2012년 5월 '열린 데이터 광

장' 서비스를 개시하고 50여종의 데이터를 개방했다. 하지만 미국 정부가 39만종, 캐나다와

영국이 각각 1만3,000종과 8,700여종의 데이터를 제공하는 데 비하면 아직 미미한 수준이다.

이러한 데이터의 개방과 공유는 지자체 단위로까지 이 같은 흐름이 이어져야 빅데이터 생태

계 구축 및 관련 산업 활성화를 앞당길 수 있다.

지자체는 공공데이터의 개방과 공유에 적극 나서고 민간기업이 이를 기반으로 실제 사업

화하고 서비스를 제공 할 수 있도록 지원하여야 한다. 이를 위하여 지자체는 수요자(민간)를

대상으로 공공정보에 간편하게 접근하고 수집할 수 있도록 정보목록서비스, 공공정보 신청안

내, 정보 보유기관 연계 등의 서비스를 지원하여야 한다.

4. 공공데이터 활용을 위한 오픈 플랫폼 구축

data.go.kr은 공공데이터포털로서 우리나라의 대표 개방창구로서의 역할을 수행하고 있

Page 25: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

37

다. 그러나 현재 공개되는 통계청에서 제공하는 수치로 표시된 데이터를 제외하고 대부분의

데이터는 문서 자료 등과 같은 비정형 데이터이므로 표준화된 데이터 세트를 공개할 필요가

있다. 이를 위하여 여러 기관에서 표준화된 OPEN API41)를 기반으로 개발할 수 있는 플랫폼

을 구축하여 제공함으로써 지자체가 공개한 데이터를 이용한 민간 기업의 애플리케이션 개발

을 장려할 수 있다.

표준화된 OPEN API를 지자체에서 개발, 제공하기는 어렵지만 지자체가 오픈 플랫폼을

활용하여 보유하고 있는 공공데이터를 개방 공유함으로써 민간사업자의 참여를 유도하고 관

련 산업 활성화와 지방 정책 수립에 집단지성의 효과를 극대화하는 것은 지자체의 몫이다.

미국 Socrata사는 공공데이터를 개방하고자 하는 연방정부, 공공기관을 대상으로 공통된

플랫폼을 구축해주는 사업을 하고 있다. Socrata의 플랫폼은 표준화된 데이터 세트를 제공하

기 위한 API, 클라우드 시스템, 시각화 시스템 등을 제공하며 시카고, 시애틀, 오레곤, 워싱턴

등 지방정부가 이 플랫폼을 이용하고 있다. 지자체의 오픈 플랫폼 제공을 위해서는 미국

Socrata사의 사례를 참고할 필요가 있다.

5. 소셜미디어의 활용

최근 공공기관에서 소셜미디어를 활용하는 사례가 많이 나타나고 있다. 우리나라 85개 지

방자치단체를 분석대상으로 소셜미디어 활용과 관련한 설문 조사에서 84.7%인 72개 지방자

치단체에서 현재 소셜미디어를 활용하고 있다(서진완 외, 2012). 따라서 지자체의 빅데이터

활용을 위한 소셜 데이터의 확보는 가능한 것으로 판단된다.

소셜미디어를 정부 및 공공기관에서 활용하는 사례나 잠재적 활용분야는 매우 다양하다.

정부의 정책과 정부 간행물에 대한 홍보와 PR, 민원서비스, 고객(주민)에 대한 정보제공, 자

연재난과 위기발생시 정보전파와 대응요령 등 전달, 캠페인 실시, 필요 인력 채용통로로 활

용, 조직 내 커뮤니케이션 통로 활용 등 다양한 분야에서 활용이 이루어지고 있다. 하지만 아

직 우리나라에서 구체적으로 소셜미디어를 빅데이터에 활용한 사례는 많지 않다. III장의 빅

데이터 활용 사례에서 보는 바와 같이 공공부문에서의 비정형 데이터와 소셜미디어의 활용이

늘어나는 추세이므로 지자체에서도 빅데이터의 성공적인 추진을 위하여 소셜 데이터를 활용

41) OPEN API(Application Programming Interface)란 자신이 보유한 정보나 애플리케이션들을 네트워크

를 통하여 정보시스템에서 활용할 수 있도록 공개하는 기술

Page 26: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

38 │ Journal of Korean Association for Regional Information Society

할 필요가 있다. 지자체에서 빅데이터의 성패는 데이터의 대부분을 차지하는 비정형데이터의

활용에서 갈릴 수도 있기 때문이다.

6. 중앙정부의 공공분야 빅데이터 지원 사업 활용

중앙정부(미래부와 한국정보화진흥원)는 빅데이터 도입에 관심 있는 정부부처, 지자체,

공공기관, 기업을 대상으로 사업 기획, 데이터 현황 분석 및 개인정보보호 등에 문제가 없는

데이터 연계방안, 데이터 형태・규모를 고려한 적정 기술 등을 제공하는 빅데이터 컨설팅 사

업을 추진하고 있다. 지자체는 이러한 사업을 통해 지자체의 빅데이터 도입을 통한 지방 정책

역량을 향상시킬 수 있을 뿐만 아니라, 민간기업과의 협력방식으로 추진하여 빅데이터 초기

시장 및 새로운 비즈니스 창출에 기여할 수 있을 것으로 사료된다.

7. 빅데이터 사업 유형 및 도입 방법

빅데이터 도입 방법은 케이스마다 다르고, 지방정부의 상황에 따라 다르다. 지방자치단체

에서 추진하는 빅데이터 사업의 유형은 크게 분석환경 구축형과 분석 서비스 활용형으로 대

별할 수 있다(한국정보화진흥원, 2012). 분석 환경 구축형은 빅데이터 분석과 활용을 위해 지

자체가 분석 시스템과 운영환경을 구축하여 확보하기 위한 사업 유형이다. 이와 대조적으로

분석 서비스 활용형은 지자체가 분석 환경을 자체 구축하지 않고, 외부 분석 업체의 데이터와

분석 환경을 활용하거나, 지자체 내 시스템을 외부 분석업체의 분석 시스템과 연계하여 활용

하는 방식이다.

분석환경 구축형은 장기적이고 지자체 조직 전체에 빅데이터 인프라를 우선 도입하는 방

식이고 분석 서비스 활용형은 데이터 기반으로 문제해결을 위한 목표 지향적인 도입방식으로

볼 수 있다. 지자체가 분석환경 구축형을 선택하여 조직 전체에 빅데이터 인프라를 도입의 경

우 많은 예산이 필요하고, 장기적인 구축이 예상되기 때문에 최고 경영자의 승인과 지속적인

지원이 필수적이다. 이러한 점을 고려하면 우리나라 지자체의 환경에서는 도입을 검토하는

단계에서 좌절할 가능성이 높다고 판단된다.

대부분의 지방정부는 현재 해결해야 하는 당면과제를 안고 있기 때문에 문제해결이라는

목표를 중심으로 빅데이터 도입을 검토하는 것이 조직 전체의 빅데이터 인프라 도입보다 현

실적인 방안이라 할 수 있다. 현안 문제를 정의하고 이에 대한 해결책으로 빅데이터를 활용하

Page 27: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

39

는 접근은 소규모 예산으로 단기간에 실행할 수 있으며 부서 단위에서 의사결정으로도 가능

할 수 있다. 이 과정을 통해 데이터 기반 문제해결의 가능성을 검증하고, 향후 본격적인 빅데

이터 도입 타당성을 마련하는 기회로 활용할 수도 있다. 즉, 지방 정부는 현재 지자체가 당면

한 문제나 시급히 해결해야 할 분야 등 빅데이터 활용의 효과가 뛰어난 분야를 선정하고 집중

적인 투자와 기술개발을 통해 성공사례를 만든 후 보다 많은 분야로 점차 확대할 필요가 있

다.

이러한 점을 고려할 때 지방정부의 초기 빅데이터 도입은 문제해결을 위한 목표 지향적인

도입방식인 분석 서비스 활용형이 상대적으로 적합하다고 사료된다.

Ⅵ. 결론

폭증하는 데이터가 경제적 자산이 되는 ‘빅데이터 시대’가 도래하면서 국가의 경쟁력에도

지대한 영향을 미치게 되었다. 이에 따라 미국・영국・EU 등 세계 각국도 경쟁적으로 공공데

이터를 개방하고 빅데이터 기반의 국가 미래전략을 추진하고 있으며 빅데이터를 사회 현안

해결을 위한 새로운 방법으로 활용함으로써 공공서비스의 효율을 높이고 있다.

III장에서 살펴 본 공공부문의 빅데이터 사례는 사회, 의료・보건, 금융, 교통, 재난・국방・치안과 같이 다섯 가지 적용분야에 편중되어 있으나 다양한 분야로 확산되고 있는 추세이다.

이에 반하여 한국의 경우, 공공데이터의 빅데이터 적용 분야도 매우 한정되어 있을 뿐만 아니

라, 지역정보화 차원에서의 빅데이터 활용도 매우 미흡한 편이다. 따라서 지자체는 위의 적용

분야 이외에 다양한 적용 분야를 개발할 필요가 있다. 또한 SNS의 급격한 확산으로 비정형

소셜데이터에 기반한 빅데이터 분석의 활용사례가 증가할 것으로 예상되므로 소셜데이터의

확보, 지자체의 당면한 문제를 정의하고 이를 빅데이터 분석에 적용, 결과를 해석할 수 있는

내부 인재의 양성 및 빅데이터 적용 기술의 이해를 높이는 등의 준비가 요구된다.

지자체의 성공적인 빅데이터 추진을 위하여는 사전에 철저한 준비가 필요하다. 이를 위하

여 지자체는 보유하고 있는 공공데이터와 인프라 현황에 대한 분석이 선행되어야 한다. 인프

라 현황에 대한 분석은 컴퓨팅 자원과 같은 기술적인 인프라 뿐만 아니라 빅데이터 관련 기술

개발 및 활용에 요구되는 조직, 인력 등 소프트웨어적 인프라에 대한 현황 분석도 함께 이루

어져야 한다. 지자체는 오픈 플랫폼을 통한 공공 정보의 개방과 공유 문화 확산에도 주력하여

Page 28: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

한국지역정보화학회지 제16권 제3호

40 │ Journal of Korean Association for Regional Information Society

민간사업자의 참여를 유도하고 관련 산업 활성화와 지방 정책 수립에 집단지성의 효과를 극

대화하여야 한다. 마지막으로 지자체의 성공적인 빅데이터 도입을 위하여는 중앙정부의 공공

분야 빅데이터 지원 사업을 활용할 필요가 있으며 도입 초기에는 문제해결을 위한 목표 지향

적 도입방식인 분석 서비스 활용형 접근법이 상대적으로 보다 적합하다고 사료된다.

참고문헌

국가정보화기획단(2010), “공공 부문의 성공적인 소셜미디어 도입 및 활용 전략”, 한국정보화진

흥원, CIO Report, Vol.24, p.11.

권정은, 정지선(2012), “소셜 분석으로 살펴본 청소년 자살예방정책의 시사점”, 새로운 미래를

여는 빅데이터 시대, 정보화진흥원 보고서, pp.321-352.

민원정보분석센터(2013), “민원 키워드 중심으로 살펴 본 국민신문고 출범 이후 민원 분석”, 국

민권익위원회 연구보고서.

빅데이터 국가전략 포럼(http://bigdataforum.or.kr)

빅데이터 전략연구센터a(2012), 「선진국의 데이터 기반 국가미래전략 추진 현황과 시사점」. 한

국정보화진흥원 연구보고서.

빅데이터 전략연구센터b(2012). 「알기쉬운 공공부문 빅데이터 분석 활용 가이드 v1.0」. 한국정보

화진흥원 연구보고서.

빅데이터 전략연구센터a(2013). 「데이터기반 국가미래전략을 위한 정책과제」. 한국정보화진흥

원 연구보고서.

빅데이터 전략연구센터b(2013). 「Big Data_글로벌 10대 선진사례」. 한국정보화진흥원 연구보고

서.

빅데이터 전략연구센터c(2013). 「새로운 미래를 여는 빅데이터 시대」. 한국정보화진흥원연구보

고서.

서진완・남기범・김계원(2012). “지방자치단체의 소셜미디어 활용 현황 분석과 의미”. 한국행정

학보 제46권1호: 131∼155.

이만재(2011). “빅데이터와 공공데이터 활용”. Internet and Information Security. 제2권2호.

이응용(2012). “빅데이터 시대, 새로운 가능성과 해결과제”. 인터넷 & 시큐리티 이슈: 한국인터

넷진흥원, 2012년 2월호: 4∼26.

일본 총무성(2012). ‘知識情報社會の實現に向けた情報通信政策の在り方: Active Japan ICT 戰

Page 29: 지방자치단체의 빅데이터 도입을 위한 제언*¹€신곤_조재희.pdf · 대한 텍스트 데이터와 지리 정보를 제공하여 상세한 정보를 바탕으로

지방자치단체의 빅데이터 도입을 위한 제언

41

略’, 자료39-3-2, 2012.7.12 재구성.

정용찬(2012), “빅데이터 혁명과 미디어 정책 이슈”, KISDI Premium Report, p.10.

조문래(2012). “美・日의 Big Data R&D 전략과 우리나라의 대응과제“. IT R&D 정책동향: 정보통

신산업진흥윈.

Colin Upstill, Matthew Addis, Freddy Choi, Steve Taylor, and Rowland Watkins(2010). Infectious

Diseases: Preparing for the Future, Office of Science and Innovation, University of

Southampton IT Innovation Centre.

Lim, Irvin(2007), “Comprehensive Maritime Domain Awareness”, Journal of The Singapore Armed

Forces, Vol.33 No.3.

President's Council of Advisors on Science and Technology(2010). Design a Digital Future: Federally

Funded Research and Development in Networking and Information Technology. White House:

Executive Office of the President.

Steinberg, Alan & Christopher Bowman(2004). "Rethinking the JDL Data Fusion Levels". National

Symposium on Sensor and Data Fusion.

42)

김신곤: 제1저자, 연세대학교 경영학과를 졸업하고 서울대학교 대학원 경영학과에서 경영학 석사 (재무관

리), Georgia State University 에서 CIS (Computer Information Systems) 석사와 경영정보학 박사를 취득하

였다. 코리아로터리서비스 (KLS)에서 즉석복권을 개발하였고 현재 광운대학교 경영학부 교수로 재직 중이

다. 주요관심분야는 경영정보시스템, 시스템다이나믹스, 비즈니스 인텔리전스, CRM, 빅데이터 등이다

([email protected]). 조재희: 제2저자/교신저자, 연세대학교 경영학과를 졸업하고 Miami University(Ohio)에서 경영학 석사, University of Nebraska-Lincoln에서 경영정보학 박사를 취득하였다. 펜타시스템테크놀로지와 LG CNS에서

컨설턴트로 근무하였고, 현재 광운대학교 경영학부 교수로 재직 중이다. 주요 관심분야는 데이터자산의 전략

적 활용, 다차원 모델링, 데이터웨어하우스, 비즈니스 인텔리전스, CRM, 빅데이터 등이다([email protected]).

<논문접수일: 2013. 9. 2 / 게재확정일: 2013. 9. 22>