빅데이터로 인한 기회-맞춤정부 만들기_nia

55
보다 빠르고 스마트한 맞춤 정부 만들기 크리스 유 빅데이터로 인한 기회

Upload: giru-jang

Post on 13-Jul-2015

1.348 views

Category:

Documents


2 download

TRANSCRIPT

보다 빠르고 스마트한 맞춤 정부 만들기

크리스 유

빅데이터로 인한 기회

보다 빠르고 스마트한 맞춤 정부 만들기

크리스 유

빅데이터로 인한 기회

목 차

Ⅰ 요약 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 1

Ⅱ 빅데이터로 인한 기회 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 3

Policy Exchange 및 저자 소개 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 5

디지털정부유닛에 대하여 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 6

감사의 글 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 7

요약 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 8

1 어디를 가도 데이터 천지 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 12

2 빅데이터 개요 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 13

3 공공부문에서 빅데이터가 왜 중요한가 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 18

4 실용적인 아이디어 소개 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 24

5 노력의 결실 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 30

6 빅데이터에도 엄격한 판단이 필요하다 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 33

7 역량 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 36

8 권한(Power)과 책임 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 41

9 권고 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 44

덧붙이는 말 지도자들이 해야 할 질문 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 49

요약 985115 1

985150 요 약 985150983787 보편화된 모바일 기기 사용 및 SNS 이용 확산 등에 따라 빅데이터

(Big data)가 글로벌 이슈로 급부상

๐ 미국과 일본 정부는 이미 빅데이터 활용을 통한 정부 서비스 개선

전략1)을 추진 중이며 OECD는 빅데이터의 경제적 가치 측정을 주요

의제2)로 채택하여 논의

983787 주요 선진국을 중심으로 빅데이터 전략이 추진되고 있는 가운데 영국의

연구기관인 팔러시 익스체인지(Policy Exchange)가 빅데이터의 경제적

가치를 추정한 보고서(The Big Data Opportunity)를 발표

๐ 영국이 공공부문에서의 빅데이터 활용을 통해 연간 160억 파운드에서

최대 330억 파운드를 절감할 것으로 추정

lt 영국 공공부문에서의 빅데이터 경제적 효과 (단위 billions 파운드) gt

연간 상한선 및 하한선

2-8 16-33

1-3

6

1713-222

2

9

1

1613

운영효율개선 부정오류 감소 세입 증가 합계

출처 영국 재무부 국세관세청 맥킨지 Policy Exchange 분석

1) 미국 정부는 2012년 3월 2억 달러 이상이 투입되는 lsquoBig Data Research and Development Initiativersquo를 일본은 2012년 7월 lsquoActive JapanICT 전략rsquo의 하위 전략으로 lsquo액티브 데이터 전략rsquo을 수립하여 추진 중

2) OECD는 2011년 6월 7 8일 양일간에 걸쳐 개최된 제15차 WPIIS 회의에서 lsquoMeasuring the Economics of Big datarsquo를 의제로 채택하여 빅데이터의 경제적 가치를 검증하고 정책적 함의 도출

2 985115 빅데이터로 인한 기회

๐ 세부 내역별로는 정부의 운영효율개선을 통해 최대 220억 파운드

세수 확대 및 부정 오류 감소를 통해 최대 110억 파운드를 확보할

것으로 분석

๐ 팔러시 익스체인지는 공공부문의 빅데이터 활용이 공공 서비스의

수준을 낮추지 않으면서도 정부 운영 효율을 향상시킬 수 있는

방안이라고 주장

983787 팔러시 익스체인지는 세수 관리 인구 조사 등에 이르기까지 여러 분야의

빅데이터 적용 아이디어를 제안

๐ 10년 주기로 실시하는 인구조사 대신 선거인명부 건강보험 환자기록

국민연금 데이터 등을 결합하여 인구학적 정보 획득

๐ 이를 통해 약 5억 파운드의 예산 절감이 가능할 뿐만 아니라 고품질의

시의성 있는 인구센서스 정보 확보 가능

983787 필연적으로 도래한 빅데이터 시대를 맞이하여 영국 정부가 빅데이터를

효과적으로 활용하기 위한 전제조건 제시

๐ 빅데이터 활용을 가로막는 장애사항을 해결하고 공공부문 인력의

역량 강화

๐ 개인정보 및 프라이버시 침해 등에 대한 국민 신뢰 확보를 위해 최고

수준의 도덕성을 기반으로 빅데이터 정책 추진

빅데이터 이용 활성화를 위한 전제조건

① 빅데이터 기술 이외에 품질 표준 등의 쟁점사항 해결

② 정부 스스로 데이터를 분석해석활용할 수 있는 역량 확보

③ 지도자 및 정책 담당자들이 기본적인 빅데이터 기법을 숙지하고 이를 정책

판단시 결합할 수 있는 능력 보유

④ 개인정보보호 추적 감시 등 프라이버시 침해 등으로부터 국민의 신뢰를

확보하기 위한 견고한 윤리의식 기반의 빅데이터 정책 추진(책임분석강령

채택 권고)

빅데이터로 인한 기회- 보다 빠르고 스마트한 맞춤 정부 만들기 -

2012 7

본 자료는 2012년 7월 3일 영국의 연구기관인

팔러시 익스체인지(Policy Exchange)가 발표한

lsquoThe Big Data Opportunity Making government faster

smarter and more personalrsquo의 번역본입니다

Policy Exchange 및 저자 소개 985115 5

Policy Exchange

Policy Exchange는 영국 최고의 싱크탱크이다 교육 자선단체로서 더 나은 공공 서비스 보다 튼튼한 사회 더욱 역동적인 경제를 실현할 새로운 정책안을 발굴 홍보하는 것을 목적으로 하고 있다(자선단체 등록번호 1096300)

Policy Exchange는 정책 개발을 위해 증거 기반의 접근방식을 취한다 학계 및 기타 전문가들과 협력하고 있으며 대안적 정책 결과의 상세한 경험적 조사와 관련된 주요 연구를 맡고 있다 다른 국가들의 정책 경험이 영국 정부에게도 중요한 교훈이 된다는 점을 믿고 있으며 기업 및 자원봉사 부문에서도 정부가 배울 점이 많다고 본다

이사진

Daniel Finkelstein (의장) Richard Ehrman (부의장) Theodore Agnew Richard Briance Simon Brocklebank-Fowler Robin Edwards Virginia Fraser Edward Heathcoat Amory David Meller George Robinson Robert Rosenkranz Andrew Sells Tim Steel Rachel Whetstone and Simon Wolfson

저자 소개

크리스 유(Chris Yiu)는 Policy Exchange의 디지털정부유닛(Digital

Government Unit)의 장이다 디지털 통신 첨단 및 빅데이터 시대에서

의 공공정책에 관한 연구를 지휘하고 있다 크리스 유는 런던에서 태어

나고 자랐으며 캠브리지대학교 경제학과를 수석으로 졸업하고 동대학 경

제 및 금융 대학원 석사학위를 보유하고 있다

copy Policy Exchange 2012Published byPolicy Exchange Clutha House 10 Storeyrsquos Gate London SW1P 3AYwwwpolicyexchangeorguk

ISBN 978-1-907689-22-2Printed by Heron Dawson and SawyerDesigned by Soapbox wwwsoapboxcouk

6 985115 빅데이터로 인한 기회

디지털정부유닛에 대하여

디지털정부유닛은 정책담당자 및 정치인들이 혁신적인 디지털 경제

보다 스마트한 공공부문 그리고 더 튼튼한 사회를 위해 기술 잠재력을

발현시킬 수 있도록 도와주고 있다 보다 자세한 사업 내용은 다음 연락

처로 문의하면 된다

Email chrisyiupolicyexchangeorgukTwitter PXDigitalGov

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

보다 빠르고 스마트한 맞춤 정부 만들기

크리스 유

빅데이터로 인한 기회

목 차

Ⅰ 요약 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 1

Ⅱ 빅데이터로 인한 기회 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 3

Policy Exchange 및 저자 소개 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 5

디지털정부유닛에 대하여 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 6

감사의 글 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 7

요약 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 8

1 어디를 가도 데이터 천지 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 12

2 빅데이터 개요 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 13

3 공공부문에서 빅데이터가 왜 중요한가 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 18

4 실용적인 아이디어 소개 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 24

5 노력의 결실 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 30

6 빅데이터에도 엄격한 판단이 필요하다 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 33

7 역량 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 36

8 권한(Power)과 책임 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 41

9 권고 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 44

덧붙이는 말 지도자들이 해야 할 질문 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 49

요약 985115 1

985150 요 약 985150983787 보편화된 모바일 기기 사용 및 SNS 이용 확산 등에 따라 빅데이터

(Big data)가 글로벌 이슈로 급부상

๐ 미국과 일본 정부는 이미 빅데이터 활용을 통한 정부 서비스 개선

전략1)을 추진 중이며 OECD는 빅데이터의 경제적 가치 측정을 주요

의제2)로 채택하여 논의

983787 주요 선진국을 중심으로 빅데이터 전략이 추진되고 있는 가운데 영국의

연구기관인 팔러시 익스체인지(Policy Exchange)가 빅데이터의 경제적

가치를 추정한 보고서(The Big Data Opportunity)를 발표

๐ 영국이 공공부문에서의 빅데이터 활용을 통해 연간 160억 파운드에서

최대 330억 파운드를 절감할 것으로 추정

lt 영국 공공부문에서의 빅데이터 경제적 효과 (단위 billions 파운드) gt

연간 상한선 및 하한선

2-8 16-33

1-3

6

1713-222

2

9

1

1613

운영효율개선 부정오류 감소 세입 증가 합계

출처 영국 재무부 국세관세청 맥킨지 Policy Exchange 분석

1) 미국 정부는 2012년 3월 2억 달러 이상이 투입되는 lsquoBig Data Research and Development Initiativersquo를 일본은 2012년 7월 lsquoActive JapanICT 전략rsquo의 하위 전략으로 lsquo액티브 데이터 전략rsquo을 수립하여 추진 중

2) OECD는 2011년 6월 7 8일 양일간에 걸쳐 개최된 제15차 WPIIS 회의에서 lsquoMeasuring the Economics of Big datarsquo를 의제로 채택하여 빅데이터의 경제적 가치를 검증하고 정책적 함의 도출

2 985115 빅데이터로 인한 기회

๐ 세부 내역별로는 정부의 운영효율개선을 통해 최대 220억 파운드

세수 확대 및 부정 오류 감소를 통해 최대 110억 파운드를 확보할

것으로 분석

๐ 팔러시 익스체인지는 공공부문의 빅데이터 활용이 공공 서비스의

수준을 낮추지 않으면서도 정부 운영 효율을 향상시킬 수 있는

방안이라고 주장

983787 팔러시 익스체인지는 세수 관리 인구 조사 등에 이르기까지 여러 분야의

빅데이터 적용 아이디어를 제안

๐ 10년 주기로 실시하는 인구조사 대신 선거인명부 건강보험 환자기록

국민연금 데이터 등을 결합하여 인구학적 정보 획득

๐ 이를 통해 약 5억 파운드의 예산 절감이 가능할 뿐만 아니라 고품질의

시의성 있는 인구센서스 정보 확보 가능

983787 필연적으로 도래한 빅데이터 시대를 맞이하여 영국 정부가 빅데이터를

효과적으로 활용하기 위한 전제조건 제시

๐ 빅데이터 활용을 가로막는 장애사항을 해결하고 공공부문 인력의

역량 강화

๐ 개인정보 및 프라이버시 침해 등에 대한 국민 신뢰 확보를 위해 최고

수준의 도덕성을 기반으로 빅데이터 정책 추진

빅데이터 이용 활성화를 위한 전제조건

① 빅데이터 기술 이외에 품질 표준 등의 쟁점사항 해결

② 정부 스스로 데이터를 분석해석활용할 수 있는 역량 확보

③ 지도자 및 정책 담당자들이 기본적인 빅데이터 기법을 숙지하고 이를 정책

판단시 결합할 수 있는 능력 보유

④ 개인정보보호 추적 감시 등 프라이버시 침해 등으로부터 국민의 신뢰를

확보하기 위한 견고한 윤리의식 기반의 빅데이터 정책 추진(책임분석강령

채택 권고)

빅데이터로 인한 기회- 보다 빠르고 스마트한 맞춤 정부 만들기 -

2012 7

본 자료는 2012년 7월 3일 영국의 연구기관인

팔러시 익스체인지(Policy Exchange)가 발표한

lsquoThe Big Data Opportunity Making government faster

smarter and more personalrsquo의 번역본입니다

Policy Exchange 및 저자 소개 985115 5

Policy Exchange

Policy Exchange는 영국 최고의 싱크탱크이다 교육 자선단체로서 더 나은 공공 서비스 보다 튼튼한 사회 더욱 역동적인 경제를 실현할 새로운 정책안을 발굴 홍보하는 것을 목적으로 하고 있다(자선단체 등록번호 1096300)

Policy Exchange는 정책 개발을 위해 증거 기반의 접근방식을 취한다 학계 및 기타 전문가들과 협력하고 있으며 대안적 정책 결과의 상세한 경험적 조사와 관련된 주요 연구를 맡고 있다 다른 국가들의 정책 경험이 영국 정부에게도 중요한 교훈이 된다는 점을 믿고 있으며 기업 및 자원봉사 부문에서도 정부가 배울 점이 많다고 본다

이사진

Daniel Finkelstein (의장) Richard Ehrman (부의장) Theodore Agnew Richard Briance Simon Brocklebank-Fowler Robin Edwards Virginia Fraser Edward Heathcoat Amory David Meller George Robinson Robert Rosenkranz Andrew Sells Tim Steel Rachel Whetstone and Simon Wolfson

저자 소개

크리스 유(Chris Yiu)는 Policy Exchange의 디지털정부유닛(Digital

Government Unit)의 장이다 디지털 통신 첨단 및 빅데이터 시대에서

의 공공정책에 관한 연구를 지휘하고 있다 크리스 유는 런던에서 태어

나고 자랐으며 캠브리지대학교 경제학과를 수석으로 졸업하고 동대학 경

제 및 금융 대학원 석사학위를 보유하고 있다

copy Policy Exchange 2012Published byPolicy Exchange Clutha House 10 Storeyrsquos Gate London SW1P 3AYwwwpolicyexchangeorguk

ISBN 978-1-907689-22-2Printed by Heron Dawson and SawyerDesigned by Soapbox wwwsoapboxcouk

6 985115 빅데이터로 인한 기회

디지털정부유닛에 대하여

디지털정부유닛은 정책담당자 및 정치인들이 혁신적인 디지털 경제

보다 스마트한 공공부문 그리고 더 튼튼한 사회를 위해 기술 잠재력을

발현시킬 수 있도록 도와주고 있다 보다 자세한 사업 내용은 다음 연락

처로 문의하면 된다

Email chrisyiupolicyexchangeorgukTwitter PXDigitalGov

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

목 차

Ⅰ 요약 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 1

Ⅱ 빅데이터로 인한 기회 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 3

Policy Exchange 및 저자 소개 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 5

디지털정부유닛에 대하여 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 6

감사의 글 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 7

요약 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 8

1 어디를 가도 데이터 천지 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 12

2 빅데이터 개요 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 13

3 공공부문에서 빅데이터가 왜 중요한가 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 18

4 실용적인 아이디어 소개 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 24

5 노력의 결실 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 30

6 빅데이터에도 엄격한 판단이 필요하다 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 33

7 역량 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 36

8 권한(Power)과 책임 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 41

9 권고 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 44

덧붙이는 말 지도자들이 해야 할 질문 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot 49

요약 985115 1

985150 요 약 985150983787 보편화된 모바일 기기 사용 및 SNS 이용 확산 등에 따라 빅데이터

(Big data)가 글로벌 이슈로 급부상

๐ 미국과 일본 정부는 이미 빅데이터 활용을 통한 정부 서비스 개선

전략1)을 추진 중이며 OECD는 빅데이터의 경제적 가치 측정을 주요

의제2)로 채택하여 논의

983787 주요 선진국을 중심으로 빅데이터 전략이 추진되고 있는 가운데 영국의

연구기관인 팔러시 익스체인지(Policy Exchange)가 빅데이터의 경제적

가치를 추정한 보고서(The Big Data Opportunity)를 발표

๐ 영국이 공공부문에서의 빅데이터 활용을 통해 연간 160억 파운드에서

최대 330억 파운드를 절감할 것으로 추정

lt 영국 공공부문에서의 빅데이터 경제적 효과 (단위 billions 파운드) gt

연간 상한선 및 하한선

2-8 16-33

1-3

6

1713-222

2

9

1

1613

운영효율개선 부정오류 감소 세입 증가 합계

출처 영국 재무부 국세관세청 맥킨지 Policy Exchange 분석

1) 미국 정부는 2012년 3월 2억 달러 이상이 투입되는 lsquoBig Data Research and Development Initiativersquo를 일본은 2012년 7월 lsquoActive JapanICT 전략rsquo의 하위 전략으로 lsquo액티브 데이터 전략rsquo을 수립하여 추진 중

2) OECD는 2011년 6월 7 8일 양일간에 걸쳐 개최된 제15차 WPIIS 회의에서 lsquoMeasuring the Economics of Big datarsquo를 의제로 채택하여 빅데이터의 경제적 가치를 검증하고 정책적 함의 도출

2 985115 빅데이터로 인한 기회

๐ 세부 내역별로는 정부의 운영효율개선을 통해 최대 220억 파운드

세수 확대 및 부정 오류 감소를 통해 최대 110억 파운드를 확보할

것으로 분석

๐ 팔러시 익스체인지는 공공부문의 빅데이터 활용이 공공 서비스의

수준을 낮추지 않으면서도 정부 운영 효율을 향상시킬 수 있는

방안이라고 주장

983787 팔러시 익스체인지는 세수 관리 인구 조사 등에 이르기까지 여러 분야의

빅데이터 적용 아이디어를 제안

๐ 10년 주기로 실시하는 인구조사 대신 선거인명부 건강보험 환자기록

국민연금 데이터 등을 결합하여 인구학적 정보 획득

๐ 이를 통해 약 5억 파운드의 예산 절감이 가능할 뿐만 아니라 고품질의

시의성 있는 인구센서스 정보 확보 가능

983787 필연적으로 도래한 빅데이터 시대를 맞이하여 영국 정부가 빅데이터를

효과적으로 활용하기 위한 전제조건 제시

๐ 빅데이터 활용을 가로막는 장애사항을 해결하고 공공부문 인력의

역량 강화

๐ 개인정보 및 프라이버시 침해 등에 대한 국민 신뢰 확보를 위해 최고

수준의 도덕성을 기반으로 빅데이터 정책 추진

빅데이터 이용 활성화를 위한 전제조건

① 빅데이터 기술 이외에 품질 표준 등의 쟁점사항 해결

② 정부 스스로 데이터를 분석해석활용할 수 있는 역량 확보

③ 지도자 및 정책 담당자들이 기본적인 빅데이터 기법을 숙지하고 이를 정책

판단시 결합할 수 있는 능력 보유

④ 개인정보보호 추적 감시 등 프라이버시 침해 등으로부터 국민의 신뢰를

확보하기 위한 견고한 윤리의식 기반의 빅데이터 정책 추진(책임분석강령

채택 권고)

빅데이터로 인한 기회- 보다 빠르고 스마트한 맞춤 정부 만들기 -

2012 7

본 자료는 2012년 7월 3일 영국의 연구기관인

팔러시 익스체인지(Policy Exchange)가 발표한

lsquoThe Big Data Opportunity Making government faster

smarter and more personalrsquo의 번역본입니다

Policy Exchange 및 저자 소개 985115 5

Policy Exchange

Policy Exchange는 영국 최고의 싱크탱크이다 교육 자선단체로서 더 나은 공공 서비스 보다 튼튼한 사회 더욱 역동적인 경제를 실현할 새로운 정책안을 발굴 홍보하는 것을 목적으로 하고 있다(자선단체 등록번호 1096300)

Policy Exchange는 정책 개발을 위해 증거 기반의 접근방식을 취한다 학계 및 기타 전문가들과 협력하고 있으며 대안적 정책 결과의 상세한 경험적 조사와 관련된 주요 연구를 맡고 있다 다른 국가들의 정책 경험이 영국 정부에게도 중요한 교훈이 된다는 점을 믿고 있으며 기업 및 자원봉사 부문에서도 정부가 배울 점이 많다고 본다

이사진

Daniel Finkelstein (의장) Richard Ehrman (부의장) Theodore Agnew Richard Briance Simon Brocklebank-Fowler Robin Edwards Virginia Fraser Edward Heathcoat Amory David Meller George Robinson Robert Rosenkranz Andrew Sells Tim Steel Rachel Whetstone and Simon Wolfson

저자 소개

크리스 유(Chris Yiu)는 Policy Exchange의 디지털정부유닛(Digital

Government Unit)의 장이다 디지털 통신 첨단 및 빅데이터 시대에서

의 공공정책에 관한 연구를 지휘하고 있다 크리스 유는 런던에서 태어

나고 자랐으며 캠브리지대학교 경제학과를 수석으로 졸업하고 동대학 경

제 및 금융 대학원 석사학위를 보유하고 있다

copy Policy Exchange 2012Published byPolicy Exchange Clutha House 10 Storeyrsquos Gate London SW1P 3AYwwwpolicyexchangeorguk

ISBN 978-1-907689-22-2Printed by Heron Dawson and SawyerDesigned by Soapbox wwwsoapboxcouk

6 985115 빅데이터로 인한 기회

디지털정부유닛에 대하여

디지털정부유닛은 정책담당자 및 정치인들이 혁신적인 디지털 경제

보다 스마트한 공공부문 그리고 더 튼튼한 사회를 위해 기술 잠재력을

발현시킬 수 있도록 도와주고 있다 보다 자세한 사업 내용은 다음 연락

처로 문의하면 된다

Email chrisyiupolicyexchangeorgukTwitter PXDigitalGov

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

요약 985115 1

985150 요 약 985150983787 보편화된 모바일 기기 사용 및 SNS 이용 확산 등에 따라 빅데이터

(Big data)가 글로벌 이슈로 급부상

๐ 미국과 일본 정부는 이미 빅데이터 활용을 통한 정부 서비스 개선

전략1)을 추진 중이며 OECD는 빅데이터의 경제적 가치 측정을 주요

의제2)로 채택하여 논의

983787 주요 선진국을 중심으로 빅데이터 전략이 추진되고 있는 가운데 영국의

연구기관인 팔러시 익스체인지(Policy Exchange)가 빅데이터의 경제적

가치를 추정한 보고서(The Big Data Opportunity)를 발표

๐ 영국이 공공부문에서의 빅데이터 활용을 통해 연간 160억 파운드에서

최대 330억 파운드를 절감할 것으로 추정

lt 영국 공공부문에서의 빅데이터 경제적 효과 (단위 billions 파운드) gt

연간 상한선 및 하한선

2-8 16-33

1-3

6

1713-222

2

9

1

1613

운영효율개선 부정오류 감소 세입 증가 합계

출처 영국 재무부 국세관세청 맥킨지 Policy Exchange 분석

1) 미국 정부는 2012년 3월 2억 달러 이상이 투입되는 lsquoBig Data Research and Development Initiativersquo를 일본은 2012년 7월 lsquoActive JapanICT 전략rsquo의 하위 전략으로 lsquo액티브 데이터 전략rsquo을 수립하여 추진 중

2) OECD는 2011년 6월 7 8일 양일간에 걸쳐 개최된 제15차 WPIIS 회의에서 lsquoMeasuring the Economics of Big datarsquo를 의제로 채택하여 빅데이터의 경제적 가치를 검증하고 정책적 함의 도출

2 985115 빅데이터로 인한 기회

๐ 세부 내역별로는 정부의 운영효율개선을 통해 최대 220억 파운드

세수 확대 및 부정 오류 감소를 통해 최대 110억 파운드를 확보할

것으로 분석

๐ 팔러시 익스체인지는 공공부문의 빅데이터 활용이 공공 서비스의

수준을 낮추지 않으면서도 정부 운영 효율을 향상시킬 수 있는

방안이라고 주장

983787 팔러시 익스체인지는 세수 관리 인구 조사 등에 이르기까지 여러 분야의

빅데이터 적용 아이디어를 제안

๐ 10년 주기로 실시하는 인구조사 대신 선거인명부 건강보험 환자기록

국민연금 데이터 등을 결합하여 인구학적 정보 획득

๐ 이를 통해 약 5억 파운드의 예산 절감이 가능할 뿐만 아니라 고품질의

시의성 있는 인구센서스 정보 확보 가능

983787 필연적으로 도래한 빅데이터 시대를 맞이하여 영국 정부가 빅데이터를

효과적으로 활용하기 위한 전제조건 제시

๐ 빅데이터 활용을 가로막는 장애사항을 해결하고 공공부문 인력의

역량 강화

๐ 개인정보 및 프라이버시 침해 등에 대한 국민 신뢰 확보를 위해 최고

수준의 도덕성을 기반으로 빅데이터 정책 추진

빅데이터 이용 활성화를 위한 전제조건

① 빅데이터 기술 이외에 품질 표준 등의 쟁점사항 해결

② 정부 스스로 데이터를 분석해석활용할 수 있는 역량 확보

③ 지도자 및 정책 담당자들이 기본적인 빅데이터 기법을 숙지하고 이를 정책

판단시 결합할 수 있는 능력 보유

④ 개인정보보호 추적 감시 등 프라이버시 침해 등으로부터 국민의 신뢰를

확보하기 위한 견고한 윤리의식 기반의 빅데이터 정책 추진(책임분석강령

채택 권고)

빅데이터로 인한 기회- 보다 빠르고 스마트한 맞춤 정부 만들기 -

2012 7

본 자료는 2012년 7월 3일 영국의 연구기관인

팔러시 익스체인지(Policy Exchange)가 발표한

lsquoThe Big Data Opportunity Making government faster

smarter and more personalrsquo의 번역본입니다

Policy Exchange 및 저자 소개 985115 5

Policy Exchange

Policy Exchange는 영국 최고의 싱크탱크이다 교육 자선단체로서 더 나은 공공 서비스 보다 튼튼한 사회 더욱 역동적인 경제를 실현할 새로운 정책안을 발굴 홍보하는 것을 목적으로 하고 있다(자선단체 등록번호 1096300)

Policy Exchange는 정책 개발을 위해 증거 기반의 접근방식을 취한다 학계 및 기타 전문가들과 협력하고 있으며 대안적 정책 결과의 상세한 경험적 조사와 관련된 주요 연구를 맡고 있다 다른 국가들의 정책 경험이 영국 정부에게도 중요한 교훈이 된다는 점을 믿고 있으며 기업 및 자원봉사 부문에서도 정부가 배울 점이 많다고 본다

이사진

Daniel Finkelstein (의장) Richard Ehrman (부의장) Theodore Agnew Richard Briance Simon Brocklebank-Fowler Robin Edwards Virginia Fraser Edward Heathcoat Amory David Meller George Robinson Robert Rosenkranz Andrew Sells Tim Steel Rachel Whetstone and Simon Wolfson

저자 소개

크리스 유(Chris Yiu)는 Policy Exchange의 디지털정부유닛(Digital

Government Unit)의 장이다 디지털 통신 첨단 및 빅데이터 시대에서

의 공공정책에 관한 연구를 지휘하고 있다 크리스 유는 런던에서 태어

나고 자랐으며 캠브리지대학교 경제학과를 수석으로 졸업하고 동대학 경

제 및 금융 대학원 석사학위를 보유하고 있다

copy Policy Exchange 2012Published byPolicy Exchange Clutha House 10 Storeyrsquos Gate London SW1P 3AYwwwpolicyexchangeorguk

ISBN 978-1-907689-22-2Printed by Heron Dawson and SawyerDesigned by Soapbox wwwsoapboxcouk

6 985115 빅데이터로 인한 기회

디지털정부유닛에 대하여

디지털정부유닛은 정책담당자 및 정치인들이 혁신적인 디지털 경제

보다 스마트한 공공부문 그리고 더 튼튼한 사회를 위해 기술 잠재력을

발현시킬 수 있도록 도와주고 있다 보다 자세한 사업 내용은 다음 연락

처로 문의하면 된다

Email chrisyiupolicyexchangeorgukTwitter PXDigitalGov

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

2 985115 빅데이터로 인한 기회

๐ 세부 내역별로는 정부의 운영효율개선을 통해 최대 220억 파운드

세수 확대 및 부정 오류 감소를 통해 최대 110억 파운드를 확보할

것으로 분석

๐ 팔러시 익스체인지는 공공부문의 빅데이터 활용이 공공 서비스의

수준을 낮추지 않으면서도 정부 운영 효율을 향상시킬 수 있는

방안이라고 주장

983787 팔러시 익스체인지는 세수 관리 인구 조사 등에 이르기까지 여러 분야의

빅데이터 적용 아이디어를 제안

๐ 10년 주기로 실시하는 인구조사 대신 선거인명부 건강보험 환자기록

국민연금 데이터 등을 결합하여 인구학적 정보 획득

๐ 이를 통해 약 5억 파운드의 예산 절감이 가능할 뿐만 아니라 고품질의

시의성 있는 인구센서스 정보 확보 가능

983787 필연적으로 도래한 빅데이터 시대를 맞이하여 영국 정부가 빅데이터를

효과적으로 활용하기 위한 전제조건 제시

๐ 빅데이터 활용을 가로막는 장애사항을 해결하고 공공부문 인력의

역량 강화

๐ 개인정보 및 프라이버시 침해 등에 대한 국민 신뢰 확보를 위해 최고

수준의 도덕성을 기반으로 빅데이터 정책 추진

빅데이터 이용 활성화를 위한 전제조건

① 빅데이터 기술 이외에 품질 표준 등의 쟁점사항 해결

② 정부 스스로 데이터를 분석해석활용할 수 있는 역량 확보

③ 지도자 및 정책 담당자들이 기본적인 빅데이터 기법을 숙지하고 이를 정책

판단시 결합할 수 있는 능력 보유

④ 개인정보보호 추적 감시 등 프라이버시 침해 등으로부터 국민의 신뢰를

확보하기 위한 견고한 윤리의식 기반의 빅데이터 정책 추진(책임분석강령

채택 권고)

빅데이터로 인한 기회- 보다 빠르고 스마트한 맞춤 정부 만들기 -

2012 7

본 자료는 2012년 7월 3일 영국의 연구기관인

팔러시 익스체인지(Policy Exchange)가 발표한

lsquoThe Big Data Opportunity Making government faster

smarter and more personalrsquo의 번역본입니다

Policy Exchange 및 저자 소개 985115 5

Policy Exchange

Policy Exchange는 영국 최고의 싱크탱크이다 교육 자선단체로서 더 나은 공공 서비스 보다 튼튼한 사회 더욱 역동적인 경제를 실현할 새로운 정책안을 발굴 홍보하는 것을 목적으로 하고 있다(자선단체 등록번호 1096300)

Policy Exchange는 정책 개발을 위해 증거 기반의 접근방식을 취한다 학계 및 기타 전문가들과 협력하고 있으며 대안적 정책 결과의 상세한 경험적 조사와 관련된 주요 연구를 맡고 있다 다른 국가들의 정책 경험이 영국 정부에게도 중요한 교훈이 된다는 점을 믿고 있으며 기업 및 자원봉사 부문에서도 정부가 배울 점이 많다고 본다

이사진

Daniel Finkelstein (의장) Richard Ehrman (부의장) Theodore Agnew Richard Briance Simon Brocklebank-Fowler Robin Edwards Virginia Fraser Edward Heathcoat Amory David Meller George Robinson Robert Rosenkranz Andrew Sells Tim Steel Rachel Whetstone and Simon Wolfson

저자 소개

크리스 유(Chris Yiu)는 Policy Exchange의 디지털정부유닛(Digital

Government Unit)의 장이다 디지털 통신 첨단 및 빅데이터 시대에서

의 공공정책에 관한 연구를 지휘하고 있다 크리스 유는 런던에서 태어

나고 자랐으며 캠브리지대학교 경제학과를 수석으로 졸업하고 동대학 경

제 및 금융 대학원 석사학위를 보유하고 있다

copy Policy Exchange 2012Published byPolicy Exchange Clutha House 10 Storeyrsquos Gate London SW1P 3AYwwwpolicyexchangeorguk

ISBN 978-1-907689-22-2Printed by Heron Dawson and SawyerDesigned by Soapbox wwwsoapboxcouk

6 985115 빅데이터로 인한 기회

디지털정부유닛에 대하여

디지털정부유닛은 정책담당자 및 정치인들이 혁신적인 디지털 경제

보다 스마트한 공공부문 그리고 더 튼튼한 사회를 위해 기술 잠재력을

발현시킬 수 있도록 도와주고 있다 보다 자세한 사업 내용은 다음 연락

처로 문의하면 된다

Email chrisyiupolicyexchangeorgukTwitter PXDigitalGov

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

빅데이터로 인한 기회- 보다 빠르고 스마트한 맞춤 정부 만들기 -

2012 7

본 자료는 2012년 7월 3일 영국의 연구기관인

팔러시 익스체인지(Policy Exchange)가 발표한

lsquoThe Big Data Opportunity Making government faster

smarter and more personalrsquo의 번역본입니다

Policy Exchange 및 저자 소개 985115 5

Policy Exchange

Policy Exchange는 영국 최고의 싱크탱크이다 교육 자선단체로서 더 나은 공공 서비스 보다 튼튼한 사회 더욱 역동적인 경제를 실현할 새로운 정책안을 발굴 홍보하는 것을 목적으로 하고 있다(자선단체 등록번호 1096300)

Policy Exchange는 정책 개발을 위해 증거 기반의 접근방식을 취한다 학계 및 기타 전문가들과 협력하고 있으며 대안적 정책 결과의 상세한 경험적 조사와 관련된 주요 연구를 맡고 있다 다른 국가들의 정책 경험이 영국 정부에게도 중요한 교훈이 된다는 점을 믿고 있으며 기업 및 자원봉사 부문에서도 정부가 배울 점이 많다고 본다

이사진

Daniel Finkelstein (의장) Richard Ehrman (부의장) Theodore Agnew Richard Briance Simon Brocklebank-Fowler Robin Edwards Virginia Fraser Edward Heathcoat Amory David Meller George Robinson Robert Rosenkranz Andrew Sells Tim Steel Rachel Whetstone and Simon Wolfson

저자 소개

크리스 유(Chris Yiu)는 Policy Exchange의 디지털정부유닛(Digital

Government Unit)의 장이다 디지털 통신 첨단 및 빅데이터 시대에서

의 공공정책에 관한 연구를 지휘하고 있다 크리스 유는 런던에서 태어

나고 자랐으며 캠브리지대학교 경제학과를 수석으로 졸업하고 동대학 경

제 및 금융 대학원 석사학위를 보유하고 있다

copy Policy Exchange 2012Published byPolicy Exchange Clutha House 10 Storeyrsquos Gate London SW1P 3AYwwwpolicyexchangeorguk

ISBN 978-1-907689-22-2Printed by Heron Dawson and SawyerDesigned by Soapbox wwwsoapboxcouk

6 985115 빅데이터로 인한 기회

디지털정부유닛에 대하여

디지털정부유닛은 정책담당자 및 정치인들이 혁신적인 디지털 경제

보다 스마트한 공공부문 그리고 더 튼튼한 사회를 위해 기술 잠재력을

발현시킬 수 있도록 도와주고 있다 보다 자세한 사업 내용은 다음 연락

처로 문의하면 된다

Email chrisyiupolicyexchangeorgukTwitter PXDigitalGov

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

Policy Exchange 및 저자 소개 985115 5

Policy Exchange

Policy Exchange는 영국 최고의 싱크탱크이다 교육 자선단체로서 더 나은 공공 서비스 보다 튼튼한 사회 더욱 역동적인 경제를 실현할 새로운 정책안을 발굴 홍보하는 것을 목적으로 하고 있다(자선단체 등록번호 1096300)

Policy Exchange는 정책 개발을 위해 증거 기반의 접근방식을 취한다 학계 및 기타 전문가들과 협력하고 있으며 대안적 정책 결과의 상세한 경험적 조사와 관련된 주요 연구를 맡고 있다 다른 국가들의 정책 경험이 영국 정부에게도 중요한 교훈이 된다는 점을 믿고 있으며 기업 및 자원봉사 부문에서도 정부가 배울 점이 많다고 본다

이사진

Daniel Finkelstein (의장) Richard Ehrman (부의장) Theodore Agnew Richard Briance Simon Brocklebank-Fowler Robin Edwards Virginia Fraser Edward Heathcoat Amory David Meller George Robinson Robert Rosenkranz Andrew Sells Tim Steel Rachel Whetstone and Simon Wolfson

저자 소개

크리스 유(Chris Yiu)는 Policy Exchange의 디지털정부유닛(Digital

Government Unit)의 장이다 디지털 통신 첨단 및 빅데이터 시대에서

의 공공정책에 관한 연구를 지휘하고 있다 크리스 유는 런던에서 태어

나고 자랐으며 캠브리지대학교 경제학과를 수석으로 졸업하고 동대학 경

제 및 금융 대학원 석사학위를 보유하고 있다

copy Policy Exchange 2012Published byPolicy Exchange Clutha House 10 Storeyrsquos Gate London SW1P 3AYwwwpolicyexchangeorguk

ISBN 978-1-907689-22-2Printed by Heron Dawson and SawyerDesigned by Soapbox wwwsoapboxcouk

6 985115 빅데이터로 인한 기회

디지털정부유닛에 대하여

디지털정부유닛은 정책담당자 및 정치인들이 혁신적인 디지털 경제

보다 스마트한 공공부문 그리고 더 튼튼한 사회를 위해 기술 잠재력을

발현시킬 수 있도록 도와주고 있다 보다 자세한 사업 내용은 다음 연락

처로 문의하면 된다

Email chrisyiupolicyexchangeorgukTwitter PXDigitalGov

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

6 985115 빅데이터로 인한 기회

디지털정부유닛에 대하여

디지털정부유닛은 정책담당자 및 정치인들이 혁신적인 디지털 경제

보다 스마트한 공공부문 그리고 더 튼튼한 사회를 위해 기술 잠재력을

발현시킬 수 있도록 도와주고 있다 보다 자세한 사업 내용은 다음 연락

처로 문의하면 된다

Email chrisyiupolicyexchangeorgukTwitter PXDigitalGov

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

감사의 글 985115 7

감사의 글

이 보고서를 만들어내기까지 자신의 관점 견해 및 주요 문제점들을

저희와 공유해 준 모든 개인 기업 및 기타 단체들에게 감사드립니다

내용상의 오류 및 누락의 책임은 저희에게 있습니다

특히 이 프로젝트 기간 내내 지원과 도전 격려를 아끼지 않은 EMC

사에 깊은 감사를 표합니다

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

8 985115 빅데이터로 인한 기회

요 약

현대 사회는 어마어마한 양의 데이터를 만들어내고 있으며 정부 업무도

예외가 아니다 복지수당 및 국민건강보험(National Health Service)의

관리에서부터 여권 및 운전면허 발급에 이르기까지 공공부문 전반에서

방대한 양의 데이터가 공공 서비스 운영 중에 쌓이게 된다 세금 부문만

하더라도 국세관세청(HM Revenue amp Customs)이 영국 국립도서관

(British Library)보다 80배 이상 많은 양의 데이터를 보유하고 있다고

한다3)

빅데이터(big data)란 이처럼 거대한 데이터세트를 말하며 빅데이터

분석(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여

의미를 찾아내고자 하는 과정을 말한다

공공 데이터의 사용 재사용 및 재배포를 허용하는 등 개방의 문제에

관해 정부가 어떠한 입장을 취하든 관계없이 방대한 양의 데이터와 처리

역량은 공공부문이 새로운 방식으로 조직 학습 및 혁신할 수 있도록 해

준다

이 짧은 보고서의 목적은 다음 세 가지이다 첫째 데이터 및 그 분석

을 통해 정책입안자들에게 공공 서비스 혁신 기회에 대한 영감을 주기

위해서 둘째 이러한 의제가 공공부문에 미치는 문제점에 대한 주의를

환기시키기 위해서 셋째 정부가 어떻게 후자의 문제점을 다루는 동시

에 전자의 기회를 실현시킬 수 있는지에 대해 권고하기 위해서이다

공공 서비스 혁신의 기회는 현실적이다 국민들에게 있어 데이터와 기

술 및 분석의 응용은 종이문서를 감소시키고 질문에 대한 답변을 보다

3) 역외탈세자를 추적하다(On the trail of the offshore tax dodgers) BBC 2011 12

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

요약 985115 9

빨리 얻을 수 있으며 국민이 누려야 할 혜택을 발견 및 주장할 수 있도

록 하며 현장에서의 서비스를 개개인의 요구 및 행동에 맞추어 보다

접하게 조율할 수 있도록 하는 것이다 예를 들어 보건 부문에서 데이터

및 분석을 잘 활용한다면 요양 시설 환자들이 적절한 시기에 적절한 약

물치료를 받을 수 있게 되고 병원은 치료 및 상담을 환자별로 맞춤화하

여 수술 후 재입원을 최소화할 수 있도록 할 수 있다 복지 부문에서는

보다 정교한 세분화 및 맞춤화를 통해 실직인구가 필요한 지원이 어떤

것인지 알아내고 이를 장기적인 사업을 통해 제공할 수 있도록 해 준

다4) 어느 분야에서든 더욱 스마트하고 맞춤화된 공공 서비스는 우리가

일반적으로 상업적 제품 및 서비스를 사용하는 소비자로서 익숙한 경험

수준만큼 정부와의 상호작용 수준을 높일 수 있을 것이다

거시적인 관점에서는 정부 운영의 전반적인 효율을 개선하고 부정 및

오류를 줄이기 위한 노력을 가속화하며 세금 격차(실제 거두어들이는 세

금과 이론상 부과된 세금의 차이) 문제까지 해결할 수 있게 된다 획기

적인 성과가 있다면 머지않아 공공부문에서 연간 160억 파운드에서 330

억 파운드를 절감할 수 있을 것으로 추정되며 이는 인구 1인당 250 파

운드에서 500 파운드를 절감하는 것에 해당된다

그러나 빅데이터 기술만으로는 공공부문의 혁신을 위한 특효약이 될

수 없다 품질 표준 편향 등과 같은 그 이면의 이슈들도 인식하고 해

결해야 한다 또한 정부는 데이터 결과 및 분석 작업을 현명하게 수행

해석 및 소비할 수 있는 역량을 갖추어야 한다 이러한 역량은 최첨단

데이터 과학 기술의 일부에 해당할 뿐이다 또 중요한 것은 공공부문의

지도자 및 정책담당자들이 과학적 기법에 대한 지식을 갖추고 빅데이터

를 견고한 판단과 결합할 수 있어야 한다는 점이다 공공부문 지도자들

이 자신의 조직에 대해 고찰해 보아야 할 기본적인 질문들을 이 보고서

마지막에 실어 놓았다

4) 맞춤복지 고용지원 및 일자리센터에 관한 재고찰 (Personalised Welfare Rethinking employment support and jobcentres) Policy Exchange 2011

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

10 985115 빅데이터로 인한 기회

또한 정부는 견고한 윤리의식 및 믿음을 가지고 이러한 의제를 추진할

수 있는 용기가 필요할 것이다 수많은 잠재력을 가진 기술은 그만큼 시

민의 자유에 심한 압박을 가할 수도 있다 데이터 자산에서 가치를 추출

해내려는 시도가 추적 감시 및 선발당하고 싶지 않은 개인의 희망과 충

돌하면서 정부와 기업 모두 긴장 관계에 놓이게 된다 그러나 당연히 정

부의 입장에서는 데이터 축적 및 분석의 동기가 영리를 위한 경우는 거

의 없다 단지 보여줄 수 있는 타당한 공공 정책의 근거를 호기심에 의

해 조작이 가능하다는 위험이 있다 우리는 지도자들에 대한 기대 수준

을 최고로 높일 수 있으며 반드시 그렇게 해야만 한다

권고

1 국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics Team)

을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수 있

도록 도와주는 책임을 부여한다

부분적으로는 행동조사팀(Behavioural Insights Team)과 같은 접근

법을 바탕으로 설립하고 주요 목적은 다음과 같이 한다

bull 부처들과의 협력을 통해 데이터와 분석을 새롭고 창의적이며 보다 정

교한 방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를

혁신한다

bull 공공부문 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대

한 인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절

감하여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시하고

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

요약 985115 11

1년 후 일몰심사를 거친다

2 정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

강령의 주요 요소는 다음과 같을 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 절대로 그 자체

를 위해서가 아닌 명확하고 개방적인 소통이 이루어진 공공 정책의

합당한 이유를 근거로 획득하여야 한다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의

개인적이거나 은 한 정보(자녀현황 또는 성적 취향 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우

명확하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획

은 모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검

토 및 동료평가(peer review)를 통해 실행 여부를 결정해야 한다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

12 985115 빅데이터로 인한 기회

1 어디를 가도 데이터 천지

장기적인 관점에서 보면 데이터 수집 사용 및 공개에 관한 정부의 선

택은 경제 및 사회 부문을 가장 많이 좌우하는 결정의 일부일 수 있다

데이터에 대한 정부의 태도가 기업 및 국민 그리고 수십년 동안 지속될

공공정책 계획의 기틀을 위한 분위기를 조성하게 된다

우리는 2012년 초에 데이터에 대한 권리(A Right To Data)를 발간

하여 공공부문 오픈데이터의 경제적 사례를 조사한 바 있다5) 우리는

정부의 일상 업무를 지원하기 위해 수집 또는 생성되는 모든 비개인적

데이터는 공개되어야 하며 접근이 쉽고 무료로 제공되며 사용 또는 재사

용에 관한 제한이 없어야 한다고 주장하였다 비정부 사용자들이 새롭고

미지의 용도로 핵심 공공 데이터 자산을 사용하도록 개방하는 것은 우리

국가의 디지털 경제 인프라를 구축하는 데 있어 필수적인 단계이다

이 보고서는 공공부문 빅데이터 전략에 관한 것이며 이러한 전략이 공

공 서비스 및 국민들에게 어떻게 실제적인 변화를 가져올 수 있는지에

대한 것이다 빅데이터에 관해 우리가 논의하고자 하는 도전 및 기회는

오픈데이터 이슈와 많은 부분에서 상호보완적이기는 하지만 별개의 것으

로 구분된다 개방에 관해 정부가 어떠한 입장을 취하든 관계없이 방대한

양의 데이터와 처리 역량은 공공부문이 새로운 방식으로 조직 학습 및

혁신할 수 있도록 해준다 또한 다루어야 할 시민의 자유와 프라이버시에

관해 새로운 도전을 안겨주며 공공부문에서 요구되는 재능 및 역량의 수

준을 높이기도 한다 빅데이터가 가져오는 기회를 놓치지 않으려면 최고

수준의 리더쉽과 도덕성이 필요할 것이다 이러한 측면에서 성공하는 정

부들은 그 혜택이 크고 또한 오래 지속될 것이다

5) 데이터에 대한 권리 영국 오픈 공공데이터의 약속 이행(A Right to Data Fulfilling the promise of open public data in the UK) Policy Exchange 2012 3

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

2 빅데이터 개요 985115 13

2 빅데이터 개요

전 세계의 정보 저장 확산 및 처리 용량은 기하급수적으로 늘어나고

있다 수치로 따지면 우리가 일상생활에서 사용하는 범위를 이미 훨씬

넘어섰다

이동전화 메모리에서부터 DVD 블루레이 하드디스크 등 모든 종류의

저장매체를 통틀어 전 세계에서 정보를 저장할 수 있는 용량은 올해 약

25 제타바이트(zettabytes)에 달할 것으로 예상된다 1 제타바이트는 1

조 기가바이트에 해당한다 이만큼의 데이터를 DVD로 저장하여 쌓는다

면 그 높이는 지구에서 달까지 거리의 15배에 해당할 것이다 더욱 놀

라운 것은 이러한 수치가 매년 50 이상씩 증가하고 있다는 사실이다

전 세계 저장 용량이 이러한 속도로 계속 증가한다면 2020년에는 약

100 제타바이트에 달할 것이다(그림 1 참조)6)

처리능력 또한 계속 발전하고 있다 유명한 무어의 법칙에 따르면 마

이크로칩 한 개에 들어갈 수 있는 데이터양이 18개월에서 2년마다 두

배씩 증가한다고 한다 2014년에는 전 세계 이동전화 정보 처리 용량이

전체 수퍼컴퓨터의 정보처리 용량을 10배 넘어설 것이다 전 세계 비디

오게임 콘솔의 총 처리용량은 그보다 10배 더 클 것이다7)

이처럼 데이터 저장 처리 및 전파 용량이 놀라운 증가세를 보이는 가

운데 기업 및 정부는 매일 단위로 생성 및 저장되는 엄청난 양의 데이터

를 다루는 방법을 배우고 있다 빅데이터 혁명은 분명 향후 십년 동안

가장 중요한 글로벌 트렌드에 속할 것이다

6) Hilbert Loacutepez 2011을 토대로 저자가 계산한 수치임7) Ibid

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

14 985115 빅데이터로 인한 기회

빅데이터에 관한 문헌에서는 그 정의가 비교적 탄력적이다 그리 놀

라운 일은 아닌 것이 데이터 저장 및 처리역량의 급속한 발전 속도로

인해 바이트 또는 대역폭을 기준으로 한 빅데이터의 절대적 정의가 무

색해지기 때문이다 보다 실용적인 정의이자 이 보고서에서 우리가 사

용할 정의는 빅데이터가 기존의 수기로 하던 데이터베이스 관리 도구를

가지고 다루기에는 너무나 불편한 데이터세트를 의미한다는 것이다 그

이유는 기존 방식으로는 그 정도의 데이터를 수집 저장 관리 또는 분

석할 수 있는 능력에 한계가 있다는 점 등 여러 가지를 들 수 있다

빅데이터 정의

bull 빅데이터 기존의 수기로 하던 데이터베이스 관리 도구를 가지고 다루기

에는 너무나 불편한 데이터세트

bull 빅데이터 분석 빅데이터 자산을 연구 및 조사하여 의사결정에 가치 있는

의미를 추론하는 과정

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

2 빅데이터 개요 985115 15

연간 최적압축 MB

로그스케일

전망

전망

디지털

아날로그

lt그림 1gt 전 세계 저장용량의 증가추이 및 전망 (1986~2021)

일부 조직에서는 매우 큰 규모의 데이터세트를 어쩔 수 없이 다루어야

하는 경우가 있었다 대규모 소매영업 물류운영 금융부문 거래 등을

다루는 기업들이 바로 현대 비즈니스의 핵심인 빅데이터를 보여주는 전

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

16 985115 빅데이터로 인한 기회

형적인 예이다 공공부문은 예전부터 빅데이터를 다루어왔다 많은 수의

국민이나 복잡한 과정을 다룬 결과 국세관세청 노동연금부(Department

for Work and Pensions) 국민건강보험 기상청(Met Office) 등의 기

관들은 모두 방대한 양의 데이터를 확산시키고 있다

최근의 변화 중 중요한 점은 지도자들이 빅데이터를 단지 업무 중 다

루는 것이 아니라 가치 및 경쟁 우위의 중요한 원천으로 인식하기 시작

했다는 것이다

빅데이터 및 분석의 장점을 잘 활용하는 기업의 사례는 자료로 정리되

어 있다 이들 사례 중 상당수는 우리의 일상생활 속에 있는 것으로 예

를 들면 테스코 클럽카드(Tesco Clubcard 수퍼마켓 회원카드)를 사용

하였거나 구글 검색을 해 본 사람이라면 누구나 빅데이터의 세계에 발을

들여놓은(프라이버시와 관련하여 영향을 받은 셈이다) 셈이다 빅데이터

기술과 그에 따르는 사고방식 및 문화에 통달한 기업들은 소비자 및 주

주를 위해 새로운 가치의 원천을 만들어내고자 그러한 기술을 사용하고

있다

민간부문에서 시도되고 있는 많은 빅데이터 도구 및 기법들은 공공부

문에서도 큰 역할을 할 것이다 예를 들어 미국의 경우 과학 및 공학의

새로운 발견 속도를 높이고 국가 안보를 강화하며 교육 혁신을 위해 빅

데이터를 사용하는 전략을 백악관에서 공식적으로 수립하여 이행해오고

있다(표 1 참조)8)

그러나 정부를 위해 빅데이터의 모든 잠재력을 완전히 드러내기 위해

서는 기술 투자 및 상업적 혁신을 따라하는 것 이상이 요구된다는 점을

우리는 인식해야 한다 공공부문 조직의 목적이 서로 다르고 국가 대 국

민 관계의 고유한 성격 때문에 많은 투자가 이루어지고 있다

8) 빅데이터는 빅딜이다(Big data is a big deal) 과학기술정책실(Office of Science and Technology Policy) 2012 3

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

2 빅데이터 개요 985115 17

lt표 1gt 미국의 빅데이터 관련 제도9)

분야 제도 설명

보건사회복지부(Department

of Health and Human

Services)

건강보험서비스센터 (Center for Medicare amp

Medicaid Services)

ldquo행정데이터를 사용하여 유용한 정보 상품을 개발

함으로써 더 나은 의사결정을 촉진 및 지원하도록

하는데 목적을 둔 데이터 비주얼리제이션 도구 플

랫폼 기술 이용자 인터페이스 옵션 및 고성능 전

산처리 기술rdquo

미국국립보건원(National

Institutes of Health)

환자건강측정 정보시스템 (Patient Reported Outcomes

Measurement Information System)

ldquo환자가 제시하는 건강 상태를 측정하는 시스템으

로 신뢰성 유효성 탄력성 정확성 반응성이 고도

로 높다 환자의 건강 상태에 관한 데이터의 수

집 저장 및 분석을 도와주는 도구 및 데이터베이

스를 제공한다rdquo

미국국립보건원(National

Institutes of Health)

암 영상기록 (The Cancer Imaging

Archive)

ldquo영상을 활용하여 암 발견 및 진단의 효율과 재현

성을 높이고 치료 반응의 객관적 평가를 제공하며

궁극적으로는 보다 나은 임상 진단 지원을 위해 영

상 자료 개발을 촉진함으로써 오늘날 암 연구 및

치료에 있어 영상의 활용을 개선하고자 하는 데 목

표가 있다rdquo

재향군인부(Department of Veterans

Administration)

문자처리를 통한 건강현상 캡처 알고리즘 (Algorithms for Text Processing to Capture

Health Events)

ldquo군대배치와 관련된 건강상태를 확인 추적 및 측

정하기 위하여 새로이 개발된 정보과학을 토대로

한 조사기반 감시 프로그램rdquo

에너지국 (Department of Energy)

대기복사 측정 및 기후연구 시설

(Atmospheric Radiation Measurement Climate

Research Facility)

ldquo대기현상의 이해 및 기후모형 발달에 필요한 주요

대기 현상을 정확하게 관측하기 위해 국제 연구 커뮤

니티 인프라를 제공하는 멀티플랫폼 과학 시설이다rdquo

미국항공우주국 (NASA)

고급 정보시스템기술상 (Advanced Information Systems Technology

Awards)

ldquo우주 및 지상기반 정보시스템의 위험 비용 규모

및 개발기간을 줄이고 과학 데이터의 접근성 및 유

용성을 높이기 위한 빅데이터의 역량을 촉진하는

것을 목적으로 한다rdquo

국가과학재단 (NSF)

추계적 네트워크 모형에 관한 연구그룹

(Focused Research Group on stochastic

network models)

ldquo네트워크상의 지식을 일반 지식과 차별화한다 생

물학 및 수학 분야의 협력주체들이 대규모 신문 데

이터베이스 속에서 단어 및 구절 사이의 관계를 연

구하여 미디어 분석가들에게 확장가능한 자동 도구

를 제공하게 될 것이다 전 분야를 망라한 아이디어

랩(Ideas Lab)은 대규모 데이터세트를 사용하여 교

육 환경의 효과성을 높이는 방안을 마련할 것이다rdquo

9) 연방정부 전반의 빅데이터(Big data across the Federal Government)에서 발췌 과학기술정책실 2012 3

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

18 985115 빅데이터로 인한 기회

3 공공부문에서 빅데이터가 왜 중요한가

빅데이터 분석이 제대로 이루어진다면 정책담당자들의 활동 및 국민이

정부와 상호작용하는 방식에 현실적이고 직접적인 영향을 줄 수 있다

이번 장에서는 빅데이터가 공공행정 서비스 및 국민의 경험을 어떻게

개선할 수 있는지에 대해 폭넓게 살펴보도록 한다 우리는 공공부문 지

도자들이 빅데이터에 대해 가지고 있는 인식이 높을 것이라 기대해 왔

다 발전 대신 혁신을 추구하는 것이 빅데이터의 비전이 가지는 명확한

특징이다 이러한 점에서 공공부문과 관련이 있는 빅데이터의 기회는 다

음의 다섯 가지로 정리된다

1 공유 (Sharing)

공공부문은 대규모 정부부처에서부터 각 학교 병원 및 도서관 등 수

천 개의 다양한 조직으로 구성된다 이들은 각자 업무 및 관련 국민들에

대해 많은 것을 알고 있다 이러한 데이터를 어떻게 공유 또는 연계할

지를 고민해 보는 것은 국민의 시간 및 납세자의 세금을 절약할 수 있는

일이다

영국에서는 2006년의 신분증법(Identity Cards Act)이 2011년 연립

정부에 의해 폐지됨에 따라 통합된 단일 신원정보 데이터베이스가 없으

며 따라서 특정 기관으로부터 국민 개인에 관련된 정보를 조회할 수 없

다 이전의 기술 세대 같으면 동일한 데이터의 사본을 여러 개 저장하지

않고는 다른 대안이 없었을 것이다 그러나 오늘날의 기술은 관련 정보

의 조각들을 재빠르게 그리고 일시적으로 매치하고 연결시킨다 이를

통해 오류의 범위를 줄이고 사람들에게 같은 정보를 여러 번 제출하도록

요청하는 경우를 피할 수 있게 되어 효율적인 거래가 이루어질 수 있다

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

3 공공부문에서 빅데이터가 왜 중요한가 985115 19

영국에서 운전면허를 취득하는 과정이 이러한 데이터 공유의 좋은 예

에 해당한다 온라인으로 운전면허 신청을 하면 운전자middot차량면허청

(Driver and Vehicle Licensing Agency DVLA)이 신규 면허 발급을

위한 사진과 서명을 요구한다 신청자가 영국 여권 소지자라면 DVLA에

서 신원및여권국(Identity and Passport Service IPS)이 이미 보유하

고 있는 정보를 토대로 사진과 서명을 전자적으로 수집할 것이다10) 이

는 간단한 변화가 최종사용자에게 어떻게 실용적인 개선 결과를 제공하

는지를 보여주는 사례로 자주 사용된다

2 학습 (Learning)

빅데이터 분석기법은 조직들이 일하는 방식을 스스로 학습하도록 도와

주는 막강한 도구가 될 수 있다 기존에는 관리자 및 지도자들이 극히

일부분의 성과 지표를 가지고 조직의 건전성 및 효율성을 평가하였다

디지털화를 거치면서 접근할 수 있는 관리 정보의 양 그러한 정보를 수

집하는 해상도 및 회수 그 처리 가능속도 등이 급격히 증가하게 되었

다 입력 출력 생산성 및 과정 등에 관한 모든 데이터를 예전보다 더

욱 종합적이고 세부적으로 수집 및 상기시킬 수 있게 된 것이다

물론 지도자들이 실천으로 옮길 수 있는 통찰을 얻는데 사용되지 않는

다면 이 모든 정보는 쓸모없는 것이다 다행히도 분석 및 비주얼리제이

션 도구(인터액티브 차트 인포그래픽 딥주밍(deep zooming) 애플리케

이션 등)의 발전으로 이제는 리더십 도전에 대한 상세하고도 최신의 증

거를 확보할 수 있게 되었다 이는 다양한 업무 단위의 성과를 분석 및

최적화하는 것에서부터 서비스 제공에 대한 국민의 피드백을 실천하는

것까지 여러 방면에 걸쳐 해당된다

10) 온라인 운전면허(Driver licensing online) Directgov

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

20 985115 빅데이터로 인한 기회

많은 경우 학습을 위한 빅데이터의 주요 원천은 기존의 조직 경계 밖

에 있다 중요성이 더욱 커지고 있는 한 가지 소스로는 소셜미디어를 통

해 공개적으로 공유되는 정보이다 기업 부문의 경우 프록터앤갬블

(Procter amp Gamble)과 같은 유수의 조직들이 관련 피드백 및 의견을

스캔하여 그러한 정보가 필요한 개인의 스크린으로 바로 보내주는 최첨

단 도구를 사용하고 있다11) 이는 최대한 민첩하고 실시간으로 이루어

지는 학습에 해당하는 것으로서 종이로 읽고 펜으로 답변하는 형태의

교류와 관리 메모가 조직의 일하는 방식에 관한 주요 데이터 원천이 되

었던 기존의 접근과는 전혀 다르다

3 맞춤화 (Personalising)

빅데이터의 특징 중 하나는 세분성(granularity)이다 우리는 매우 거

시적인 수준의 지식을 갖추던 시대에서 매우 개인적인 수준의 지식을 갖

춘 시대로 넘어왔다 한 때 나는 영국의 성인 1명이 하루에 평균 1800

칼로리를 태운다고 알고 있었다 지금은 최신의 맞춤 추적 기술 덕분에

내가 어제 정확히 X 칼로리를 태웠고 내가 속한 성별 및 연령 그룹에서

Y 번째 백분위수에 해당하며 지난 주 나의 평균 칼로리 소모량에서 Z

변화한 것이라는 점도 알 수 있다

이와 같은 빅데이터의 세분성은 서비스 맞춤화에 새로운 기회를 열어

준다 서비스 공급자가 사용자에 관한 특정 정보를 알게 되면 그에 따라

서비스를 맞추어 제공할 수 있게 되는 것이다 이는 사용자가 해당 데이

터를 필요로 하고 이루어지는 거래 또는 사용되는 서비스의 특징에 맞게

맞춤화가 이루어질 때 가장 유용할 것이다 예를 들어 보건부문에서 데

이터 및 분석은 개개인의 상황에 대한 위험 요소 분석을 토대로 하여 사

람들이 수술 후 재입원을 피할 수 있도록 할 수 있다 이처럼 성과를 내

기 위한 맞춤화가 중요한 것이지 표면적인 맞춤화나 관련성 없는 교차판

11) PampG의 디지털 혁신 소개(Inside PampGrsquos digital revolution) McKinsey Quarterly 2011 11

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

3 공공부문에서 빅데이터가 왜 중요한가 985115 21

매(cross-selling)는 기껏해야 무의미하고 최악의 경우 역효과를 일으키

게 된다

상업적 세계에서 빅데이터 맞춤화는 훌륭한 결과를 낳았다 아마존의

경우 협업 필터링 즉 구매이력 제품 평가 및 후기에 대한 지식을 토대

로 하여 고도로 맞춤화된 추천을 제공하는 시스템을 최초 도입한 것으로

유명하다 이와 유사한 것으로 페이스북 및 기타 소셜네트워크에서 소셜

그래프 상의 사용자 위치 및 관계를 일부 근거로 하여 맞춤화된 뉴스피

드를 제공하는 것이 있다 그 결과 사용자들은 분류되지 않은 수많은 자

료를 걸러내고 우선순위를 매기는 일에 힘든 노력을 쏟지 않아도 자신과

관련이 있는 컨텐츠 및 서비스를 누릴 수 있게 되었다 이러한 사례를

통해 정부는 어떻게 많은 양의 정보를 국민들에게 온라인으로 제공할 수

있는지에 대한 교훈을 얻을 수 있다

4 해결 (Solving)

빅데이터 혁명의 가장 강력한 요소 중 하나는 대규모 데이터세트를 고

급 분석기술과 결합하여 문제를 해결한다는 것이다 알고리즘 및 기계학

습이 발달함과 더불어 기존의 데스크탑 분석으로 다루기에는 지나치게

광범위하고 복잡한 정보 소스를 가지고 데이터의 의미를 추출할 수 있게

되었다 이와 같이 인간의 정신적인 역량을 뛰어넘어 패턴을 발견하고

문제를 해결하는 능력은 다음 두 가지 소스로부터 빅데이터 의미를 추출

하는 결과로 이어졌다

첫째 규모가 매우 크거나 입체적인 데이터세트의 경우 이미 숨겨져

있는 패턴 및 상관관계를 찾기 위해 살펴볼 수 있다 이는 기존의 상식

실제 경험 또는 일반적 통념을 근거로 한 내용이 사실인지 확인하는 경

우에 해당할 수 있다 또는 이와 같은 분석 유형이 인구 시장 또는 기

업 역학 이면의 전혀 새로운 통찰을 제시할 수도 있다 예를 들어 라이

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

22 985115 빅데이터로 인한 기회

브후드(Livehoods) 프로젝트의 경우 위치인식 소셜네트워크 활동 속에

서 패턴을 찾아내어 기존의 지리적 위치가 아닌 중복되는 소셜 패턴을

토대로 도심 속의 이웃을 찾아준다12)

둘째 빅데이터는 신뢰할 수 있고 예측가능한 분석의 영역을 확대

한다 대규모 데이터세트에 숨겨져 있는 관계들을 관찰함으로써 미래

의 발전방향을 제시하는 차세대 모형을 구축할 수 있다 이러한 접근

법은 시나리오 기획과 결합되어 한 제도가 여러 가지 정책에 어떻게

반응할 것인지를 다양하게 예측할 수도 있다 일부 영역의 경우 최첨

단 예측 분석을 통해 매우 정확한 전망을 내놓음으로써 복잡한 제도

속에서 의사결정을 할 수 있도록 확인 가능하고 과학적인 근거를 제

공할 수 있다

이외에도 문제 해결을 위해 빅데이터 분석을 사용하는 것의 장점은 많

다 전산처리 기법의 사용이 증가하면서 조직의 구성원들이 관련 업무에

서 해방되고 대신 컴퓨터보다 인간이 계속해서 더 나은 성과를 낼 수밖

에 없는 업무분야에 집중 투입되고 전반적인 생산성이 높아지게 되었다

데이터의 의미와 근거를 정량적으로 엄 히 연결함으로써 업무 과정을

담당하던 개인의 부주의로 발생한 오류를 확인할 수 있다 ldquo증거기반 정

책수립rdquo은 영국정부가 언제나 언급하는 주문과 같다 빅데이터 분석은

기존의 노력이 빛을 발하지 못했던 문화 속으로 이와 같은 주문을 퍼트

릴 수 있다

5 성장을 위한 혁신 (Innovating for growth)

빅데이터 분석 도구 및 기술 시장은 역동적이며 급속히 발전하고 있

12) 라이브후드 프로젝트 소셜미디어를 통해 도시의 역학을 이해하기 위한 프로젝트(The Livehoods project utilizing social media to understand the dynamics of a city) Cranshaw 외 2012

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

3 공공부문에서 빅데이터가 왜 중요한가 985115 23

다 넓은 범위의 디지털경제 및 지식경제의 일부로서 빅데이터 우주에서

혁신을 이끌어가고 있는 기업 및 조직 그리고 빅데이터를 도입하고 있

는 조직들은 경제성장을 뒷받침하는 데 있어 중요한 역할을 맡고 있다

비용절감 및 효율향상을 위해 빅데이터 및 분석이 사용되는 경우 직접

적인 생산성 향상으로 이어질 수 있다 성과미달 분야를 찾아내고 자원

을 가장 생산적인 방식으로 재분배함으로써 문제가 되던 조직의 전반적

인 성과가 향상될 수 있다 상업적 부문의 경우 이는 주주들을 위한 가

치의 향상을 가져올 수 있다 공공부문 조직이라면 납세자 및 최종사용

자로서의 국민을 위한 혜택이 있을 수 있다

빅데이터 분석을 도입하고 있는 조직에게는 직접적인 혜택을 넘어 떠

오르고 있는 빅데이터 관련 도구 및 제품의 새로운 시장 영역 또한 펼쳐

진다 확고히 자리잡은 대기업에서부터 혁신적인 틈새 서비스를 제공하

는 수많은 소규모 및 신규 기업에 이르기까지 빅데이터 기술을 개발하는

기업들은 디지털경제의 지도적인 위치에 있다 영국 정부는 영국이 유럽

의 기술 허브(hub)가 될 야심찬 계획을 수립했다 공공부문에서 빅데이

터의 기회를 잡으려는 노력에 따르는 부수적인 혜택으로는 빅데이터 기

업들과의 파트너십을 통한 경제적인 측면의 장점이 될 것이다

물론 빅데이터 산업을 지원한다고 해서 의사결정 과정을 정부의 입장

에서 수립해서는 절대 안된다 가장 우선순위는 납세자와 국민이어야 한

다 그러나 타당한 상업적 파트너십을 통해 영국 경제 속의 빅데이터 및

관련 부문은 중요한 확신을 얻을 수 있을 것이다

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

24 985115 빅데이터로 인한 기회

4 실용적인 아이디어 소개

빅데이터 기술은 스마트하고 정교한 조직을 만들 수 있도록 해 주며

풍부하고 맞춤화된 사용자 경험을 제공해 준다 우리는 빅데이터를 통해

맞춤화된 서비스 및 최적화된 업무 프로세스를 고객의 입장에서 매일 경

험하고 있다 이번 장에서는 공공부문에서 빅데이터 분석의 활용을 늘리

기 위해 주목할 만한 다섯 가지 제안을 소개한다

lt표 2gt 영국 공공부문의 잠재적 애플리케이션

기회 요약 선례

실시간

정보 관리

정부의 업무 속에서 생성된 데

이터를 일상적으로 수집 부처

의 업무 성과를 확인하기 위해

이를 모니터링 낭비감소 또는

효율 향상을 위한 기회를 찾아

내기 위해 이를 분석한다

최첨단 비주얼리제이션 도구를

분석의 보조 도구로서 그리고

고위 공무원 장관 및 고문들에

게 공공부문 성과에 대한 실시

간 양방향 사실 및 수치를 제

공하기 위한 수단으로 사용한다

어떤 모습인지 이해를 돕기 위해

간단한 비주얼리제이션 사례를 소

개한다(그림 2) 실시간 데이터

분석 및 되감기예측 및 줌인아

웃 등 풍부한 인터액티브 요소가

포함되어 있음에 유의한다

소매업 물류업 에너지 수송 소셜네트

워크 등 경쟁 및 비용에 대한 압박이 큰

업종들은 모두 재고 성과 및 자금을 상

세하게 그리고 거의 실시간으로 추적하

는 업무 사례를 포함하고 있다

DCLG 오픈데이터 커뮤니티 웹사이트는 지

방정부의 성과 및 업적에 관한 통계를 일

부 제공하고 있다 인터액티브 대쉬보드에

는 각각의 지방 부처를 위한 데이터가 실

려 있으며 다른 잉글랜드 정부의 경우와

어떻게 비교되는지가 소개되어 있다13)

구글맵스(Google Maps)에는 여러 지역

의 실시간 교통 데이터가 이미 포함되어

있다14)

국립철도안내소(National Rail Enquiries)

웹사이트에는 영국 기차역의 실시간 출발

및 도착 게시판을 운영하고 있다15)

13) 오픈데이터 커뮤니티(Open data communities) 지역사회middot지방자치부(Department for Communities and Local Government)

14) 구글맵스(Google Maps) Google15) 국립철도안내소(National Rail Enquiries) 철도기업협회(Association of Train Operating Companies)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

4 실용적인 아이디어 소개 985115 25

lt표 2gt 계속

기회 요약 선례

실시간

정보 관리

언제든지 이용 및 소비가 쉬운

데이터는 사실 전달에 드는 시

간 및 노력을 덜어주고 정책 솔

루션에 집중할 시간을 더 많이

확보하도록 해 줄 수 있다

개트윅(Gatwick) 공항에 신축된 남쪽 터

미널 보안 구역에서는 줄마다 대기시간을

스크린 색깔로 구분하여 알려줌으로써 승

객이 어디로 줄을 설 것인지 선택할 수

있도록 하였다16)

Speedtestnet은 사용자들이 자신의 브

로드밴드 성능을 실시간으로 테스트하고

그 결과를 과거 성능 및 다른 수백만명

사용자들의 성능과 비교할 수 있도록 하

고 있다17)

불이행 부정

및 오류에

대한 대응

분석 및 데이터 결합을 촉진하

여 세금 복지 수당 관련 부정

및 오류를 줄인다

장점은 다음과 같다

bull 가장 많은 예산이 달려있는

분야에서 부정을 저지를 가능

성이 높은 개인에 대해 사회

복지사가 집중적으로 검토한

bull 가장 효과적으로 법률을 준수

하도록 하는 경로 및 소통을

알아내고 우선시한다

bull 생략 가능한 데이터 입력을

줄이고 시스템 입력 시점에서

잠재적 오류를 줄임으로써 전

반적인 오류를 최소화한다

공공 재원을 확보하기 위해 수당 보조금

및 기타 애플리케이션 기반 프로세스를

관리하는 정부 부처들은 지급이 이루어지

기 전에 자동 부정방지(anti-fraud) 검

토 애플리케이션을 사용해야 할 날이 멀

지 않았다 국세관세청(HMRC)은 이미

세금공제 제도에 이러한 접근을 사용하고

있으며 노동연금부(DWP) 또한 Universal

Credit(세금혜택 및 공제 제도)에 유사한

접근을 도입할 계획이다

HMRC와 DWP는 신용조회기관의 데이터

를 사용하여 청구인의 상황을 확인하는

심사결과 기반 지급방식을 택하고 있으며

실시간 범죄행위를 탐지하기 위해 온라인

거래를 모니터링할 수 있는 방법을 모색

하고 있다18)

금융서비스 산업의 경우 실시간 부정거래

자동단속을 통해 신용카드회사의 부정으

로 인한 평균 손실을 전체 거래의 약

01 정도로 감소시켰다19)

온라인 대출을 제공하는 기업들은 공개된

기록에서부터 실시간 텔레매틱스에 이르

기까지 폭넓은 범위의 데이터를 추적 및

결합하여 차입자가 가진 위험과 어떠한

조건으로 대출이 이루어져야 할지를 정교

하게 판단한다20)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

26 985115 빅데이터로 인한 기회

lt표 2gt 계속

기회 요약 선례

국민 경험의

혁신 및

맞춤화

분석 및 데이터 결합을 촉진하

여 공공 서비스가 국민 개개인

및 각 가구에 더욱 민감하게 대

응하고 맞춤화되도록 한다

장점은 다음과 같다

bull 권리는 있지만 요구하지 못했

던 수당 및 기타 지원을 가구

에서 받을 수 있도록 보장한

bull 각각의 조회신청을 더욱 빨리

처리하고 보다 유용한 정보를

제공한다

bull 초기 단계에서 국민의 관심이

무엇인지를 탐지 및 우선시

하고 그에 따라 정책을 조율

한다

부정 및 오류를 막기 위해 사용되는 분석

기법은 취약한 상황에 놓인 개인이 받아

야 할 모든 지원을 확실히 받도록 도와줄

수 있다

복지 분야의 경우 더 나은 세분화 및 맞

춤화를 통해 실업자들이 필요로 하는 지

원이 무엇인지 밝혀내고 이들이 장기적으

로 일할 수 있게 도와줄 수 있다21)

기계학습이 발달하면서 많은 기업들은 일

상적으로 수행하던 안내 업무의 부담을

덜고 가상 에이전트가 이를 맡게 되었다

IBM의 왓슨(Watson) 수퍼컴퓨터가 자연

언어 숙어 및 문맥을 분석하는 능력에서

뛰어난 경쟁력을 보여주었다22)

소셜미디어 및 기타 소스를 토대로 한 감

정분석은 기존의 포커스그룹 및 미디어

분석을 보완하는 것으로 이미 여러 기업

에서 사용하고 있다 이는 기업들이 변화

하는 사건에 대응하고 고객이 만족하지

못하면 재빠르게 조치를 취할 수 있도록

해 준다

16) 개트윅 공항은 4500만 파운드를 들여 남쪽 터미널 보안 구역을 새로 개방했다(Gatsick Airport apens new f45 million South Terminal security area) Gatwick Airport Limited 2011

17) Speedtestnet18) 정부의 부정 및 오류에 대한 대응(Tackling braud and error in government) 국무조정실

(Cabinet Office) 2012 19) 빅데이터 숫자와의 싸움(Big data crunching the numbers) The Economist 2012 520) 월가를 통하면 당신의 성공은 알고리즘을 토대로 보장된다(With Wonga your prosperity could

count on an algorithm) The Guardian 2011 1021) 복지 맞춤화 고용지원 및 일자리센터에 대한 재고찰(Personalised welfare rethinking

employment support and jobcentres) Policy Exchange 2011 22) Watson IBM

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

4 실용적인 아이디어 소개 985115 27

lt표 2gt 계속

기회 요약 선례

건강 치료

및 환자

성과의 개선

대규모 데이터세트를 결합 및

분석하여 부족한 보건 서비스

자산의 활용을 더욱 최적화함으

로써 위험모형을 발전시키고

수술 후 피할 수 있는 재입원을

줄이며 치료의 낭비를 줄이는

등 건강 자문을 맞춤화하고 낭

비를 줄인다

보건부는 서비스 개선 정보를 토대로 한

의사결정 안전하고 보다 통합적인 케어의

제공을 위해 건강 및 요양 전문가들이 연

결된 정보 및 기술을 사용하는 것이 도움

이 될 수 있다는 점을 인식한다 여기에는

요양시설에서 적절한 환자에게 적절한 약

물을 투여하는 것에서부터 연구 및 생명과

학이 요구하는 보안 데이터 연동 서비스에

이르기까지 다양한 것이 포함된다23)

미국의 많은 빅데이터 계획은 암 연구 심

폐 연구 신경과학 및 전염병 분야의 과학

적인 발견을 위해 대규모 임상 데이터세트

를 수집 결합 및 분석하는 데에 초점을

맞추고 있다24)

구글 플루 트렌드(Google Flu Trends)

는 검색 활동의 변화를 토대로 독감의 유

행을 발견하는 능력을 입증하였다 구글

의 독감예보가 2주 만에 질병대책센터

(Centers for Disease Control)를 이끌

어가고 있다25)

보다

시의적절한

저비용

인구통계의

제공

기존의 여러 인구 데이터를 결

합하여 10년 단위로 실시되었

던 인구조사를 상시적이고 실시

간적인 모자이크로 대체한다

2011년 인구조사 실시에 거의 5억 파운

드의 비용이 들었으며 기존의 계획대로라

면 2021년까지 현행화되지 않을 것이

다26) 지방세 등록부 선거인명부 건강

보험 환자기록 아동 수당 청구 데이터

및 국가 연금 자격 데이터 등과 같은 다

른 데이터세트는 영국 인구의 일부만을

포함하고 있다 이러한 데이터를 신중하

게 결합 및 제거하면 뒤처지지 않는 품질

과 우월한 시의성을 지닌 인구학적 정보

를 만드는데 사용할 수 있다

네덜란드는 행정 기록부를 사전에 정해진

시간에 링크하여 인구를 조사하는 ldquo가상

인구조사rdquo를 실시하였다 단위별로 정보

를 링크할 수만 있다면 기록부에 없는 개

인의 특징에 대한 정보까지 다른 조사의

결과를 통해 알 수 있다27)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

28 985115 빅데이터로 인한 기회

우리가 조사한 기간 동안 알게 된 또 다른 빅데이터의 기회이자 앞으

로 더욱 살펴보아야 할 것은 다음과 같다

bull 개인 및 가구를 위해 보다 상세하고 또는 인터액티브하며 맞춤화된

세금 및 수당 내역서를 개발한다

bull 범죄 예방을 촉진하고 자원을 최대한 활용하기 위해 예측기반 치안감

시 도구 및 기법을 도입한다

bull 스마트그리드 투자를 촉진하여 가구 및 기업의 에너지 사용의 전반적

인 효율을 높인다

23) 정보의 힘 필요한 건강 및 요양정보(The power of information putting all of us in control of the health and care information we need) 보건부 2012 5

24) 연방정부 전반의 빅데이터(Big data across the Federal Government) 과학기술정책실(Office of Science and Technology Policy) 2012 3

25) 검색엔진 쿼리 데이터를 사용한 독감 확산의 탐지(Detecting influenza epidemics using search engine query data) Ginsberg 외 2009

26) 공공행정 특별위원회가 2011년 인구조사 준비상황을 살펴보다(Public administration select committee looks at 2011 Census preparations) 영국의회 2009

27) 유럽의 인구조사 실시방법 2010년 인구는 어떻게 집계되는가(Census taking in Europe how are population counted in 2012) Valente 2010

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

4 실용적인 아이디어 소개 985115 29

lt그림 2gt 공공부문 성과의 비주얼리제이션

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

30 985115 빅데이터로 인한 기회

5 노력의 결실

개인의 경험을 맞춤화하고 개인 사용자의 요구에 민감하게 반응하는

공공서비스를 제공하는 것을 넘어 빅데이터는 공공부문의 효율을 개선시

키는 보다 넓은 범위의 잠재력을 지니고 있다

맥킨지 글로벌 인스티튜트(McKinsey Global Institute MGI)는 공공

부문의 비용절감을 위해 빅데이터를 사용할 수 있는 세 가지 분야를 다

음과 같이 정하였다

bull 효율성 측면의 비용절감 부처를 어떻게 조직하고 어떤 업무를 우선시

할 것인지에 대해 보다 스마트한 결정을 내림으로써 정부 운영의 직

접 비용을 줄일 수 있다

bull 부정 및 오류의 감소 빅데이터를 활용한다면 복지제도 내에서 부정

및 오류의 근원을 찾아낼 수 있으며 부족한 자원으로 가장 큰 효과를

낼 수 있을 것이다

bull 조세제도의 개선 이미 언급했듯이 빅데이터 도구를 사용하면 세금 격

차(실제 거두어들이는 세금과 이론상 부과된 세금의 차이)를 줄일 수

있는 실천방안이 무엇인지 확인 및 이를 우선시할 수 있다

MGI는 유럽 공공행정이 절감할 수 있는 잠재적 비용이 연간 약

1500억 파운드에서 3000억 파운드에 이를 것으로 추정하고 있다28)

MGI가 제시하는 방법에 따라 우리가 예측한 결과 영국 공공부문의

효율 향상 및 낭비 감소를 위한 빅데이터의 기회를 최대로 잡을 경우 연

28) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

5 노력의 결실 985115 31

간 160억 파운드에서 330억 파운드 사이를 절감할 수 있을 것으로 보

인다(세분화된 비용절감 분야는 그림 3 참조)

이는 영국의 1인당 약 250~500파운드를 연간 절감하는 것과 같으며

정부 총예산인 7000억 파운드의 25~45에 해당한다29)

이러한 전망은 어쩔 수 없이 개괄적이다 비교하자면 국세관세청

(HMRC)은 거두어들이지 못한 이론상의 세금 액수인 세금격차가 연간

약 350억 파운드 정도 되는 것으로 추정한다30) 국무조정실은 공공부문

의 부정으로 인해 납세자들이 부담해야 하는 비용을 연간 약 210억 파

운드 오류에 따른 비용이 100억 파운드 부채미상환에 따른 비용이

70~80억 파운드에 달하는 것으로 본다31)32)

미국의 경우 연방수사국(Federal Bureau of Investigation)이 주도

하는 데이터 링킹(linking) 및 마이닝(mining) 협력으로 메디케어

(Medicare 노인건강보험) 부정에 따른 비용을 40억 달러 줄였다33)

영국의 공공부문 생산성은 십 년 이상 큰 변화가 없었다34) 데이터

및 분석을 보다 잘 사용할 경우 이러한 상황에 변화를 가져올 수 있고

서비스 수준을 낮추지 않고 효율을 향상시킴으로써 국가 재정 상황에 부

합할 수 있을 것이다

29) 2012년도 예산 재무부(HM Treasury) 201230) 세금격차의 측정(Measuring tax gaps) 국세관세청 201131) 정부의 부정 및 오류에 대한 대응(Tackling fraud and error in government) 국무

조정실 2012 32) 중앙정부로부터의 부채에 대한 대응(Tackling debt owed to central government) 국무

조정실 2012 33) 보건분야 부정방지 및 집행노력으로 실적이 회복되다(Health care fraud prevention

and enforcement efforts result in record recoveries) 연방수사국(Federal Bureau of Investigation) 2012

34) 전체 공공서비스 실적 투입 및 생산성(Total public service output inputs and productivity) 영국통계청(National Statistics) 2010

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

32 985115 빅데이터로 인한 기회

연간 파운드 (

하한 및 상한선)

운영 효율의 개선

부정 및 오류 감소

세입 증가 합계

분석 기반

가능 비중

잠재 비용절감

합계

1 모든 정부기능에 대한 공공부문 지출 사회보호사업 2009-10 공공지출통계분석(PESA)

2011의 목록 42는 제외

2 사회보호사업 2009-10 공공지출통계분석(PESA) 2011 목록 42에 대한 공공부문 지출

3 2009-10 총 세입 국세관세청 및 국민보험국(NICs) 수입

자료 재무부 국세관세청 맥킨지글로벌인스티튜트 Policy Exchange 분석

lt그림 3gt 영국 공공부문 빅데이터의 잠재력

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

6 빅데이터에도 엄격한 판단이 필요하다 985115 33

6 빅데이터에도 엄격한 판단이 필요하다

우리는 빅데이터 도구 및 기법의 응용으로 공공서비스 제공 및 효율을

잠재적으로 개선할 수 있다고 믿는다 그러나 데이터가 풍부하고 처리역량

이 뒷받침된다고 해서 훌륭한 의사결정이 저절로 보장되는 것은 아니다

빅데이터는 정부가 직면하는 모든 경제적 통계적 분석적 난제에 대

한 특효약이 아니라는 점을 인식하는 것이 중요하다 빅데이터(또는 빅

데이터 분석 결과)를 다루는 지도자 및 분석가들은 정책 제안이 견고하

고 증거에 제대로 기반을 두도록 하는 데에 지속적으로 주의를 기울여야

한다 특히 공공정책 분야의 경우 우리는 대표성 있는 데이터세트를 다

루고 데이터 선정에 치우침이 없는지 주의 깊게 살펴보며 데이터 추론

결과에 대한 신뢰 및 정량적 분석의 한계에 대해 균형잡힌 관점을 유지

해야 한다 캠벨의 법칙(Campbellrsquos law) 굿하트의 법칙(Goodhartrsquos

law) 그리고 정책 방향에 대한 루카스 비판(Lucas critique) 모두 빅데

이터를 실제로 다루는 것과 관련이 있다35)36)37)

데이터 품질 및 보안 또한 중요한 고려사항이자 공공부문이 극복해야

할 도전과제에 해당할 수 있다

정부는 투명성을 증대하기 위한 노력을 통해 데이터 품질도 향상시켜

왔다 그럼에도 불구하고 정부가 다양한 데이터세트를 통합시킴으로써

35) 캠벨의 법칙 사회적 의사결정시 정량적 사회지표를 많이 사용할수록 부패 압력에 굴복할 가능성이 높고 감시해야 할 사회적 프로세스를 왜곡 및 부패시키는 경향이 높다

36) 굿하트의 법칙 어떤 사회정책이나 경제정책 또는 기타 제도를 시행하는 대상이 되는 지표는 일단 시행이 이루어지면 애초에 그 근거가 되었던 특성들이 변화할 수 있다

37) 루카스 비판 전적으로 과거의 데이터 (특히 고도로 집합된 과거 데이터)에서 나타나는 관계를 토대로 경제정책에 변화를 주어 그 효과를 섣불리 예측하는 것은 무지한 일일 수 있다

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

34 985115 빅데이터로 인한 기회

얻을 수 있는 혜택을 완전히 누리기 위해서는 각각의 데이터 소유주들이

중요하다고 판단되는 지표들에 대해서만이 아니라 모든 지표에 걸쳐 데

이터 수집 및 그 품질을 관리하도록 하는 장려책이 있어야 한다

기술 발달과 함께 데이터 보안이 지켜지고 유지되어야 한다 이는 현

대적인 데이터센터 암호화 정부 보안플랫폼 등과 같은 하드웨어어적인

측면이 일부 해당된다 그리고 이것은 또한 인간에 관한 것이기도 하다

개인 및 팀 단위로 민감한 데이터를 다룰 경우 그 문화와 인센티브는 데

이터 보안을 견고하게 구축하도록 하는 것이어야 한다 암호화되지 않은

CD가 우편배송 중에 분실되는 것은 말할 것도 없고 기차나 바에 노트북

이나 메모리를 두고 오는 것은 이제 과거의 일이 되어야 한다

다양한 데이터세트를 통합하고 정부에서 빅데이터 분석을 실시하는

데 있어 상호운용성 또한 중요하다 개방형 표준은 모든 부처들이 사용

할 수 있는(그리고 공공 및 민간 커뮤니티에서 공유할 수 있는) 데이터

프레임워크를 구축한다 표준이 폐쇄적이고 독점 데이터 포맷 및 소프

트웨어 패키지에 지나치게 의존하여 분석이 이루어질 경우 공공부문에

서 데이터를 창의적으로 활용하는 잠재력이 값비싼 솔루션에 얽매이거

나 완전히 상실될 위험이 있다 공공부문의 지도자들이 다양한 소스에

서 얻은 여러 가지 데이터세트를 쉽게 통합할 수 있을 것이라고 단순

히 추측한다면 역부족일 것이다 데이터 통합을 강제해야 하는 경우도

많다

이상 모든 유의점은 공공부문에서 데이터 및 분석을 다루는 사람들의

태도가 얼마나 중요한지를 강조하는 것이다 개인 및 팀이 가장 효과적

이 되려면 균형을 이루어 스스로의 판단과 데이터 분석결과를 결합하고

다양한 관점에 신중히 귀를 기울이며 반대 의견을 제시할 준비가 되어

있어야 한다 CEB사(The Corporate Executive Board)는 이러한 집단

을 ldquo정보 회의론자(informed sceptics)rdquo로 묘사하고 있는데 이 집단은

본능적 의사결정자(visceral decision makers 분석을 거의 신뢰하지

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

6 빅데이터에도 엄격한 판단이 필요하다 985115 35

않으며 일방적으로 의사결정을 하는 사람) 집단과 무조건적 경험주의자

(unquestioning empiricists 판단보다 분석을 신뢰하며 합의에 가치를

두는 사람) 집단 사이에 자리잡고 있다38)

38) 좋은 데이터가 좋은 결정을 보장하지는 않는다(Good data wonrsquot guarantee good decisions) Harvard Business Review 2012 4

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

36 985115 빅데이터로 인한 기회

7 역량

빅데이터의 기회를 잡기 위해서는 인식과 열정 그 이상이 필요할 것

이다 공공부문 지도자들에게 요구되는 빅데이터의 기회에 대한 비전을

넘어 재능 및 역량에 관한 현실적이고도 중요한 도전 과제를 해결해야

한다

이 분야에서 인정받기 위해 필요한 스킬 및 적성의 조합은 그 범위가

넓고 다양하다 최근에는 데이터 과학자(data scientist)라는 조직내 새

로운 역할이 등장하면서 고용주들이 찾고 있는 종류의 역량이 한꺼번에

갖추어지도록 되었다 데이터 과학자는 주로 여러 학문에 능통하다 가

트너는 이러한 데이터 과학자를 ldquo세 가지의 핵심적인 데이터 과학 스킬

즉 데이터 관리 분석 모델링 그리고 기업 분석 스킬rdquo을 갖추고 있는

것으로 설명한다 그 이외에도 소통 협업 리더쉽 창의력 기강 열정

등과 같은 소프트 스킬 또한 정보를 위해서 또 진실의 발견을 위해서

중요하다고 지적하고 있다39)

이러한 설명을 볼 때 데이터 과학자는 대다수의 조직에서 기존에 볼

수 있었던 역할이 아닌 것임은 분명하다 뿐만 아니라 이처럼 여러 영역

을 넘나들며 능력을 갖추는 것은 보기 드문 경우다 이미 앞서고 있는

미국의 경우를 보면 경제 전반에서 데이터 과학자의 수가 급속히 증가하

기 시작하고 있다(단 그 시작점은 낮은 수준이다(그림 4 참조))

데이터 과학자와 관련 학계 사이의 일자리 격차는 여러 가지 연구를

통해 추정되어 오고 있으며 2020년대 초반에는 미국에서 심도 깊은 분

석기술을 갖춘 인재가 수십만명 부족할 것으로 전망된다 아마도 기업

39) 데이터 과학자의 역할 정의 및 차별화(Defining and differentiating the role of the data scientist) Gartner 2012 3

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

7 역량 985115 37

및 다른 조직에서 빅데이터를 잘 활용하기 위해서는 ldquo데이터에 능한rdquo 관

리자가 열 배 더 필요할 것이다40)

영국 공공부문에서는 데이터 과학자라는 공식적인 직위는 없다 아마

가장 근접한 자리가 마련된 곳이 정부운영연구소(Government

Operational Research Service GORS)로 복잡한 상황을 이해 및 구

조화하여 의사결정을 지원하는 업무를 담당한다고 하는 곳이다 GORS

직원의 핵심 역량에는 경영과학 통계 수치전산 스킬 사업관리 문제

해결 및 팀워크 등이 포함된다 GORS는 전문가 조직으로 여기에 소속

된 분석가들은 각 정부 부처의 공무원으로 파견된다 채용은 대민서비스

분석가 속진임용제(Civil Service Analytical Fast Stream)를 통해 이

루어지며 정부 경제 서비스(Government Economic Service GES)

정부 통계 서비스(Government Statistical Service GSS) 정부 사회

조사 서비스(Government Social Research Service GSR) 등과 같은

팀의 채용도 이 제도를 통해 이루어진다

따라서 영국 공공부문이 직면한 도전은 두 가지이다 데이터 과학 분

야에서 핵심 전문가를 발굴하는 것과 주요 대민 서비스 전반에서 데이터

를 사용 및 소비할 수 있는 보다 일반적인 역량을 강화하는 것이다

40) 빅데이터 혁신 경쟁 생산성을 위한 차세대 주자(Big data the next frontier for innovation competition and productivity) McKinsey Global Institute 2011 6

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

38 985115 빅데이터로 인한 기회

해당 일자리 공시 비율

해당 일자리 공시 비율

해당 일자리 공시 비율

데이터

빅데이터

데이터 과학자

자료 Indeedcomlt그림 4gt 일자리 동향

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

7 역량 985115 39

이러한 종류의 의제 논의를 어떻게 시작할 것인가를 고민할 때 최근

정부 중앙에서 이루어진 두 가지 혁신의 경험이 도움이 되겠다

첫 번째는 정부디지털서비스(Government Digital Service GDS) 팀

이다 이 팀은 다이렉트거브(Directgov)가 2010년 노동연금부에서 국무

조정실로 그 소관이 이동한 이후 설립되었으며 마사 레인 폭스(Martha

Lane Fox)가 정부 디지털 서비스에 관한 보고서에서 제시한 권고에 따

라 그 임무가 확대되었다41) GDS는 디지털 참여 다이렉트거브 단일

정부 도메인 등을 포함한 프로젝트를 맡고 있다 목표는 대담하다 ldquo정

부 디지털 서비스 제공의 설계자 및 엔진룸의 역할을 수행하여 국민과

정부간 높은 품질의 사용자 경험을 확고하게 하는 팀이 되는 것rdquo이

다42) 이 목표를 달성하기 위해 GDS는 외부 채용을 진행하고 기존 공

무원을 뽑아오기도 하며 개방적이고 투명한 업무 방식을 옹호하였고 화

이트홀(Whitehall) 근처로 사무실을 이전하기도 했다 부처에 도전과제

를 부여하고 정부 전반의 변화를 가져오겠다는 장관들의 확고한 의지가

큰 도움이 되었다

두 번째는 행동조사팀(Behavioural Insights Team BIT)으로 이 또

한 국무조정실에 속한다 BIT는 연립정부 초반에 ldquo국민들이 스스로 더

나은 선택을 할 수 있도록 장려 지원 및 실천하게 하는 지능적 방식을

모색하기 위해rdquo 만들어졌다43) 이 팀 또한 기존 업무를 혁신하고 새로

운 접근을 시범적으로 도입한다는 분명한 임무를 가지고 모든 정부 부처

에 걸쳐 활동해 왔다 그 책임 범위에 있는 두 가지 혁신 조항 즉 팀

운영 재정의 10배 수익을 달성하고(설립 후 2년이 되는) 2012년 7월에

팀의 일몰심사를 수행한다는 조항 덕에 업무 탄력이 지속되고 있다

41) 정부 서비스를 위한 디폴트 디지털화 방안의 제안(Digital by default proposed for government services) 국무조정실 2010

42) 정부 디지털 서비스에 관해(About the Government Digital Service) 국무조정실43) 행동조사팀 국무조정실

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

40 985115 빅데이터로 인한 기회

현상유지에 변화를 가져올 강력한 정치적 지원 혁신적이고 새로운 실

천을 탐구할 자유 그리고 예상 수익 및 계획의 엄 한 내역 등을 포함

하는 이 두 가지 모델의 요소들은 정부가 데이터 및 분석에 대한 업무

탄력을 어떻게 비슷한 수준으로 끌어올릴 것인가와 관련이 있다

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

8 권한(Power)과 책임 985115 41

8 권한(Power)과 책임

빅데이터 기술 그 중에서도 특히 예측 분석 기술은 조직에 놀라운 역

량을 부여해줄 수 있다 개인 사용자 소비자 또는 국민에 대해 많은 사

실을 알게 되면 때로는 매우 정확하게 그들의 특정 수요와 행동을 예측

할 수 있게 된다 책임을 가지고 활용한다면 수요를 예측하는 이러한 역

량은 크게 도움이 될 수 있다 시간을 절약하고 서비스를 맞춤화하며 아

마 가장 중요하게도 원하지 않는 결과를 피하기 위해 결정을 내리거나

행동을 바꿀 수 있게 된다

이미 우리는 연계된 데이터를 토대로 거래 속도를 높이거나 질병의 위

험을 높이는 생활습관적인 요소들을 제거 또는 감소시키기 위해 노력하

는 등 어느 정도 이를 모두 실천하고 있다

그러나 우리는 빅데이터 분석기술이 프라이버시와 도덕성과 같은 어려

운 문제와 충돌하는 현상을 더욱 자주 경험하고 있다 몇 가지 예를 들

면 다음과 같다

bull 소매업자들은 개인 또는 가구가 처한 상황에 대한 민감한 정보를 얻

기 위해 데이터를 구매하여 이를 다른 공개된 정보와 함께 사용할 수

있다 마케팅 목적이거나 고객 충성도를 높이기 위해 이 방법은 매우

도움이 될 수 있다 그러나 이 때 적용할 수 있는 검토의 깊이에 대

해 모든 고객들이 괜찮다고 느끼지는 않는다 한 가지 유명한 예로

미국의 소매유통회사인 타겟(Target)이 한 십대 소녀가 임신사실을

부모에게 알리기도 전에 이를 추론하여(그에 맞는 쿠폰을 발송하는

등) 도가 지나친 행위를 한 적이 있다44)

44) 기업은 어떻게 당신의 비 을 캐내는가(How companies learn your secrets) New York Times 2012 2

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

42 985115 빅데이터로 인한 기회

bull 소셜네트워크 검색엔진 및 기타 온라인 서비스는 정교한 방법을 사용

하여 온라인상에서의 사용자의 행동을 추적하고 관심 대상을 추론해

내며 개인적 상황의 변화를 예측할 수 있다 페이스북에서 상태 업데

이트를 취합하여 관계 속에서 아주 세 한 패턴까지 찾아낼 수 있으며

이를 소셜 그래프 속에서 사용자의 행동 및 관계에 대한 정보와 함께

샅샅이 살펴볼 경우 개인의 관계가 언제 형성되고 끝날지를 예측하는

데 사용할 수도 있다45) 구글은 최근 프라이버시 정책을 변경하였는

데 이는 여러 가지 제도를 편리하게 통합하였을 뿐 아니라 회사의 서

비스 전반에 걸쳐 광고 대상을 확보할 수 있는 능력을 증대시켰다46)

bull 보안 및 반테러 기관들은 거대하게 성장한 전자 커뮤니케이션 환경과

더욱 정교해지는 위협자들을 대상으로 일하고 있다 이 보고서를 집필

하는 현재 정부는 전자 커뮤니케이션으로부터 트래픽 및 컨텐츠 데이

터를 감시 차단 및 저장하는 국가의 권한을 확대하는 제안을 검토하

고 있다47) 정부 권한을 확대하는 문제는 프라이버시 권리 및 시민의

자유와 충돌관계에 놓여 있다 한편으로는 정부 당국이 접근할 수 있

는 정보가 많을수록 위협을 감시 및 제거하는 능력이 개선될 수 있다

그러나 반대로 많은 국민들이 자신의 행동 및 소통내용이 일상적으로

상세히 감시당하는 것에 반대하고 있다

bull 정당에서도 유권자들을 상세히 세분화하기 위해 빅데이터 분석을 사용

하는 경우가 늘어나고 있다 개인의 상황 및 우선순위를 자세히 알게

되면 가구별로 선거자료를 맞춤화하여 제공할 수 있다 이러한 사례는

미국에서 이미 흔하게 발생하고 있다 득표차가 작을 경우 정당의 입

장에서 이러한 전략은 결정적인 차이를 만들어낼 수 있다 그러나 일

부 평론가들은 이러한 현상이 조리 정연한 공청회 대신 분열을 초래

하고 극단적으로 편파적인 입장을 부추긴다고 비판한다48)

45) 페이스북에 관한 놀라운 사실과 결별(Amazing facts about Facebook and break- ups) Mikkeisen 2010

46) 프라이버시 정책(Privacy policy) Google 201247) 커뮤니케이션 데이터 안건(Draft communications data bill) 영국정부 2012

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

8 권한(Power)과 책임 985115 43

정부가 계속해서 빅데이터 도구 및 기술 사용을 연구 및 확대하고 있

음에 따라 이러한 긴장과 더 많이 마주치게 될 수밖에 없을 것이다 권

력을 가진 위치에서 정부는 책임감 있게 분석을 실시해야 할 특별한 의

무를 지닌다 이 분야에서 정부가 어떻게 행동하는지에 따라 각 관할 구

역에서 데이터를 다루는 다른 국가 정부 및 조직을 위한 기준을 마련할

수 있다

정부는 시민의 자유를 최대한 존중해야 하고 시민은 정부의 윤리 및

도덕적 수준에 대한 기대치를 최고로 잡아야 한다

48) 정보라는 무기와 레이스(The information arms race) GOOD News 2011 9

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

44 985115 빅데이터로 인한 기회

9 권고

공공부문 빅데이터의 완전한 잠재력을 활용하는 것은 커다란 도전이며

하룻밤 사이 이루어지는 것이 아니다 그럼에도 불구하고 실제 국민을

위한 더 나은 서비스 더욱 효율적이고 스마트한 공공부문이라는 혜택을

위해서는 공공부문 데이터 자산을 더욱 잘 활용하기 위한 노력을 새롭게

할 만하다고 생각한다

이 주제에 관해 검토한 결과 우리는 다음 두 가지를 권고하고자 한다

1 고급분석팀(Advanced Analytics Team)

국무조정실(Cabinet Office)에 고급분석팀(Advanced Analytics

Team)을 신설하여 빅데이터 기회를 발굴하고 부처들이 이를 실현할 수

있도록 도와주는 책임을 부여한다

정부디지털서비스(GDS)와 행동조사팀(BIT)이 취하는 접근법을 바탕으

로 하여 고급분석팀은 목표를 뚜렷이 하고 외부 전문가를 초빙하며 여러

부처의 경계를 넘어 어떻게 적용될 수 있는지에 관계없이 정책 개선을

위한 기회를 모색할 수 있어야 한다

고급분석팀의 목표와 책임범위를 다음과 같이 제안한다

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

9 권고 985115 45

고급분석팀의 책임범위(안)

팀의 목적은 정부가 데이터 자산을 사용하는 방식의 경계를 허물어 효율적인

면에서 비용을 절감하고 공공 서비스를 개선하기 위함이다

팀의 우선 목표는 다음과 같다

bull 부처들과의 협력을 통해 데이터 및 분석을 새롭고 창의적이며 보다 정교한

방식으로 적용함으로써 공공정책 제공의 세 가지 주요 분야를 혁신한다

bull 공공부문의 고위 지도자들에게 최첨단 데이터와 분석도구 및 기법에 대한

인식 이해 및 수요를 확대한다

bull 중앙정부에서 최소한 기존 계획을 상회하는 10억 파운드의 비용을 절감하

여 혜택을 실현한다

시급한 사안인 만큼 고급분석팀에서는 1년 이내에 경과 보고서를 발표하여

어떻게 비용절감을 실현할 것인지에 대한 명확한 계획을 제시한다 그 후

1년 동안 이러한 비용절감을 실현한 후 일몰심사를 거친다

(필요하다면 급여와 관계없이 높은 자질을 갖춘 인사를 초빙할 정도의

충분한 탄력성을 확보하고) 팀의 예산은 수백만 파운드 초반대로 할 수

있을 것이다 비교하자면 새로이 설립된 오픈데이터인스티튜트(Open

Data Institute)는 오픈데이터를 조사하는 기관으로 5년에 걸쳐 1000

만 파운드의 정부의 출연을 확보했다49) GDS의 2011-12 예산은

2200만 파운드이다50)

계획이 성공적이라면 정부는 공공부문에서 데이터 과학자라는 커리어

패스를 공식화하는 것을 고려해 보아야 한다 이는 기존에 운영중이던

49) 오픈데이터인스티튜트 설립계획 발표(Plans to establish Open Data Institute published) 국무조정실 2012 5

50) 전자정부 재정(Electronic government finance) Hansard 2011 9

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

46 985115 빅데이터로 인한 기회

연구 서비스와 통합되거나 빅데이터 및 분석을 보다 정기적으로 다루는

사람들을 위해 새로운 전문직종으로 개발될 수 있다

어쨌든 이 전문가 집단은 공공부문 전반에 걸쳐 데이터 취급 경쟁력을

향상시킬 책임이 있다 대부분의 경우 데이터세트를 만들고 데이터 분석

및 비주얼리제이션 결과를 소비하는 것은 비전문가들일 것이다 고위 공

무원 및 장관들이 빅데이터 분석을 효과적으로 소비 및 사용하는 방식을

배울 기회가 없다면 세계 최고의 데이터 과학자들이라 해도 소용없다

2 책임분석강령(Code for Responsible Analytics)

정부는 책임분석강령(Code for Responsible Analytics)을 채택하여

데이터 및 분석의 사용에 있어 최고 수준의 도덕성을 지키도록 한다

데이터 권력 및 시민이 각각 처한 고유의 입장을 고려할 때 이 강령

은 빅데이터 소유주의 도덕적 데이터 사용을 위한 금본위제(gold

standard)에 해당될 것이다 정부가 가장 먼저 강령을 채택하고 다른

조직들은 여기에 자유로이 동참할 수 있을 것이다

강령의 내용은 의회 정부부처 국민과 시민사회 기업 등 사회 모든

주체들이 상세히 고려 및 검토해야 한다

강령의 초안이 아래에 소개되어 있다 우리는 정부를 비롯해 관심있는

모든 주체들이 우리의 제안에 대해 토론하고 문제를 제기하며 개선해 줄

것을 요청한다

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

9 권고 985115 47

책임분석강령(안)

현대 정부 업무에서 데이터를 윤리적으로 사용하는 것은 근본적인 원칙의 문

제이다 정부는 다음을 따를 것이다

bull 능력보다 결과를 중요시한다 데이터 및 분석 역량은 명확하고 개방적인

소통이 이루어진 공공 정책의 합당한 이유를 근거로 획득하여야 한다 이

러한 역량은 절대로 그 자체를 위해서 축적되어서는 안되며 중복될 경우

즉시 포기해야 한다 호기심만으로는 절대 충분한 이유가 될 수 없다

bull 프라이버시에 대한 권리를 존중한다 보조 데이터 및 분석은 국민의 개인

적이거나 은 한 정보(자녀현황 성적 취향 정치적 활동 등)를 추론하는데

사용되어서는 안 된다 공공 정책을 위해 이러한 정보가 필요할 경우 명확

하게 동의를 구해야 한다

bull 연구실에서는 실패해도 현실에서는 안 된다 모든 빅데이터 관련 계획은

모의 환경 테스트 및 데이터 합성 테스트를 거친 다음 엄 한 검토 및 동

료평가(peer review)를 거친다 도덕성 및 프라이버시의 허용 수준을 넘어

서는 계획은 취소될 것이다 장관의 엄격한 검토를 통과하는 계획만 실행

될 것이다

이 모든 의제를 통틀어 우리는 정부가 공공정책의 혜택에 관해 개방적

이고 투명한 사례를 만들 준비가 되어 있는 경우에만 데이터 및 분석을

사용해야 한다고 생각한다

우리가 제안하는 강령의 마지막 요소는 정부가 빅데이터 및 분석의

취급 범위를 어디까지 허용해야 하는지에 대해 명확한 경계선을 긋는

것이 우리 모두에게 어렵다는 사실을 고려할 때 특히 중요하다 대부분

의 경우 우리는 우리 눈에 보이는 기준선을 넘어서는 정책을 가장 잘

발견해 낸다 대중의 반발로 모든 데이터 의제가 원점으로 돌아갈 수

있는 위험은 계획을 제대로 이행하는 것이 얼마나 중요한지를 보여준

다 모의환경 구축 및 합성 데이터 실험에 관한 제안은 최근 발표된 공

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

48 985115 빅데이터로 인한 기회

공서비스 혁신보고서의 ldquo정책실험(policy labs)rdquo 정신에 부합된다51) 장

관의 검토에 더하여 의회의 감독 역할을 부여함으로써 검토를 더욱 엄

격히 할 수 있다

단지 정부가 빅데이터를 다룰 수 있다는 것일 뿐이지 반드시 그렇게

해야 한다는 것은 아니다 최종 분석 단계에서 부처별로 빅데이터 또는

관련 데이터의 검토를 거쳐 계획을 수립하는 것에 대해 장관이 불편함을

느낀다면 해당 계획은 정부 정책으로 만들어져서는 안 되는 것이다

51) 공공서비스 혁신계획(The Civil Service reform plan) 국무조정실 2012 6

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

덧붙이는 말 지도자들이 해야 할 질문 985115 49

덧붙이는 말 지도자들이 해야 할 질문

우리는 공공부문이 빅데이터 여행의 시작점이며 이 보고서에 소개된

여러 가지 기회를 누리기 위해서는 시간과 노력이 필요하다는 사실을 알

고 있다

공공부문 지도자들이 자신의 조직 내에서 이러한 화두를 던질 수 있도

록 스스로 물어보아야 한다고 생각되는 다섯 가지 주요 질문을 취합해

보았다

1 우리가 아는 것은 실제로 알고 있는 것일까

이 질문은 어떤 조직에서든 빅데이터를 다루는 기본에 해당한다 빅데

이터 자산의 종합감사에 데이터 수집 및 저장 이유에 대한 신중한 분석이

결합되면 조직이 어떠한 기회를 모색해야 하는지를 이해하는 기본 바탕을

마련해 줄 것이다 조직이 만들어 내는 데이터의 많은 부분은 일상적인

업무 과정에서 생성되는 것일 수 있으나 일상적으로 수집되지는 않는다

데이터와 정보를 우리가 알고 있음을 아는 것(known knowns)과 모르고

있음을 아는 것(known unknowns)으로 구분하는 연습을 통해 지식의

빈 공간이 어디인지 확인하고 개선이 필요한 분야를 밝혀낼 수 있다

2 우리는 결정을 내리기 위해 데이터를 사용하고 있는가

증거기반 정책 수립의 중요성은 화이트홀에서 가장 자주 언급되는 것

중 하나이다 현대 조직이 만들어내는 데이터의 양은(모두는 아니지만)

적어도 이론적으로는 정량적 데이터를 기반으로 하여 많은 의사결정을

내릴 수 있다는 사실을 의미한다 물론 실제로는 분석이 가능한 방식으

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

50 985115 빅데이터로 인한 기회

로 데이터가 수집되지 못하거나 의사결정자들에게 도움이 되는 방식으로

분석이 이루어지지 않을 수도 있다 어떠한 결정이 데이터와 반복적인

분석을 기반으로 하는 것인지 그리고 어떠한 결정이 판단과 추정 경험

을 기반으로 하는 것인지 구분할 수 있는 것이 중요하다

3 얼마나 빨리 답변을 얻을 수 있는가

사건이 발생하면 빠른 대응이 요구되며 이는 상업적 기업만큼 공공부

문에서도 통하는 사실이다 빅데이터 자산을 잘 관리하고 분석 기능이

잘 마련된 조직이라면 빠른 시간 내에 질문에 답하고 가설을 검증할 수

있어야 한다 즉 조직 전체에 어떤 일이 일어나고 있는지를 거의 실시

간으로 알고 있어야 한다는 의미이다 조직이 답변을 제공하는 데에 수

일 수주 또는 수개월이 걸린다면 업무 프로세스 및 보틀넥에 대한 감사

가 필요한 것이다

4 빅데이터 혁신을 위한 우리의 전략은 무엇인가

조직이 빅데이터를 다루는 데에 점차 익숙해져 간다면 이 보고서 초반

에 소개한 기회들을 실현시키고자 하는 욕구와 수요도 늘어날 것이다

지도자들은 데이터 과학자의 자리를 만들 필요성과 혁신 및 창의성을 발

휘하는 다른 일자리를 마련할 필요성 사이의 균형을 지켜 인재를 가장

중요한 전략 부문에 집중시키도록 한다 공공부문의 조직들은 또한 다른

조직들과 그리고 민간부문의 전문가들과 어떻게 함께 일할 것인지를 결

정해야 할 것이다

5 누가 책임을 지는가 그리고 이 사람이 적당한가

빅데이터와 분석으로부터 가치를 만들어내는 책임은 여러 조직의 다양

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

덧붙이는 말 지도자들이 해야 할 질문 985115 51

한 곳에 있다 책임이 귀속되는 전형적인 업무 영역에는 금융 IT 전

략 HR 운영 그리고 임원진 등이 포함된다 중요한 사실은 윗선에서

빅데이터를 통해 실현하고자 하는 것과 책임 소재 영역에 일관성이 있다

는 점이다 많은 경우 빅데이터에 대한 책임은 계획에 의거한 전략적 결

정이라기보다는 조직의 역사가 만들어낸 인공물인 경우가 많다 빅데이

터를 사용하고 이로부터 가치를 추출하는 조직의 역량이 강화되는 가운

데 이를 바로잡는 것이 중요할 것이다

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

현대 사회는 방대한 양의 데이터를 만들어내고 있으며 정부의 사업도 예외가 아

니다 빅데이터(big data)란 용어는 거대한 데이터세트를 말하며 빅데이터 분석

(big data analytics)이란 이러한 데이터세트를 결합하고 관찰하여 의미를 찾아

내고자 하는 과정을 말한다

이 보고서는 공공부문 빅데이터 전략에 관한 것이다 데이터 및 그 분석을 통해

정책담당자들에게 공공 서비스 혁신 기회에 대한 영감을 주기 위해서 우리는 전

반적인 개요 및 사례들을 제공하고 있다 또한 이러한 의제가 공공부문 특히 재

능 역량 시민의 자유 등에 미치는 문제점에 대한 주의를 환기시키기고 있다

우리의 권고는 정부가 어떻게 공공부문이 직면하게 될 문제점들을 해결하면서

동시에 빅데이터의 기회를 확보할 수 있는지를 보여준다

pound1000ISBN 978-1-907689-22-2

Policy ExchangeClutha House10 Storeyrsquos GateLondon SW1P 3AY

wwwpolicyexchangeorguk

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)

bull동향분석시리즈는정보통신진흥기금으로수행한정보화정책연구사업의

결과입니다

bull본자료를인용할경우출처를명시하여주시기바랍니다

bull본자료는한국정보화진흥원의공식견해가아니며본내용에대한

문의나제안사항이있으시면한국정보화진흥원정보화기획총괄부로

연락하여주시기바랍니다

bull본자료는wwwitglobalorkr에서볼수있습니다

bull문의한국정보화진흥원정보화기획총괄부김진숙책임

(02-2131-0131jskimniaorkr)