빅더 업무적용가이드 · 2020. 4. 10. · 공공 빅데이터 업무적용 가이드 2...

87
빅더 IOIEi 업무적용드 I WhBig, Why Big, How Bi] l,.lllMμMμHUH---pgTllKT+·-----· I i•I 행정자*|부 NIA햄쟁보확핀

Upload: others

Post on 14-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 컨컴1 빅더IOIEi

    업무적용가이드

    I Wh따 Big, Why Big, How Bi형 ]

    맨ffl)

    μ양니냐 빼

    l,.‘ll」l•

    니μ빼η뷰 M

    、‘

    μMμHUH -

    --‘pgT↓’’

    ll「KT+·

    -----’’”·

    、、、‘

    、‘、‘、‘‘

    ‘、

    ‘‘

    “ “

    ti I 정백현운변화

    『뎌i•I터 • 행정자*|부 NIA햄쟁보확핀흉웬

  • 제1장 개요 1제1절 목적과 필요성 ···································································································2

    제2절 구성과 활용범위 ·······························································································3

    제3절 빅데이터 분석 및 활용의 의의 ·····································································4

    제2장 사전준비 단계 11제1절 추진체계 구성 ·································································································13

    제2절 빅데이터 분석과제 발굴 ·············································································16

    제3절 데이터 확보방안 검토 ···················································································25

    제4절 분석과제 선정 ·································································································30

    제5절 분석 방안 수립 ·······························································································33

    제6절 분석 결과 활용계획 수립 ·············································································33

    제7절 분석 추진계획 수립 ·······················································································36

    제3장 활용 및 분석모델 고도화 43제1절 업무 적용 및 효과 검증 ···············································································45

    제2절 분석 결과 홍보 ·······························································································48

    제3절 유지관리 ···········································································································50

    제4절 분석모델 고도화 ·····························································································52

    부록1. 사업 추진 단계별 점검항목 55Ⅰ. 요건 정의 ··············································································································57

    Ⅱ. 데이터 수집 ··········································································································62

    Ⅲ. 데이터 전처리 ······································································································64

    Ⅳ. 분석모델링 ············································································································69

    Ⅴ. 모델 구현 ··············································································································71

    Ⅵ. 시각화 ····················································································································73

    Ⅶ. 검증 및 안정화 ····································································································75

    부록2. 사업 추진 단계별 주요항목 79

  • [표 1: 빅데이터 기술과 DW/BI 기술의 차이점] ····················································6

    [표 2: 주제 도출 시 고려사항] ···············································································16

    [표 3: 민원 신고 사이트별 주요 관리 민원] ·······················································19

    [표 4: ‘16년 행자부 추진 표준분석 모델별 상세내용] ································23

    [표 5: 웹소셜데이터 수집 대상 URL 및 ID 개수 (2016년 8월말 기준)] ····26

    [표 6: 공공데이터포털 보유데이터 건수(2016. 5. 기준)] ······························27

    [표 7: 국내 공공분야 주요 오픈 API] ··································································28

    [표 8: 과제 평가 기준표 예시] ·············································································30

    [표 9: 수요조사의 심사기준과 심사내용] ·····························································38

    [표 10: 사업비 산정 단계별 주요 내용] ······························································41

    [표 11: 유지관리 체크리스트] ··············································································50

    [표 12: 유지관리 대상별 관리 포인트] ······························································51

    [표 13: 분석모델의 장·단기 활용 방안 예시] ················································53

    [표 14: 품질관리목표] ······························································································66

    [표 15: 결과공유 항목] ····························································································75

    [그림 1: 공공 빅데이터 분석과제 추진 프로세스] ···············································3

    [그림 2: 빅데이터의 속성 3V + 1V] ·····································································5

    [그림 3: 빅데이터 추진체계도 예시] ·····································································14

    [그림 4: 주제 선정 절차 예시] ·············································································16

    [그림 5: 빅데이터 아이디어 공모전 예시] ·························································21

    [그림 6: 빅데이터 포털 메인 페이지] ···································································22

    [그림 7: 분석 주제 시급성/난이도별 순위 선정 예시] ·····································31

    [그림 8: 시내버스 효율적 운영 사업(광주시)의 분석 결과 활용방안 예시] ····34

    [그림 9: ‘16년 신규 분석사업 선정 절차 및 일정 예시] ······························38

    [그림 10: 빅데이터 포털 활용 검토 방법] ······················································39

    [그림 11 : 분석 과제의 장·단기적 목표 및 활용계획 예시] ························46

    [그림 12: 분석결과 공유] ························································································48

    [그림 13: 분석 전문가 세미나] ············································································48

    [그림 14: 빅데이터 사업 설명이 가능한 인포·모션그래픽스 제작 및 활용] ···49

  • [그림 15: 빅데이터 역량 강화의 선순환 구조와 단절 원인] ··························52

    [그림 16: 요건 정의 단계의 주요 활동] ······························································57

    [그림 17: 데이터 수집 단계의 주요 활동] ························································62

    [그림 18: 데이터 전처리 단계의 주요 활동] ······················································65

    [그림 19: 데이터 기초 통계분석 예시] ································································67

    [그림 20: 데이터 연계 구상도 예시] ····································································68

    [그림 21: 분석모델링 단계의 주요 활동] ····························································69

    [그림 22: 분석 시나리오 구성 예시] ····································································69

    [그림 23: 모델구현 단계의 주요활동] ································································71

    [그림 24: 시각화 단계의 주요 활동] ··································································73

    [그림 25: 검증 단계의 주요 활동] ······································································76

    [그림 26: 통합 테스트 절차 예시] ········································································77

  • 제1장 개요

    제1절 목적과 필요성

    제2절 구성과 활용범위

    제3절 빅데이터 분석 및 활용의 의의

  • 공공 빅데이터 업무적용 가이드

    2

    제1절 목적과 필요성

    1. 가이드의 목적

    m 공공 빅데이터의 다양한 가치에 대한 인식을 제고하고 효율적인 빅데이터

    분석과 활용으로 국가, 지자체 및 공공기관 업무의 효과성 극대화를 도모함

    - 빅데이터 분석을 통한 공공정책 의제발굴 · 정책결정 및 추진전략 수립의

    방향을 이해하고 올바르게 적용할 수 있는 가이드를 제공

    m 공공 빅데이터 분석과제의 추진 담당자가 추진절차를 실제 업무에 적용하기

    위해서 점검해야 할 단계별 항목과 체크리스트를 제시함으로써, 실제 업무

    에서 담당자가 쉽게 활용할 수 있는 체계를 마련함

    - 사전준비 단계와 활용 및 분석모델 고도화 단계는 추진 담당자가 주도적으로

    수행할 수 있도록 비교적 상세하게 기술하였으며 사업추진 단계는 담당자가

    사업을 추진하면서 검토해야 할 점검사항 위주로 기술하였음

    - 가이드를 통해 정보화 담당자는 물론 빅데이터를 경험해 보지 못한 현업

    담당자도 빅데이터 분석과제를 준비하고 추진할 수 있도록 기술하였음

    2. 배경 및 필요성

    m 국가 안전 및 치안, 의료, 교육, 복지, 환경 등 사회 전반에 걸쳐서 빅데이터의

    활용 가능성이 높아지고 실제 수요도 크게 증가하고 있음

    m 그러나 이를 수행하는데 참고할 지침이 마련되어 있지 않아 실무 담당자들이

    실제 추진과정에서 불필요한 시행착오를 거쳐 추진될 우려가 있음

    m 빅데이터를 업무에 효과적으로 적용하기 위한 절차 및 방법 등에 대해

    체계적으로 설명된 가이드의 제작이 필요함

    - 공공부문 실무 담당자를 위하여 과제 목표와 방향 설정, 과제 추진 및 관리를 위한 체계적인 절차와 점검 항목 등을 제시한 가이드 제작

  • 3

    - 빅데이터 분석 시의 추진 프로세스를 고려한 실무지침을 현장 업무에 직접

    활용 가능하도록 작성

    제2절 구성과 활용범위

    1. 가이드의 구성

    m 본 가이드는 사전준비 단계, 사업추진 단계, 활용 및 분석모델 고도화의

    3단계로 구성되어 있으며, 부록1의 사업추진 단계별 점검항목에서는

    실무 담당자가 확인해야할 사항을 점검항목 형식으로 제공함

    m 공공분야 빅데이터 단계별 프로세스를 포괄적으로 포함하여 실무 담당자가

    이해하기 쉽도록 작성하였음

    m 사전준비 단계는 가이드를 활용하여 분석과제 추진을 준비할 때 어려움이

    없도록 필수 활동들을 상세하게 설명하였으며, 활용 및 분석모델 고도화

    단계에서는 분석모델의 활용, 결과 홍보, 유지보수, 고도화 측면에서 활용

    할 수 있도록 상세하게 기술하였음

    - 본 가이드는 빅데이터 분석과제 추진 담당자의 업무 활용을 목적으로 하므로,

    사전준비 단계와 활용 및 분석모델 고도화 단계에 대해서는 본문에서 상세히

    설명하였으며, 사업추진 단계는 부록으로 별도 구성하여 추진 담당자가

    점검사항 위주로 참고할 수 있게 하였음

    [그림 1: 공공 빅데이터 분석과제 추진 프로세스]

  • 공공 빅데이터 업무적용 가이드

    4

    2. 활용범위

    m 본 가이드는 빅데이터 분석을 통한 공공정책 의제발굴과 추진전략 기획을

    담당하는 공공기관의 실무 담당자를 위한 것임

    - 본 가이드는 빅데이터 분석과제를 대상으로 작성되었으며, 빅데이터 시스템

    구축 사업에 대한 가이드는 제시하지 않음

    m 공공부문에서의 빅데이터 분석과 활용에 대한 이해를 높이고, 과제 타당성

    검토와 방향성 확보 등의 기획 업무 등에 활용되기 위해 작성됨

    m 본 가이드에서 제시하는 업무 절차는 필수 적용 절차가 아닌 참고용으로,

    각 기관의 빅데이터 활용 목표와 운영 환경 및 분석 대상 데이터의

    특성에 따라 타당성 검토 후 적용되어야 함

    제3절 빅데이터 분석 및 활용의 의의

    1. 빅데이터 분석의 개념 및 의의

    m 빅데이터는 기존의 방법으로 처리가 어려운 대용량 혹은 다양한 유형의

    실시간 생성되는 데이터의 집합을 의미함

    m 빅데이터 분석은 시간, 공간 그 외 조건들의 변화에 따른 데이터의

    분포와 데이터 간의 상호관계를 다양한 관점으로 조망하므로 의미 있는

    패턴을 발견하고 세상을 이해해 가는 과정임

    m 초창기『일반적인 DB SW가 저장·관리·분석하는 범위를 초과하는 데이터』등

    규모를 강조하던 관점에서(McKinsey, 2011), 최근에는『다양한 종류의

    데이터로부터 저렴한 비용으로 가치를 추출하고 초고속 분석을 지원하는

    기술』등으로 가치창출 및 활용으로 초점이 이동됨(IDC, 2011)

  • 5

    [그림 2: 빅데이터의 속성 3V + 1V]

    m 빅데이터는 경제, 사회 전반에서 혁신을 주도하는 일종의 플랫폼 기술

    (GPT: General Purpose Technology)을 의미하며 효과적으로 활용시 정부·

    기업·개인 모두에 막대한 효용을 수반함

    2. 빅데이터 활용의 필요성

    m 빅데이터를 분석하는 목적은 과거에 어떤 일이 일어났고, 그 원인이

    무엇이며, 앞으로 어떤 일이 일어날 것인지를 예측하기 위함

    - 미래를 예측할 수 있다면 합리적인 의사결정을 통하여 기관 및 국민

    에게 엄청난 이득을 가져다줄 수 있으며, 과학적으로 데이터에 근거

    해서 의사결정을 하게 되면 문제와 결론이 명확한 합리적 의사결정을

    할 수 있음

    * (예시) LAPD(로스엔젤레스 경찰국)에서 도입한 범죄예측 시스템은 아침마다 순찰을 할 때 LA 경찰들이 어디를 가보아야할지 범죄율과 연관된 순찰 코스를 정해주면서, 최소의 인력으로 최대의 효율을 이끌어 낼 수 있는 합리적인 업무를 가능하게 함

    m 기존 DW(Data Warehouse), BI(Business Intelligence), 통계분석 등은 비싼

    하드웨어, 소프트웨어에서 실행되며, 이 또한 데이터가 많아지면, 비싼

    하드웨어를 추가해도 실행할 수 없음

    m 그래서 나온 것이 빅데이터 기술이며, 우선 빅데이터는 PC같이 상대적

    으로 싼 하드웨어와 공개 소프트웨어에서 운영되고 많은 데이터를 돌릴

    때에는 하드웨어를 계속 늘려나가도 문제가 없으며 컴퓨팅 성능도 계속

    올라감

  • 공공 빅데이터 업무적용 가이드

    6

    m 결국 기존 RDBMS기술의 고질적인 문제점을 빅데이터 소프트웨어가

    해결했는데 이것이 바로 하둡(Hadoop), NoSQL DB임

    3. 빅데이터 활용 사례

    m 맞춤형 서비스 분야

    - (시민목소리 분석) 특정주제에 대한 시민의 목소리를 이해하고 그 추이를

    분석함. 민원 접수 데이터와 소셜 데이터에 기반할 수 있으며, 정책의제

    빅데이터 기술 DW/BI 기술

    데이터정형과 비정형 데이터(SNS, 사진, 동영상, 위치 정보, 지리 정보, 기타)

    정형 데이터

    기본 기술Hadoop, No SQL, CEP 등 대단히 다양

    RDB에 근간

    특징수십, 수백억 건 이상도 처리 가능, HW만 늘려가면 퍼포먼스가 증가함(Scale-out)

    데이터가 수십억 건 이상 되면 HW를 더 많이 사용해도 퍼포먼스가 증가하지 않음

    서버 저가의 일반 x86 서버 사용 주로 Unix, x86에 비해 고가

    소프트웨어대체로 공개 소프트웨어(물론 상용 소프트웨어도 있음)

    모두 고가 상용 소프트웨어

    데이터 처리3개 노드에 데이터 중복해서 카피함, 1~2개의 노드에 문제가 동시에 있어도 자동 복구

    데이터 중복을 안 하는 대신 시스템은 중복, 고비용

    데이터 처리 방식

    배치 처리(Hadoop), 실시간 데이터 처리(CEP 등), 다양한 분석 방식(NoSQL 등)

    주로 배치 처리

    참고사항공개 소프트웨어이므로 기술 지원 문제, 기존 RDB와는 완전히 다른 기술

    고가이고, 데이터 처리 양이 늘어나면 한계에 이르며, 비정형 데이터는 처리하기 어려움

    향후 트렌드기존의 DW/BI에 빅데이터 기술을 도입하는 방향,비정형 데이터를 처리해야 하는 분야에 부분적으로 도입 가능,DW/BI에 빅데이터 기술을 융합하는 형태

    [표 1: 빅데이터 기술과 DW/BI 기술의 차이점]

  • 7

    발굴과 전략 방향 설정 등에 활용할 수 있음

    * (예시) 시민의 소리(민원) 분석(광주 광산구), 시민 요구사항 분석(영천시)

    - (사회이슈 분석) 사회이슈의 자동 감지와 연관 주제의 동향 분석을 통해

    잠재 정책 수요를 발굴함. 지역별 이슈를 도출하고 지역별 맞춤형 대국민

    서비스 전략 수립이 가능함. 주요 일간지, 소셜 데이터, 민원 접수 데이터

    등이 분석 대상임

    * (예시) 지자체 갈등 이슈 파악을 통한 선제적 대응(행자부), 빅데이터 기반의여론분석(문화체육관광부)

    - (맞춤형 민원서비스) 지역별, 기관별 민원인의 행동 및 요구사항 분석을

    통해 민원 행정서비스의 개인 맞춤형 서비스를 구현함. 지역별 기관별

    서비스 사용로그, 게시판 및 민원 접수 데이터, 포털게시판과 질의응답

    데이터 등이 주요 분석 대상임

    * (예시) 구민 건의사항 및 온라인 민원 분석(부산 해운대구)

    m 국민 안전 분야

    - (범죄예방과 대응) 지역별, 시간별, 이벤트별, 유형별, 범죄 패턴 분석과

    이를 활용한 지역별, 시기별 맞춤형 범죄예방 전략 도출이 가능함. 범죄

    및 경찰업무기록, 보고서, 뉴스 및 소셜 데이터 등이 주요 분석 대상임

    * (예시) 수원시 CCTV·보안등 사각지대 선정(경기도), 시민순찰대 순찰노선 지정지원을 위한 빅데이터 분석(성남시)

    - (도시관제 및 재난대응) 도심 내의 문제를 조기 파악하거나 재난을 조기에

    감지하여 대응할 수 있도록 하며, 도시민과 재난지역의 시민 목소리를

    바르게 이해하여 응급활동에 반영할 수 있는 정책의제 발굴에 활용함.

    센서 데이터, CCTV, 소셜 데이터 등이 주요 분석 대상임

    * (예시) 빅데이터 기반 산불 위험예보(산림청), 재해 예․경보시설 스마트 365감시체제 구축(제천시), 홍수대응시스템 구축(세종시)

    m 조세 분야

    - (금융감독 및 세금추징) 금융거래 이상 징후, 조세 회피 및 탈세 등의

  • 공공 빅데이터 업무적용 가이드

    8

    패턴 감지와 조기 대응력 확보, 금융 및 조세정책에 대한 시민 인식과

    지역별, 기간별 동향에 대한 분석에 활용됨. 조세·금융거래 데이터, 소셜

    데이터 등이 주요 분석 대상임

    * (예시) 통합형 탈세 및 사기 범죄 방지 시스템(미국 국세청)

    m 의료·복지 분야

    - (의료 및 복지서비스 강화) 의료보험 비용 분석을 통한 사업 최적화,

    부당 청구 방지, 복지 정책 입안과 만족도 분석, 지역별 복지 불균형

    해소 등에 활용됨. 의료 및 복지 지출데이터, 민원센터 로그, 소셜 데이터,

    서비스기관 홈페이지 및 포털 게시판, 주요 일간지 등이 주요 분석 대상임

    * (예시) 스마트 공간을 위한 빅데이터 기반의 스마트 라이프 케어서비스(청주시)

    - (질병 및 전염병 관리) 유행 전염병, 질병에 대한 예측 및 대응과 지역별

    분포 분석에 활용됨. 연도별 마크로 분석, 가축 전염병과 환경, 이동 경로

    데이터 등이 주요 분석 대상임

    * (예시) 국민건강 알람서비스(국민건강보험공단), 의약품 부작용 분석(식약처)

    m 교통·환경 분야

    - (환경감시 및 대응) 환경오염과 변화 상황의 모니터링을 통한 대응 및

    환경정책관련 중장기적 수행 전략수립 등에 활용됨. 국가 및 도심 센서

    네트워크로부터 수집된 환경 데이터, 다양한 관련 보고서 등이 주요 분석

    대상임

    * (예시) 쓰레기 무단투기 분석(부산광역시)

    - (교통상황관리 및 최적화) 교통흐름 모델링과 예측, 최적화 시스템 구현,

    교통 신호체계와 유지보수 정책에 활용됨. 도로 센서 네트워크, 사건사고

    로그, 날씨, 명절 및 스포츠 등 이벤트 데이터 등이 주요 분석 대상임

    * (예시) 교통정보 빅데이터분석시스템 구축(청주시)

  • 9

    m 교육 분야

    - (교육정책 및 현안분석) 교육환경 개선과 교육 민원 처리, 합리적 교육

    예산 집행과 절감 등을 위해 활용됨. 교육 예산 집행 데이터, 각종 보고서

    및 소셜 데이터, 민원로그 분석 등이 주요 분석 대상임

    * (예시) 교육 빅데이터를 활용한 아젠다 개발(한국교육학술정보원)

    4. 공공 빅데이터 활용의 기대효과

    m 공공 부문에서 축적된 빅데이터를 분석하고 활용하면 다양한 편익과

    기대효과를 창출하게 되며, 특히 대국민 서비스 향상, 재난 관리, 안보,

    범죄 예방, 부패 방지, 공공관리 등 공공적 가치 증진에 기여할 수 있음

    - (대국민 서비스 만족도) 개방과 협력을 통해 지역별 맞춤형 민원 서비스,

    교육 환경 개선, 교통 환경 최적화 등에서 빅데이터 분석 결과가 활용

    되므로 대국민 서비스의 질을 높이고, 서비스 만족도를 제고함

    - (예산 절감) 정책 의제 발굴을 위한 비용과 시간을 절약할 수 있으며,

    의료 복지 서비스, 국가 R&D 정책 입안, 교육 정책과 범죄 예방 등

    거의 모든 부분에서 예산 절감 효과가 있음. 예를 들어, 조세 분야에서

    빅데이터 분석 결과를 활용할 경우 탈루된 세금을 회수하는 등 상당한

    예산절감 효과를 기대할 수 있음

    - (정책운영 효과성 향상) 빅데이터 분석을 통한 가시적인 정책효과 예측

    으로 국민의 수요에 부응하는 공공서비스를 제공함으로써 국가 정책

    운영의 효과성 향상

    - (사회비용 절감) 환경, 교통 등의 분야에서 빅데이터를 활용하여 국민의

    개인적인 비용 절감은 물론 사회 전체가 공동으로 부담해야 하는 사회

    비용을 절감할 수 있음

    - (합리적 정책 수립) 고부가가치 정보 활용으로 글로벌 환경변화에

    대응하고 합리적 국가정책을 수립하고 집행함

  • 공공 빅데이터 업무적용 가이드

    10

    - (위기대응 능력항상) 재난안전 분야에서 빅데이터의 활용은 정책권자의

    신속한 의사결정을 지원할 뿐만 아니라, 국민의 위기 대응능력을 향상

    시킬 수 있음

    - (업무효율성 제고) 빅데이터 분석을 통해 미래예측에 근거한 선제적

    행정서비스를 제공함으로써 공공의 업무 효율성 제고

    - (공공 기관과 국가 투명성 제고) 공공데이터 공개와 빅데이터 기반의

    평판* 관리, 투명하고 근거 있는 내부감사 등은 기관과 국가의 투명성을

    향상시키며 국제 경쟁력 확보와 지속적 성장을 견인함

    * 평판(Reputations)이란 공공서비스에 대하여 다수의 국민이 공유하는 집합적 인식을 의미하며,

    좋은 평판은 공공에 대한 신뢰를 통해 정책 추진의 우호적 여론을 형성할 수 있음

    - (정보 비대칭 해소) 공공 빅데이터 분석결과를 공공데이터포털, 빅데이터

    포털 등을 통해 공개·공유함으로써 공공-민간, 중앙정부-지자체간 정보

    비대칭 문제를 해소

    - (산업 활성화) 민간·공공의 융합지식을 민간에 개방·공유하여 다양한

    비즈니스 창출 및 산업 활성화에 기여함

    참고 – 범정부 빅데이터 추진체계

    범정부 빅데이터 활용추진체계 및 인프라 업무는 크게 행정자치부(공공정보정책과)와 미래창조과학부에서 담당한다. 행정자치부는 정부차원의 빅데이터 활용에 관한 전반적인 업무와, 대용량의 정형 또는 비정형의 데이터 셋에 관한 제도·정책 및 기본계획의5 수립·시행, 빅데이터 기반 구축·운영 및 활용에 관한 업무를 총괄한다. 미래창조과학부는 대학 및 민간차원의 빅데이터 활용에 관한 업무를 담당한다.

  • 제2장 사전준비 단계

    제1절 추진체계 구성

    제2절 빅데이터 분석과제 발굴

    제3절 데이터 확보방안 검토

    제4절 분석과제 선정

    제5절 분석 방안 수립

    제6절 분석 결과 활용계획 수립

    제7절 과제 추진계획 수립

  • 공공 빅데이터 업무적용 가이드

    12

    사전 준비 단계 개요

    사전 준비 단계에서는 빅데이터 분석과제를 선정하는 과정을 다룬다. 이는 업

    무 담당자가 가장 어려워하는 작업이기에 어떤 과정을 거쳐 분석과제들을 발

    굴하고 과제 후보들을 어떤 기준으로 평가하여 최종 추진 과제를 선발할지에

    대한 절차를 소개한다. 과제가 확정되면 과제의 필요성과 문제를 식별하고 정

    의하며, 빅데이터 분석을 통해 어떻게 문제를 해결할 수 있는가에 대한 방안

    을 정리하고 분석 결과를 어떤 목적으로 활용할 수 있을지도 생각해 봐야 한

    다. 이 장의 내용을 숙지하면 빅데이터 분석과제 선정부터 과제 추진계획 수

    립 까지의 업무를 처리 할 수 있을 것이다.

    □ 추진 절차

  • 13

    제1절 추진체계 구성

    m 추진체계는 과제가 발굴되고 빅데이터 분석을 준비하는 과정에서 구성되는

    것이 일반적이지만, 이런 경우 기관 전체의 빅데이터에 대한 관심을 유도

    하는 것이 어렵고, 조직내 다양한 분야에서 과제를 발굴하는 것도 어려움

    m 빅데이터 기술은 IT 기술이지만, 빅데이터 분석은 IT 사업이 아니라는 인식이

    필요하며, 기존의 정보화 사업과 달리 빅데이터 분석은 IT부서 단독으로

    추진할 수 없음. 따라서, 과제 발굴 단계에서부터 국민과의 접점에서

    현안을 가장 잘 이해하고 있는 현업 부서의 참여가 반드시 필요함

    - IT 담당자들은 현장 업무를 해박하게 알지 못하므로 데이터 분석을 할

    수 없고, 현업 담당자는 업무는 알지만 빅데이터를 모르기 때문에 자신의

    업무 중 어떤 부분에 빅데이터를 도입해야 할지 알 수가 없음.

    - 또한 외부 전문가는 빅데이터는 알지만 업무를 잘 모르므로 빅데이터

    분석과제를 제시할 수 없음

    - 따라서, 현업 담당자, IT 담당자, 외부 전문가가 함께 참여하여 빅데이터

    분석과제를 발굴할 필요가 있음

    m 분석과제를 발굴하는 과정에서 현업 부서와 정보화 부서가 함께 정책

    수요와 현안 및 문제점을 도출하고 아이디어 구현 방안을 도출하는

    작업을 함께 하는 것이 바람직함

    m 따라서, 빅데이터 분석과제를 추진하기 위한 추진 체계의 구성이 우선

    되어야 하며, 데이터, 정보, 기술 등에 대한 전문성을 지닌 정보화 부서와

    정책 분야별로 국민의 요구를 가까이에서 파악할 수 있는 현업 부서와의

    시너지 효과가 창출될 수 있도록 해야 함

  • 공공 빅데이터 업무적용 가이드

    14

    [그림 4: 빅데이터 추진체계도 예시]

    m 또한, 창의성을 갖춘 빅데이터 전문가가 자문함으로써 아이디어를 발굴하고

    현업 및 정보화 부서에 이를 제공할 수 있는 체계가 이상적임

    - 빅데이터 전문가는 현업 부서와 정보화 부서를 지원하는 자문 역할로써

    상시 참여하도록 구성함

    - 데이터 분석 및 정책 개발을 바탕으로 사회 문제를 해결하기 위해 빅데이터

    전문가, 정보화 부서, 현업 부서 간의 교류가 활발히 이루어져야 함

    - 특히, 현업 부서가 파악한 개별 정책 수요와 빅데이터 전문가들이 개발한

    창의적인 아이디어를 잘 결합하여 빅데이터 활용에 의한 정책 구현이

    현실적으로 가능해지도록 정보화 부서의 전문성이 뒷받침되어야 함

    - 국민이 무엇을 필요로 하는지 현업 부서에 수요를 제기하면, 현업 부서는

    이 사항을 빅데이터 전문가 및 정보화 부서와 협의

    - 정보화 부서는 정책 수요를 해결할 수 있는 공공 데이터의 유무를 확인하고,

    관련 정보를 빅데이터 전문가에게 제공하여 문제 해결 방안에 대한 자문을

    받을 수 있음

    - 정보화 부서는 빅데이터 전문가의 자문내용을 종합하여 추진방향 및

  • 15

    아이디어를 도출하고, 실제 어떻게 구현할 수 있는지 등에 관한 전문적인

    지식과 정보를 현업 부서에 제공함

    - 이를 바탕으로 현업 부서는 정책을 최종적으로 기획, 조정하여 수요 맞춤별

    정책을 제공함

    - 이상의 과정이 유기적으로 연계될 수 있도록 각 주체들 간의 교류와 협력이

    활발히 이루어질 때 국민의 편익을 극대화시킬 수 있음

    m 도출된 과제 후보들을 평가하여 빅데이터의 과제를 최종적으로 결정하는

    것은 현업 부서의 역할이고 정보화 부서와 외부전문가는 이를 지원하고

    후보 과제들을 평가하는 보조적인 역할을 해야 함

    빅데이터 활용에 대해 기관장과 관리자의 관심과 추진 의지가 있나?

    추진체계에 현업 담당자가 포함되어 있나?

    과제추진을 위한 현업/정보화 담당자간 명확한 역할과 책임이 정의되었는가?

    빅데이터 전문가가 참여하여 필요시 자문을 받을 수 있는가?

  • 공공 빅데이터 업무적용 가이드

    16

    제2절 빅데이터 분석과제 발굴

    1. 주제 도출 절차 및 고려사항

    m 업무 담당자는 데이터 분석을 해보지 않은 경우가 대부분이므로, 빅데이터

    주제를 도출하는 것은 매우 어려운 작업임

    m 추진체계가 구성되고 IT 담당자, 현업 담당자, 외부 전문가가 함께 참여

    하여 주제를 도출하는 것이 바람직함

    m 다음은 빅데이터 주제 선정 절차 예시로, 정책 방향과 시민 중심의 주제

    위주로 현황 파악을 위한 자료 조사를 하고, 인터뷰를 진행한 후 주제를

    도출하고 향후 과제를 선정할 수 있도록 주제별 특성을 정리함

    [그림 5: 주제 선정 절차 예시]

    m 분석 주제는 다음과 같은 기준에 적합한 것들을 도출하며, 도출된 주제는

    추진 가능성을 최종 검토하여 분석 주제를 확정하게 됨

    주제 도출 기준 고려 사항

    분석 목적· 분석 주제는 어떤 기대효과를 달성하기 위해 도출하였나? - 대국민 서비스 개선 - 예산 절감

    [표 2: 주제 도출 시 고려사항]

  • 17

    2. 주제 도출 방법

    m 빅데이터 분석 주제를 도출하는 방법은 내부의 당면한 문제와 현안을

    파악하여 해결하기 위한 방안을 찾는 방법과 기관 외부로부터 아이디어를

    수집해서 주제를 도출하는 방법이 있음

    - 현업 담당자는 조직이 당면한 문제와 해결 방안, 국민 만족도 제고

    방안을 가장 잘 파악하고 있고, IT 담당자는 문제 해결을 위해 조직의

    IT 자원이 충분한지를 파악하고 있으므로, 주제 도출 과정에서 서로

    긴밀히 협력해야 함

    - 외부로부터 아이디어를 수집하는 것은 내부에서 주제가 도출되지 않은

    경우에 활용하지만, 아이디어 공모전과 같이 전국민의 관심을 유도하고

    기관의 정책을 홍보할 수 있는 이벤트로써의 의미도 있음

    주제 도출 기준 고려 사항

    - 정책 수립 또는 개선 등

    서비스 제공 대상 · 기관 내부용인가, 외부 서비스용인가?

    데이터 획득 가능성

    · 내부에 존재하는 데이터를 활용하는가?· 분석 대상 데이터의 품질은 좋은가?· 필요한 외부 데이터는 확보 가능한가?· 외부 데이터를 내부 데이터와 매시업*할 수 있는가?* 매시업(Mashup) : 데이터를 서로 융합하여 새로운 서비스를 만들어

    내는 것

    담당 조직의 의지 · 담당 조직은 적극적으로 참여하는가?

    분석의 가능성 · 제시된 주제를 분석할 때 구현이 가능하며 제약 사항 해결이 가능한가?

    예상 구현 비용 · 제시된 주제를 분석하는데 소요되는 예산은 적절한가?

  • 공공 빅데이터 업무적용 가이드

    18

    2.1 문제 해결을 위한 주제 도출

    2.1.1 사회 문제 해결을 위한 국민의 수요 파악

    m 각 부처, 지방자치단체 및 기관 별로 당면 문제가 무엇인지 국민들의

    수요를 파악해 나가는 전략적 접근 방식이 요구됨

    m 최근 공공부문에서도 빅데이터 활용이 강조되면서 이에 관한 논의가

    활발히 전개되고 있기는 하지만, 주로 ‘데이터’ 그 자체, 즉, 기술 혹은

    시스템적인 측면에만 관심을 가짐

    m 현재 직면한 문제들을 데이터와 연계시켜 해결하려는 노력이 선행돼야 함

    - 각 부처, 혹은 각 지방자치단체에서 행하고 있는 개별 정책 업무 영역을

    파악한 후 이를 현재 보유하고 있는 데이터들과 매칭 시켜 보는 작업이

    필요함

    - 이를 통해 현재 어떠한 데이터들이 부족한지, 개별 정책 업무 영역을

    관통하는 공통의 문제가 무엇인지를 파악함

    - 기관의 정책 추진 방향성 수립을 위하여 빅데이터 분석 결과를 적용할

    수 있는 사례를 발굴함

    * (예시) 전주시는 지역 관광정책 수립 및 집행을 위해 소셜미디어 키워드 분석, 주요 유입 관광객 특성 분석 등을 실시(‘15)하여 관광객의 이동경로 및 특성을 파악하여 전주시인근 지역과 연계 관광정책을 수립

    m 결국 빅데이터 활용이 문제 해결 중심으로 이루어져야 민의에 적합한

    공공서비스를 제공할 수 있게 되며, 국민들의 수요를 가까이에서

    파악해야 하는 지방자치단체의 경우, 이러한 접근 방식이 더욱 요구됨

    참고 사항 – 언론보도 내용 탐색

    언론보도를 통하여 문제된 이슈를 기관 차원에서 해결하기 위해 빅데이터 분석을 고려할 수 있다. 경기도는 2014년 아파트 관리비 비리 문제가 언론에 자주 보도되면서 전국의 아파트 관리비 비리문제를 해결하기 위하여 ‘공동주택 관리비 투명성 제고(’15)’ 사업을 추진한 바 있으며, 많은 지자체와 공공기관에서 언론에 이슈가 되는 지역, 사회의 다양한 문제들을 해결하기 위해서 빅데이터 분석을 추진한다.

  • 19

    2.1.2 민원 해결을 위한 주제 발굴

    m 중앙부처, 지자체 및 공공기관 등에 제출된 각종 민원 내용을 분석하면

    기관에서 시급히 해결이 필요한 민생현안 문제를 식별할 수 있음

    * (예시) 포항시는 최근 10여년간 집적된 민원을 분석해 시민의 요구사항을 파악하고요구사항 관련 해결방안을 제시(‘15)

    민원 사이트(URL) 주요민원내용

    행정자치부(http://www.moi.go.kr)

    - 정책의 수립, 집행, 평가 등 전 과정에 국민이 직접 참여하는 민주주의를 실현하기 위한 국민제안 및 참여

    - 공직비리신고, 예산낭비신고 등 공정하고 합리적인 정책을 위한 사이버 신고 등

    국민신문고(http://www.epeople.go.kr)

    - 법령ㆍ제도ㆍ절차 등 행정업무에 관한 질의 또는 설명이나 해석 요구

    - 행정기관의 위법ㆍ부당한 처분 및 불합리한 행정제도로 인해 침해된 국민의 권리 구제 등

    정부민원안내콜센터(https://www.110.go.kr)

    - 정부관련 모든 문의사항 뿐만 아니라 생활 불편사항이 있을 경우 정부대표전화 110으로 문의

    지자체(서울 중구청 등)(http://www.junggu.seoul.kr)

    - 소음, 쓰레기, 보도ㆍ차도 파손 등 주민의 일상생활 중 겪게 되는 불편사항 등 지자체 생활불편 신고

    새올민원(각 지자체 온라인 민원상담)

    - 쓰레기, 시설물, 교통, 환경 등 생활불편 사항을 온라인과 스마트폰을 통해 신고

    [표 3: 민원 신고 사이트별 주요 관리 민원]

    2.1.3 업무 효율성 제고를 위한 주제 발굴

    m 빅데이터의 분석 및 활용을 통해 기관 업무 추진의 효율성과 효과성을

    제고하고, 업무 프로세스를 개선하는 주제를 식별할 수 있음

    m 현재 지방자치단체에서 빅데이터를 활용하는 주요 분야는 교통 및

    관광과 같은 주민서비스와 관련이 있으며, 재난·재해 분야는 중앙부처를

    중심으로 빅데이터가 활용되고 있음

    m 하지만, 지방자치단체에서도 주민서비스 외에 예산의 절감을 위해

  • 공공 빅데이터 업무적용 가이드

    20

    빅데이터를 활용하는 등 그 분야를 다양하게 확장시킬 필요가 있음

    * (예시) 고용노동부는 근로감독관의 효율적인 근로감독을 위하여 기초고용질서 위반의 위험성이 높은 사업장을 예측하기 위한 ‘근로감독 사업장 선정 과학화’(’15) 사업을 추진

    2.1.4 대국민 서비스 개선을 위한 선제적 주제 발굴

    m 국내·외 빅데이터 활용 사례를 분석하여, 공공분야에 활용되었을 때

    사회적 비용이 감소되거나 국민 만족도 제고가 가능한 테마를 선별함

    m 빅데이터 개념이 먼저 도입된 선진국의 경우, 우리보다 빅데이터를 활용한

    사례가 보다 많이 확산되어 있으며, 이 중 우리나라의 상황을 고려하여

    도입 가능한 서비스를 벤치마킹 할 수 있음

    * (예시) 건강보험심사평가원(‘16)은 건강보험 청구자료와 기상청의 날씨자료 등을 활용하여 날씨와 질병과의 상관관계를 분석, 국민관심질병 예측 서비스 사업을 추진 중에 있음

    2.2 아이디어 수집을 통한 주제 도출

    2.2.1 아이디어 공모전을 통한 주제 발굴

    m 행정자치부에서 주최한 ‘공공 빅데이터 아이디어 공모전’과 같이 대국민

    공모전을 통하여, 생활의 불편함 및 문제점을 파악하고 해결할 수 있는

    아이디어를 수집함

    m 언론보도, 주관 기관의 민원사항, 대국민 서비스 또는 업무 추진의 효율성과

    효과성을 제고할 수 있는 내용으로 공모전을 추진하여 창의력이 돋보이는

    주제를 도출함

    - 공모전을 주최하는 경우 지자체는 지역민의 관심을, 공공 기관은 해당

    주제에 대한 전국민의 관심을 유도하여 빅데이터를 활용한 정책 시행에

    탄력을 줄 수 있음

  • 21

    [그림 6: 빅데이터 아이디어 공모전 예시]

    2.2.2 공공 빅데이터 사례집을 통한 주제 발굴

    m ‘생활을 디자인하는 빅데이터’(2016. 행정자치부), ‘2015년도 빅데이터 글로벌

    사례집’(2015. NIA) 등 빅데이터 활용 사례집을 통해 아이디어를 발굴할 수 있음

    2.2.3 빅데이터 컨설팅사를 활용한 주제 발굴

    m 전통적인 IT 프로젝트와 달리 빅데이터 프로젝트에서는 컨설팅이 ‘보조’

    또는 ‘지원’의 역할을 함. 빅데이터의 주요한 테마, 주제를 결정하는

    것은 현업 부서의 역할이지만 컨설팅은 이를 도와주고 지원하며, 후보들을

    검토하는 보조적인 역할을 수행할 수 있음

    m 빅데이터 컨설팅을 활용하기 위해 빅데이터 주제 도출 부분을 프로젝트화

    할 수 있으며 빅데이터 교육, 활용 데이터의 타당성 분석, 빅데이터 마스터

    플랜 수립 등에 도움을 받을 수 있음

  • 공공 빅데이터 업무적용 가이드

    22

    3. 주제 중복성 검토

    3.1 빅데이터 포털을 통한 중복성 검토

    m 추진하고자 하는 분석 주제가 유관기관에서 이미 실행한 것인지에 대한

    중복성 여부를 사전 검토하여, 불필요한 자원 투자를 최소화하고 유사

    하거나 중복인 경우 빅데이터 포털에 공유된 분석사례를 참조하여 문제

    해결을 할 수 있음

    m 빅데이터 포털에는 각 정부부처, 공공기관에서 수행한 분석과제에 대한

    정보들이 정리되어 있음

    - 내부망에서 빅데이터 포털사이트(http://www.insight.go.kr)에 접속, 공직자

    이메일 계정으로 회원가입 후 활용

    [그림 7: 빅데이터 포털 메인 페이지]

    - 빅데이터 포털을 통해 소셜 데이터 수집이 가능하며, 빅데이터 분석에 대한

    설명과 함께 분석 서비스를 제공하고 있음

  • 23

    - 특히 빅데이터 포털에서 분석과제 정보, 데이터 로딩, 데이터 전처리, 분석기법적용, 보고서 작성 및 시사점 도출의 5단계에 걸쳐 시범과제에 대한설명을 열람할 수 있음

    - 또한, 과제 수행 과정의 이해도를 높이기 위한 샘플 데이터를 제공함

    3.2 기 분석모델 활용 검토

    m 주제 중복성 검토 결과 유사하거나 중복된 빅데이터 서비스가 이미 존재

    하는 경우, 담당자는 기 분석모델 활용을 우선적으로 고려하여야 함

    * (예시) 행자부는 기 추진 빅데이터 분석모델 중 기관의 수요가 높고 공통적으로 적용이 필요한 모델을 표준분석모델로 정립(‘16년 민원, 교통, 관광, 공동주택, 근로감독, CCTV의 6건)

    모델명 활용영역 분석모델 상세내용

    민원민원 내용과 처리 절차

    분석 및 활용

    - 민원데이터를 분석하여 민원에 효과적으로 대응할 수 있는 단기 및 중장기 해결방안 제시

    ※ 민원데이터 : 새올, 민원 상담 콜센터, 시장/도지사에게 바란다, 칭찬합시다 등

    - 민원 처리 절차를 분석하여 민원 대응의 효율성 개선

    교통효율적인

    대중교통(버스)정책 수립

    - 교통카드 이용 현황, 유동인구 및 주거인구 데이터 등을 분석하여 이동수요, 저상버스 필요 노선, 환승 지점 등 파악

    - OD분석, 운행기록 분석 등을 통한 탄력배차제 적용 노선 결정, 배차간격 조정·결정 등

    관광관광 정책

    수립

    - 지역행사·축제 방문인구, 전년대비 증감분석 및 축제장소별, 시간추이별 관람객 증감 분석을 통한 관광객 수요예측 및 관광시설 공급판단 등 관광정책 수립

    - 상권 통계 기반 지역상권 매출 분석을 통한 최적화된 상권 관리 및 지역 경제 활성화 기여도 평가

    - 관광 통계 기반 외국인 관광객 유치 활성화 방안 마련 및 외국인 전용 관광 코스 개발 활용 등

    공동 주택

    공동주택관리비 및 입찰

    비리 분석

    - 공동주택 관리비 부당 징수 의심 대상 단지 분석- 공동주택 공사 입찰 부정 및 원·하도급 부당 거래 의심 정보

    분석

    근로감독

    효율적인 근로감독

    - 사업장별 5대 취약 지수(최저임금, 서면계약, 임금체불, 근로시간 불이행, 약자보호) 도출 및 이를 활용하여 반복적으로 위법 행태를 보이는 근로 사업장을 선정하여 우선 감독

    - 근로감독 분야와 유사한 형태의 관리 감독 업무가 필요한 분야에 대한 확대 적용 가능한 개념적 분석 모델 제공

    CCTV CCTV 설치지역 - 범죄, 사고 다발지역 등 보안이 취약한 안전사각지대 도출 및

    [표 4: ‘16년 행자부 추진 표준분석 모델별 상세내용]

  • 공공 빅데이터 업무적용 가이드

    24

    * ‘16년 분석 사업 중 실시간 국민관심질병예측 서비스(심평원), 국민 참여형 어린이 안전 및 교통사고원인 분석(경기도), 잠재적 사회취약계층 일자리 창출 및 자립 지원(국민연금공단, 남양주시) 등 5개 모델이 ’17년에 추가될 예정

    m 추진하고자 하는 분석주제가 행정자치부가 정립·보급하는 표준분석모델에

    포함되어 있을 경우, 표준분석모델 활용 가이드북을 이용하여 분석을

    수행함

    - 표준분석모델 활용 가이드북은 빅데이터 포털에서 제공되며, 데이터

    수집부터 시각화까지의 전 프로세스에 대한 상세한 설명을 제공함

    - 가이드북과 함께 분석에 필요한 표준 데이터 목록 및 포맷, 샘플 데

    이터, 분석 프로세서, 분석 스크립트 등도 제공됨

    - 분석 주제의 특성과 수행 기관의 상황에 따라 행정자치부 빅데이터

    공통기반시스템의 활용 여부에 대한 의사결정이 필요함

    주제 도출 과정에 현업 담당자가 참여하여 적극적으로 의견을 제시하였나?

    도출된 주제의 서비스 대상, 데이터 획득 가능성, 구현 가능성은 고려하였나?

    해결하고자 하는 문제가 국가·지역·사회적으로 시급한 것인가?

    수행하고자하는 주제가 무엇인지 구체적이고 명료하게 정의할 수 있는가?

    수행하고자하는 주제에 대해 빅데이터 포털을 통한 중복성 검토를 하였나?

    모델명 활용영역 분석모델 상세내용

    분석CCTV를 설치할 우선 지역 선정을 위한 분석

    - CCTV 취약 지수, 범죄 취약 지수, 유동인구 취약 지수 등을 활용한 Cell별 가중치 생성 및 설치 포인트 도출

  • 25

    제3절 데이터 확보방안 검토

    1. 필요 데이터의 정의

    m 관련기관, 지자체, 실무자 및 외부전문가 등 이해관계자들과 업무 해결을

    위한 인터뷰 등을 통하여 빅데이터 분석 목적에 적합한 데이터 목록을

    작성하고 데이터별로 확보 가능여부를 점검함

    2. 기관 내 데이터 확보방안 검토

    m 필요 데이터에 대해 데이터 명, 데이터 설명, 데이터 형태, 용량 등 기관

    보유 데이터 현황조사를 수행함

    - 기관이 보유하고 있는 데이터 중 분석을 위해 필요한 데이터를 도출

    - 내부 데이터라도 데이터가 잘 정제되어 품질이 좋은지, 데이터가 지속적

    으로 업데이트되고 있는지, 분석에 필요한 기간만큼의 데이터가 충분히

    적재되어 있는지, 코드 데이터의 과거 변경 이력이 있는지 등도 파악

    m 분석대상 데이터의 관리 권한이 주관부서 이외의 타 부서에 속하는 경우,

    관련 부서간 협의를 통하여 데이터의 공유가 가능한지 확인함

    m 내부 데이터이지만, 관련 법, 보안, 개인정보보호 문제 등으로 사용이

    어렵지는 않은지 확인이 필요하며, 개인정보의 경우 비식별화를 통해

    사용하는 방안도 고려해야 함

    3. 기관 외 데이터 수집 가능성 검토

    m 데이터 보유기관, 데이터 명, 데이터 설명, 데이터 형태, 용량 및 데이터

    제공형태 등 현황을 검토함

    - 분석대상 데이터의 수집에 법률상 제약사항은 없는지 확인함* (예시) 국세기본법 제81조의13에 명시된 사유 외에는 국세청의 과세정보 활용이 곤란함

    m 법률상 제약이 없는 데이터의 경우 보유기관과의 협의를 통하여 데이터의

  • 공공 빅데이터 업무적용 가이드

    26

    공유가 가능한지 확인함

    m 외부 데이터 중, 민간 기업이 보유한 데이터의 경우 활용 대상 범위(종류,기간 등)와 그에 따른 데이터 구매비용을 고려해야 함

    4. 기타 데이터 수집 가능성 검토

    4.1 빅데이터 포털 제공 데이터

    m 빅데이터 포털(http://www.insight.go.kr)에서는 뉴스, 블로그, 트위터 및 각

    분야별 주요 정보 사이트의 웹소셜데이터를 수집하고 있으며, 수집 대상

    및 수집 방법은 다음과 같음

    수집 대상 수집 단위 수량 수집 기준

    News URL 384 주요 신문사/뉴스 제공사

    Blog URL - 네이버에 포스팅된 블로그 전체

    Twitter ID 160 영향력 및 트윗 많은 사용자 계정(ID)

    [표 5: 웹소셜데이터 수집 대상 URL 및 ID 개수 (2016년 8월말 기준)]

    m 빅데이터 포털에서는 수집하고 있지 않은 특정한 사이트의 데이터를

    수집할 필요가 있을 경우나, 과거 특정 시점의 웹소셜 데이터가 필요한 경우에 기관의 신청을 받아 신청 내용이 승인될 경우, 해당 사이트 또는 기간의 데이터를 수집하여 제공함

    m 또한, ‘데이터지도’ 메뉴를 통해 공공기관에서 생성하여 공개하였거나보유하고 있는 데이터의 현황 정보를 분류 체계별로 시각화하여 보여주고

    있으므로 검색을 통해 데이터 확인이 가능함

    4.2 공공데이터포털 제공 데이터

    m 공공데이터포털(http://www.data.go.kr)에서 제공하는 데이터셋 명칭과 설명, 보유기관, 원천정보시스템명, 데이터 유형 등의 내용 조회가 가능함

  • 27

    순서 분류기준공공데이터포털 데이터 건수

    데이터 건수 Open-API건수1 공공행정 2,960 1942 과학기술 595 1483 교육 828 1294 교통물류 975 1925 국토관리 913 1086 농축수산 616 1367 문화관광 1,770 3338 법률 31 159 보건의료 922 6510 사회복지 1,192 6711 산업고용 1,257 20912 식품건강 398 7913 재난안전 720 4414 재정금융 428 5815 통일외교안보 173 6916 환경기상 963 107

    합계 14,741 1,953

    [표 6: 공공데이터포털 보유데이터 건수(2016. 5. 기준)]

    4.3. 행정정보 공동이용 대상 데이터

    m 행정정보공동이용센터의 행정정보 공동이용 대상 정보 목록 검토를 통하여

    분석에 활용 가능한 데이터를 확인함

    m 행정정보공동이용센터 홈페이지에는 ‘행정정보파일목록서비스’ 항목이 있어,

    이를 통해 이용 가능한 공공정보의 소재를 안내받을 수 있음

    참고 – 행정정보공동이용센터

    행정정보공동이용센터(행공센)는 행정기관, 공공기관, 금융기관, 교육기관 등이 정보들을 서로 공유하여 업무를 전자적으로 처리함으로써 국민에게는 민원 편의성을, 정부차원에서는 효율적인 행정을 할 수 있는 전자정부의 핵심 서비스이다.2016년 현재 주민등록표 등·초본, 토지등기사항증명서 등 148종의 행정정보를 이용할 수 있다. 접속은 https://www.share.go.kr 를 통해 가능하며, 접근 권한을 등록하고 열람 권한을 승인 받아야 이용 가능하다.행공센의 데이터는 대용량의 실시간 데이터가 많으므로, 데이터를 활용함에 있어 분석 인프라가 충분한 용량을 갖추고 있는지 확인하여 분석에 필요한 기간의 데이터를 수집하여 활용한다.

  • 공공 빅데이터 업무적용 가이드

    28

    4.4 기타 공공분야 오픈 API

    m 각 공공기관별로 해당 기관 홈페이지 등을 통해 데이터를 독립적으로

    지원함

    제공 포털 분류 체계 주요 오픈 API (활용순)

    서울 열린데이터 광장data.seoul.go.kr

    일반행정, 문화관광, 보건, 환경, 산업경제, 도시관리, 교통, 복지,안전, 교육

    1. 공공와이파이 위치정보2. 시장마트 현황3. 공중화장실 위치정보4. 개인서비스 요금 정보5. 지하철 호선별 첫차와 막차 정

    공간정보 오픈플랫폼www.vworld.kr

    행정주제도, 3차원 영상, 기타 메타데이터

    1. 2D 지도2. 3D 지도3. 배경지도4. WMS/WFS5. 데이터6. 지도검색7. Static Map8. 3D 모바일

    보건의료빅데이터개방시스템

    opendata.hira.or.kr

    요양기관, 의료인력, 의약품,진료비정보, 진료정보, 질병정보,치료재료, 환자표본, 기타

    1. 병원정보서비스2. 질병정보서비스3. 병원코드정보서비스4. 병원약국찾기 정보5. 병원코드정보서비스

    기상자료개방 포털data.kma.go.kr/cmmn/

    main.do

    지상, 고층, 해양, 황사, 레이더, 위성, 수치예보, 역사기후, 간행물, 기상자원지도, 지점정보

    1. 동네예보정보조회서비스2. 예보구역정보조회3. 생활기상지수조회4. 중기예보정보조회서비스5. 보건기상지수6. 항공기상정보

    재난안전데이터 포털data.mpss.go.kr

    안전정책, 생활안전, 비상대비, 재난예방, 재난대응. 재난복구, 소방정책, 119구조구급, 해양경비안전, 해양오염방제

    1. 교통사고정보2. 낙뢰관측 정보3. 재난상황전파 정보4. 자연재해상황 및 복구비

    지원내역5. 습득물정보 조회 서비스

    농림축산식품 공공데이터 포털data.mafra.go.kr

    농산, 산림, 농지용수, 교육, 말산업, 검역, 식품안전, 축산, 유통, 시설장비, 농촌복지,

    1. 전국 도매시장 일별 경락가격2. 전국 도매시장 일별 실시간

    경락가격

    [표 7: 국내 공공분야 주요 오픈 API]

  • 29

    빅데이터 분석을 위한 다양한 데이터 원천을 파악하고 있는가?

    - 데이터가 분석 목표 달성을 위해 적절한지 검토 - 신뢰할 만한 품질의 데이터가 존재하며, 적당한 시기에 입수 가능한지 검토 - 내외부 협력체계와 같은 구체적인 데이터 확보방안 및 절차를 갖추었는지 확인

    분석대상 외부데이터 확보를 위한 기관간 협의가 되어 있는가?

    외부 데이터는 내부 데이터와 통합하여 분석 가능한가?

    데이터 수집관련 보안사항 및 개인정보보호 관련 문제 등을 점검하였는가?

    제공 포털 분류 체계 주요 오픈 API (활용순)

    농축산기술, 식품산업, 품질관리

    3. 낙농체험 목장 정보4. 농촌마을별 자원정보25. 농업마이스터대학 현황

    교통정보공개서비스openapi.its.go.kr

    교통소통정보, 공사정보, CCTV정보, 돌발상황정보

    1. 교통소통정보2. 공사정보3. 사고정보4. CCTV정보5. VMS정보

    KOSIS 공유서비스kosis.kr/openapi

    국내통계 주제별, 국내통계 기관별, 광복이전통계, 작성중지통계, 지역통계(주제별), 지역통계(기관별), e-지방투표, 대상별통계, 이슈별통계, 인기통계, 영문 KOSIS, 국제통계

    1. 추계인구2. 경제활동참가율3. 경제성장률4. 전산업생산지수5. 기대수명6. 사교육 참여율

  • 공공 빅데이터 업무적용 가이드

    30

    제4절 분석과제 선정

    1. 분석 추진 가능성 검토

    m 분석과제의 추진 가능성을 검토하기 위해서는 기관이 자신의 상황에 맞는

    평가 항목으로 구성한 평가 기준표를 활용하여 항목별로 점수를 부여하고

    총점을 기준으로 평가하는 방법이 있음

    - 평가 항목별 점수 배점은 기관의 상황에 따라서 적용. 예를 들어, 추진

    시급성이 가장 중요한 항목이라면 높은 점수를 할당함

    - 지금까지 조사한 내용을 바탕으로 기관 자체 평가기준을 적용한 과제

    평가표를 만들고 분석과제별 타당성 평가

    m 표 8의 예시는 행정자치부에서 공공 빅데이터 분석과제 후보를 평가할

    때 사용하는 평가 기준표로, 분석과제의 추진 필요성, 파급효과, 추진

    시급성, 구현 가능성, 데이터 수집 가능성, 모델 확장성을 검토하고 검토

    결과를 기반으로 평가 항목별 점수를 부여하여 추진 가능성을 검토함

    평가 항목 기준 설명

    필요성 공공정책 결정이나 공공서비스 측면에서 본 분석과제가 필요한지 판단

    파급효과 정성적, 정량적 기대효과의 정도 판단

    추진시급성 당장 해소되어야 할 사회현안 여부 판단 : 장기과제 성격 분리

    구현가능성과제를 구현함에 있어서 어려움이 없는지 현실성 판단(표준분석모델을 활용하거나, 빅데이터 포털에서 구현 가능한 과제는 구현가능성이 높을 수 있음)

    데이터 수집가능성

    기관 협조나 데이터 확보, 데이터 구매 비용 등 제약사항 판단(표준분석모델을 활용하거나, 빅데이터 포털에서 구현 가능한 과제는 데이터 수집 가능성이 높을 수 있음)

    모델 확장성 과제가 시범과제로 끝나지 않고 전국 모델로 확장 가능한지 판단

    [표 8: 과제 평가 기준표 예시]

  • 31

    m 과제 선정에 있어서 중요한 평가요소 중 과제의 ‘추진 시급성’과 빅데이터

    분석모델의 ‘구현 가능성’으로, 경우에 따라서는 추진시급성과 구현

    가능성만을 고려하여 주제를 선정할 수도 있으며 관련 내용은 아래

    ‘참고’에 기술함

    참고 – 과제의 추진시급성/구현가능성을 고려한 주제 선정 방안

    기관이 분석과제 선정을 위해 평가 기준표를 활용하여 과제 후보별로 평가하는

    방식이 일반적이지만, 그림 7과 같이 과제의 추진시급성과 구현가능성만으로 평

    가하여 주제를 선정하는 방안도 있다.

    ○ 분석과제를 추진할 때 전략적 중요도에 따른 시급성을 우선 고려해야 하며,

    데이터를 생성, 저장, 가공, 분석하는 비용과 과제에 대한 분석 수준을 고려한

    난이도 또한 우선순위 선정에 중요한 기준이 된다.

    ○ 우선순위 선정 기준을 토대로 시급성 또는 난이도를 고려해 우선 추진해야 하는

    분석 과제와 제한된 자원을 고려해 단기적 또는 중장기적으로 추진해야 하는

    분석 과제 등 4가지 유형으로 구분해 분석 과제의 적용 우선순위를 결정한다.

    ○ 그림 7의 사분면의 번호와 같이 각 과제별 시급성과 난이도를 구분하여 사분면

    안에 과제를 위치하고 우선순위를 식별한다. 사분면 영역에서 가장 우선해서

    분석 과제 적용이 필요한 영역은 Ⅲ 영역이다.

    ○ 또한 전략적 중요도가 현재 시점에는 상대적으로 낮은 편이지만 중장기적으로는

    현안에 미치는 영향도가 높고, 분석 과제를 바로 적용하기 어려워 우선순위가

    낮은 영역은 Ⅱ영역으로 볼 수 있다.

    [그림 8: 분석 주제 시급성/난이도별 순위 선정 예시]

  • 공공 빅데이터 업무적용 가이드

    32

    2. 분석과제 확정

    m 과제 평가표에서 전체 총점이 가장 높은 과제를 최종 후보로 선정

    - 단, 전체 총점이 가장 높을지라도 구현가능성 점수가 현저히 낮은 경우는

    실제 추진 시 실패할 가능성이 높음

    - 전체 총점은 다소 낮을지라도 추진시급성에서 가장 높은 점수를 받은 과제는

    제약요소를 해소할 수 있는 방안을 찾고 과제의 범위를 보완하여 추진할

    수 있음

    과제 후보를 평가할 수 있는 평가 기준표를 만들고 객관적으로 평가하였나?

    평가 기준표에 적절한 가중치를 적용하여 타당한 결과를 도출하였나?

    확정된 분석과제는 추진 시급성이 높고 구현 가능한 주제인가?

    - 난이도가 높은 주제를 선정하였다면, 기간 내에 분석결과를 도출할 수 있는 방안을 가지고 있어야 함

    ○ 적은 비용으로 추진하여 빠른 시일 내에 효과를 거둘 수 있는 주제를 선정하는

    것이 좋지만, 기관이 처한 상황에 따라 비용이 많이 투입되어도 꼭 해야만 하는

    과제의 경우에는 시급성이 매우 높게 측정될 것이므로, 난이도를 기관의 상황에

    따라 조율하여 추진한다.

    ○ 시급성이 높고 난이도가 낮은 과제는 성공했을 때의 홍보 효과도 상당하고 이에

    따라 기관의 빅데이터 추진도 탄력 받을 가능성이 크다.

    * (예시) 서울시의 심야버스 사례의 경우, 심야버스 노선을 신규로 만들기 위

    해 빠른 분석이 필요했고 비교적 적은 비용으로 분석을 완료하여 우수사례

    로 소개되고 있으며, 이후 서울시의 빅데이터 예산이 크게 증액되고 본격적

    으로 빅데이터 프로젝트를 늘려 나가게 되었음

  • 33

    제5절 분석 방안 수립

    m 추진 가능성에 대한 검토가 완료된 과제를 명확하게 제시한 후, 보유한

    데이터와 분석 방법론 등을 활용하여 해당 이슈를 해결하기 위한

    분석 방안을 제시함

    - 과제와 관련된 현재 이슈에 대한 기초 분석 단계를 설정하고 기초 분석

    단계에서는 해당 이슈 관련 현황을 도출

    - 현업 부서, 정보화 팀, 빅데이터 전문가가 함께 어떠한 데이터를 활용해서

    어떻게 이슈를 해결할 것인지 분석 목표와 이에 따른 방안을 제시

    - 과제 관련 학습을 통해 과제의 이해도를 높이고, 국 내외 선행 사례 또는

    전문가와 함께 실현 가능한 분석 방안 구성과 성과 목표를 수립

    - 데이터를 추가하거나 기존의 데이터를 변경하고, 선행 사례의 분석

    방법론에 대한 변경 사항들을 고려하여 이슈해결 방안을 모색

    m 분석 방안은 기술적 해결책과 무관하게 정책 결정자와 최종 사용자 위주의

    관점에서 기술해야 함

    제6절 분석 결과 활용계획 수립

    m 이 단계에서는 빅데이터 분석 결과를 어떻게 업무에 반영할 것인지에 대한

    액션 플랜을 만들고 업무 성과를 지속적으로 모니터링 할 수 있는 방안을

    수립함

    m 과제를 실제 추진하는 과정에서도 분석 결과 활용방안을 수립할 수 있지만,

    분석 결과를 활용하여 사회적 문제를 해결하고, 기관과 국민 모두에게 가치

    를 창출할 수 있는가?

    과제에 대한 분석 방안이 논리적으로 이해 가능하고 구체적으로 도출되었나?

    분석 목표 달성을 위하여 필요한 정보 항목을 정의하였나?

    분석 결과에 대한 성과 목표와 활용 방안이 도출되었나?

  • 공공 빅데이터 업무적용 가이드

    34

    과제 추진 전에 분석 결과의 활용 방안을 미리 고민하고 분석하고자 하는

    목적을 명확히 한 후 추진하는 것이 실패할 확률을 줄일 수 있음

    m 왜 빅데이터 분석을 하려고 하는지, 빅데이터 분석을 통해 어떤 결과를

    도출하고, 도출된 결과를 어떻게 활용할 것인지, 활용을 통해 어떤

    효과를 얻을 것인지를 고민하고 활용 활성화 방안을 수립해야 함

    - 빅데이터 사용을 활성화하기 위해서 노력하는 이유는 분석을 해놓고도

    분석 결과를 활용하지 않는 경우가 많기 때문임. 기관이 빅데이터 도입에

    성공했다고 해서 즉시 국민의 만족도가 올라가지는 않기 때문에 기관이

    지속적으로 관심을 갖고 분석 결과를 활용하고, 적용하고, 활성화하는

    것이 빅데이터 분석 성과를 위해 필요함

    m 과제 수행 후 분석 결과를 즉시 적용할 수 있는 단기 활용계획을 제시할

    수 있어야 하며, 중장기적인 활용 계획을 수립하고 상세화 해야 함

    m 빅데이터 분석이 끝나면 각 현업부서에서 분석 결과를 활용해야 하며,

    이때 이전에 수립한 활용방안이 계획대로 잘 수행되고 있는지 모니터링

    해야 함

    [그림 9: 시내버스 효율적 운영 사업(광주시)의 분석 결과 활용방안 예시]

  • 35

    - 빅데이터 분석 및 활용을 위한 구체적인 업무 분담, 책임 및 권한 체계를

    정의

    m 분석 결과를 활용하고 확산하기 위해서 교육과 홍보를 병행할 필요가

    있으며 홍보 방안으로는 홈페이지 배너광고, 버스광고, 홍보 동영상 제작,

    기념품 제작, 보도자료 배포, 리플릿 제작 등의 방법을 사용할 수 있음

    - 빅데이터 관련 정보화 부서와 현업 부서 구성원의 빅데이터 분석 및

    활용에 대한 이해를 제고하기 위해 내외부 교육 훈련 방안을 수립하고

    필요시 빅데이터 분석 및 활용을 장려할 수 있는 인센티브 정책을 마련

    m 활용 성과에 대한 점검은 수립한 활용 계획에 대해 6개월이나 1년 단위로

    측정하여 정량화하는 관리가 필요함

    m 분석모델을 기관내외부에서 지속적으로 활용하고 발전시킬 수 있도록

    기관간 데이터 연계, 데이터 통합, 분석, 결과 활용 내용을 포함한 확산

    계획도 고려하여 방안을 수립함

    m 이 과정은 실제 사업추진 시 성과관리 계획 단계에서 실현 가능한 방향으로

    다시 한번 구체화하는 작업을 하도록 함

    빅데이터 분석 및 활용에 대한 방안을 수립할 때 전체 조직 구성원들의 아

    이디어와 의견이 반영되었나?

    분석 결과를 활용하고, 적용하고, 활성화 하려는 계획을 갖고 있나?

    - 결과를 즉시 적용할 수 있는 단기 활용계획과 중장기 활용계획 수립 및 상세화 - 빅데이터 도입 또는 활용과 관련하여 단계적이고 구체적인 계획 수립

    빅데이터 분석 종료 후 결과 활용을 위한 관련부서 협조와 예산확보는 가능한가?

    - 빅데이터 분석 및 활용 방안은 기술적, 경제적으로 충분히 실현가능해야 함

    분석모델을 지속적으로 유지보수하고 업그레이드할 수 있나?

  • 공공 빅데이터 업무적용 가이드

    36

    제7절 분석 추진계획 수립

    m 과제를 정의하고 분석결과 활용방안을 수립한 후, 해당 분석과제의 진행

    계획을 수립함

    m 과제 목표를 정할 때 해당 과제의 성공 요인과 성과를 객관적으로 측정할

    수 있는 성과지표를 개발함

    m 요구사항 도출과 소요 비용을 산정하고 과제 추진 방법을 선정한 후, 추진

    계획서를 작성함

    1. 분석 목표 정의

    m 빅데이터 분석을 통해 달성하고자 하는 목표를 명확히 기술함

    m 성공적으로 달성할 경우의 결과를 나타내는 성과목표를 정의하고 이를

    효과적으로 측정할 수 있는 성과지표를 개발함

    - 빅데이터 분석과제 수행 후, 분석 결과를 활용하여 달성하고자 하는

    성과 목표를 설정하고 관리하여 빅데이터 분석이 일회성으로 그치지 않고

    지속적으로 업무에 활용될 수 있는 체계를 마련하기 위해 성과지표를

    개발함

    - 성과지표는 이후 분석과제가 추진되면 요건정의 단계에서 더욱 구체화

    되고 상세화됨

    * 성과지표에 대한 예시는 부록1. ‘사업추진 단계별 점검항목’의 제1절 요건정의 부분의 ‘성과관리 계획’ 참조

    - 추진계획 수립 시에는 과제의 목표와 배경, 분석 결과의 구체적인 활용

    방안을 반영한 성과지표를 수립하여 실제 과제 수행 과정부터 관리

    하도록 함

  • 37

    2. 기본 요건 정의

    m 빅데이터 분석과 활용을 통해 해결하고자 하는 현안이 무엇인지 명확히

    이해하고 정의함

    m 과제에 대해 이해하기 위해서 분석 분야에 대한 상세 업무를 파악하며

    분석 결과의 사용자가 누구인지, 요구사항이 무엇인지, 풀려고 하는

    문제가 무엇인지, 기대효과는 무엇인지 등을 정의함

    - 필요시 내·외부 수요자에 대한 사전조사(민원, 설문, 인터뷰 등)를 통해

    제공하고자 하는 서비스의 내용과 범위를 구체화

    3. 분석 추진 방법 선정

    3.1 행정자치부 수요조사 지원

    m 행정자치부는 국가적 현안 및 사회적 이슈 해결 등을 위해 매년 파급력이

    큰 공공 빅데이터 분석과제를 발굴·추진하고 있음

    m 각 기관 담당자는 행정자치부의 분석과제 발굴을 위한 수요조사에 참여

    함으로써 빅데이터 분석사업 추진의 기회를 얻을 수 있음

    * 수요조사는 매년 행자부가 중앙행정기관, 지방자치단체 및 공공기관 대상으로 실시함

    m 기관별 수요조사에 대한 심사 및 과제 효과성·타당성 검토를 거쳐 과제를

    확정·추진함

    - 앞서 과제 후보 추진 가능성 검토 단계에서 활용한 ‘과제 평가 기준표’는

    기관이 자체적으로 과제를 발굴해서 추진하는 것을 목적으로 하지만,

    행정자치부 수요조사는 범정부 차원의 공공 빅데이터 분석과제 발굴을

    목적으로 하므로 과제의 필요성과 목표를 포함하여 기대효과와 참여

    기관의 의지도 중요한 심사기준으로 함

  • 공공 빅데이터 업무적용 가이드

    38

    * ‘16년에는 수요조사를 거쳐 건강보험심사평가원의 “실시간 국민관심질병 예측 서비스”등 5개의 신규 분석사업을 확정·추진 중

    심사기준 심사내용

    과제 필요성 및 목표 과제의 중요성, 시급성, 구체성 및 혁신성 등

    분석데이터 확보방안 분석 데이터 확보를 위한 외부 기관과의 협의 여부

    빅데이터 분석방법 분석과제 세부 내용의 구체성 및 명료성

    과제 수행 결과물 추진 목적에 부합하는 결과물 도출 가능성

    기대효과 정량적 기대효과 제시 및 지속적 활용가능성

    참여 기관의 의지 사전 BPR/ISP 수행여부, 분석 결과 공유·공개 여부 등

    [표 9: 수요조사의 심사기준과 심사내용]

    수요조사서

    접수⇒

    과제 효과성 및

    타당성 검토⇒

    과제선정 및

    사업계획 수립⇒ 과제추진

    [그림 10: ‘16년 신규 분석사업 선정 절차 및 일정 예시]

    3.2 자체 예산 확보를 통한 사업추진

    m 빅데이터 분석사업에 전문성을 가진 사업자를 선정하여 정보화사업 형태로

    추진할 수 있음

    - 분석 사업의 추진체계가 갖추어져 있고, 추진 예산이 확보되어 있다면

    요구사항을 상세화 하여 사업 발주

    * 본 가이드의 부록1. “사업추진 단계별 절차”는 정보화사업 형태로 빅데이터 분석을 추진할 경우 담당자가 확인해야 할 사항을 체크리스트 형태로 제시

    m 사업을 자체적으로 추진하는 경우, 빅데이터 분석 사업의 관리자는 조직

    내에서 정보화사업과 현업 업무를 두루 경험한 자를 선정하여 사업을

    총괄하고 공정관리와 실적 점검, 산출물 관리 및 검수, 데이터 현황조사

    지원, 업무 분석 지원 등이 원활히 진행될 수 있도록 하여야 함

    - ‘제1절 추진체계 구성’에서도 설명했듯이, 빅데이터 분석 사업은 IT 사업이

    아니라는 인식이 필요하며, 기존의 정보화 사업과 달리 IT부서 단독으로

  • 39

    추진할 수 없음. 따라서, 분석 사업의 관리자는 IT와 현업 모두 원활한

    협업을 이끌 수 있는 사람이 적임자임

    m 또한, 외부 전문가를 자문조직으로 구성하여 분석 사업에 대한 자문 등

    과업 수행을 지원하고, 사업이 효율적으로 추진될 수 있도록 정책적

    자문을 받는 것이 필요함

    3.3 빅데이터 공통기반시스템을 활용한 과제분석

    [그림 11: 빅데이터 포털 활용 검토 방법]

    m 추진하고자 하는 과제를 빅데이터 포털에서 검색(①)하여 과거 타기관에서

    분석한 동일한 과제가 존재하는지(②), 표준분석모델에 포함된 과제가

    아닌지(③) 판단

    m 동일한 과제가 존재하지 않는 경우는 공공 빅데이터 분석과제로 수행한

    적이 없는 신규 과제로 판단하여 추진(④)하며, 이 경우, 본 가이드의

    부록1. ‘사업추진 단계별 절차’의 점검사항을 참조하여 사업을 추진함

    m 동일한 과제가 존재하지만, 표준분석모델에 포함되지 않는 경우는 빅데이터

    포털의 기존 과제를 활용하여 과제를 추진(⑤)할 수 있음

  • 공공 빅데이터 업무적용 가이드

    40

    m ④, ⑤의 경우 모두 빅데이터 공통기반시스템을 활용하여 과제를 분석할 수

    있는데, 이 경우 빅데이터 포털내 전문분석을 요청하여 분석을 진행할 수 있음

    참고 사항 – 빅데이터 포털 전문분석 도구

    빅데이터 포털에서는 사용자가 빅데이터 공통기반 내에서 데이터 처리/분석/시각화 등을 직접 수행할 수 있도록 전문분석 도구를 제공한다.전문분석 도구는 다음과 같이 구성되어 있다.

    빅데이터 포탈의 전문분석 도구 설명

    도구명 사용분야 설명

    Hadoop 2. X플랫폼 (SBP)

    데이터저장/처리

    ㅇ Hadoop 2.0 기반의 Big Data 플랫폼ㅇ 데이터 저장 및 처리 지원 도구ㅇ GUI기반 Big Query, Workflow 등 지원

    R-GUI 솔루션(SRA)

    데이터분석

    ㅇ R기반 데이터 분석을 GUI 환경으로 제공ㅇ 분석 프로세스에 대한 Workflow화 가능ㅇ Hadoop 데이터 연계 분석 가능

    시각화 솔루션(Tableau)

    분석시각화

    ㅇ 다양한 형태의 차트를 통한 분석 시각화ㅇ Hadoop 데이터 및 R분석 모듈 연동

    m 추진하고자 하는 과제가 표준분석모델에 포함되어 있는 경우는 표준분석

    모델을 활용하여 사업을 추진(⑥)할 수 있으며, 이 경우, 빅데이터 포털

    환경을 사용하여 구현할 것인지의 여부에 따라서 다음과 같은 추진

    방안이 있음

    - 표준분석모델 모듈을 받아 직접 분석 사업을 진행하는 경우 행정자치부로

    표준분석모델 모듈을 요청하여 기관이 자체적으로 추진(⑥-1)해야 하며,

    이 경우도 빅데이터 공통기반시스템의 전문분석을 요청하여 추진 가능

    * 빅데이터 공통기반시스템의 전문분석 절차에 관하여는 빅데이터 공통기반가이드북 제1 권 참조 (http://www.insight.go.kr 의 공지사항)

    - 빅데이터 공통기반시스템에서 표준분석모델 프로세스를 이용하여 추진

    가능(⑥-2)* 빅데이터 공통기반시스템의 표준분석모델 매뉴얼 참조

    (http://www.insight.go.kr 의 공지사항)

    http://www.insight.go.krhttp://www.insight.go.kr

  • 41

    4. 분석 비용 및 기간 산정

    m 과제 분석에 소요되는 비용과 예상 추진기간을 산출하며 수행에 필요한

    비용을 산정해야 함

    m 비용은 공공 빅데이터 분석 사업비 대가산정 가이드(2016.08. 행정자치부)를

    준수하여 작성할 것을 권고함

    * 대가산정 가이드를 반드시 준수해야 하는 것은 아니므로 기관에 맞게 활용할 수 있음

    - 공공 빅데이터 분석 사업비 산정 모형에는 분석사업의 세부 태스크별로

    난이도와 작업자수, 작업일수를 산정(①, ②)하고 작업 단계별 난이도를

    고려한 보정계수(③)와 단계별 수행률 설정(④)을 통해 전체 투입

    공수를 계산하여 개발원가를 산정(⑤)* 개발원가는 인건비, 제경비, 기술료를 포함

    단계 주요 내용

    사전 준비 ○ 분석대상 업무와 요구사항을 명확히 정의하고, 단계별 주요활동과 태스크 도출

    단계별 투입공수 산정

    ○ 요구사항에 근거하여 분석대상 업무의 태스크 별로 난이도, 작업자 수, 작업일수 산출

    단계별 보정계수 산정

    ○ 분석 사업의 특성을 고려하여 보정요소별로 복잡도(보정계수) 산정 – 보정요소 : 데이터 규모 보정, 데이터 처리 기술 보정, 분석모델

    수립의 난이도 보정, 빅데이터 분석 기술 적용에 따른 복잡도 보정

    단계별 수행률 설정○ 사업 단계별 수행률 설정○ 예를 들어, 데이터 수집, 전처리를 기관의 IT담당자가 수행하는

    경우, 해당 단계별 수행률을 0%로 설정 가능

    보정 후 소요비용 산정

    ○ 식별된 보정계수에 따라 소요공수 보정 – 소요공수 = 보정 전 분석규모 × 보정계수○ 소요 공수에서 도출된 기술등급별 투입공수로 등급별 소요비용

    산정○ 등급별 소요비용에 제경비와 기술료를 더해 소요비용 합계 산정

    직접경비 산정 ○ 해당 분석 사업에 관련된 직접경비 계산

    분석 사업비 산정 ○ 분석 사업비 산정 – 분석 사업비 = 개발원가 + 직접경비

    [표 10: 사업비 산정 단계별 주요 내용]

  • 공공 빅데이터 업무적용 가이드

    42

    - 데이터의 구매료, 특정 소프트웨어 도구 사용료, 특정기술 도입 관련

    전문가 비용, 홍보물 제작 및 배포, 컨퍼런스 개최 등의 홍보비용을

    포함하는 직접경비를 계산(⑥)

    - 개발원가와 직접경비를 더해 공공 빅데이터 분석 사업비를 산정(⑦)

    m 분석모델을 지속적으로 활용하고 개선해 나가기 위해서 과제 완료 이후

    유지관리를 위한 계획도 고려되어야 하며, 이에 필요한 인력과 예산도

    별도로 수립해야 함

    m 사업비용 산정 시 대가산정 기준에 포함되지 않은 변수나 고려사항이

    많거나, 구축 관련 인프라의 도입이 필요한 경우 빅데이터 관련 전문

    업체나 기존에 분석 사업을 진행했던 경험이 있는 업체를 통해 기초

    견적을 의뢰하는 방법도 고려

    빅데이터 분석을 통해 달성하고자 하는 목표는 명확히 정의하였나?

    사업 목적 달성을 위해서 필요한 요구사항이 빠짐없이 정의되었나?

    다양한 과제추진 방법을 인지하고, 분석과제에 적합한 추진방법을 고려하였나?

    예산수립 및 기간산정의 적정성 여부는 적절히 검토되었는가?

  • 제3장 활용 및 분석모델 고도화

    제1절 업무 적용 및 효과 검증

    제2절 분석 결과 홍보

    제3절 유지관리

    제4절 분석모델 고도화

  • 공공 빅데이터 업무적용 가이드

    44

    활용 및 분석모델 고도화 개요

    활용 및 분석모델 고도화 단계에서는 분석 결과 업무적용에서 효과검증, 홍보,

    유지관리, 분석모델 고도화에 이르기까지의 과정을 다룬다. 기 추진한

    분석과제 결과를 업무에 적용하기 위한 준비, 실제 업무에 적용 그리고 적용

    후에 나타나는 효과에 대한 검증까지 자세히 안내한다. 분석 결과 홍보 및

    성과결과 공유 차원에서 다양한 매체를 통한 결과 홍보가 필요하며, 아울러

    분석 서비스의 안정적인 운영과 현행화된 데이터의 수집·저장 관리, 분석

    결과의 정책개발 및 행정업무 지원 등의 지속적인 활용을 위해 유지관리가

    필요하다. 끝으로 분석모델은 대한 주기적이고 지속적인 고도화에 대한

    필요성이 제기됨에 따라 기관에서는 분석 결과에 대한 활용 및 확산,

    분석모델에 대한 지속적인 고도화를 통해 빅데이터 분석과제 추진의 목적을

    달성할 수 있을 것이다.

    □ 추진 절차

  • 45

    제1절 업무 적용 및 효과 검증