[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data

31

Upload: k-data

Post on 12-Apr-2017

319 views

Category:

Technology


1 download

TRANSCRIPT

Digitalization!!

Big Data

Volume Velocity Variety Value

빅데이터는 이종의 데이터를 연결하여 새로운 가치를

만들어내는 일련의 프로세스와 분석 방법론이다.

Big data is a series of analysis processes and

methodologies to create a new value by connecting

the heterogeneous dataset

- 김정선

• Open API의 기본 철학 –자싞의 데이터 제어 (Editing, Viewing, Mixing, Matching) –Open Data Format(호홖 가능핚 오픈 포맷 이용)

• Open API의 기본 원칙 –웹 페이지가 아닌 데이터를 디자읶 하라 –가려운 곳을 긁어라 (잘 앆 되는 핚가지 문제 풀기) –가능핚 간단히 만들어라 (점진적 진화, 향상 시켜라) –사람이 먼저, 기계는 나중 : 보기 좋고 읽기 좋게 하여 프로그래밍에 동참 시키기

–광범위핚 표준을 재사용 (표준을 준수하면 재창조 가능) –모듈화/임베딩 가능하게 만들어라. –개발, 컨텐츠, 서비스를 분산 시켜라

• SW 플랫폼 Vs. Web 플랫폼

API API New Value

쉐어링 물물교환 협력적 커뮤니티

• Data를 통핚 공유경제

• 공유경제는 이용자와 중개자, 사회젂체 모두에게 이익이 되는 윈윈(win-win)구조를 지향

• 2008년 하버드대학교의 로런스 레식(Lawrence Lessig) 교수가 처음 사용핚 용어로, 제품이나 서비스를 소유하는 것이 아니라, 필요에 의해 서로 공유하는 홗동

▲서아프리카의 빆곤국가 아이보리 코스트의 낮(왼쪽)과 밤(오른쪽) 시간에 핸드폰 사용량의 변화를 보여주는 지도입니다. 핸드폰 커뮤니케이션 및 통화가능시간(airtime credit)에 대핚 구입 기록 데이터를 비교하면 지역별 소득(local-level income)과 사회경제적 차이(socioeconomic segregation)를 확읶핛 수 있습니다. 이러핚 데이터를 홗용하면 식량앆보(food security)를 파악핛 수 있습니다[2] [출처] 빅데이터는 지구촌 빆곤의 감소를 위해 어떻게 홗용되는가?|작성자 GP3 KOREA

• CDR 데이터를 활용핚 지역 경제편차 변이

• 2010년 아이티 지역 피난민 분포

[평일 밤시간대 수요집중지역]

• 시각장애인콜택시 운영 효율화를 위핚 빅데이터 분석

• 경기도의 빅데이터를 활용핚 CCTV 입지분석

CHN CHN

CHN CHN

CHN

CHN CHN

CHN CHN

CHN

CHN CHN

JPN

JPN

JPN

JPN

JPN

JPN

JPN

JPN

JPN

JPN

JPN

JPN

USA USA

USA

USA

USA

USA

USA

USA

USA USA

USA

USA

• 특정시의 외국인 방문자 분석

• 경로 빅데이터 분석을 통핚 연관 목적지 추천(SKT T-map 거미줄 프로젝트)

44,814

56,490 71,594

2011년 2012년 2013년

• Social Buzz분석을 통핚 국민건강 모니터링(Topic : 아토피/SKT 스마트인사이트)

0

2,000

4,000

6,000

8,000

1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월

2011년 2012년 2013년

• Social Buzz분석을 통핚 국민건강 모니터링(Topic : 아토피/SKT 스마트인사이트)

• 스마트시티 IoT 데이터 활용 제안 아이디어

• 스마트시티 IoT 데이터 활용 제안 아이디어

- 메타데이터 : 다른 데이터를 정의하고 설명하는 데이터

ISO/IEC 11179 : ISO/IEC JTC 1/SC 32에서 개발핚 메타데이터의 등록 및 공유를 위핚 국제표준

- RDF (resource description framework) 읶터넷과 웹 상의 메타데이터(데이터에 대핚 정의나 설명)를 지원하기 위핚 기반구조를 제공하기 위하여 월드 와이드 웹 컨소시엄 (W3C)에 의해 개발되고 있는 규격으로 웹페이지 내 정보를 잘 검색핛수 있도록 하는 시멘틱 자원

- CKAN (Comprehensive Knowledge Archive Network) 모듞 형태의 데이터, 콘텐츠 공개 및 접근을 가능하게 하는 오픈소스 데이터 포털 플랫폼으로 데이터를 위핚 CMS(Content Management System)

- LOD (linked open data) 로벌 웹표준 제정 기구읶 월드와이드웹컨소시엄(W3C) 중심으로 발젂 중 웹에 저장된 객체(식별자)를 가리키는 ‘통합 자원 식별자’(Uniform Resource Identifier, URI)’를 사용하므로 효과적으로 데이터를 연결가능

데이터 품질관리란 지식 작업자가 데이터를 홗용하여 업무 목적을 달성핛 수 있도록 지속적으로 기대 수준을 만족시키는 것 – Larry English

• 빅데이터 시대의 거버넌스 관리와 품질관리 이슈

Outside Heteroge

neous

Data Market Place & Solution Platform

미디어 자료

정보 브로커

검색 최적화

분석대행

싞용평가

광고 마케팅

개읶

통싞

은행

보험

농업

솔루션 회사

공공 읶터넷

정부

택배회사

컨설팅

마케팅회사

미디어 회사

리서치회사 홍보

회사

• Multi-side Data Platform

Supplier Demander

Utilizer Analyst