[2016 데이터 그랜드 컨퍼런스] 2 2(빅데이터). skt beyond big data
TRANSCRIPT
빅데이터는 이종의 데이터를 연결하여 새로운 가치를
만들어내는 일련의 프로세스와 분석 방법론이다.
Big data is a series of analysis processes and
methodologies to create a new value by connecting
the heterogeneous dataset
- 김정선
• Open API의 기본 철학 –자싞의 데이터 제어 (Editing, Viewing, Mixing, Matching) –Open Data Format(호홖 가능핚 오픈 포맷 이용)
• Open API의 기본 원칙 –웹 페이지가 아닌 데이터를 디자읶 하라 –가려운 곳을 긁어라 (잘 앆 되는 핚가지 문제 풀기) –가능핚 간단히 만들어라 (점진적 진화, 향상 시켜라) –사람이 먼저, 기계는 나중 : 보기 좋고 읽기 좋게 하여 프로그래밍에 동참 시키기
–광범위핚 표준을 재사용 (표준을 준수하면 재창조 가능) –모듈화/임베딩 가능하게 만들어라. –개발, 컨텐츠, 서비스를 분산 시켜라
쉐어링 물물교환 협력적 커뮤니티
• Data를 통핚 공유경제
• 공유경제는 이용자와 중개자, 사회젂체 모두에게 이익이 되는 윈윈(win-win)구조를 지향
• 2008년 하버드대학교의 로런스 레식(Lawrence Lessig) 교수가 처음 사용핚 용어로, 제품이나 서비스를 소유하는 것이 아니라, 필요에 의해 서로 공유하는 홗동
▲서아프리카의 빆곤국가 아이보리 코스트의 낮(왼쪽)과 밤(오른쪽) 시간에 핸드폰 사용량의 변화를 보여주는 지도입니다. 핸드폰 커뮤니케이션 및 통화가능시간(airtime credit)에 대핚 구입 기록 데이터를 비교하면 지역별 소득(local-level income)과 사회경제적 차이(socioeconomic segregation)를 확읶핛 수 있습니다. 이러핚 데이터를 홗용하면 식량앆보(food security)를 파악핛 수 있습니다[2] [출처] 빅데이터는 지구촌 빆곤의 감소를 위해 어떻게 홗용되는가?|작성자 GP3 KOREA
• CDR 데이터를 활용핚 지역 경제편차 변이
CHN CHN
CHN CHN
CHN
CHN CHN
CHN CHN
CHN
CHN CHN
JPN
JPN
JPN
JPN
JPN
JPN
JPN
JPN
JPN
JPN
JPN
JPN
USA USA
USA
USA
USA
USA
USA
USA
USA USA
USA
USA
• 특정시의 외국인 방문자 분석
44,814
56,490 71,594
2011년 2012년 2013년
• Social Buzz분석을 통핚 국민건강 모니터링(Topic : 아토피/SKT 스마트인사이트)
0
2,000
4,000
6,000
8,000
1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월
2011년 2012년 2013년
- 메타데이터 : 다른 데이터를 정의하고 설명하는 데이터
ISO/IEC 11179 : ISO/IEC JTC 1/SC 32에서 개발핚 메타데이터의 등록 및 공유를 위핚 국제표준
- RDF (resource description framework) 읶터넷과 웹 상의 메타데이터(데이터에 대핚 정의나 설명)를 지원하기 위핚 기반구조를 제공하기 위하여 월드 와이드 웹 컨소시엄 (W3C)에 의해 개발되고 있는 규격으로 웹페이지 내 정보를 잘 검색핛수 있도록 하는 시멘틱 자원
- CKAN (Comprehensive Knowledge Archive Network) 모듞 형태의 데이터, 콘텐츠 공개 및 접근을 가능하게 하는 오픈소스 데이터 포털 플랫폼으로 데이터를 위핚 CMS(Content Management System)
- LOD (linked open data) 로벌 웹표준 제정 기구읶 월드와이드웹컨소시엄(W3C) 중심으로 발젂 중 웹에 저장된 객체(식별자)를 가리키는 ‘통합 자원 식별자’(Uniform Resource Identifier, URI)’를 사용하므로 효과적으로 데이터를 연결가능
데이터 품질관리란 지식 작업자가 데이터를 홗용하여 업무 목적을 달성핛 수 있도록 지속적으로 기대 수준을 만족시키는 것 – Larry English
• 빅데이터 시대의 거버넌스 관리와 품질관리 이슈
Outside Heteroge
neous