인턴1주차 '빅데이터

10
빅 빅빅빅 IdeaN 빅빅빅

Upload: -

Post on 29-Nov-2014

769 views

Category:

Documents


7 download

DESCRIPTION

 

TRANSCRIPT

Page 1: 인턴1주차 '빅데이터

빅 데이터

IdeaN 서정인

Page 2: 인턴1주차 '빅데이터

목차

1. 빅 데이터란 ?

2. 빅 데이터의 활용 사례 및 가치

3. 고찰 및 결론

‘ 넘쳐나는 데이터의 홍수 속에 데이터의 진짜 가치를 찾다…’

Page 3: 인턴1주차 '빅데이터

빅 데이터 란 ?현재 우리는 정보의 홍수시대에 살아 가고 있다 . ‘ 빅 데이터’란 단지 데이터베이스처럼 크기만을 말하는 것은 아니다 . 용량과 데이터의 형태 , 접근방식의 다양성 , 축적속도 , 추출 분석 등 복잡성을 종합적으로 표현하며 이로부터 유용한 자원을 추출해 사회적 경제적 과학적 으로 활용 할 수 있는 자원인 것이다 . 스마트 기기와 SNS 등의 확산으로 급증하고 있는 데이터가 컴퓨팅 능력의 향상과 관리 및 분석기술의 발전으로 인해 새로운 가치를 창출하는 원천으로 주목 받고 있다 . 최근 세계 경제 포럼은 떠오르는 10 대 기술 중 그 첫 번째를 빅 데이터로 선정 , 계속해서 빅 데이터의 중요성이 떠오르고 있는 추세다 .

Page 4: 인턴1주차 '빅데이터

J E O N N A M I T D E V E L O P M E N T C E N T E R

빅 데이터의 활용 사례

데이터 분석 솔루션

대부업 : 대상자의 신용정도 파악

자동차 보험 : 합리적 보험료 산출

의료 : 환자에 맞는 치료법 추천

구매정보 서비스 : 최저가 구매 시점 제시

광고 : 방문자에 맞춘 매체 광고 제공

Page 5: 인턴1주차 '빅데이터

‘ 난 , 이미 알고 있었다’                                         

“ 올해 미국과 한국 대선에서도 빅 데이터가 위력을 발휘했다 . 지난달 재선에 성공한 오바마 미국 대통령은 선거 2 년 전부터 빅 데이터팀을 가동했다 . 이들은 6 만 6000 번의 모의선거를 통해 데이터를 수집했다 . 이 데이터는 정치헌금 모금을 위한 디너파티의 초청 대상 결정부터 TV· 온라인 광고 제작에까지 활용됐다 . 선거를 7 개월 앞두고서야 빅 데이터의 중요성을 깨달은 미트 롬니 공화당 후보보다 앞선 전략이었다 .

한국도 대선 하루 전인 지난 18 일 특정 검색어의 기간별 검색량을 분석해주는 서비스 ‘ 구글 트렌드’에서 박근혜 대통령 당선인과 문재인 민주통합당 대선 후보를 검색한 비율은 각각 52.5%, 47.5% 였다 . 실제 득표율 51.6% 와 48.0% 에 근접한 수치다 . 정치권에선 빅 데이터가 선거 결과에 영향을 줬다는 평가가 나왔다…”

Page 6: 인턴1주차 '빅데이터

‘KT, 오픈소스 빅데이터로 576 억 절감’

“KT 가 오픈소스 기반 빅데이터 플랫폼 구축을 통해 앞으로 5 년간 시스템 설치와 운영 비용이 567 억원가량 절감될 것으로 내다봤다 . 내년에는 빅데이터 인프라를 증설 , 계열사와 외부 데이터를 융합하고 공공 데이터로 분석 대상을 확대할 계획이다 . 

KT 는 상세통화내역 (CDR) 과 콘텐츠 이용 데이터 급증으로 빅데이터 플랫폼을 지난해 구축했다 . 오픈소스 기반으로 구축된 빅데이터 플랫폼은 기존 오라클 RAC 기반 HP 슈퍼돔을 이용할 때보다 향후 5 년간 88% 인 567 억원 비용절감 효과를 가져다 줄 것으로 예측했다 . 데이터추출 (ETL) 병목현상 개선 등 성능도 최대 6배까지 높였다 . 실시간 검색 평균 처리시간도 1 초 미만으로 빨라졌다…”

Page 7: 인턴1주차 '빅데이터

빅 데이터 분석 방법 예시 스플렁크는 단계별로 데이터를 처리하고 관리하고 분석하는 게 아니라 스플렁크라는 한 장소에서 데이터를 한꺼번에 처리하고 분석하는 식이다

스플렁크 솔루션은 오픈소스 하둡을 이용해 빅데이터를 분석한다 . 하둡에서 스플렁크라는 대용량 창고로 데이터를 가져와 통합 처리하는 식이다 .

스플렁크에 모인 각종 시스템 데이터와 로그 정보는 색인화 과정을 거쳐 데이터 분석을 하기 위한 적합한 형태로 재가공된다 .  스플렁크는 이렇게 가공한 데이터를 유의미한 정보로 바꾼다 .

Page 8: 인턴1주차 '빅데이터

J E O N N A M I T D E V E L O P M E N T C E N T E R

고찰 및 결론

가공 / 분석자원 ( 빅데이터 )+ 역량 +

기술

경제적 효과 창출

새로운 IT

패러다임 견인

사회적 문제 해결

빅 데이터의

출현

Page 9: 인턴1주차 '빅데이터

우리가 빅 데이터 분석에 있어서 주의할 점은 빅 데이터 분석 자체가 중요한 것이 아니라 빅 데이터 분석에서 얻는 통찰을 통해 현실의 문제 해결에 기여하는 것이 핵심이다 .

최근 빅 데이터의 툴이나 효과에만 관심이 집중되고 있지만 빅 데이터 자체는 정보가 아니고 가공을 통해서만 정보로서의 가치를 발생한다는 점이다 . 또한 정보 자체에서 통찰을 얻는 것이 아니라 , 정보를 분석해야만 통찰을 얻을 수 있다는 점이다 . 이러한 과학 데이터 및 비정형의 빅 데이터에 대한 조기 안목을 가지고 미래를 준비하고 투자한다면 향후 글로벌 이슈가 되고 있는 다양한 분야에서 세계를 선도할 수 있는 발판을 마련해야 한다 .

Page 10: 인턴1주차 '빅데이터

감사합니다