big data analysis network system - fkii.org · 기초 사용볟 및 고급 사용볟를 위뽨...
TRANSCRIPT
• 제품명 : uBEANs
• 기업명 : ㈜유누스
• 담당자 : 손소열
• 연락처 010-2345-7947
Big data Analysis Network System 빅 데이터 수집/저장/분석/시각화
빅 데이터 통합 솔루션
2
I. 빅데이터 소개
1. 빅데이터 소개
2. 해외 시장 현황
3. 국내 시장 현황
4. 적용예시
II. uBEANs
1. 솔루션 개요
2. 솔루션 형상
3. 핵심가치
4.시스템 품질
5. 기능적 특징
6. 주요기능
7. 적용사례
8. 제품 구성
Contents
3
I. 빅데이터 소개
1. 빅데이터 소개
2. 해외 시장 현황
3. 국내 시장 현황
4. 적용예시
4
Big Data는 ‘기존의 일반적인 기술로 관리하기 곤란한 대량의 데이터군’으로 ‘과거 ∙ 현재의 상황 분석 및 가시화’를 통하여 활용도 높은 미래 예측과 의사 결정의 수단
데이터 크기 (Volume)
데이터 유입속도 (Velocity)
데이터 형태 (Variety)
기존 기술로는 관리할 수 없는 데이터의 양 (수십 테라바이트, 패타바이트)
데이터의 발생 빈도와 갱신 속도에 따라 수집 및 분석 속도의 증가와 이에 대한 실시간 처리 및 저장 처리 필요
다양한 데이터의 형태를 처리함 (정형데이터(15%), 비정형데이터(85%)에 대한 처리)
Volume
Variety Velocity
• Terabytes • Records • Transactions • Tables, files
• Batch • Near time • Real time • Streams
• Structured • Unstructured • Semistructured • All the above
Big Data
빅데이터 소개
4V := Volume / Variety / Velocity + Value
5
글로벌 빅데이터 시장은 빅데이터 분석이 차세대 IT를 이끌어 갈 핵심 동력으로 “기존과 차별화된 대용량 데이터의 새로운 분석과 추론(전망)을 통해 새로운 서비스를 개발” 할 수 있는 가능성으로 전 산업 분야에서 걸쳐 고 성장세를 유지
서비스 분야
자연언어 처리기계
학습인공지능 기술로
맥락 이해와 추론
서비스가 증가하고
의료금융 등의 공공
분야를 혁신하는 新
산업 분야를 개발.
맞춤형 개인화 서비스
산업의 활성화가
이루어짐.
과거탈퇴고객의 이용패턴을 분석해 이탈 가능성이 높은 가입자를 관리함 .
모든 차량 내부에 센서를 부착해 이동 중 발생하는 결함 발견
크레인 곳곳에 센서를 부착해 무게 중심 이탈 여부오작동 징후 파악
해외 시장현황
유통 분야
제조 분야
고객이 대여한 영화 목록 등을 분석해 개인별 맞춤형 영화 콘텐트를 제공함 .
환자차트병원시술자료논문 등 모든 정보를 검색해 적절한 치료법을 제시함.
전자제품 가격흐름을 예측해 고객에게 적절한 구매시기를 알려줌
각 매장의 모바일과 소셜 쇼핑의 특징 이용 가능한 ‘월마트랩’운영.
과거 고객이 구입한 서적 목록을 분석해 개인화된 쿠폰 발급.
전 세계 매장 판매재고 데이터 분석으로 재고 시스템 실현.
글로벌 빅데이터 활용 사례
6
서울특별시 교통 데이터와 KT의 요일별/시간대별 유동인구 빅데이터를 활용하여 최적의
노선과 배차간격을 도출해내고, 거기에 KT의 통화량 데이터를 바탕으로 실수요에 대한 예측을
통해 일부 구간을 조정하여 최종적으로 올빼미버스 노선을 확정.
하루 평균 6000여 명의 승객들이 이용할 정도로 성공적인 결과 달성
지도와 연결된 유동인구, 업종별 ․ 월별 매출 등의 정보(10종)로 상권분석 서비스를 제공.
자영업 창업희망자인 이용자는 2,650만 SK텔레콤 가입자 동선(유동인구), 3,000만 OK캐쉬백
회원 소비패턴, 현대카드 가맹점 결제, 부동산 114의 상권 시세 등의 데이터를 통해 업종별 매출
현황, 경쟁 매장, 잠재 수요고객, 유동인구 등의 정보를 지도에서 직접 분석
생산 공정별 온도, 습도, 압력, 성분 등의 비철강 생산 전 과정의 각종 데이터를 0.001초 단위로
수집 ․ 분석함으로써 불량률을 최소화하여 생산효율성이 높아지도록 실시간으로 공정을
제어하고 가격변동이 큰 철광석 등의 자원을 적시에 조달하기 위해 데이터 분석을 통해 최적
구매 시기와 가격대를 결정
1) 빅 데이터가 수집되지 않는 비효율적인 비즈니스 현장 2) 역량 축적으로 이루어지지 않는 소모적인 데이터 활용 상태 3) 빅 데이터 관리와 분석에 필요한 지식기반 취약에 기인함 1) 빅 데이터가 수집되지 않는 비효율적인 비즈니스 현장 2) 역량 축적으로 이루어지지 않는
소모적인 데이터 활용 상태 3) 빅 데이터 관리와 분석에 필요한 지식기반 취약에 기인함
국내 시장현황
국내 빅데이터 시장은 높은 IT 인프라 구축 및 세계 최고 수준의 기술 수용력을 가진 이용자를 보유한 데이터 생산국이자 소비국으로 “데이터의 활용 측면에서는 아직 낮은 수준”에 머물러 있으나 각 기업 빅데이터 적용 기반 구축에 관심 높음.
국내 빅데이터 활용 사례
7
구분 서비스 설명
통계 고도화
고객 현황 총가입자/신규가입/결합상품/지역/해지고객 등의 월별/일별 고객 현황 파악
가입자 현황 신규가입자/결합상품/지역 등의 신규 가입자의 월별/일별 현황 파악
VOC 현황 VOC 유형별 구분/지역/처리비용 등의 VOC의 월별/일별 현황 파악
마케팅 현황 마케팅 유형별 구분/비용에 대한 월별/일별 현황 파악
매출 현황 총매출/항목별 지출비용/항목별 순이익 등의 월별/일별 현황 파악
연관분석 강화
이용량 분석 외부 요인(날씨, 주가, 환율 등)에 의한 제품 이용량 변화 요인 파악 및 증대 전략 도출
가입자 분석 신규가입자/광고선전비용/외적 요인 등의 월별/일별 연관성 분석을 통한 가입자수 하락원인 파악 및 가입자수 증대 전략 도출
VOC 분석 VOC 유형별 구분/처리비용/강수량/외적요인 등의 연관성 분석을 통한 VOC 증가원인 파악 및 VOC 감소 전략 제시
부정 사용 발견 기존 범죄 분석 결과로 알려진 부정 사용 유형을 이용하여 실시간으로 부정 사용 패턴을 발견하여 사전 예방함
해지고객 분석 해지고객/VOC 유형별 구분/이탈방지 마케팅 비용/외적 요인 등의 연관성 분석을 통한 해지고객 증가 원인 파악 및 고객 유출 방지 전략 제시
매출 분석 총매출/항목별 순이익/지역별 가입자수/VOC 건수/가입비/설치비/가입상품 유형구분/마케팅비용 등의 연관성 분석을 통한 매출 감소 원인 파악 및 매출증대 전략 제시
만족도 분석 VOC/홈페이지 웹로그/소셜 키워드 등의 연관성 분석을 통한 만족도 상승 전략 제시
예측 시뮬레이션
가입자 예측 광고 선전비와 같은 마케팅 비용 입력으로 가입자/VOC/해지고객/외적요인 등의 연관성 분석을 통한 가입자 예측으로 가입자수 하락 방지 대책 수립
해지고객 예측 이탈방지 마케팅과 같은 마케팅 비용 입력으로 해지고객/VOC/외적 요인 등의 연관성 분석을 통한 해지고객 예측으로 해지고객 감소 방지 대책 수립
가입자/VOC/만족도/마케팅/매출 항목 등에 대해 관련성 높은 데이터를 선별하고, 연관성 분석을 통해 현황파악 및 예측 시뮬레이션을 제공 적용 예시1
마케팅 분야 활용 예시
8
가입자/해지자/VOC 데이터에 대한 현황/추이 분석과 연관성이 높은 외부 데이터(강수량, SNS 등)와의 상관 관계를 분석하여 해지 고객을 예측하여 대응 전략 수립 가능 적용 예시2
데이터 현황 분석, 연관 분석 및 예측
9
고객의 세그멘테이션에 따른 만족도와 이용 현황 분석을 통해 고객의 Needs를 파악하고 개인별 컨텐츠 추천 서비스를 제공, 예측 알고리즘을 통한 서비스 이상 알림 제공 적용 예시3
세그멘테이션에 따른 마케팅 현황, 이상 징후 분석
10
II. uBEANs 소개
1. 솔루션 개요
2. 솔루션 형상
3. 시스템 품질
4. 기능적 특징
5. 주요 기능
6. 적용 사례
7. 제품 구성
11
데이터 분석/예측의 최적화
Data Report
uBEANs
기술 통계 / 데이터 마이닝 분석 개별 고객 단위의 패턴 분석 성향 그룹화 및 패턴 분석 매출 증대/비용 절감 방안 도출 BI 주1) 분석 및 예측 지원
데이터 활용의 시의성 보장
데이터 수집/분석 시 일괄 배치 처리 대용량 데이터의 준 실시간 배치 수집/처리 시의성 데이터에 대한 준 실시간 수집/처리
경제적 가치 창출
빅데이터를 활용한 다면적 판단 기능 반복적 시뮬레이션을 통한 예측 데이터 산출 저렴한 비용으로 데이터 경영 실현
※ 주1) BI(Business Intelligence) : 신속하고 정확한 비즈니스 의사 결정을 위해 사용하는 데이터 처리 기술(통계 분석, 예측, 데이터마이닝 등)
BEANs 솔루션은 기존 데이터관리 시스템으로 분석이 불가능했던 정형, 비정형의 Big Data를 수집/저장/분석/시각화하는 전 과정을 지원함으로써, 고객이 보유한 데이터에 대한 Insight와 Solution을 얻을 수 있도록 지원하는 통합 관리 시스템 솔루션 개요
12
Open & Collaboration Legacy Business Infra Interface
고객 기업 Legacy System 정부/공공기관 Open Data
과거와 현재의 현상 파악 다양한 패턴 발견 장래 고객/수요/소비 예측 고객/가격/정책 최적화 Public value
Individual data
정형 데이터
비정형 데이터
SNS 데이터
센싱 데이터
외부 VIP 고객
기업임원/ 최상위관리자
마케팅 담당자
시스템모니터 고객VOC담당
데이터 수집/저장
데이터 시각화
데이터 예측
데이터 분석
※ 주1) Hadoop(High-Availability Distributed Object-Oriented Platform) : 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크. ※ 주2) 하이브리드DW(Data Warehouse) : 투자 비용 절감을 위해 기존 DW와 하둡기술 기반의 빅데이터 플랫폼을 연계한 빅데이터 수용 방안
통합관리시스템
BEANs 솔루션은 통합된 이용 환경 하에서 하둡(Hadoop)주1) 및 오픈 소스 기반으로 최적화되어 패키징된 서비스 맞춤형 하이브리드 DW주2) 를 지원하는 대용량 데이터 분석 시스템 솔루션 형상
13
트래픽 증가에 따른
대용량 Disk 증설을 위한
분산 코디네이터 서비스
기능을 이용한 대용량
트래픽 분산 처리 지원
분산형 데이터 처리
Scale Out 기능
자동 Fail Over
Load Balancing
※ 주1) Scale Out : 용량과 성능 요구조건에 맞추기 위해 Node 단위(스토리지)로 증가되고 하나의 시스템처럼 운영되는 방식
대용량 트래픽 분산 처리 지원, 서버의 수평적 Scale Out주1) 기능 제공 장애 발생 시 무중단 자동 Fail Over 기능 등을 지원하여 저비용, 효율성을 보장 시스템 품질
빅데이터 시스템 품질 기본 요건
트래픽 증가에 따른
각 서버의 수평적 Scale Out
기능 제공
서버간 독립적 구조로
확장 증설 편의성 제공
장애 발생 시 무 중단
실시간 자동 Fail Over 기능
장애 발생시 고 가용성 보장
처리 성능 보장을 위한
실시간 병렬 처리 구조 지원
대용량 데이터 트래픽 부하
분산을 위한 로드 밸런싱 지원
14
수집 Aggregator
저장 Storage
분석 Analysis
시각화 Visualization
통합 UI 및 관리도구 제공
대량 데이터의 배치 수집
정형 데이터 수집
80여종의 다양한
데이터 수집 형식 지원
대용량 데이터의
안정적 저장
대용량 데이터의
준 실시간, 배치 처리
Hybrid Data Warehouse
구조 지원
기본통계/확장통계 등
통계 분석 도구
Data Clustering, Classification,
패턴 추출 등 다양한 데이터
마이닝 기술
고급 분석 R 제공
다양한 Chart형, Grid형
보고서 및 Data Export 기능
관리도구 내 사용자 정의
Dashboard 생성, 관리
Open API를 통해 외부
웹사이트에서 활용
데이터 처리 4단계 상의 기능적 특징
BEANs 통합 개발 환경을 이용하여 4단계의 간단한 설정으로 빅데이터 수집/분석/시각화 적용이 가능하며, 이용자 관리, 데이터 수집/분석, Dashboard 생성/관리 기능 제공 기능적 특징
15
온라인상에서 간단하게 데이터 수집 및 저장 설정
양이 많은 데이터라도 복잡한 절차 없이 간단한 설정만으로 데이터의 수집주기와 타입을 설정하여 지정한 형태로
데이터를 수집/저장이 가능하며 수집이 완료된 데이터는 미리보기를 통해 확인해볼 수 있습니다.
수집 데이터 추가/복제 및 그룹간 데이터 공유
다양한 데이터를 손쉽게 수집하고 저장
데이터 수집을 위한 이벤트 주기를 기본 1분 및 분 단위, 직접 입력으로 설정할 수 있으며, 수집 타입과 저장 타입을 설정하여 원하는 형태의 데이터 수집/저장이 가능 주요 기능 1
16
기초 사용자 및 고급 사용자를 위한 데이터 분석 설정 ‘R’을 통한 데이터마이닝, 알고리즘 등 고급 분석 지원
기본적인 기술 통계 분석은 GUI상에서 간단한 클릭만으로 데이터 평균, 분포, 범위 등을 즉시 분석하거나 필요한 데이터만 따로 필터링하여
조회 할 수 있으며 쿼리입력 등의 방식을 지원하여 통계 계산과 그래픽을 위한 고급 분석 환경인 R연동을 통한 고급분석도 가능합니다.
데이터 분석 및 고급 분석 지원
주요 기능 2
‘R’을 통해 데이터 마이닝, 알고리즘 등 다양한 통계 기법과 수치 해석 기법을 지원하며 별도의 ‘R’ 패키지 실행 없이 BEANs 통합 환경에서 곧바로 이용 가능
17
30여종의 다양한 시각화 제공 리포트 저장 및 관리 & 리포트 미리보기
가공된 데이터에 대하여 분석 리포트작성 시 30여종의 다양한 chart/grid 시각화를 제공하고 GUI상에서 손쉬운 시각화 설정이 가능하며 원
하는 형식(JPEG/PNG/PDF/SVG)으로 리포트를 저장할 수 있습니다.
각 분야에 적합한 30여종의 다양한 chart/grid 시각화를 GUI상에서 손쉬운 리포트 작성이 가능하며 원하는 형식으로 리포트를 저장하거나 출력 가능
주요 기능 3
다양한 리포트 및 시각화 제공
18
개별 URL을 발행하여 웹페이지로 제공 별도 웹사이트에 구성된 대시보드 시각화
대시보드의 레이아웃 유형과 테마를 설정할 수 있고 독자 URL을 생성 후 간편하게 접속가능하며 분석리포트를 API로 연동하여 기업 독자
사이트에 구성 가능합니다.
기상정보
개별 저장된 리포트를 활용하여 Dashboard형 웹페이지를 구성할 수 있으며, 서비스 성격에 따라 Open API를 통해서 고객사 웹사이트에서 간편하게 삽입 가능 주요 기능 4
웹 출판
19
건축 시공 최적(구조안정성) 분석 서비스 개발 전력 예측 분석 시스템 구축
건축 시공상의 수화열, 변위, 기둥 축소량에 대한 센서 데이터를 수집 및 분석 진행
실시간 전력 사용량 통계 및 에너지 수요 예측량 분석 및 시각화
적용 사례 1
BEANs 빅데이터 솔루션 적용사례
센서 데이터 기반의 건축 시공 안정성 및 전력 에너지 빅데이터 분석
20
월별 추이, 방문회차, 연령별 추이, 처방, 외래, 병동, 의사 이동현황 등을 분석한 통계를 제공
온라인 블로그 및 SNS를 수집 후 분석하여 정형 데이터 변화량 및 비정형 키워드 분석 시각화 진행
방송 프로그램
적용 사례 2
BEANs 빅데이터 솔루션 적용사례
기업(의료기관) 경영 데이터 및 온라인 비정형 데이터 분석
C병원 월별 추이 및 방문자 등 통계 분석 K방송 핫이슈 분석 서비스 시행
21
사용자의 연령,지역,성별, 서비스 이용 시간대를 분석하여 시의성 있는 인기있는 정보 콘텐츠를 추천
콜센터 음성 VOC를 분석하여 토픽 키워드, 관련 상품, VOC 유형등을 시각화하여 제공
적용 사례 2
BEANs 빅데이터 솔루션 적용사례
온라인(모바일) 서비스 로그 및 콜센터 음성 VOC 분석
공공기관 외국인 대상 추천 콘텐츠 분석 콜센터 음성 VOC 분석
22
BEANs All-in-One
Tiny Lite Standard Enterprise Enterprise+
Collector / Core
Collector / Core
Collector
Master Node
Data Node
Data Node
Data Mart
Master Node
Data Mart
Data Node
Core Application
Collector
Core Application
Data Node
Monitoring
:
Collector
Master Node
Data Node
Data Node
Data Mart
Master Node
Data Mart
Data Node
Core Application
Collector
Core Application
Data Node
Monitoring
:
Package Server Core Memory Storage
Tiny 1 8 32 GB 4 TB
Lite 5 8 32 GB 38 TB
Standard 9 10 32 GB 44 TB
Enterprise 13~ 10 32 GB 70 TB~
Enterprise+ 13~ 20 64 GB 70 TB~
Master Node
Data Node
Data Node
Data Mart
Master Node
Data Mart
Data Node
Collector / Core
Data Node
Data Node
Data Mart
Master Node
제품 구성
수집(Collector), 응용(Core), 저장(Master/Data/Mart) 등 3개의 주요 기능을 가진 서버로 구성되며, 수집할 데이터의 용량과 요구 성능에 따라 5가지의 패키지 모델로 구성
패키지 구성
빅데이터의 경제적 가치에 주목하라! 세계 빅데이터 시장 규모는 매년 40~60% 성장하여 2015년에는 169~321억 달러 규모로 증가하고, 2017년에는 534억 달러에 달할 것으로 전망
www.u-beans.com [email protected]