insight korea big data solutioninsightdeepmining.com/download/[insight korea] deep...산업별big...

39

Upload: others

Post on 01-Jan-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Insight Korea Big Data Solution

비정형데이터를 정형데이터와 결합하여 빅데이터 인프라를 통해 사용자 요구에 맞는 서비스 결과를 제공합니다.

Insight Korea Big Data Solution System Framework

빅데이터 분석 인프라

Hadoop

Impala/Spark

Machine Learning

Python RSolr

Analysis Model

STT/TA 결과 소셜빅데이터

정형데이터

사용자 UI

사용자주도분석

분석가 의사결정자

Dashboard

Client의사결정 활용

Customer

STT(음성인식)

TA(텍스트분석)

ARS녹취서버

Crawling(정보수집)

Analysis(텍스트분석)

Insight 도출(데이터가공)

저장

수집

설정

Issue/Risk Detect

Text Mining

NLP

데이터 추출

키워드 정제

목적/관점

시각화

데이터 추출

키워드 기준

목적/관점

User-DrivenAnalysis

(데이터분석)

전화상담

음성합성

대화생성

대화관리

Virtual Agent(가상상담원)

Batch

Real-time

NLP

Text Mining

Detection

Deep Neural Network

음성인식

음성학습

Legacy

게시판상담 채팅상담 이메일상담

고객DB 상품DB 거래DB ∙∙∙

Call

e-mail

Web

SNS

Insight Korea Big Data Analysis Process

01 02 03 04원천 Data 수집 / 전처리 분석 활용

내부 Data

외부 Data

Pre-Processing Text Mining (Unstructured)

Data Mining (structured)

Risk 대응

Marketing 활용

제공 방법

Web Crawling

트위터, 페이스북블로그, 뉴스, 인스타그램

Contact Center, A/S Center메일, 제품정보, 고객리뷰 등

Text

TaxonomySpeech to Text

Statistics

Association

Risk Scoring

Analysis

자연어 처리(NLU)

Keyword 추출

Classification

감성 분석

• 위기감지• 불만요인 분석• 경영층 보고서• 이슈 분석

• 제품 개선• 마케팅 효율화• SCM 운영 개선• 신제품 개발• 기업 이미지 개선

Dashboard Report

Insight Korea Big Data Solution

분야

산업별 Big Data 활용분야?산

비즈니스 활용영역

빅데이터 기반광고

소비재산업마케팅

콜센터 효율화빅데이터 분석

헬스케어빅데이터

금융기관리스크 관리

IoT홈오토메이션

음성인식 자연어처리 감성분석 이미지분류 데이터마이닝 빅데이터 딥러닝 질의응답

마케팅활용분야

트랜드 변화 요인과 트랜드 방향은?

• 라이프 스타일 변화 감지

• 고객의 니즈 변화 및 핵심 가치 분석

• 새로이 부각되는 상품/서비스 탐색

국내/해외 신상품 동향 및 향후 벤치마킹은?

• 해외/국내 신상품/서비스의 동향 분석

• 신상품의 핵심 경쟁 요인 분석

• 새로 도입 및 벤치마킹 가능한 상품/서비스 아이디어 탐색

신상품의 초기 반응과 대응책은?

• 자사 신상품의 수용도 및 개선점 분석

• 신상품 주요 고객 포지셔닝 조사

• 신상품의 핵심 성장/장애 요인 분석

• 커뮤니케이션 효과 및 확대 방향 분석

기존 상품의 개선점 및 Innovation 방향은?

• 상품 반응 및 매출 증감 변화의 원인 탐지

• Renovation 방향 분석

Insight Deep MininG Services의Marketing 활용분야

Insight Deep MininG Services의Marketing 활용분야

경쟁 상품의 경쟁력 및 판매전략은?

• 경쟁 상품의 강점/약점 분석

• 경쟁 상품들의 온라인 채널 판매전략 조사

• 온라인 유통 채널 탐색

소재나 제품 요소들은 어떻게 소비자 효익으로 전달해야 하는가?

• Communication 방법 분석

• PR, Campaign을 위한 소비자 핵심 언어 조사

광고/홍보 효과는?

• 광고/홍보 효과 분석

• 광고 모델의 적합성/효율성 분석

• 광고로 인한 상품의 포지셔닝 변화 조사

상담의 업무 효율화는 어떻게 할 수 있는가?

• 상담사 교육 방안 및 역량 분석

• 고객 유형별 응대 방안 차별화

• 상담사 성과 강화 방안 모색

온라인 몰, 홈쇼핑, 소셜 커머스 등 유통에서의 성장 가능한 품목은?

• Sales 집중 품목 선정

• 고객 선호 품목 예상

TM의 업무 효율화와 매출 증대를 위한 방법은?

• 고객 유형별 대처방안 차별화를 통한 매출 증대 방안 모색

• TM의 불완전 판매원인 및 개선 방안 탐색

• 상담원의 시너지 기능 강화를 위한 관리 시스템 탐색

Q/A, TM, A/S의 생산성을 높이는 방안은?

• 기록 녹취 및 즉각 분류 시스템을 활용한 생산성 향상 방안 모색

• 상담 중 주요 정보 감지 및 대비 시스템 구축

• 수익성 증대를 위한 상담인력 감축 방안 모색

고객들의 불만 원인을 감지하고 즉각 대처할 수 있는방안은?

• 고객 이탈 가능성 감소를 위한 최적의 대처 방안 모색

• 고객 불만 정도 예측 및 원인 해결을 위한 방안 모색

고객들의 요구와 소리를 통합해서 총괄 관리는 어떻게 해야 하나?

• 다양한 고객 접점에서 접수 되는 정보 통합 및 일괄 관리 시스템 구축

Insight Deep MininG Services의Marketing 활용분야

Deep Learning 기반 Data Minging을통한활용분야

개별 고객맞춤 상품/

서비스 추천

이탈/유입 고객 예측

및 비율 추정

상품/서비스

가입/구입율 추정

가격 시뮬레이션/

Dynamic Pricing

Optimal Media

Planning

Fraud Detection,

Customer Retention,

Pricing

소비 Trend/

사용패턴 추정

환자 초기 진단 Early

Detection of

Impending

Physiological

Disorder (EDIP)

거시환경 변화에 따른

총 수요시장 변화 추정

Sales Promotion

고객군 파악

활용한통합서비스

Integrated VOC Management

과거 대부분의 기업들은 수집된 VOC 데이터를 제대로 활용하지 못하고 VOC 해소 여부만을 모니터링 하였으나이제는 Big data 분석, 가공 및 활용 방안을 도입하여 진정으로 고객이 원하는 것이 무엇인지 확인할 수 있게 됨

통합 VOC란 Call Center 등 경로로 유입된 고객의 직접적 Voice 뿐만 아니라

Social Network상에서 교환되고 있는 간접적 Voice까지 ‘통합’ 관리하는 모델을 말합니다.

VOC 관리체계에 Big data가 활용된 배경

소셜 데이터 포함,기업 내·외부 VOC

통합관리

콜센터 중심 VOC 관리

콜센터VOC

커뮤니티Blog

SNS

홈페이지Q&A

Portal검색

콜센터VOC

커뮤니티Blog

SNS

홈페이지Q&A

Portal검색

Social Data 통합VOC

콜센터VOC

커뮤니티Blog

SNS

홈페이지Q&A

Portal검색

통합 VOC 관리의 의미 Ⅰ

Integrated VOC Management

통합 VOC 관리의 성공의 열쇠는 Technology 측면의 접근만이 아닌 정보를 어디에 활용할 수 있는지 명확하게 정의하는 것

• Insight추출

조기경보

신상품개발

마케팅전략

고객응대개선

상품/서비스개선포인트

도출

제품/서비스 개발

서비스 불만요인 및추가 필요기능 정의

마케팅

캠페인ROI 평가체계 구축

고객관리

‘Customer Experience’ 체계 연계

리스크관리

부정적 평판조기대응

담당부서로의 적극적인 피드백 및 활용 프로세스 구축

통합 VOC 관리의 성공 요소

‘통합’관리의 두 번째 측면은 Insight 추출 후 관련부서로의 피드백 프로세스까지

포함한다는 것입니다.

통합 VOC 관리의 의미 Ⅱ

관련부서 활용

Integrated VOC Management

+

Our Service Category_서비스 유형

고객사의 규모와 요구사항, VOC 활용목적에 따라 통합 VOC 관리체계 및 데이터 분석 플랫폼을 고객사에 직접 도입하거나 분석 서비스형태로 제공받는 크게 두 가지 방식으로 서비스 유형을 선택하시거나, 두 가지 방식을 결합한 하이브리드 방식의 도입도 가능

VOC 분석서비스 제공(Analysis as a Service)

Deep Mining이 보유하고 있는 VOC 분석엔진과 Tool을

활용한 분석 및 인사이트 리포트 제공 서비스

• Deep Mining이 보유하고 있는 VOC 분석엔진과 Tool을

활용하여 콜데이터 또는 SNS상의 데이터를 분석하여 찾아낸

인사이트를 리포트로 제공하는 서비스.

• 월별 또는 분기별 등 다양한 주기로 정기적인 분석서비스를 제공

VOC 분석체계 도입 지원(Embedding)

고객사의 자체적인 VOC 분석체계 구축을

지원하는 서비스

• VOC를 수집/가공/분석/활용하는 체계를 자체적으로

구축하고자 하는 고객사를 종합적으로 지원하는 서비스

• 진단 및 마스터플랜, 개별 고객사 맞춤형 통합 VOC 분석체계

설계, 분석엔진 및 툴 도입 지원, 시스템 구축 지원

분석

Machine Learning Algorithms

Machine Learning Algorithms (sample)

Unsupervised Supervised

Continuous

Cate

gorica

l

• Clustering & Dimensionality Reduction- SVD- PCA- K-means

• Regression- Linear- Polynomial

• Decision Trees

• Random Forests

• Association Analysis- Apriori- FP-Growth

• Hidden Markov Model

• Classification- KNN- Trees- Logistic Regression- Naïve-Bayes- SVM

H2O Modeling 과정및 Output

Data & Text Mining Analysis Contents

언어 분석

문장 분리

형태소 분석

어절 단위 구문 분석

개체명 인식

텍스트 마이닝

어휘 중요도 분석

연관어 분석

감성/속성 분석

이슈 군집 분석

DATA 마이닝

고객 분석

Risk 탐지

상품/서비스 반응 분석

마케팅 효과 분석

실시간결과제공 End User-UI Main 화면내용

EXTERNAL DATA INTERNAL DATA

음성인식음성인식학습

감성분석TextMining자연어처리

산업별 트렌드이벤트/리스트

키워드/연관어분석

지도학습비지도학습

Activate

Analyse

DataProcessing

Management 사용자사전 키워드 TEXONOMY HMD

리스크 관리고객 이탈방지 서비스개선 잠재 고객 발굴 신규 상품개발

PREDICTIVEROOT-CAUSEAUDIENCECONTEXT

COLLECT CONNECT

Voice(음성)

Social(SNS)

WebCrawling

Log(로그)

Structured Date(정형데이터)

EMOTION

빅데이터분석 > Keyword

Category ▼

업무유형

▪ 해지 처리

▪ 보상금 신청

▪ 계약

▪ …

고객 요구사항

▪ 없음

▪ RC교체

▪ 보험_대출

▪ 보험_계약

고객 불만사항

▪ 없음

▪ 불만

▪ 고불만

▪ …

선택한 부분만 화면에

표시됨 - 업무유형은

Default로 1개 이상

체크되어야 함

Period

2016.03.01 ~ 2016.03.07

화살표를 이동하여 기간

조정 가능

업무 유형

CategoryCalls Count

고객요구사항

고객불만사항

해지처리 ● 12 ● 7 ● 2

보상금신청 ● 2 ● 1 ● 1

계약 ● 1 ● 1 ● 1

해지 처리

30%

보험금 신청

24%

Count

12

Volume of the Callsfor the current selection업무유형 별 키워드 비율

업무유형 클릭 시키워드 수 표시

키워드 기준 업무유형 별 전체 Count, 업무유형별 고객요구사항, 업무유형별고객불만사항표시

문서리스트 차트 or Count 수를 클릭 했을 때 해당 문서리스트를 표시

# PID DID Date File 유형 Sentence

1 hli_data2 20160222 20000 11U^KGIQ07811369_CONV RC교체

여보세요. 네 여보세요. 네 고객님 여기 아까. 방금 전에 통화했던 한화 생명 김현정인데요. 네도 현진님되실까요. 네 네 고객님 다름이 아니고 고객님 아까. 외환 은행으로 약관 대출 이자 변경해드렸는데 네 부분 고객님 이십오일 날까. 구월달 이십오 일부터 이자 부분 출금이 되세요. 그러세 지금네 확인해 보니까. 고객님 아까. 가상 계좌 말씀해 주셨는데요. 네 약관대출은 고객님 그 가상 계좌가 있습니다. 우리 은행요. 네 네 예 알겠습니다. 고객님 근데 우리 은행 계좌 번호하구요. 금액도같이 문자로 좀 보내드릴까. 알겠습니다. 네 김현정었습니다. 늘 건강하세요.

2 hli_data2 20160222 20001 10UW$TK$10411368_CONV 자동이체 행복을 전하는 상담원 김은영입니다

3 hli_data2 20160222 20002 1-MQL2KA11311371_CONV 카드수납 행복을 전하는 상담원 아라입니다

4 hli_data2 20160222 20003 1-G$HH($09911370_CONV 서비스불만 고객과 함께 하는 상담원 조희주입니다

문서리스트를 클릭 했을 때 팝업 형태로 표시

고객 요구사항 / 불만사항

8

Volume of the Calls for the current selection업무유형 별 고객요구사항과 불만사항 표시 -업무유형 클릭 시 달라짐

고객요구사항 or 고객불만사항 Count

53

53

57 8

4 53

6 6 7

2

1

13

43

5

33

1

1 23

140104 140105 140106 140107 140108 140109 140110 140111 140112 140113 140114 140115 140116

고객요구사항 고객불만사항

빅데이터분석 > Solr검색

APACHE

Solr

QA효율화 > 이슈 Call 분석

Category

Period

2016.03.01 ~ 2016.03.07

기간 별 이슈 추이상담그룹

전체 ▼

▪ 1. 김상담

▪ 2. 이상담

▪ 3. 박상담

▪ 4. …

▪ 5. …

▪ 6. …

▪ 7. …

▪ 8. …

▪ 9. …

▪ 10. 유상담

▪ 11. …

▪ 12. …

상담원

김상담

53

53

57

8

45

3

6

140104 140105 140106 140107 140108 140109 140110 140111 140112 140113 140114

상담원 이슈 Call 빈도수 날짜 별/누적 Issue Score

140101 140102 140103 140104 140105 140106

선택 상담원 이슈 건수 누적 선택 상담원 이슈 건수

10

76

김상담 이상담 박상담

이슈건수: 10 / 녹취 수: 12상담원: 김상담 상담일: 2016-03-09

Cumulative Sum: 37:00상담일: 2016-03-09Day Sum: 15:00

상담원 TOP 목록 선택 상담원 이슈추이

140104 140105 140106 140107 140108 140109 140110 140111 140112 140113 140114

모든 상담원 이슈 평균 선택 상담원 이슈

● 이슈 ● 녹취

순위 상담그룹 상담원명 이슈건수 녹취수

1 그룹1 김상담 10 12

2 그룹2 이상담 8 10

3 그룹3 박상담 5 6

Insight Korea Big Data Solution

차별점

Solution 차별점

최신 머신러닝 분석툴

H2O 내장

자연어 검색엔진

Solr 내장

빅데이터 분석

인프라

실시간 음성인식 및

텍스트 분석

최고 성능

한국어 NLP

최고의 STT 인식률 음성 톤 분석 통합 강력한 탐지력을 가진 다

중탐지 사전

딥러닝 감성분석 및

분류 엔진

자동 사전보강

프로세스

1. 최고의 STT 인식률

현재까지 달성한 인식률 분석결과 도메인별 분리학습을 실시할 경우 평균 인식률이 음절단위 85%이상,

키워드 단위 95%이상 도달. DNN의 로직으로 볼 때 인식률의 한계선은 없으며 학습에 의해서 계속 개선.

인식

STT키워드기준

STT음절기준

舊버전

100시간 학습

新버전

100시간 학습

normal

新버전

100시간 학습

최고 기록

300시간

학습

77.3%

85%

현재시점

음절 최고기록

94.78%

평균

음절 인식률

90%이상

STT

新버전(DNN)

평균

키워드 인식률

95%이상

현재시점

키워드 최고기록

95%

2. 음성톤분석통합

Raw Data

(pcm)

Pitch 산정

위한

가공데이터

Spectrum

Analyzer

(저/중/고음)

Volume 최종판정

음성의 Volume / Pitch 분석 등을 추가해서 고정밀 감성분석 가능

Pitch & Volume Data by Time

중요 어휘도 기술

Hierarchical Multiple Dictionary (다중 탐지어 사전)

3. 강력한탐지력을가진다중탐지사전

다중 탐지어 사전(HMD)은 Text Analytics 엔진에 의해서 지원됩니다.

세부감성 분석 내용기반 자동 분류 기술+ +

i-VOC를 활용한 다중탐지어 구현

기존의 알고리즘 대비 높은 성능을 보이는 딥러닝 감성분석엔진과 분류엔진을 내장

4. 딥러닝감성분석및분류엔진

Data Set Model Accuracy

MobileTrain : 4543Test : 500

SVM (word feature) 85.58

RAE (word feature) + Word Embedding

87.57

CNN (relu, karnel3, hid50)+ Word embedding

(word feature)91.20

CNN (relu, karnel3, hid50) + Random init.

89.00

85

86

87

88

89

90

91

92

0 50 100 150 200

SVM Iatent SVM CNN(relu,k3) CNN(relu,k5)

데이터가 쌓일수록 정확해지는 딥러닝 & 탐지사전간 자동 사전 보강프로세스 내장됨

5. 자동사전보강프로세스

국민연급

국민연금 보험료 인상시기를 놓치면국채발행이라는 최후의 수단을 통해

연명할 수밖에 없다는 우려가제기됐다.

재해

일본 화산 폭발' '아소산 분화' 일본각지에서 자연재해가 잇따르고 있다.

원문

국민연금 보험료 인상시기를 놓치면국채발행이라는 최후의 수단을 통해

연명할 수밖에 없다는 우려가제기됐다.

일본 화산 폭발' '아소산 분화' 일본각지에서 자연재해가 잇따르고 있다.

딥러닝(Deep Learning)엔진

Output

Classifier

Input Data, Label

Feature Extractor

4. 학습 이미지 획득

재해

일본 기상청은 15일 이 분화가땅속의 마그마에 닿은 지하수 등이

수증기가 돼 폭발하는 '마그마수증기 폭발'일 가능성이 높다고

발표했다.

종합

사전방식과 기계학습 방식이

결합된

종합 분석결과

다중탐지어사전 (HMD)

L1 국민연금

국민연금$국채발행

인상@시기@놓치

국민연금 $ 보험료

어휘분류체계(Taxonomy)

L1 재해

국민연금

레저

L2 화산

부과방식

수상스포츠

폭발

고갈

한강홀릭

쇼핑 백화점 홈쇼핑 1.사전작업

2.사전기반탐지

6. 엔진 실행 결과 사전 반영

3. 딥러닝 학습

5. 분류엔진 실행

NLP는 한국어처리 핵심기술로서 한국어 처리를 위한 대용량의 분석 사전과 정확성 향상을 위한 기계학습 기반의 기술이 포함되어 있음.

6. 최고성능한국어 NLP(자연어처리)

제안 NLP 특장점

• 170여 분류의 개체명 인식 성능

제공(개체명 분류 관련 세계 최다

분류체계 구축)

• 각 단계에 걸쳐, 전처리/

후처리를 위한 각종 사전, 규칙

등이 적용 가능하여 신조어 등에

효과적으로 대응 가능

대한은행이 인터넷을 통해 중도금대출 서류 작성을 편리하게 할 수 있는 서비스를 마련했다. 복잡한 중도금대출을 온라인으로 신청·접수할 수 있는

중도금대출 온라인 신청 서비스를 시행한다고 25일 밝혔다.

수집 문서를 가장 작은 의미 단위인 형태소 단위로 분할

대한/nc+은행/nc+이/jc 인터넷/nc+을/jc 통하/pv+어/ec 중도금/nc 대출/nc 서류/nc 작성/nc+을/jc 편리/nc+하/xsm+게/ec

하/px+ㄹ/etm 수/nb 있/pa+는/etm 서비스/nc+를/jc 마련/nc+하/xsv+었/ep+다/ef

문장에 포함된 인물명, 기업명, 장소, 숫자 표현 등의 개체명(Named-entity) 인식

<<OGG_Economy:대한/nc+은행/nc>>+이/jc 인터넷/nc+을/jc 통하/pv+어/ec 중도금/nc 대출/nc 서류/nc 작성/nc+을/jc

편리/nc+하/xsm+게/ec 하/px+ㄹ/etm 수/nb 있/pa+는/etm 서비스/nc+를/jc 마련/nc+하/xsv+었/ep+다/ef

문장에서 주어, 목적어, 서술어 등의 수식 관계 문장구조 식별

((((((대한은행이/NP_SBJ 인터넷을/NP_OBJ 통해)/VP (((중도금/NP 대출)/NP 서류)/NP 작성을)/NP_OBJ 편리하게/VP_AJT

할)/VP_MOD 수)/NP_SBJ 있는)/VP_MOD 서비스를)/NP_OBJ 마련했다)/ROOT

수집 문서를 기계 학습에 기반한 문장 분리 모델을 통해 문장 단위로 분리

“대한은행이 인터넷을 통해 중도금대출 서류 작성을 편리하게 할 수 있는 서비스를 마련했다”

“복잡한 중도금대출을 온라인으로 신청·접수할 수 있는 중도금대출 온라인 신청 서비스를 시행한다고 25일

밝혔다”

01문장분리

02 형태소분석

03개체명인식

04구문분석

산업 도메인 및 고객 특성에 유연한 대처가 가능하도록 대용량 기본사전 및 사용자 사전을 제공

6. 최고성능한국어 NLP(자연어처리)

형태소 분석

사전

▪ 기본 사전 30만 어휘

▪ 기분석 사전(부분 어절에 대한 형태소 분석 결과를 미리 구축하고 다양한 복합 명사에 대한

복합어 분해 사전 포함) 160만 어휘

▪ 인명 및 기타 분석 사전으로 약 10만 어휘 구축

개체명 사전

▪ 15개 대분류: PERSON, STUDY_FIELD, THEORY, ARTIFACTS, ORGANIZATION, LOCATION, CIVILIZATION, DATE,

TIME, QUANTITY, EVENT, ANIMAL, PLANT, MATERIAL, TERM

▪ 170여 유형에서 약 360만 어휘에 대하여 개체 유형을 부착한 사전을 구축

이형태 인식

사전

▪ 축약형(건국대학교 -> 건대), 혼용형(국민학교 -> 초등학교), 약칭형(미래창조과학부 -> 미창부), 별칭형, 이동형, 생략형

등 다양한 이형태 표현에 대하여 원형 복원 사전을 통해 일관성 있는 어휘 관리를 지원함

▪ 약 8만 어휘에 대한 분석 사전 구축

7. 실시간음성인식및텍스트분석

실시간 STT 뿐만 아니라 실시간 TA까지 완벽히 지원됨

Real-Time STT-TA : 실시간 Text 전환, Keyword 분석,

패턴분석,감성분석 및 콜 분류와 요약

수집/분배서버

수집 분배

음성인식서버

STT

STT

STT

STT

TA 서버

NLP

키워드

패턴

감성분석

콜분류

요약

결과 처리∙분석서버

ImpalaSolr

Hadoop

Web/WAS Dashboard

실시간이슈Keyword

녹취파일

VOC 전사QA 평가상담요약분류

8. 빅데이터분석인프라비정형(음성/텍스트)과 정형 데이터, 내부와 외부 VOC를 아우르는 통합 플랫폼입니다.

내부

시스템

고객사 정형 DW

정형분석내부

데이터

I/F

외부

시스템

외부

데이터

I/F

STT/TA 영역

STT

음성인식결과

언어모델학습

음성모델학습

NLP

구문분석

개체명인식

형태소분석

문장분리

TM

감성 분석

내용기반자동분류

어휘중요도분석

연관어분석

Streaming 영역

Spark

정형

데이터

비정형

데이터

H

D

F

S

배치분석

H2O Prediction Engine

SDK/API

Rapids QueryR-engine

Nano FastScoring Engine

In-MemMap ReduceDistributedfork/join

Deep Learning

MemoryManagerColumnar

Compression

Clu

ster

Cla

ssify

Regre

ssio

nTre

es

Boost

ing

Fore

sts

Solv

ers

Gra

die

nts

Ensembles

Impala

R

실시간 분석

화사용자

9. System Infra & 자연어검색엔진 Solr 내장

10. 최신머신러닝분석알고리즘제공

통계적 분석

▪ 선형 모델 (GLM)

▪ Cox Proportional Hazards

▪ Naïve Bayes

앙상블

▪ Random Forest

▪ Distributed Trees

▪ GBM

▪ R 패키지

- Super Learner Ensembles

깊은 신경망

▪ Multi-layer Feed

-Forward Neural Network

▪ Auto Encoder

▪ Anomaly Detection

▪ Deep Features

군집화

▪ K-Means

차원 축소

▪ Principal Component Analysis

▪ Generalized Low Rank Models

해결사 & 최적화

▪ Generalized ADMM Solver

▪ L-BFGS (Quasi Newton Method)

▪ Ordinary Least-Square Solver

▪ Stochastic Gradient Descent

데이터 먼징

▪ Integrated R-Environment

▪ Slice, Log Transform

REVOLUTIONARY,

This word pretty much describes data analysis era in which we live.

Big data analysis is a do-or-die requirement for today’s businesses.

You will experience big insights that you have not seen through ‘Deep MininG’,

which is the big data service of Insight Korea.

We are much different from traditional marketing researchers or

data scientists who are based on statistics.

Our research-based data scientists can turn big data into real big insights!

You will get more than you expected from our big data service.

www.insightdeepmining.com