[giip] a.i. infrastructure advisor (인공지능 인프라 어드바이저)

60
http://giip.littleworld.net AI Infra System Advisor Global Infrastructure Information Platform

Upload: lowy-shin

Post on 09-Jan-2017

37 views

Category:

Technology


3 download

TRANSCRIPT

http://giip.littleworld.net

AI

Infra System Advisor

Global Infrastructure Information Platform

E-business Networks People Internet Another world

시장분석

시장분석

자체보유서버는줄고클라우드로서버사용량증가

인프라트렌드변화

Physical Machine

IDC Cloud

물리머신을직접구매해서자사전산실을구비해야해서시설

투자비의허들이높음

전문데이터센터가나오면서자체전산실을줄이고전문시설에

맡기면서서비스의안정성을높임

클라우드서비스시대가도래하여개인이쉽게서버를임대하여사용하여초기시설비용을줄임

모바일트래픽추이 글로벌 DCIM매출추이

시장분석

인프라수요급증

모바일기기사용량증가

인공지능/머시러닝리소스증가

동영상등의대용량트래픽증가IDC수요증가

DCIM : Data Center Infrastructure Management

쉽게도입이가능한클라우드및 IT 서비스증가로글로벌 IT인프라의수요가급증하고이에따른인프라운영의니즈가급증

시장분석

• 기업당 1시간장애로인한평균손실은약 6억원• 기업당연평균장애건수약 7회

서비스장애로인한피해규모

https://axcient.com/downtime-calculator/

시장분석 (구인난)

• 인프라전문가부족으로장애책임부담, 연중무휴단순작업으로인한기피

• 효율적인인프라설계가능자부재로빅데이터분석및효율적튜닝등의전문운영불가

• IT기술발전및대규모투자로신규비즈니스가확장되어인프라관리자수요폭증

인스톨 배포

감시

장애대응

점검 장애분석

튜닝

보고

인프라관리자수요에비해공급이턱없이부족

데이터센터구인 NHN 전용데이터센터 ‘각’

시장분석(구인난)

구인난

비용효율화를위해지방에 IDC를건설, 인프라인력수요는급증하나운영인력부족현상

시장분석(솔루션)

대부분의솔루션은한가지기능에만집중되어 SE의업무는여전히줄어들지않음

인스톨배포

감시

장애대응

점검 장애분석

튜닝

보고

솔루션의한계

E-business Networks People Internet Another world

개요

개요

AI 가머신러닝을통해서버시스템의운영을어드바이스하고,

자동으로운영을대행하는서비스

Our goal

- Machine Learning을통해서버장애를사전예측하여해결방안을미리제안- Logistic Regression Algorithm을통한장애시점및장애이전시계열데이터를학습하여

학습된데이터의이전전조증상을자동으로찾는기술구현- 스스로생각하는자동운영으로무인데이터센터의구현

giip System Advisor

- 서버를 giip에등록하기만하면..

- AI 가스스로용도를판단하여관리자에게모니터링항목및튜닝제안, 백업등운영제안- 관리자는원클릭으로각종모니터링항목등록및변경, 튜닝을위한설정변경, 백업을자동으로처리함

서버관리자의메리트- giip를이용하면 advisor가새로운기술에대한제안및정보제공을하여엔지니어가같이학습하면서성장하며기업맞춤형 Knowledge base를축적할수있음

Definition

개요

All works of SE

서버를등록하면 giip AI가제안하고유저의판단에따라운영작업을진행

운영자동화

설치 배포 감시장애

대응튜닝

수시

체크

관리자자동화

· ·Cloud

ServerOversea

Servers

Virtual

Server

Legacy

Server

백업운영

PA NSA API

ML CQE MQE

비정형로그 통계 KB

A.I. 스스로생각하는자동운영

• 설치,배포,감시,운영,백업,장애대응,

튜닝,수시체크등운영업무를스크립트기반으로자동화함

• 서버를연결하면 PA(Process Analyzer)와NSA(Network Status Analyzer)가프로세스및통신을분석하여자동으로용도파악및사용량파악, 튜닝제안

• ML(Machine Learning)을이용하여장애패턴학습및서버튜닝학습

• CQE(Command Queue Engine)으로관리자의운영작업/장애대응자동화및작업이력, 작업내역자동저장, 이상시Rollback가능

• MQE(Message Queue Engine)으로서버상태이상및장애대응내역, ML로학습한장애예휴판단시알람제공

• Couchbase NoSQL을이용한비정형데이터저장(미국 CIA채용, AWS채용, IBM

Cloudant기반기술)

• ML로학습된 KB를기반으로주기적인리스크권고및대응안제시

• 16000대서버로온라인게임서비스중인일본 G게임사의2000대의서버포함누적 4000대이상, 동시 2500대이상의자동운영경험

Architecture

개요

System

Engineer

SP own Service

Custom

Dashboard

Op

en

AP

I

CQE

(Command Queue

Engine)

MQE

(Message Queue

Engine)

Op

en

AP

ITMF

(Trigger Management

Function)

MSF

(Message Sender

Function)

ASR

(Automation Script

Repository)

SCHD

(Scheduler)

RD

B

LogD

B

DCUB

E

DSF

AMF

(Authentication Mapper

Function)

SM

TP

RMF

(Resource Management

Function)

LGF

(Log Gathering Function)

Se

rvic

e M

ark

et P

lac

e

GLB Service

CDN Service

Forensic Service

Infra. Service

Ba

sic

GU

I

MLE

(Machine Learning

Engine)

3rd Party Solution

개요

Cloud

Hosting

Bro

ke

rag

e

Se

rvic

e

Sin

gle

Ve

nd

or

Positioning

On Premise Edition

SaaS

Positioning - Prediction & AI

Infrastructure

Virtualization

Analysis

Automation

Monitoring

Deployment

Prediction & AI

개요

개요

Service

GLB

WS

WAS

Image

Server

DB

DNS

CDN

Edge

Device

1

2

3

4

5

6

7

8

91

0

1

11

2

1

3

1

4

URL 체크페이지로딩타임체크브로큰이미지 체크

Ping 체크Process 체크

서비스반응체크디스크체크

CPU 사용율체크메모리점유율체크네트워크사용량체크

Slow Query 체크Lock Query 체크

Service Flow & GIIP Check Point

고객인프라

고객사이드체크

시스템사이드체크

DBMS등어플리케이션퍼포먼스체크

개요

주요공략업종

❑새로운기술및패러다임변경은엔지니어의신기술학습및작업부담이가중됨

❑엔지니어가신기술을잘사용할수있는어드바이저필요

Key

Findings

분야 기회 타겟사례

게임

교육

SMB

대기업

쇼핑몰

▪잦은서비스의추가및종료로 SE의업무부담큼▪다양한외부서비스및업체의연동으로관리포인트증가

▪시스템노후화및입시철특수등의폭주대응미비▪이러닝시스템도입후전문관리필요

▪비용절감(인프라,S/W)

▪ Active DR 및 Cloud DR등으로 DR 패러다임전환

▪지속적으로증가하는스타트업기업의수요 (2016년약 3만개)

▪빠른확장및글로벌화가용이

▪워게이밍넷▪라이브플렉스

▪ EBS

▪파고다어학원

▪동부화재▪엘지유플러스

▪우먼스톡▪ hotdeallink (해외직구채널링)

▪ P2P 기업▪스마트포캐스트

▪직구/역직구시장확대로글로벌화가속▪쇼핑몰의채널다각화로복잡한연계서비스증가

공공▪빅데이터, 머신러닝등으로대용량자료보관이슈

▪모바일서비스로공공지원서비스이용자급증▪한국고용정보원▪ NIPA, KISA

새로운트렌드및신기술이도입되면서인프라담당자들에게요구되는기술력과업무량이늘어해당분야에도입기회가증가

E-business Networks People Internet Another world

경쟁력

대규모시스템 소규모시스템(SMB)

경쟁력

비용절감효과

IT 인프라운영비용최소화및 TCO 절감

As-Is To-be

5,843만원/월 110만원/월

98%

As-Is To-be

25,658만원/월 5,500만원/월

80%

인프라비용

운영솔루션

인건비

인프라비용

운영솔루션

인건비

인프라비용

운영솔루션

인건비

인프라비용

운영솔루션

인건비

기존방식 giip

경쟁력

인프라비용의절감

giip의 AI 어드바이저가고객상황에적합한인프라서비스를제안하고쉽게경쟁력있는인프라서비스로이동할수있으며단일 UI에서추가노력없이운영이가능하여비용절감및변경된UI등의학습시간을절약

IaaS

+

Analytics

IaaS

+

DBaaS

IaaS

+

SNS + WPM

IaaS

+

SNS + WPM

IaaS

+

Analytics

Management Advise

서비스구분 서비스내역 SE 클라우드서비스 고급형 비고

고정비용 기본가격(천원/대) * 1000대기준 35,000 17,500 250,000 50,000 인건비

이력관리 기술지원이력관리 417 외부솔루션구입필요 0 0 ITSM

모니터링기본모니터링(CPU/Memory/Disk/Process) 1,167 O 0 0 NMS 솔루션

URL모니터링 12,500 AWS(추가비용) 0 0 URL모니터링솔루션

로그, 이벤트모니터링 8,333

AWS, Azure, GCE 외다수(추가비용발생) 0 0 로그분석솔루션

24시간감시 80,000

AWS SNS등유료부가서비스 0 0 SE 16명 24시간

OS운영 OS 기본운영(설치, 패치) 0 초기 VM생성시 OS설치만 0 0 SE

파일백업및리스토어관리 4,167

이미지백업으로지원(추가비용발생) 0 0 backup solution

웹서버운영웹서버기본운영(구축및설정변경등) 0 고객이직접해결 0 0 SE

웹서버이중화 30,000

AWS, Azure, GCE등메이저

클라우드 (추가비용및유저가직접작업) 30,000 5,000 LB 임대, giip는 GLB

웹서버튜닝 20,000 외부솔루션구입필요 0 0 SE 전문가비용

DB서버운영DB 기본운영(설치, 백업, 리스토어, 패치등) 0 서비스로설치만지원 0 0 SE

DB 최적화튜닝 60,000 외부솔루션구입필요 0 0 DB 전문가비용

DB 이중화 0 O 0 0 DB 전문가비용포함

웹방화벽 웹방화벽설치및운영 5,000 외부솔루션구입필요 0 0 솔루션

합계 256,583 105,117 280,000 55,000

경쟁력

솔루션및인력비용절감

giip는현재비용의 20% 이하로최고수준의인프라서비스를지원

단위 : 천원, - : 미지원, 0또는숫자 : 지원및금액(0인경우다른금액에포함된것임)

대규모조정

서비스구분 서비스내역 SE 클라우드서비스 외주운영 비고

고정비용 인건비등기본비용 (천원/대) * 20대기준 3,500 3,500 5,000 1,000 인건비

이력관리 기술지원이력관리 417 외부솔루션구입필요 0 0 ITSM

모니터링 기본모니터링(CPU/Memory/Disk/Process) 583 O 0 0 NMS 솔루션

URL모니터링 250 AWS(추가비용) 0 0

URL모니터링솔루션

로그, 이벤트모니터링 4,167

AWS, Azure, GCE 외다수(추가비용발생) 0 0 로그분석솔루션

24시간감시 40,000

AWS SNS등유료부가서비스 0 0 SE 8명 24시간

OS운영 OS 기본운영(설치, 패치) 0 초기 VM생성시 OS설치만 0 0 SE

파일백업및리스토어관리 417

이미지백업으로지원(추가비용발생) 0 0 backup solution

웹서버운영 웹서버기본운영(구축및설정변경등) 0 고객이직접해결 0 0 SE

웹서버이중화 600

AWS, Azure, GCE등메이저클라우드 (추가비용및유저가직접작업) 600 100 LB 임대, giip는 GLB

웹서버튜닝 2,000 외부솔루션구입필요 0 0 SE 전문가비용

DB서버운영DB 기본운영(설치, 백업, 리스토어, 패치등) 0 서비스로설치만지원 0 0 SE

DB 최적화튜닝 6,000 외부솔루션구입필요 0 0 DB 전문가비용

DB 이중화 0 O 0 0

DB 전문가비용포함

웹방화벽 웹방화벽설치및운영 500 외부솔루션구입필요 0 0 솔루션

합계 58,433 14,617 5,600 1,100

경쟁력

Many solutions vs. outsourcing vs. giip

직접운영하기에부담이큰 SMB 마켓에서의타사와의 80%이상의 비용경쟁력확보

단위 : 천원, - : 미지원, 0또는숫자 : 지원및금액(0인경우다른금액에포함된것임)

경쟁력

다른애들이못따라올핵심기능만나열

● Simple Management

○ 관리자의작업을최소한으로할수있는획기적인어드바이저설계

● Free Customizable UI/UX

○ RESTful OpenAPI로자유롭게대시보드제작이가능

● Script Market Place

○ 유저의운영 Script를판매할수있는신개념 market place제공

● Own Knowledge Base

○ 초급엔지니어로도고품질의운영퀄리티제공및엔지니어의성장기회제공

● Real Machine Learning

○ Logistic Regression Method를활용, AWS ML 및 Spark 등연동가능한시스템운영학습

기술

기술경쟁력

E-business Networks People Internet Another world

실적

On-premise & SaaS reference

시스템관리및네트워크기기관리를메인으로운영자동화 제공

실적

전 세계 120개국에 판매된 도어폰 및 기타 제품들의 글로벌 IoT연동 플랫폼의

설계및컨설팅, 자동화솔루션도입, GLB로모듈서버의로드밸런싱

4개의 인프라 관리 툴을 통합한 통합 관리 툴의 제공 및 기존 툴로는 감지가

매우어려운장애상황에서도대응가능한서비스제공

다양한환경의온라인게임인프라관리용으로서비스제공

로보어드바이저 서비스 업체인 S사에서는개발자가 시스템을 운영하면서 신규 개발 및장애대응을 모두 하면서업무효율하락

운영토털서비스

실적

WEB

WEB

DBMS

System

Manager

MQE 메시지를 보고고객이직접소스수정

선택이필요한내용의전달및

추천

MQE

•시스템자원정보수집• JOB 프로세스감시• Server Farm 단위 JOB LB

•시스템로그모니터링•데이터표준화(JSON)

CQE

• DNS 설정•서버추가/삭제/운영•시스템설정변경•백업스케쥴링•자동운영

WEB

WEB

DBMS

• 시스템운영경험이낮아도높은수준의시스템운영가능

• 서비스가늘어도추가노력없이추가가능

• 자동튜닝및개선제안으로시스템의효율적인사용

개선효과

페이지 로딩이 느린 이슈가 있는 이커머스 업체인 W사는 자체적으로 해결하지 못하여 빈번한 서비스 정지 및성능저하이슈발생

DBMS Tuning

실적

MQE

• WEB 서버 Connection Status

확인• WAS Thread count 확인• DBMS Lock, slow query 확인

WEB

WEB

DBMSSystem

Manager

MQE 메시지를 보고고객이직접소스수정

평균반응속도 1초, 최대 11초 평균반응속도 0.14초, 최대 4초

Mail로병목 Query

전달

• 지속적인 DBMS 병목현상감시로성능저하요소를찾아해결방안제공

• DBMS 이슈시발생하는다양한서버간의상태정보를고객에게알려소스수정포인트알림

개선효과

머신러닝, 비트코인, 고속 렌더링등의 수요가 늘고 있는 GPU Farm을 만들어 고객에게 서비스하는데 인프라의

관리에서부터 JOB관리까지 giip에서제공

GPU 렌더링팜서비스

실적

MQE

•시스템자원정보수집• JOB 프로세스감시• Server Farm 단위 JOB LB

•시스템로그모니터링•데이터표준화(JSON)

GP

U

Se

rve

r

Radeon rx 480

Radeon rx 480

GP

U

Se

rve

r

Radeon rx 480

Radeon rx 480

GP

U

Se

rve

r

Radeon rx 480

Radeon rx 480

Tablet

pc

Laptop

Smart

phone

CQE

• Server Farm 단위 JOB LB

•장애시자동복구•신규시스템자동설정•백업스케쥴링•자동운영

Service

Provider

Control UI

Billing UI

Statistics UI

• 고객은 UI만개발함으로서 GPU Cloud Service를제공할수있어빠른최신기술의서비스런칭이가능

• 서비스에필요한모든 Measuring data 및 Control 을 giip엔진에서 제공으로개발공수절감

• JOB 제어및분산, 서버당 GPU 상태정보취득등 giip만의고유한기능제공으로타사대비경쟁력확보

개선효과

시스템 구입시 번들로 딸려오거나 시스템 증설시 라이선스 이슈로 구매하지 못하는 등 인프라 증설에 따른

관리툴및관리포인트가늘고복잡해지는상황을개선

시스템통합감시

실적

MQE

•시스템자원정보수집•상이한관리툴의통합모니터링•마우스액션등 시나리오모니터링•시스템로그모니터링•데이터표준화(JSON)

Server

Server

Server

Tablet

pc

Laptop

Smart

phone

CQE

•통합명령•장애시자동대응•다른환경의신규서버통합설정•백업스케쥴링•자동운영

End User

Dashboard

Control UI

Statistics UI

• 고객은 UI만개발함으로서다양한환경의인프라관리시스템탄생

• 기존관리툴에서취하는액션의자동화처리

• 서버접속시간절감및운영작업시간절감으로 TCO 절감효과

개선효과

Server

글로벌서비스를 위해 소스의 배포 및 데이터의 싱크에 표준 CDN 기술을 활용하여 배포 자동화 및 배포 관리를

giip에서제공하여간단히배포시스템을구축

배포자동화

실적

MQE

•전세계클라우드/레거시 서버상태통합관리•유저환경에서 배포자동확인•시스템로그모니터링•데이터표준화(JSON)

Origin

Server

Edge

Server

Tablet

pc

Laptop

Smart

phone

CQE

• CDN기술을 활용한파일전송•전세계클라우드/레거시 서버지원•전송실패알림및재전송지원•스케쥴전송및수동전송지원

• 고객은 UI만개발함으로서배포시스템구축

• 배포에필요한파일업로드및배포자동화, 스케쥴관리및재배포등필요한기능을쉽게적용

• 전세계의다양한환경의서버를통합관리및배포관리

개선효과

Edge

Server

Edge

Server

End User

Dashboard

Control UI

Statistics UI

글로벌 IoT 통합관리

실적

홈오토시스템업체인 C사의전세계 120개국에있는수만대의다양한물리/클라우드환경의 IoT 장비및관리서버를중앙에서제어

하드웨어폴트시자동으로그나라의 A/S담당자에게 통지

국내 IoT 서버

해외 IoT 서버

클라우드 IoT 서버

국내관리서버

지역담당엔지니어 중앙관리자

NMS 자동화

다양한서비스를 하고 있는 D사에서는 각서비스별다른 NMS를사용하고있고, 특정 NMS는장비 추가시설정

비용이별도로들어운영비용이슈및여러화면으로관리해야하는문제발생

실적

giip 도입으로 NMS에서 제공하는 정보를 API로 취득하거나 직접 SNMP를 통해 정보를 취득하고 장비 추가시

간단한설정추가만으로쉽게통합관리가가능

실적

장애추적시스템

Customer

System

Manager

Web

Server

Service

WAS

DB

MQE

• Login Test

• Page Response Check

• Payment Test

• Community Text Crawling

• Process

• Latency

• Connections

• Network

• IO

• Memory

• DB Lock

• Wait_Time

• Thread Count

• IO Latch

CQE

Command

Repository

Web

Server

Service

WAS

DB

Fault

Report Form

Repository

Scenario monitoringAutomatic Incident

ProcessingReport &

Machine Learning

Machine

Learning

MQE

Update exp. Knowledge

Base

Trigger

Repository

• giip 가스스로원인을찾아서고객에게알려주고대응도처리하여장애대응속도향상

개선효과

운영으로솔루션구매 2년마다약 40억, 운영인건비 2억/월을소비하지만, 연평균 200회장애발생으로서비스정지및브랜드가치하락

E-business Networks People Internet Another world

파트너

On-premise & SaaS reference

파트너

E-business Networks People Internet Another world

기능

Basic Feature

기능

❑엔지니어가필요로하는모든정보취득

❑엔지니어의업무에필요한모든액션및리포팅자동화

Key

Findings

IT Asset Management Action

❑ Basic server information

❑ IP usage

❑ Disk usage

❑ Domain

❑ Resource usage

❑ Custom server information

❑ Send command

❑ Send Script

❑ Triggering

❑ Monitoring

❑ Gather system message

❑ Gather custom message

Messaging

❑ Send Notification

❑ Using Mail, MMS

❑ Support send to RESTful

API

❑ Send custom message

❑ Send log message

기능

No security changes

뛰어난접근성

보안설정변경없이쉽게구축가능- 필요한포트는 OS update용 outbound 80포트만있으면모든처리가능

기능

Gather all system information for bigdata analyze

통합 UI의중앙시스템관리

서버접속없이대규모서버의감시, 운영가능모든서버액션을중앙에서처리중앙로깅으로전체적인장애원인분석가능커스텀어플리케이션및모바일디바이스, 앱의로그까지저장및분석가능

기능

Manage hybrid infrastructure

하이브리드클라우드관리

클라우드뿐만아니라물리서버까지포괄적인운영하이브리드클라우드아키텍쳐를기반으로한통합솔루션관리프라이빗클라우드및하이브리드클라우드의관리툴개발지원

See and go as human

기능

❑사람의액션을최소화

❑모니터링데이터로인사이트획득및예측

Key

Findings

시나리오모니터링 액션로그모니터링

❑ 웹서비스로그인테스트

❑ 결제테스트

❑ 앱기동/액션테스트

❑ 유저와같은환경

❑ 액션결과스크린샷

❑ 액션결과에따른반응

❑ RESTful API를이용한로그

❑ 고객니즈에따라가변필드지원 (JSON)

❑ 로깅데이터그래프지원

❑ 로깅데이터의이벤트감지

❑ 비정형데이터저장

빅데이터분석

❑ 로깅데이터의통계분석

❑ NoSQL을이용한방대한데이터처리

❑ 비정형데이터분석처리

E-business Networks People Internet Another world

Roadmap

Roadmap

Our goal is platform for SE

• ITAM Function expand

• Domain management expand

• Dashboard

• Xen auto install

• CDN Automation (3rd party)

• GLB Automation (3rd party)

• Server forensic service(3rd party)

• Openstack API Support

• Public Cloud Service API Support

• Docker Management

• CHEF Management

• Big-data System Log Analytics (3rd party)

• Script Market Place

• Chinese Version

• giip Log Analytics (Machine Learning)

• giip Advertisement Platform

• Global Support Center

• IT Service Market Place

• Global Infra. Market Place

• Solution Market Place

• Expand Global Channel

Analysis Prediction Ecosystem

2016 2017 2018 2019

E-business Networks People Internet Another world

운영

운영

Concept - Reduce work for SE

서버에 Agent를 설치하면모든준비는끝

System

Manager

Agent Install

Server

Concept - Just follow virtual system advisor

주기적으로 Virtual system advisor가 해주는어드바이스를 참고로원클릭으로모니터링, 튜닝, 관리, 장애대응가능

System

Manager

Mail from virtual system advisor

Server

Monitoring Advise

Tuning Advise

Maintenance Advise

One-click

Implementation

Gather system informationKnowledge

Base

운영

운영

시나리오

유저와 giip A.I. 와의메일인터랙션으로인한쉬운운영

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

로그인

Google 로그인(On-premise Edition은독립 Login 지원)

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

로그인

로그인후아무것도설정되지않은상태

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

안내메일수령

서버등록매뉴얼이담긴안내메일자동발송

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

서버등록

메일의 URL을클릭하면 github에있는서버등록매뉴얼로이동

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

서버등록

github 매뉴얼을따라서버등록 (소요시간 1분)

서버등록직후에는아무정보도없음

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

추가안내메일수령

서버를등록한뒤, 시간이지나면추천 JOB을메일로안내

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

자동체크추가

이메일의 URL을클릭하면모니터항목을자동으로추가

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

시스템어드바이스메일수령

수집된정보를기반으로다양한어드바이스메일이자동으로도착

모니터링상태중이상징후알림

추가모니터링항목추천

수집정보를기반으로보안/튜닝/백업등의어드바이스를진행

giip A.I.

서버등록안내

서버감시안내

User Action

Google Login

서버등록

서버감시등록

추가수집안내

추가수집등록

운영어드바이스

조언에따른액션

Machine

Learning

운영

지속적인장애대응및튜닝

메일어드바이스를기준으로스스로선택하여운영및튜닝지원

시스템관리자를도와주는전문인공지능엔지니어

Customer

System

Manager

Web

Server

Service

WAS

DB

MQE

Login Test

Page Response Check

Payment Test

Community Text Crawling

Process

Latency

Connections

Network

IO

Memory

DB Lock

Wait_Time

Thread Count

IO Latch

CQE

Command

Repository

Web

Server

Service

WAS

DB

Fault

Report

Form

Repository

Scenario monitoring

Automatic IncidentProcessing

Report & Machine Learning

Machine

Learning

MQE

Update exp. Knowledge

Base

Trigger

Repository

56

Internet

Auth01~02 WAS01~02

API 01~N

Collector

RDBMS 01~02

NoSQL 01~N

GLB01 GLB02

Architecture - All works of SE

글로벌서비스를위한지역분산및 Scale out형확장구조

운영

Physical Servers

Cloud Servers

E-business Networks People Internet Another world

활용

DR(Disaster Recovery) 구성

타 센터가 단순 DR을 위한 스탠바이가 아닌 DR의 자원을 부하분산 및 재난 관리까지 가능한

구성으로 제공이 가능하며, Bittorrent Sync 와 연동하여 서비스를 구성하거나 고객이 보유하고

있는 BCP 솔루션의검증및이중감시용으로 활용

활용

S5000(Active)

Active-Active 구성

자사서버 클라우드서버자사서버 클라우드서버

S5000(Stand-by)

Active-Active 구성

동기화된파일의더블체크

서버의상태체크및관리

다양한환경에서의

파일동기화

Internet

RC(Root Cause) 분석

다양한 고객 환경에서 장애 등 이슈가 발생했을 때 시스템, 네트워크, 어플리케이션 전반에 걸친

시간축기반의데이터수집을이용하여문제발생원인파악에도움을주는용도로활용

Analytics모든레이어의값을상황별

시간값을수집

고객의모든상황분석자료를

취합후, 빅데이터분석으로

문제원인분석

Internet

Server

OS

Network

Exchange + Domino

Server

OS

Network

Verse + Domino

활용

giip 서비스이용으로수집되는시스템운영정보를기반으로시스템이슈를예측하여빅데이터

분석으로장해예측서비스(SFPS, System Fault Prediction Service) 제공

시스템장애 예측서비스 (2017.1Q 예정)

• 다양한장해패턴정보 KB 공유

• 벤더의공식대응 KB를장해발생시

실시간공유

• 사용자의상황에알맞은벤더매칭

• ML로장해이전시점의공통점

학습및예측

ML 처리(Machine Learning)

• 서버의장해패턴데이터수집

• 서버간데이터상관관계수집

• 어플리케이션정보수집

• 다양한시스템외의정보수집

활용