비즈니스인텔리전스 -...

63
비즈니스 인텔리전스 2016.06 충북대학교 조완섭 [email protected]

Upload: others

Post on 23-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 비즈니스 인텔리전스

    2016.06

    충북대학교 조완섭[email protected]

  • 목차

    • 정보시스템

    • 분석처리 시스템

    • 비즈니스 인텔리전스

    • DW & OLAP

    • BI 구축방안

    2016-09-30 충북대학교 ([email protected]) 2

  • 정보시스템

    • 정보시스템 History

    2016-09-30 충북대학교 ([email protected]) 3

    Master files, reports

    Lots of master files – complex anddata redundancy

    Databases – single sources of datafor all processing (data sharing/integrity)

    Databases & High performanceTransaction Systems & 4GLERP System

    Internet-based IntegrationDB서버 / Web서버 /응용서버분리Business Intelligence(Data Warehouse & OLAP)

    인터넷

    1960

    1965

    1970

    1975~

    1990~ BigDataBigData

    Advanced Databases

    2010

  • 정보시스템

    • 거래처리 시스템(OLTP)과 분석처리 시스템(OLAP)으로 구분

    • 최근들어 다양한 기업정보 시스템에 빅데이터를 수용하여 확장하는 문제가 중요한 이슈로 부각 => 특히 분석처리를 담당하는 BI 부문 확장

    2016-09-30 충북대학교 ([email protected]) 4

    충북대학교 기업정보화지원센터

    ERP(생산/회계/ 인사/판매 등)

    SCM(기업간 거래정보시스템)

    CRM(고객관계관리 시스템)

    비즈니스 인텔리전스고객

    협력사

    통합 DB

    거래처리시스템

    분석처리시스템

    Big Data

    Big Data Big Data

  • 거래처리 시스템

    • 거래처리 시스템의 발전 : 통합DB 기반의 ERP

    2016-09-30 충북대학교 ([email protected]) 5

    통합 DB

    ERP(생산/회계/ 인사/판매 등)

    SCM(기업간 거래자동화 시스템)

    CRM(고객관계관리

    시스템)

    SEM (BI)(지능형 전략정보시스템)

    ERP기반 전사적 자원관리

    생산재무회계판매인사…BI

    SCM

    CRM

    협력사 고객

    수많은 애플리케이션들이 개별적으로 개발운영⇒ 상호 연계처리가 어려움⇒ IT가 비즈니스의 발목을 잡는 현상이 심화됨

    DB 중복 문제 심각⇒ 동일한 데이터를 여러 시스템에 여러 번 입력⇒ 정확한 데이터를 실시간으로 활용하는 것이 불가능

    기존 시스템을 고쳐서 해결하는 것은 불가능⇒ Global ERP 도입으로 단번에 best practice 실현

    검증된 시스템을 도입한 후 교육을 통해임직원들의 일하는 방식을 upgrade 하자.

    Point-Solution

  • 거래처리 시스템 - ERP

    2016-09-30 충북대학교 ([email protected]) 6

  • 분석처리 시스템 (Business Intelligence)

    • 필요성

    – 데이터는 넘치나 의사결정에 필요한 정보는 부재한 상태를 극복하기 위해 분석시스템 구축이 필수

    – 전사적 통합/요약된 정보를 찾거나 장기간 추세파악이 중요함

    – 특히 외부데이터는 물론 빅데이터까지 수집, 저장, 분석해야 함

    – 궁극적으로 데이터 분석 기반의 과학적인 의사결정 정착

    • 분석처리 시스템 관련 기술의 발전– Databases, ERP 시스템 급속한 확산

    => 이질적 데이터베이스의 통합관리 기술

    – 통합된 데이터의 고도 분석을 통한 정보발견과 예측 요구증대⇒Database Integration, ETL 기술

    ⇒DW & OLAP, Data mining, ... (Business Intelligence) 기술

    2016-09-30 충북대학교 ([email protected]) 7

  • 분석처리 시스템 (BI)

    • Business Intelligence– [가트너] 비즈니스 인텔리전스는 조직의 의사결정과 성능을 개선하기 위한 정보를 수집하고, 이를 분석하기 위한 응용, 인프라, 도구, 베스트 프랙티스를 모두 포함하는 개념이다 (an umbrella term that includes the applications, infrastructure andtools, and best practices that enable access to and analysis ofinformation to improve and optimize decisions and performance.).

    – [위키피디어] 비즈니스 인텔리전스는 조직 내부 혹은 외부의 원시 정보를 수집하고 비즈니스 분석을 위해 유용한 정보로 변환하는 기술과 도구들의 집합이다 (a set of techniques and tools for the acquisition and transformation ofraw data into meaningful and useful information for business analysispurposes).

    – 비즈니스 인텔리전스는 조직의 운영에서 전략에 이르는 광범위한 비즈니스 의사결정을 지원함

    2016-09-30 8충북대학교 ([email protected])

  • • BI의 필요성– 현대의 조직들은 정보화로 인해 데이터는 넘치지만 최고경영자의 의사결정을 지원하는 데는 부족함

    – 최고 경영자의 의사결정에는 조직 내부와 외부에 산재해 있는과거부터 현재까지의 데이터를 모두 수집하고, 통합하고, 분석하는 경우가 많음

    2016-09-30 충북대학교 ([email protected]) 9

    거래처리Databases 의사결정용

    Databases

    직원 임원주문대출

    의사결정전략수립

    거래처리Databases거래처리Databases

    비즈니스 인텔리전스

    분석처리 시스템 (BI)

  • 분석처리 시스템 (BI)

    • Data Warehouse 란 ?

    – Collection of diverse data aimed at executive, decision maker

    subject oriented

    often a copy of operational data

    with value-added data (e.g., summaries, history)

    Integrated, historical, and non-volatile data

    – Collection of tools gathering data

    cleansing, integrating, ...

    querying, reporting, analysis

    data mining

    monitoring, administering warehouse

    2016-09-30 CBU / MIS 10

  • 분석처리 시스템 (BI)

    • Two approaches in the analysis

    – Query-Driven (Lazy) ; Limitation !

    – Data Warehouse (Eager)

    2016-09-30 CBU / MIS 11

    Source Source….SourceSource

    SourceSource

    Query-driven ?or

    Data warehouse ?

  • 분석처리 시스템 (BI)

    • Query-Driven Approache

    2016-09-30 CBU / MIS 12

    Limitation- Historical data ?- Overhead in the OLTP systems

    Client Client

    Wrapper Wrapper Wrapper

    Mediator

    Source Source Source

    Query &Results &Analysis

    OLTP

    OLAP

    OLTP

  • 분석처리 시스템 (BI)

    • Adv. Of Query-Driven

    – No need to copy data

    – Less storage

    – No need to purchase data

    – More up-to-date data

    – Query needs can be unknown (ad-hoc queries)

    – Only query interface needed at sources

    2016-09-30 CBU / MIS 13

  • 분석처리 시스템 (BI)

    • Data Warehouse Approach

    2016-09-30 CBU / MIS 14

    Client Client

    Warehouse

    Source Source Source

    Query & Analysis

    Integration

    MetadataExtractionTransformationCleansingLoading

    OLAP & Data Mining

  • 분석처리 시스템 (BI)

    • Adv. Of DW Approach

    – High query performance (specialized indexes)

    – Queries not visible outside warehouse

    – Local processing at sources (OLTP) unaffected

    – Can operate when sources unavailable

    – Can query data not stored in a DBMS (queries on the integrated database)

    – Extra information at warehouse

    – Summarize (store aggregates)

    – Add historical information

    – Sufficient meta data

    2016-09-30 CBU / MIS 15

  • • ERP와 BI의 비교

    – ERP는 조직내 업무 정보화 측면에서 효과가 있으나 전략적 의사결정이나 성과 향상 측면에서는 회의적임 => BI 동기

    – ERP는 기업 내부 업무 효율성 증진을 위해 정보통합과 거래처리 효율성 증대를 추구; BI는 분석을 통한 의사결정 지원이 목표

    2012-11-00 16

    항목 ERP BI

    정의전사적 프로세스 통합프로세스 혁신운영계 시스템으로 현업지원

    전사적 데이터 통합데이터 혁신 (정제, 통합, 분석)의사결정 지원

    사용자 지원측면

    업무 트랜잭션 처리 시스템통합된 기능지원일부 리포팅 기능 내재(현황위주 단순정보제공)현재 데이터 활용중심

    트랜잭션의 결과분석 시스템통합되고 정제된 데이터 활용수많은 리포팅 기능 (다차원분석)과거에서 현재까지 시계열성 데이터 분석

    데이터 분석측면

    운영계 데이터 활용 중심OLTP 에서 제한된 분석정보 제공

    전사적 데이터 통합과 분석내부 뿐 아니라 외부 데이터까지 활용목적별로 마트 구축기업환경 변화에 유연한 대처

    분석처리 시스템 (BI)

  • • 본 강좌에서는 BI 용어를 BA까지 포함한 것으로 확대사용

    2016-09-30 충북대학교 ([email protected]) 17

    기존 DW & OLAP 분석 (BI) 빅데이터 분석 (BA)

    분석대상 주로 과거데이터를 분석하여 현황을 분석하는 정적 보고서 작성

    과거와 현재 데이터를 실시간 수집하여새로운 정보를 발견하고, 가까운 미래를예측함

    데이터특성

    정형 데이터 위주의 적은 데이터를 기존 컴퓨터에서 저장, 처리

    다양한 유형의 데이터 (문서, SNS, IoT, 오디오, 동영상 등)를 클라우드 등에 분산저장, 분산처리함

    분석특성

    온라인, 다차원 분석위주 데이터마이닝, 통계기법, 기계학습 등 심화분석과 가시화 중요

    분석의 예 과거 수년간 매출정보를 분석하여 지역, 시간, 제품, 고객별로 매출을 집계함 (다차원 분석)

    현재 실시간으로 발생하는 데이터를 바로수집, 연계통합, 분석함으로써 미래 예측- 대형사고가 터지기 전에 30개의 작은 사고

    가 있고, 그전에 300개 징후가 있음 (빅데이터로 예측하자 !)

    - SNS, 블로그 등에 올라오는 고객불만을 실시간으로 분석하면 적절한 대처가 가능함

    분석처리 시스템 (BI)

    Business Intelligence

  • 비즈니스 인텔리전스

    • 비즈니스 인텔리전스를 구성하는 요소 기술들

    – Data warehouse & Online analytical processing (OLAP)

    – Analytics : data mining, text mining, process mining,predictive analytics and prescriptive analytics.

    – Complex event processing,

    – Business performance management, benchmarking

    – Big data technology

    – Reporting

    • 비즈니스 인텔리전스 솔루션

    – IBM사의 Cognos

    – SAP 사의 Business Objects

    – MS사의 Analysis Service

    – SAS사의 BI 툴

    2016-09-30 충북대학교 ([email protected]) 18

    수많은빅데이터용오픈소스 BI Tools

    Talend, Spark, R, Tableau, …

  • 비즈니스 인텔리전스

    • Architecture - 비즈니스 인텔리전스를 구현하는 시스템 구조

    2016-09-30 충북대학교 ([email protected]) 19

    Data Sources Data Storage

    OLAPEngine

    Front-end Tools

    ERP시스템

    BI

    BI

    BI

    BI

    BI BI

    Tier 1 :DataWarehousing

    Tier 2 :OLAP분석처리

    OLAP Server

    Tier 3 :Client

    일상업무처리(OLTP)

    지능적업무처리

  • 비즈니스 인텔리전스 - 사례

    • 사례 : A 기업 구매담당 임원은 아침에 출근하여 구매 팀장을 불러서 다음 지시함. 점심시간에 B사의 구매담당 임원을만나 중요한 의사결정을 하기로 되어 있는데 오전 중으로 다음 자료를 정리하여 보고 요망.

    2012-11-00 20

    A 고객사에 대한 매출분석 보고서

    . 지난 3년간 년도별/분기별/월별 판매량과 매출액

    . 지난 3년간 매출이익

    . 지난 3년간 A 고객사의 부서별 서비스 지원 요청 회수

  • 비즈니스 인텔리전스 - 사례

    • 작업량 – 추정

    2012-11-00 21

    담당 팀장은 지시를 들으면서 “오늘 점심시간까지 될 수 있을지?” 라고걱정하면서 자리로 돌아와서 팀원들을 불러 매출분석 보고서와 관련된회의를 하였다.한시간 후에 임원이 지시한 업무의 규모와 처리 절차가 분석되었는데요약하면 다음과 같다.

    - 공동 작업해야 할 팀의 수 : 3개 팀- 공동 작업을 해야 할 자회사 : 1개 (전산외주회사)- 소요기간 (예측) : 6일- 소요인원 (예측) : 현업 6명, 전산요원 4명 (5개 팀)

  • 2012-11-00 22

    소요기간 : 6일 (33 단계)소요인원 : 현업 5명, 전산요원 4명 (4개팀)

    1. 비즈니스 인텔리전스를 도입하지 않은 경우

  • 2. 비즈니스 인텔리전스를 도입한 경우

    2012-11-00 23

    데이터 웨어하우스(과거 data, 외부d ata)

    OLAP분석

    비즈니스 인텔리전스

    DBDBDBDB

    OLTP 일상업무

    ERP

    업무처리 단계 : 없음소요시간 : 10분소요인원 : 0명

  • 비즈니스 인텔리전스 - 배경

    • 비즈니스 인텔리전스를 도입하지 않은 기업

    – 결국 임원은 점심시간에 A고객사 임원과의 회의에서 필요한 정보를 보고받지 못한 채 회의장으로 가거나 혹은 미팅을 연기해야 할 것임

    – 이러한 문제는 기업과 공공기관 등 대부분의 조직에서 발생하는 흔한 문제이며, CEO나 CIO가 BI의 필요성을 절실하게 느끼는 이유도 여기에 있음

    • 비즈니스 인텔리전스가 구축된 기업

    – 이러한 분석은 실시간(온라인)으로 이루어짐

    – 그것도 전산부서나 현업의 도움 없이 임원이 자신의 방에서버튼 클릭 몇 번으로 원하는 자료를 그래픽 형태로 출력할 수있게 됨

    – 소요시간은 10분 이내이고, 소요인원은 0 명

    2012-11-00 24

  • DW & OLAP

    • Data Warehouse (DW)– 관리자의 의사결정을 지원하기 위하여 수집한 조직 내부 혹은외부의 데이터로써 과거정보까지 포함할 수 있음

    – 일반직원들의 거래처리를 위한 데이터의 집합으로 정의되는데이터베이스와는 용도가 다름

    – 비즈니스 인텔리전스를 구현하기 위한 데이터의 모음

    • 특징

    – 데이터 웨어하우스는 다음 네가지 특징을 가짐

    주제 지향적(subjectoriented) 데이터

    통합적(integrated) 데이터

    시계열적(timevarient) 데이터

    비휘발적(nonvolatile) 데이터

    2016-09-30 충북대학교 ([email protected]) 25

  • DW & OLAP

    – 주제 지향성(subject-orientation)은 데이터를 주제별로 구성함으로써 최종 사용자(end user)와 전산에 약한 분석자라도 이해하기 쉬운 형태로 구성하는 것임

    예: 매출액을 고객별로, 제품별로, 판매시간대별로, 지역별로 구성

    – 통합성(integration)은 DW에 입력될 때 일관적인 형태(항목이름, 측정값 단위, 일관된 코드 등)로 변환되어 연계, 통합됨

    – 시계열성은 현재 데이터 뿐 아니라 과거 일정 기간 동안 발생한 데이터를 포함하여 기간별 분석이 가능하게 함

    – 비휘발성(nonvolatilization)로 DW에 일단 데이터가 적재되면일괄 처리(batch) 작업에 의한 추가 및 삭제 외에는 변경 연산이 수행되지 않음

    매달(혹은 매주) 말에 한달㈜치 거래 내역이 추가되는 형태

    2016-09-30 충북대학교 ([email protected]) 26

  • DW & OLAP

    • OLAP (Online Analytical Processing) 정의

    – 최종 사용자(분석가, 임원)가

    – 다차원 정보인 DW에 직접 접근하여

    – 대화식으로 정보를 분석하고

    – 분석결과를 다양한 보고서 형식 (GUI)으로 출력하여

    – 의사결정에 활용하는 과정

    2012-11-00 27

    DW

    DB4

    DB3

    DB2

    DB1

    OLAP

    DMETL

    filesData Mining

    OLTP 영역 BI 영역

  • DW & OLAP

    • 다차원 정보

    – 다양한 각도에서 분석될 수 있는 정보 (매출액 등)를 의미함

    2012-11-00 28

    제품별로

    매출액은 ?

    기간별로

    매출액은 ?

    매출액의목표대비실적은 ?

    권역별매출액은 ?

    매출액

    데이타

    제품별매출액은 ?

    제품별/권역별매출액은 ?

    제품별/권역별/분기별매출액은 ?

    세부제품별/도시별/월별매출액은 ?

    … (수많은분석질의) …

  • DW & OLAP

    • 직접 접근 (온라인/실시간 분석)

    – 전산부서와 같은 매개자를 거치지 않고 임원이나 사용자가원하는 정보에 직접 접근하여 분석함을 의미함

    2012-11-00 29

    정보원

    정보원

    사용자

    전산부서 사용자

    < 기존의 분석방식 >

    < OLAP 분석방식 >

  • DW & OLAP

    • 대화식 분석

    – 이전 분석질문 결과를 이용하여 다음 분석질문을 작성하는 방식으로 다양한 분석을 수행함

    2012-11-00 30

    권역별

    매출액의 전

    년 동월 비교

    결과는 ?

    호남권의 매출액

    전년 동월에 비해

    감소

    호남권에 속

    한 각 도시

    매출액 ?

    목포시의 제품별매출액 변화는 ?…. (PC가 문제)

    온라인/대화식 분석 처리가 중요함

  • DW & OLAP - 예제

    2012-11-00 31충북대-경영정보학과

    권역 전체 변수 매출액 유형 실적

    권역별 당월(3월) 전월 전년동월전년동월대비증감 (%)

    수도권 67,500 43,600 61,500 10

    충청권 45,500 32,000 56,000 (19)

    영남권 55,300 46,500 66,700 (17)

    호남권 43,200 33,900 56,000 (23)

    권역 호남권 변수 매출액 유형 실적

    도시별 당월(3월) 전월 전년동월전년동월대비증감 (%)

    광주 8,900 9,000 8,500 5

    전주 7,800 7,200 7,200 8

    군산 5,500 6,100 6,800 (19)목포 4,500 5,800 7,100 (37)

    권역 목포 변수 매출액 유형 실적

    제품별 당월(3월) 전월 전년동월전년동월대비증감 (%)

    냉장고 7,500 3,600 6,500 15TV 5,500 2,000 6,000 (8)

    스마트폰 5,300 6,500 5,700 (7)PC 3,200 3,900 6,000 (47)

    지역별/제품별/월별 매출정보데이터

    웨어하우스

    다양한 분석

    OLTP DB

    다양한 분석

    다양한 분석

    판매 데이타

    목포지역의C 판매량 ?

    실시간/대화식 분석

  • DW & OLAP - 예제

    • GUI를 활용한 시각화

    – 현황이나 추세를 수치보다는 그래프 형태로 보여줌

    2012-11-00 32충북대-경영정보학과2016-09-30

  • DW & OLAP과 OLTP 비교

    2012-11-00 33

    OLTP OLAPMostly updates

    Many small transactions

    Mb-Tb of data

    Raw data

    Clerical users

    Up-to-date data

    Consistency, recoverabilitycritical

    Mostly reads

    Queries long, complex

    Gb-Tb of data

    Summarized, consolidated data

    Decision-makers, analysts

    Historical data

    Integration critical

    ERP 업무처리의 대부분

    예: 은행거래 (입출금, 이체),

    주문처리 등

    최근 3년간 강남지역의 매출액 추세 ?

    지역별/상품별 매출액은 ?

    지역별/상품별/년도별 매출액은 ?

    지역별/상품별/특정년도의 월별 매출액?

  • BI 구축 방안

    • 전사적 공감대의 형성

    – 데이터가 전사적으로 다양한 부서에서 추출되고 통합 분석되어야 하며, 분석결과가 해당 부서에서 활용되어 지능 높은 비즈니스로 연결되어야 함

    • 현업 요구 사항에 대한 단계별 수용

    – DW가 한꺼번에 모든 문제를 해결할 것이라는 지나친 기대는 금물

    – 단계별로 Pilot 시스템 구축 =>사용 => 평가 및 feedback 과정을 반복하여점진적으로 최적화됨

    • Business-Oriented– 기술적 문제보다 business 전략에 초점을 맞추는 것이 중요하며, 기존 시스템에서 불가능한 비즈니스 전략을 보여주어야 함

    – DW 구축 안이 business 부서에서 나와야 하며, 주관부서를 명확히 해야 함

    – “분석을 위한 분석”으로 전락하는 것을 경계해야 하며, 구축 대상이 되는 업무 영역이 명확해야 함

    2012-11-00 34

  • BI 구축 방안

    • 시스템 측면의 유의사항

    – 데이터의 quality 보장방안 수립

    – 데이터 (과거 데이터와 외부 데이터까지 포함)와 사용자 증가로인한 성능 고려

    – 사용자의 정보조회 유형의 변경과 확대를 고려 (유연성 => 구축보다는 도구 활용)

    – 부하가 큰 ETL 부분 (운영시스템 성능저하) 최적 자동화 방안

    – 시스템 구축 이후에도 전담 팀의 유지

    개발된 시스템의 평가와 지속적인 개선

    IT팀/Business팀 사이의 communication 채널

    2012-11-00 35

  • BI 구축 방안

    • BI 구축의 접근방법

    – EXCEL 기반 (구식)

    – Relational Database 기반 의사결정용 데이타베이스 구축과 분석 프로그램 작성

    – BI tool 기반 부서별로 Data marts구축 => Enterprise DW통합구축

    EDW설계및구축 => Data marts구축

    – 기간,초기비용,위험요소,분석의난이도등을고려하여결정함

    2012-11-00 36

  • BI 구축 방안

    • Excel-based approach

    – 담당자만이 이해 가능한 모델 (예: 수십 개의 엑셀 sheet가 복잡한 수식으로 연결되어 있음)

    – BI 업무의 특성상 프로세스 단계별 조정 사항이 매우 빈번하며,수작업 프로세스로 인한 처리비용 증가 (시간, 정확도, 인력 등)

    – 데이터 공유가 어려우며, 타 시스템과의 인터페이스도 어려움

    – 구조 변경의 요구사항에 대처하기 어려움 (예: 조직의 변경, 제품의 추가)

    – 깊이 있는(상세 레벨) 분석모델을 운영하기 어려움(예: 지점별,상품별,월별 매출액 등 다차원 분석)

    2012-11-00 37

  • Multidimensional Data Model

    2016.06

    충북대학교 조 완섭

    비즈니스 인텔리전스

  • 목차

    • 다차원모델

    • Cube Operators

    • Star Schema

    • 실무사례

    2012-11-00 39

  • 다차원 모델

    • 다차원 배열 구조(cube)로 DW 데이터 저장, 관리

    2012-11-00 40

    Time(quarter)

    Item (types)

    TV …..Computer PhoneCar

    Vancouver

    ALL

    Sales amount ofSales amount ofComputer in Vancouverduring Q1

    Q1

    Q2

    Q3

    Q4

    Chicago

    New York

    Toronto

    실세계정보

    Cube

  • 다차원 모델

    • Tables vs. Cubes

    2012-11-00 41

    sale prodId storeId amt

    p1 c1 12

    p2 c1 11

    p1 c3 50

    p2 c2 8

    c1 c2 c3

    p1 12 50

    p2 11 8

    Table view: 2-D cube:

    dimensions = 2

  • 다차원 모델

    • Tables vs. Cubes

    2012-11-00 42Customer (custId)

    Store

    P1

    p50

    P2…

    1111 … 53 …

    C100

    ….C3

    C2

    C1

    60

    50

    40

    150

    Store(storeId)

    sale oderId date custId prodId storeId qty amt

    100 1/7/97 53 p1 c1 1 12

    102 2/7/97 53 p2 c100 2 11

    105 3/8/97 111 p1 c3 5 50

    price

    3-D cube

  • 2012-11-00 43

    MOLAP - CUBE Operators

    • Han’s book 그림

    2016-09-30 CBU / MIS 43

    OLAP 연산자Cube Operators

    Dice

    Roll-up

    Slice

    Drill-down

    Pivot Combination ofcube operators=> 복잡한 분석

  • CUBE Operators

    • Pivot– 행과 열의 위치를 바꾸는 연산자

    • Roll-up– 차원 계층을 따라서 상위 레벨에 대한 집계치를 계산하는 연산– 예를들어, 날짜별 판매량에서 주별, 혹은 월별 판매량을 구할 때 사용됨

    • Drill-down– 차원 계층을 따라서 하위 레벨에 대한 집계치를 계산하는 연산– 예를들어, 월별 판매량에서 주별, 혹은 날짜별 판매량을 구하는데 사용됨

    • Slice– 한 차원에 대하여 주어진 값으로 selection한 결과 (subcube)를 산출하는 연산– 예를들어 slice for time = "Q1"은 time 차원에서 하나의 값 (Q1)으로 셀렉션하여 생성됨

    • Dice– 두 차원 이상에 대하여 주어진 값들로 selection한 결과 (subcube)– location, time, item 세 차원에서 selection 된 결과 subcube를 만들 때 사용됨

    • Drill-across– 두 개 이상의 사실 테이블을 포함한 질의를 수행할 때 사용되는 연산자

    • Drill-through– 큐브에서 해당 소스 데이터베이스 (관계형 데이터베이스 테이블)까지 접근하여관련 raw data를 검색하는 연산

    2012-11-00 44

  • CUBE Operators

    • Ranking (Sorting) the top/bottom N items

    – 최고치 (혹은 최소치)로부터 차례로 N개를 선택하는 연산

    – 매출량이 가장 높은 (낮은) 10개 상점은 ?

    • 이 밖에도 큐브에 대한 다양한 연산자들이 제안되고 있음

    – Moving average

    – Growth rate

    – Interests

    – Internal rate of return

    – Depreciation

    – Currency conversion

    – Statistical functions

    2012-11-00 45

  • CUBE Operators - 예제

    분석의 예제• 분기별 sales amount ? (slice)

    • 1분기 도시별, 제품별 sales amount ? (dice)

    • 월별 (혹은 날짜별) sales amount ? (drill down)

    • 도시별 sales amount ? (slice)

    • 제품별 sales amount ? (slice)

    • 분기별, 도시별 sales amount ?

    • 분기별, 도시별, 제품별 sales amount ?

    • 월별, 도시별 sales amount ?

    • 월별, 도시별, 제품별 sales amount ?

    • 1분기 New York에서 제품별 sales amount ?

    • Computer 제품의 도시별 sales amount ?

    • Computer 제품의 도시별, 분기별 sales amount ?

    • 휴일 동안에 Vancouver 에서 판매된 자동차의 sales amount ?

    • (조건에 따라서 무수히 많은 질문이 가능하며, OLAP은 이러한 질의를 효과적으로 작성하고,빠르게 분석할 수 있어야 함)

    2012-11-00 46

    Time(quarter)

    Item (types)

    TV …..Computer

    PhoneCar

    Vancouver

    Q1

    Q2

    Q3

    Q4

    ChicagoNew YorkToronto

  • CUBE Operators vs. SQL

    2012-11-00 47

    Multi-dimensional cube Relational Table

    day 2c1 c2 c3

    p1 44 4

    p2 c1 c2 c3

    p1 12 50

    p2 11 8

    day 1

    c1 c2 c3

    p1 56 4 50

    p2 11 8

    p1 p2

    c1 56 11

    c2 4 8

    c3 50

    Select ProdId, StoreId, sum(amount)From SalesGroup by ProdId, StoreId

    c1 c2 c3

    sum 67 12 50

    sum

    p1 110

    p2 19

    subcubeDice

    Pivot

    summary

    sale prodId storeId date amt

    p1 c1 1 12

    p2 c1 1 11

    p1 c3 1 50

    p2 c2 1 8

    p1 c1 2 44

    p1 c2 2 4

    p1 c1 56p1 c2 4p1 c3 50P2 c1 11P2 c2 8

  • Star Schema

    • Relational Implementation of Cubes

    2012-11-00 48

    Time(quarter)

    Item (types)

    TV …..Computer

    PhoneCar

    Vancouver

    Q1

    Q2

    Q3

    Q4

    ChicagoNew YorkToronto

    TimeTidDayWeekMonthQuarterYear

    LocationSidCityProvinceCountry

    ItemPidModelPnameCategory

    SaleTidPidSidQtyUnit_Price

  • Star Schema

    • Q1 : 년도별, 월별 판매금액 합계

    2012-11-00 49

    SELECT year, month, SUM(Qty*Unit_Price)FROM Sales S, Time TWHERE S.time_key = T.time_keyGROUP BY year, month;

    year month SUM

    2005 1 200

    2005 2 250

    2005 3 530

    ... ... ...

    2006 1 330

    2006 2 420

    ... ... ...

    TimeTidDayWeekMonthQuarterYear

    LocationSidCityProvinceCountry

    ItemPidModelPnameCategory

    SaleTidPidSidQtyUnit_Price

  • Star Schema

    • Q2 : Q1에 대한 roll-up / drill-down 연산

    2012-11-00 50

    SELECT year, SUM(dollars_sold) => year, month, SUM(dollars_sold)FROM Sales S, time TWHERE S.time_key = T.time_keyGROUP BY year => year, month

    year SUM

    2005 2200

    2006 3250

    2007 6530

    ... ...

    year month SUM

    2005 1 200

    2005 2 250

    2005 3 530

    ... ... ...

    2006 1 330

    2006 2 420

    ... ... ...

    Rollup

    Drilldown

    TimeTidDayWeekMonthQuarterYear

    LocationSidCityProvinceCountry

    ItemPidModelPnameCategory

    SaleTidPidSidQtyUnit_Price

  • Star Schema

    • Q3) Slice for time = "Q1"SELECT S.*

    FROM sales S, time T

    WHERE S.time_key = T.time_key AND T.quarter = "Q1";

    • Q4) Dice for(location.city = "Toronto" or "Vancouver") AND

    (time.quarter = "Q1" or "Q2") AND

    (item.item_name = "entertainment" or "PC")

    SELECT S.*

    FROM sales S, time T, item I, location L

    WHERE S.time_key = T.time_key AND

    S.lication_key = L.location_key AND

    S.item_key = I.item_key AND

    (T.quarter = "Q1" or T.quarter = "Q2") AND

    (L.city = "Toronto" or L.city = "Vancouver") AND

    (I.item_name = "entertainment" or I.item_name = "PC");

    2012-11-00 51

  • 실무사례

    실무사례 구축

    2016-09-30 CBU / MIS 52

    1. DW 요구사항분석Sales 전략을수립하고실행을담당하는Sales Manager는다양한분석을기반으로의사결정을수행하기위하여회사의자재 (materials), 고객(customers), 판매조직(sales organizations)에대한정보와판매기록에관한정보를 (1)~(4)의 sample data와같이관리한다.

    (1) Material Tables

  • 실무사례

    2016-09-30 CBU / MIS 53

    (2) Sale Organization data

  • 실무사례

    2016-09-30 CBU / MIS 54

    (3) Customer Tables

  • 실무사례

    2016-09-30 CBU / MIS 55

    (4) Sales Data

    - 2010년 1월부터 2012년 12월까지 월별 5개씩의 레코드를 추가하여 총 36 *

    5 = 180개 정도의 레코드를 입력하시오 (각 필드의 값은 랜덤하게).

    - 각 material 별로 unit of measure 값이 선택될 수 있도록 Sales data에 대한

    입력폼을 만들어 보시오 (form 만드는 방법 숙지).

  • 실무사례

    2016-09-30 CBU / MIS 56

  • 실무사례

    2016-09-30 CBU / MIS 57

    이상의데이터를사용하여다음과같은스타스키마로구축한다.

  • 실무사례

    2016-09-30 CBU / MIS 58

    그림 1-1의 스타 스키마에 대하여 다음과 같은 분석을 실행한다 : SQL로 작성

    • Customer Name별로 판매금액의 합계는 ?

    • 고객이 거주하는 도시별로 판매금액의 합계는 ?

    • 제품 카테고리별로 판매금액의 합계는 ?

    • 제품 이름별로 판매금액의 합계는 ? \

    • 매장이 위치한 도시별로 판매금액의 합계는 ?

    • 매장별로 판매금액의 합계는 ?

    • 년도별 Sales Revenue의 합계는 ?

    • 년도별, 월별 Sales Revenue의 합계는 ?

    • 년도별, 월별, 주별 Sales Revenue의 합계는 ? (주 : 1주 ~ 53주)

    • 제품별, 년도별 Sales Revenue의 합계는 ?

    • 비오는 날에 Sales Revenue의 합계는 ?

    • 환율이 높은 시기/중간/낮은 시기에 제품별로 Sales Revenue의 합계는 ?

  • 실무사례

    2016-09-30 CBU / MIS 59

    그림 1-1에서 다음과 같은 분석이 불가능하다. 이러한 분석이 가능하도록 1-1의 스타 스키마를 확

    장하고, 적절한 데이터베이스를 로딩한 다음에 분석을 하시오.

    • 고객이 거주하는 도시별로 Sales Revenue의 합계는 ?

    • 고객이 거주하는 도시를 EAST, MIDWEST, WEST로 구분한 지역으로 묶는다고 가정할

    때 각 지역별로 Sales Revenue의 합계는 ?

    • 고객의 성별로 Sales Revenue의 합계는 ?

    • 고객의 연령대별 Sales Revenue의 합계는 ? (10대, 20대, ..., 60대)

    • Material 테이블에서 각 항목을 4개의 categories인 Food, Furniture, Electronics,

    Others 으로 묶은 다음에 각 category별로 Sales Revenue의 합계는 ?

    • 앞에서 각 category별로 년도별 Sales Revenue의 합계는 ?

  • Access DB

    • Database – star schema

    2016-09-30 CBU / MIS 60

  • 분석 예제

    • Customer Name별로 Sales Revenue의 합계는 ?

    2016-09-30 CBU / MIS 61

    SELECT cust.이름, count(*) as 구매회수, sum(단가*판매량) as 구매금액FROM cust INNER JOIN sales ON cust.고객번호 = sales.CustGroup By cust.이름;

  • 분석 예제

    • Customer의 고객거주 도시별로 Sales Revenue의 합계는 ?

    2016-09-30 CBU / MIS 62

    SELECT cust.주소시, count(*) as 구매회수, sum(단가*판매량) as 구매금액FROM cust INNER JOIN sales ON cust.고객번호 = sales.CustGroup By cust.주소시;

  • BI 구축 방안

    • RDB-based approach

    – DB 설계와 분석용 DB 구축 및 응용 프로그램 개발에 시간 소요

    – 변화에 대한 유연성 부족(예: 대부분의 프로세스를 프로그램로직으로 구현하므로 환경 변화를 반영하는데 노력이 필요)

    – 분석과 리포팅을 위한 별도의 작업을 필요로 함

    • Packaged (BI) solution

    – 상기 방식의 단점은 대부분 해결되나 도구 자체의 내부적인 체계로 인해 그 방법론과 처리 절차에 맞추어야 함 (교육 필요)

    – 초기 가격적인 부담 (SW, 컨설팅 비용)

    – Tool에서 제공하지 않는 기능을 추가하는 것이 어려움

    – Multi-dimensional data model (vs. Star Schema) 활용

    2012-11-00 63

    Slide Number 1목차정보시스템정보시스템거래처리 시스템거래처리 시스템 - ERP분석처리 시스템 (Business Intelligence)분석처리 시스템 (BI)분석처리 시스템 (BI)분석처리 시스템 (BI)분석처리 시스템 (BI)분석처리 시스템 (BI)분석처리 시스템 (BI)분석처리 시스템 (BI)분석처리 시스템 (BI)분석처리 시스템 (BI)분석처리 시스템 (BI)비즈니스 인텔리전스비즈니스 인텔리전스비즈니스 인텔리전스 - 사례비즈니스 인텔리전스 - 사례Slide Number 222. 비즈니스 인텔리전스를 도입한 경우비즈니스 인텔리전스 - 배경DW & OLAPDW & OLAPDW & OLAPDW & OLAPDW & OLAPDW & OLAPDW & OLAP - 예제DW & OLAP - 예제DW & OLAP과 OLTP 비교BI 구축 방안BI 구축 방안BI 구축 방안BI 구축 방안Multidimensional Data Model목차다차원 모델다차원 모델다차원 모델Slide Number 43CUBE OperatorsCUBE OperatorsCUBE Operators - 예제CUBE Operators vs. SQLStar SchemaStar SchemaStar SchemaStar Schema실무사례실무사례실무사례실무사례실무사례실무사례실무사례실무사례Access DB분석 예제분석 예제BI 구축 방안