2007.06
DESCRIPTION
데이터웨어하우스. 2007.06. PowerPoint Template_Sub. Click here to add header Click to add text to your presentation Click to add text to your presentation Click to add text to your presentation. 제 3 장 데이터웨어하우스. 기업의 내부 및 외부의 데이터 (internal data) 를 주제별로 통합하여 (subject-oriented), - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/1.jpg)
2007.06
데이터웨어하우스
![Page 2: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/2.jpg)
2
Click here to add header
– Click to add text to your
presentation
– Click to add text to your
presentation
– Click to add text to your
presentation
PowerPoint Template_Sub
![Page 3: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/3.jpg)
3
제 3 장 데이터웨어하우스
![Page 4: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/4.jpg)
4
개념개념
기업의 내부 및 외부의 데이터 (internal data) 를 주제별로 통합하여 (subject-oriented), 여러 측면에서 (multi-dimensional) 분석을
가능케 하는 통합 시스템통합 시스템 이다 .
“Central Repository of Enterprise Data”
![Page 5: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/5.jpg)
5
전산분야의 현 주소전산분야의 현 주소
1. ( 문제의식 )정보시스템 As a Cost Center Profit Cener
2. ( 해결방안 )데이터웨어하우스는정보시스템이 조직 경쟁력 강화를 위한 도구 로 진화하도록 현업에서 필요한 정보를 쉽게 이용하도록 도와 주는 시스템
출현배경 HardwareHardware 의 발전과 가격하락 의 발전과 가격하락 (CPU, Memory, Parallel Processing, …)(CPU, Memory, Parallel Processing, …) DB DB 기술의 발전 기술의 발전 (( 대용량대용량 , Cluster File System, …), Cluster File System, …) DW DW 도구의 발전도구의 발전 : ETL (Extraction/Translation/Loading), : ETL (Extraction/Translation/Loading),
Multi-dimensional Cube model, OLAP Multi-dimensional Cube model, OLAP 분석도구분석도구
![Page 6: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/6.jpg)
6
OLTP(DB)OLTP(DB) 와 와 OLAP(DW, DSS)OLAP(DW, DSS) 의 의 비교비교
OLTP OLAP
목적 Transactioin procesing
Desision support를 위한 분석
사용자수 1000 이상 100 정도
Disk access mode many short I/O a few long I/O
Response time fast response
(5초이하)
fare response
(30초이내)
Data의 양 보통 100G 이하 보통 100G 이상
Data의 건수 보통 몇 백만 row 몇 천만 row 이상
History 보관 길어야 3달 보통 5년
![Page 7: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/7.jpg)
7
데이터웨어하우스의 특징데이터웨어하우스의 특징
1. 주제지향성 ( 개체중심 ) <=> 업무처리 중심2. 통합성 <=> 일관성 없이 데이터 중복 관리 3. 시계열성 ( 일 , 월 , 분기 , 년 등 ) ; 즉 , 월 / 년 등
기간과 관련을 가짐 .4. 비 휘발성 ( 일기 전용 ) <=> 갱신작업 5. 독립성 ; 기업의 운영시스템과는 분리되어 있다 ..6. 주제 중심적 ; 기존 DB 와 근본적으로 구분 . 7. Read-only; OLTP 와 달리 삭제 , 변경 등이 일어 나지
않음 .
![Page 8: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/8.jpg)
8
데이터의 수집 / 처리 ~ 활용에 이르는 일련의 프로세스 데이터의 추출 , 변환 , 정제 , 통합 단계 정보도출 단계 정보활용 단계 데이터의 추가 , 갱신 , 삭제
데이터 웨어하우징데이터 웨어하우징
![Page 9: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/9.jpg)
9
1. 데 이 터 마 트 는 비 교 적 작 은 규 모 의 데 이 터 웨 어 하 우 스 이 다 . 따 라 서 데 이 터 마 트 는 데 이 터 웨어하우스의 일부분이다 .
2. 특정 사용자가 관심을 갖는 데이터를 대상으로 한다 . 따라서 구분기준 : 사용자의 기능 또는 제공범위
데이터저장범위에 따른 구분 예 : (1) DW (Data Warehouse) : 전사적 데이터베이스 (2) 데이터 마트 : 인사 (HR) 데이터베이스
데이터 웨어하우스와 데이터마트데이터 웨어하우스와 데이터마트
![Page 10: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/10.jpg)
10
1. 실시간 기업 (RTE: Real-time Enterprise)1. 실시간 분석2. 실시간 레포팅
2. 복잡한 분석1. 다차원 분석
3. 경영 의사 결정 (EIS, SIS, …)4. 부문별 EUC
1. 영업관리팀 : Sophisticated Custom Applications 2. 생산관리팀 : Data Mining3. 고객관리팀 : Multi-Dimensional Analysis
활용
![Page 11: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/11.jpg)
11
구축 비용구축 비용
세부 실행방법에 따라 큰 차이가 있음 .
평균기간 : 6 개월 ~1 년비용 : 10 억원 내외
![Page 12: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/12.jpg)
12
기본 구성도기본 구성도
기간계 업무
정보계 업무
![Page 13: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/13.jpg)
13
구성요소구성요소
Source Data 파일 DB
DW 플랫폼 DBMS Storage 서버
클라이언트 OLAP 도구 Web 브라우저
관리 도구 Meta Data SMS
![Page 14: 2007.06](https://reader036.vdocuments.pub/reader036/viewer/2022081514/56813a0f550346895da1e616/html5/thumbnails/14.jpg)
14
오픈소스 데이터웨어하우스
Pentaho provides a full spectrum of open source Business Intelligence (BI) capabilities including reporting, analysis, dashboards, data mining, data integration, and a BI platform.
www.pentaho.org