olap과 다차원 모델

20
강성욱 E-mail : [email protected] Blog : http://sqlmvp.kr Datawaffle : http://datawaffle.com OLAP 테크놀로지 OLAP과 다차원모델

Upload: sungwook-kang

Post on 25-Jun-2015

1.963 views

Category:

Documents


15 download

DESCRIPTION

OLAP and Multi Dimension

TRANSCRIPT

Page 1: Olap과 다차원 모델

강성욱 E-mail : [email protected]

Blog : http://sqlmvp.kr Datawaffle : http://datawaffle.com

OLAP 테크놀로지

OLAP과 다차원모델

Page 2: Olap과 다차원 모델

차원(디멘전)과 차원항목

차원 • 큐브를 구성하는 축 • 사용자가 데이터를 분석하고자 하는 관점

차원항목(Member 또는 Element) • 각 축의 좌표

Page 3: Olap과 다차원 모델

큐브(CUBE)와 셀(CELL)

셀(Cell) • 각 차원을 구성하는 항목들의 조합에 대한 데이터를 저장하는 논리적인 공간

• 3 x 2 x 3 = 18 cell

Page 4: Olap과 다차원 모델

데이터 희박성(Sparsity)

희박성(Sparsity) • 셀은 논리적인 가상공간이며 물리적 존재 여부와는 별개 개념이다.

• 데이터가 존재하지 않는 셀은 물리적으로 존재하지 않게 된다. 이 부분이 희박성 이다.

Page 5: Olap과 다차원 모델

계층구조

계층구조 • 데이터가 집계되는 기본적인 경로 페어런트(Parent) • 어떤 항목의 바로 상위 항목 차일드(Child) • 어떤 항목의 바로 하위 항목 씨블링(Sibling) • 동일한 페어런트를 가진 항목 루트항목(Root) • 페어런트를 갖지 않는 항목 리프항목(Leaf) • 차일드를 갖지 않는 항목 앤세스터(Ancestor) • 어떤 항목의 모든 상위 항목 디센던드(Descendent) • 어떤 항목의 모든 하위 항목

Page 6: Olap과 다차원 모델

대칭 구조 레벨

레벨4, 제네레이션1

레벨3, 제네레이션2

레벨2, 제네레이션3

레벨1, 제네레이션4

Page 7: Olap과 다차원 모델

비대칭 구조 레벨

Page 8: Olap과 다차원 모델

애트리뷰트 / 관계식

애트리뷰트(Attribute)

• 차원 항목들의 특성을 나타내는 텍스트 형태의 정보 Ex) • 매장 : 매장 주소, 전화번호, 담당자, 매장크기, 직영 여부, 개점일 등 • 제품 : 제품의 색상, 크기, 신제품 여부 등 관계식 • 항목들간의 관계를 식으로 정의 Ex) • 평균 매출 가격 : 매출액 / 매출 수량 • 세금 : 매출액 * 0.2

Page 9: Olap과 다차원 모델

스타스키마

• 하나의 팩트 테이블과 다수의 디멘젼

테이블로 구성

• 팩트(사실) : 분석하고자 하는 대상 항

• 디멘젼(차원) : 사실을 보는 관점

다차원 데이터를 효과적으로 저장, 조회하기 위한 관계형DB의 설계 기법

Page 10: Olap과 다차원 모델

E-R모델과 스타스키마

E-R 모델

• 갱신 성능을 최적화

• 정규화됨

• OLTP

• 다수의 테이블로 구성

• 소수의 열

• 테이블간 여러 조인 경로

스타스키마

• 최적의 질의 응답을 위한 설계 기법

• 비정규화 됨

• OLAP

• 소수의 테이블로 구성

• 다수의 컬럼

Page 11: Olap과 다차원 모델

사실테이블 / 차원테이블

점진적으로 진화하는 차원에 대한 대처(SCD) • 차원 항목들의 애트리뷰트가 시간이 흐름에 따라 변화 • Ralph Kimball 정의

새로운 값으로 덮어 쓰기

• 구현이 쉬움

• 변경 과정을 파악 할 수 없음

• 과거 데이터가 중요하지 않은 경우 사용

Page 12: Olap과 다차원 모델

사실테이블 / 차원테이블

새로운 레코드 추가

• 변경 시점에 새로운 속성값을 가지는 레코드 추가

• 써로게이트키(대체키) 이용

• 일반적으로 많이 선호 함

Page 13: Olap과 다차원 모델

사실테이블 / 차원테이블

새로운 필드 추가

• 시작 속성과 현재 속성, 변경일 기준으로 관리

• 스키마 변경으로 인한 관리 어려움.

Page 14: Olap과 다차원 모델

스노우플레이크 스키마

• 스타스키마의 팩트 테이블 구조와 동일하게 유지하면서 차원 테

이블은 정규화된 구조를 형성

• 팩트 테이블과 조인되는 차원 테이블이 있으며 이 차원 테이블은

또 다른 테이블의 기본키를 참조하는 외래키를 가짐

Page 15: Olap과 다차원 모델

스노우플레이크 스키마

• 스키마 확장에 용이

• 많은 데이터 보유로 인한 성능과 집계 영향

• 참조되는 데이터를 Outboard 또는 OutBridge 불림

Page 16: Olap과 다차원 모델

변수 차원

변수차원

• 자산. 부채, 수익, 비용등과 같이 비즈니스 성과를 측정하기 위한 항목

특성

• 다른 차원들의 존재 기반을 제공

• 나머지 차원들의 상세 정도를 결정

Page 17: Olap과 다차원 모델

하이퍼 큐브

Page 18: Olap과 다차원 모델

블록 멀티 큐브

Page 19: Olap과 다차원 모델

시리즈 멀티 큐브

Page 20: Olap과 다차원 모델

참고자료

• OLAP 테크놀로지 (시그마)