er/studio를 활용한 데이터 표준화 시스템 구축방안

12
ER/Studio 활용한 데이터 표준화 시스템 구축방안 작성자 : 우성미 2010 6 Americas Headquarters 100 California Street, 12th Floor San Francisco, California 94111 EMEA Headquarters York House 18 York Road Maidenhead, Berkshire SL6 1SF, United Kingdom Devgear 서울특별시 반포 1 746-14 3 ㈜데브기어 (T) 02.595. 4288

Upload: devgear

Post on 23-Jun-2015

150 views

Category:

Software


11 download

DESCRIPTION

데이터 표준화가 필요한 이유와 절차 그리고 ER/Studio를 사용했을 때 얼마나 쉽게 구축할 수 있는지를 설명한 문서입니다.

TRANSCRIPT

Page 1: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

ER/Studio 를 활용한 데이터 표준화 시스템 구축방안

작성자 : 우성미

2010 년 6 월

Americas Headquarters

100 California Street, 12th

Floor

San Francisco, California

94111

EMEA Headquarters

York House

18 York Road

Maidenhead, Berkshire

SL6 1SF, United Kingdom

Devgear

서울특별시 반포 1 동 746-14

3 층 ㈜데브기어

(T) 02.595. 4288

데이터

표준화

시스템

Page 2: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

1. 데이터 표준화의 필요성

데이터 표준화는 시스템 별로 산재해 있는 데이터에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립

하여 이를 전사적으로 적용하는 것을 의미한다.

데이터 표준화를 전체 시스템에 적용함으로써 조직 내의 의사 소통을 원활하게 하고, 시스템간 인터페이스가

원활히 수행될 수 있도록 하기 위함이다.

2. 데이터 표준화 절차

데이터 표준화 절차는 신규 프로젝트 또는 사용 중인 데이터베이스에 이루어질 수도 있지만, 신규 프로젝트를 가

정하고 예제를 들도록 하겠다.

다음은 데이터표준 관리 프로세스를 보여준다.

데이터 표준화는 크게 논리/물리 모델을 작성하는 Modeler의 역할과 데이터 표준화 시스템에 대한 관리 및 준수

여부 관리 등을 위해 데이터 관리자(DA)의 역할로 나누어진다.

3. 데이터표준화 따라하기

지금부터 간단한 데이터 모델을 사례로 들어 데이터표준 관리 프로세스를 설명하도록 하겠다.

3.1. 논리 모델 작성

프로젝트를 성공적으로 완수하기 위한 방법의 하나로 요구사항관리를 전산화하기 위해 다음과

같은 논리모델이 작성되었다.

Page 3: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies - 3 -

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

데이터

표준화

시스템

3.2. 용어수집

현행모델의 모든 속성을 추출하여, 분류, Sort, Merge 기능 등 분석이 용이한 데이터베이스의 테이블이나 Excel

등에 저장해 보자.

Auto_Naming.bas 매크로를 실행한 후 [Execute] 버튼을 클릭하면, 아래 그림과 같이 용어사전에 없는 용어 목록

이 ②번 영역 (Unmatch words)에 리스트 된다.

버튼을 클릭하여 ①번 영역(용어사전)으로 용어를 옮긴 후, [Save] 버튼을 클릭하여 용어목록을 “용어수

집.csv”로 저장한다.

참고) 매크로는 반복되는 작업을 자동화하여 생산성을 향상시킬 수 있는 자동화 도구로 다음 기술문서에 자세히

설명되어 있다. 매크로 - 편리한 자동화

3.3. 표준단어사전 정의

표준단어 사전이란 기업에서 업무상 사용하며 일정한 의미를 갖고 있는 최소 단위의 단어를 정의한 사전이다. 표

준용어를 구성하는 단어에 대한 표준을 정의함으로써 표준용어에 대한 한글명과 영문명을 일관되게 정의할 수

있게 한다.

표준단어는 다음과 같은 일련의 과정을 거쳐 정의한다.

1) 단어 분할

수집된 용어를 최소 단위의 단어로 분할한다.

논리명 단어1 단어2 단어3 단어4

개수 개수

결재방법코드 결재 방법 코드

구매가격 구매 가격

구매포인트 구매 포인트

도서 도서

도서명 도서 명

도서번호 도서 번호

배송방법코드 배송 방법 코드

배송번호 배송 번호

배송지상세주소 배송지 상세 주소

Page 4: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

배송지우편번호 배송지 우편 번호

배송지전화번호 배송지 전화 번호

배송지주소 배송지 주소

배송지핸드폰번호 배송지 핸드폰 번호

상세주소 상세 주소

우편번호 우편 번호

이메일 이메일

전화번호 전화 번호

주문 주문

주문목록 주문 목록

주문번호 주문 번호

주문일자 주문 일자

주민번호 주민 번호

주소 주소

핸드폰번호 핸드폰 번호

회원 회원

회원명 회원 명

회원번호 회원 번호

2) 표준단어사전 정의

분할하여 취합된 모든 단어 중에서 의미가 동일한 단어에 대해 하나의 대표 단어를 표준으로 선정하고 그에 대

한 영문 약어명을 선택한다.

번호 한글명 정의 영문명 영문 약어명 동의어/유의어/

금칙어

1 가격 물건의 가격을 나타냄 AMOUNT AMT 금액, ~가

2 개수 셀 수 있는 사물의 수 COUNT CNT ~수, 건수

3 결재 승인/미승인 된 결과 SIGN SIGN 승인, 허가

4 구매 상품을 사는 행위 BUY BUY 구입

5 도서 일반적인 서적 BOOK BOOK 책

6 명 지칭하는 말 NM NM 이름

7 목록 리스트 LIST LST

8 방법 목적을 이루기 위해

취하는 방식이나 수단 METHOD

MTHD 방안

9 배송 물건을 주문한 회원에게

보내는 행위 DELIVERY

DELIV

10 배송지 물건을 주문한 회원에게

보내기 위한 장소

DELIVERY-

PLACE

DELIV_PLAC

11 번호 숫자 NUMBER NO

12 상세 자세하고 상세함 DETAIL DETA

13 우편 ZIP ZIP

Page 5: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies - 5 -

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

데이터

표준화

시스템

14 이메일 메일 주소 EMAIL EMAIL

15 일자 DATE DT

16 주문 도서를 주문 ORDER ORDER

17 주민 주민 RESIDENT RES 주민등록

18 주소 거주지의 주소 ADDRESS ADDR

19 코드 정보를 나타내는 기호의

체계 CD

CD 구분코드

20 포인트 가점, 득점 POINT PNT 점수

21 전화번호 전화번호 TELEPHONE TEL

22 핸드폰 손으로 들고 다니는

전화기

MOBILE

PHONE

MPHN 휴대폰

23 회원 어떤 회를 구성하는

사람들 MEMBER

MEMB

3.4. 표준용어사전 정의

업무적으로 사용하는 용어에 대한 표준을 정의한다.

1) 표준용어사전 정의

표준단어에 있는 단어의 조합을 통해 표준용어를 정의한다.

표준용어 영문명

개수 CNT

결재방법코드 SIGN_MTHD_CD

구매가격 BUY_AMT

구매포인트 BUY_PNT

도서 BOOK

도서명 BOOK_NM

도서번호 BOOK_NO

배송방법코드 DELIV_MTHD_CD

배송번호 DELIV_NO

배송지상세주소 DELIV_PLAC_ADDR

배송지우편번호 DELIV_PLAC_ZIP

배송지전화번호 DELIV_TEL_NO

배송지주소 DELIV_ADDR

배송지핸드폰번호 DELIV_ MPHN_NO

상세주소 DETA_ADDR

우편번호 ZIP_NO

이메일 EMAIL

전화번호 TEL_NO

주문 ORDER

Page 6: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

주문목록 ORDER_LST

주문번호 ORDER_NO

주문일자 ORDER_DT

주민번호 REG_NO

주소 ADDR

핸드폰번호 MPHN_NO

회원 MEBER

회원명 MEMB_NM

회원번호 MEMB_NO

2) 표준용어사전을 논리모델에 적용

이와 같이 정리된 표준용어를 논리 모델에 적용해보자.

① 우선, 위에서 정의한 용어사전을 “표준용어.csv” 파일로 저장한다.

② Auto_Naming 매크로를 실행하면 다음과 같은 실행화면이 나타난다.

[Open] 버튼을 클릭하여 “표준용어.csv” 파일을 선택한 후 [Excute] 버튼을 클릭하면 물리명이 자동으로 변환된다.

Unmatch words 영역에 용어사전에 없는 논리명이 하나도 없고, 오른쪽 영역에서 논리(한글)명에 해당하는

물리(영문)명이 모두 변환된 것을 확인할 수 있다.

Page 7: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies - 7 -

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

데이터

표준화

시스템

3.5. 표준도메인 정의

표준도메인은 컬럼에 대한 성질을 그룹핑 한 개념으로 표준 도메인을 컬럼에 적용함으로써 데이터 타입 및 길이

를 일관되게 정의할 수 있다.

1) 표준도메인 정의

① 모든 속성의 접미어를 분리해 보면서 공통으로 발생하는 접미어를 분리하여 하나로 만든다.

엔티티명 속성명 도메인명 도메인명

도서 도서번호 도서번호 금액

도서 도서명 명 개수

주문 주문번호 주문번호 결재방법코드

주문 주문일자 일자 도서번호

주문 결재방법코드 결재방법코드 명

주문 배송방법코드 배송방법코드 배송방법코드

주문 배송번호 배송번호 배송번호

주문 배송지우편번호 우편번호 상세주소

주문 배송지주소 주소 수량

주문 배송지상세주소 상세주소 우편번호

주문 배송지전화번호 전화번호 이메일

주문 배송지핸드폰번호 핸드폰번호 일자

주문 회원번호 회원번호 전화번호

주문목록 주문번호 주문번호 주문번호

주문목록 도서번호 도서번호 주민번호

주문목록 구매가격 금액 주소

주문목록 개수 수량 핸드폰번호

회원 회원번호 회원번호 회원번호

회원 회원명 명

주민번호 주민번호

회원 전화번호 전화번호

회원 핸드폰번호 핸드폰번호

회원 이메일 이메일

회원 우편번호 우편번호

회원 주소 주소

회원 상세주소 상세주소

회원 구매포인트 수량

Tip) 이때, 엔티티명, 속성명 목록은 Export Meta Data to Excel Version 2.1 매크로를 실행하면 쉽게 얻을 수 있

다.

② 분리된 접미어를 의미가 비슷한 것끼리 묶어(문자, 숫자, 날짜) 이름을 부여한다. 이때 코드와 번호에 해당하

는 도메인은 개별로 부여한다.

③ 각 도메인별로 데이터 타입과 길이를 지정한다.

Page 8: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

도메인구분 도메인명 도메인타입 비고

번호 도서번호 VARCHAR(10) YYYYMM+SEQ(4)

배송번호 VARCHAR(8)

전화번호 VARCHAR(18) ‘-‘포함할 수 있음

주문번호 VARCHAR(14) YYYYMM+SEQ(8)

회원번호 VARCHAR(6)

주민번호 VARCHAR(13) ‘-‘제외

우편번호 CHAR(6)

코드 결재방법코드 CHAR(2)

배송방법코드 CHAR(2)

문자 명 VARCHAR(40)

이메일 VARCHAR(100)

주소 VARCHAR(100) 시도군, 읍면동

상세주소 VARCHAR(100) 나머지 주소

날짜 일자 DATE

숫자 금액_숫자10 NUMERIC(10) 일반금액

수량 NUMERIC(7)

Tip) 이때 논리 모델에 대한 도메인타입은 다양한 Target DBMS로 물리모델 변환이 가능하도록 공통된 타입을

사용한다. 논리 데이터 타입은 크게 문자, 숫자, 날짜로 나뉘어지며 VARCHAR, CHAR, NUMERIC, DATE로 정의한

다. 물리 모델 매핑시 오라클의 경우 VARCHAR2, CHAR, NUMBER, DATE의 형태로 매핑된다. 논리 모델과 물리

모델 간의 데이터타입 매핑 정보는 Tools Datatype Mapping Editor 메뉴를 클릭하여 Datatype Mapping

Editor에서 확인이 가능하다.

2) 표준도메인을 논리모델에 적용

이와 같이 정리된 도메인을 논리 모델에 적용해보자.

① ER/Studio에서 도메인을 하나하나 정의할 수도 있지만, Import Domains from Excel 매크로를 활용하면 엑

셀로 정의한 내용을 일괄적으로 손쉽게 적용할 수 있다.

② 다음과 같이 도메인 정보를 정의한 후 “도메인일괄생성.xls”로 저장한다

Page 9: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies - 9 -

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

데이터

표준화

시스템

이때 주의할 점은 폴더명과 도메인명이 일치해서는 안 된다.

③ Import Domains from Excel 매크로를 실행하면 다음과 같은 실행화면이 나타난다.

[Browse] 버튼을 클릭하여 위에서 작업한 “도메인일괄생성.xls” 파일을 열고, [OK] 버튼을 클릭해보자. 참고로,

[Get Sample Sheet] 버튼을 클릭하면 ②에서 작업한 엑셀 Sample 파일이 다운로드 된다.

④ 그럼, 다음과 같이 모델에 도메인이 일괄 생성될 것이다.

⑤ 다음으로 각 엔티티의 속성에 도메인을 할당한다.

이 역시 Entity Editor에서 속성 하나 하나씩 도메인을 연결할 수도 있지만, 매크로를 통해 일괄 바인딩 해보도록

하자.

⑥ 다음과 같이 속성과 도메인 정보를 매핑하여 “도메인일괄바인딩.xls”로 저장한다.

Page 10: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

⑦ Domain Bindings Import From Excel 매크로를 실행하면, 다음과 같은 실행화면이 나타난다.

[Browse] 버튼을 클릭하여 위에서 작업한 “도메인일괄바인딩.xls” 파일을 열고, [OK] 버튼을 클릭하면 엑셀 정보의

내용이 모델에 적용된다.

⑧ Diagram and Object Display Option 대화상자에서 Datatype, Domain 옵션을 체크하면

다음과 같이 도메인이 일괄 바인딩 된 것을 확인할 수 있다.

3.6. 표준코드 정의

표준코드는 도메인의 한 유형으로 도메인 값(코드 값)이 이미 정의되어 있는 도메인이다. 즉, 코드에 대한 표준은

다른 표준과는 달리 데이터 값, 즉 코드 값까지 이미 정의해야 한다.

코드유형 코드명 코드 순번 코드 값

결재방법코드 현금 1 01

카드결재 2 02

무통장입금 3 03

배송방법코드 우편 1 01

택배 2 02

3.7. 물리 모델 작성

지금까지 표준용어사전과 표준도메인을 정의한 후 논리 모델에 적용했다.

물리 모델을 생성하게 되면 컬럼명은 표준용어사전에 있는 영문명으로 데이터 타입은 도메인의 데이터 타입으

로 자동 생성된다.

표준화 작업이 명칭 통일로 명확한 의사소통 증대, 데이터 품질 향상, 정보시스템 간 인터페이스를 원활히 수행

Page 11: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies - 11 -

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

데이터

표준화

시스템

할 수 있다는 많은 이점이 있지만, 처음에는 어렵고 시간이 오래 걸리는 작업처럼 인식될 수 있다. 하지만, 물리

모델 작업 시간을 단축시키고, 유지보수 시에도 생산성을 향상시킬 수 있다.

① 다음과 같이 database를 Oracle로 지정하여 물리 모델로 변환해 보자.

② 그럼, 다음과 같이 표준용어사전에 의한 물리(영문)명과 표준도메인에 의한 데이터 타입이 생성되게 된다.

3.8. 표준준수여부 확인

ER/Studio를 사용하여 데이터 모델링하고, 그것을 기초로 하여 운영 DBMS에 스키마를 생성하게 된다. 만일 데

이터표준화 내용을 준수하지 않았다면 데이터베이스 스키마 작업을 수행할 수 없도록 해야 한다. 이를 위해 데이

터베이스 스키마 생성 작업에 대해서는 별도의 승인 절차(표준준수 검사 후 생성)를 거쳐 진행되어야 한다.

스키마 생성 이후에도 주기적인 데이터모델과의 비교를 통해 운영 데이터베이스에 대한 표준준수 여부도 확인

해야 한다.

1) 데이터모델에 대한 표준준수여부 확인

데이터모델에 대해서는 표준용어사전, 표준도메인, 표준코드 사용여부 등의 표준준수 여부를 주기적으로 체크한

다.

① 논리 모델/물리 모델에 대한 표준용어사전 준수여부를 체크하기 위해 Auto_Naming 매크로를

실행하면, 다음과 같은 실행화면이 나타난다.

Page 12: ER/Studio를 활용한 데이터 표준화 시스템 구축방안

Embarcadero Technologies

데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]

ER/Studio를 활용한 데이터 표준화 시스템 구축방안

② [Verify] 버튼을 클릭하면 다음과 같이 표준용어사전을 위배한 속성/컬럼 들에 대한 목록이 엑셀 파일로 생성

된다.

③ 표준도메인 준수여부를 체크하기 위해 Domain Bindings Import From Excel 매크로를 실행하면, 다음과 같은

실행화면이 나타난다.

왼쪽 영역에 도메인 목록이 나타나며 오른쪽 영역에는 도메인에 바인딩 되지 않은 속성/컬럼의 목록이 나타난다.

왼쪽 영역에서 도메인을 선택하고, 오른쪽 영역에서 매핑 할 속성/컬럼을 선택한 후 [Bind] 버튼을 클릭하여 도메인

바인딩 작업을 할 수 있다.

[Save] 버튼을 클릭하면 도메인에 바인딩 되지 않은 속성/컬럼 목록 정보를 파일로 저장할 수 있다.

2) 운영 데이터베이스에 대한 표준준수여부 확인

일반적으로 Case Tool을 사용해 모델링하고 자동으로 스키마를 생성하여 데이터베이스를 구축하지만, 이후 변경

에 대해서는 데이터베이스에 만 이루어지는 경우가 많다.

데이터모델이 데이터베이스로 반영된 이후, Compare&Merge Utility를 통해 데이터모델과 데이터베이스의 매핑

여부도 주기적으로 확인하여, 데이터모델과 데이터베이스를 일치시켜야 한다.

그리고 표준을 준수하지 않은 경우에는 변경 영향도를 분석하여, 운영 데이터베이스와 프로그램들을 단계적으로

변경해 나가야 한다.

엠바카데로 테크놀로지는, 1993년에 설립한 데이터베이스 툴 제작사입니다. 2008년에 볼랜드의 개발툴 부문 「CodeGear」를

합병하였습니다. 현재는 애플리케이션 개발자와 데이터베이스 기술자가 다양한 환경에서 소프트웨어 애플리케이션을 설계, 구

축, 실행하기 위한 툴을 제공하는 최대 규모의 독립계 툴 제작사입니다. 미국 기업의 총수입 랭킹 「포춘 100」중 90개 기업과

전세계 300만 이상의 고객이, 엠바카데로의 RAD Studio®, Delphi®、C++Builder® 등 개발툴 제품과 ER/Studio®、

DBArtisan®, RapidSQL®, DB PowerStudio® 등 데이터 모델링 및 DB관리 제품을 채용해, 생산성의 향상과 혁신적인 소프트웨

어 개발을 실현하고 있습니다. 엠바카데로 테크놀로지스는, 샌프란시스코에 본사를 두고, 세계 각국에 지사를 전개하고 있습니

다. 보다 자세한 내용은, http://www.devgear.co.kr를 참고하시기 바랍니다.