er/studio를 활용한 데이터 표준화 시스템 구축방안
DESCRIPTION
데이터 표준화가 필요한 이유와 절차 그리고 ER/Studio를 사용했을 때 얼마나 쉽게 구축할 수 있는지를 설명한 문서입니다.TRANSCRIPT
ER/Studio 를 활용한 데이터 표준화 시스템 구축방안
작성자 : 우성미
2010 년 6 월
Americas Headquarters
100 California Street, 12th
Floor
San Francisco, California
94111
EMEA Headquarters
York House
18 York Road
Maidenhead, Berkshire
SL6 1SF, United Kingdom
Devgear
서울특별시 반포 1 동 746-14
3 층 ㈜데브기어
(T) 02.595. 4288
데이터
표준화
시스템
Embarcadero Technologies
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
1. 데이터 표준화의 필요성
데이터 표준화는 시스템 별로 산재해 있는 데이터에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립
하여 이를 전사적으로 적용하는 것을 의미한다.
데이터 표준화를 전체 시스템에 적용함으로써 조직 내의 의사 소통을 원활하게 하고, 시스템간 인터페이스가
원활히 수행될 수 있도록 하기 위함이다.
2. 데이터 표준화 절차
데이터 표준화 절차는 신규 프로젝트 또는 사용 중인 데이터베이스에 이루어질 수도 있지만, 신규 프로젝트를 가
정하고 예제를 들도록 하겠다.
다음은 데이터표준 관리 프로세스를 보여준다.
데이터 표준화는 크게 논리/물리 모델을 작성하는 Modeler의 역할과 데이터 표준화 시스템에 대한 관리 및 준수
여부 관리 등을 위해 데이터 관리자(DA)의 역할로 나누어진다.
3. 데이터표준화 따라하기
지금부터 간단한 데이터 모델을 사례로 들어 데이터표준 관리 프로세스를 설명하도록 하겠다.
3.1. 논리 모델 작성
프로젝트를 성공적으로 완수하기 위한 방법의 하나로 요구사항관리를 전산화하기 위해 다음과
같은 논리모델이 작성되었다.
Embarcadero Technologies - 3 -
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
데이터
표준화
시스템
3.2. 용어수집
현행모델의 모든 속성을 추출하여, 분류, Sort, Merge 기능 등 분석이 용이한 데이터베이스의 테이블이나 Excel
등에 저장해 보자.
Auto_Naming.bas 매크로를 실행한 후 [Execute] 버튼을 클릭하면, 아래 그림과 같이 용어사전에 없는 용어 목록
이 ②번 영역 (Unmatch words)에 리스트 된다.
버튼을 클릭하여 ①번 영역(용어사전)으로 용어를 옮긴 후, [Save] 버튼을 클릭하여 용어목록을 “용어수
집.csv”로 저장한다.
참고) 매크로는 반복되는 작업을 자동화하여 생산성을 향상시킬 수 있는 자동화 도구로 다음 기술문서에 자세히
설명되어 있다. 매크로 - 편리한 자동화
3.3. 표준단어사전 정의
표준단어 사전이란 기업에서 업무상 사용하며 일정한 의미를 갖고 있는 최소 단위의 단어를 정의한 사전이다. 표
준용어를 구성하는 단어에 대한 표준을 정의함으로써 표준용어에 대한 한글명과 영문명을 일관되게 정의할 수
있게 한다.
표준단어는 다음과 같은 일련의 과정을 거쳐 정의한다.
1) 단어 분할
수집된 용어를 최소 단위의 단어로 분할한다.
논리명 단어1 단어2 단어3 단어4
개수 개수
결재방법코드 결재 방법 코드
구매가격 구매 가격
구매포인트 구매 포인트
도서 도서
도서명 도서 명
도서번호 도서 번호
배송방법코드 배송 방법 코드
배송번호 배송 번호
배송지상세주소 배송지 상세 주소
Embarcadero Technologies
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
배송지우편번호 배송지 우편 번호
배송지전화번호 배송지 전화 번호
배송지주소 배송지 주소
배송지핸드폰번호 배송지 핸드폰 번호
상세주소 상세 주소
우편번호 우편 번호
이메일 이메일
전화번호 전화 번호
주문 주문
주문목록 주문 목록
주문번호 주문 번호
주문일자 주문 일자
주민번호 주민 번호
주소 주소
핸드폰번호 핸드폰 번호
회원 회원
회원명 회원 명
회원번호 회원 번호
2) 표준단어사전 정의
분할하여 취합된 모든 단어 중에서 의미가 동일한 단어에 대해 하나의 대표 단어를 표준으로 선정하고 그에 대
한 영문 약어명을 선택한다.
번호 한글명 정의 영문명 영문 약어명 동의어/유의어/
금칙어
1 가격 물건의 가격을 나타냄 AMOUNT AMT 금액, ~가
2 개수 셀 수 있는 사물의 수 COUNT CNT ~수, 건수
3 결재 승인/미승인 된 결과 SIGN SIGN 승인, 허가
4 구매 상품을 사는 행위 BUY BUY 구입
5 도서 일반적인 서적 BOOK BOOK 책
6 명 지칭하는 말 NM NM 이름
7 목록 리스트 LIST LST
8 방법 목적을 이루기 위해
취하는 방식이나 수단 METHOD
MTHD 방안
9 배송 물건을 주문한 회원에게
보내는 행위 DELIVERY
DELIV
10 배송지 물건을 주문한 회원에게
보내기 위한 장소
DELIVERY-
PLACE
DELIV_PLAC
11 번호 숫자 NUMBER NO
12 상세 자세하고 상세함 DETAIL DETA
13 우편 ZIP ZIP
Embarcadero Technologies - 5 -
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
데이터
표준화
시스템
14 이메일 메일 주소 EMAIL EMAIL
15 일자 DATE DT
16 주문 도서를 주문 ORDER ORDER
17 주민 주민 RESIDENT RES 주민등록
18 주소 거주지의 주소 ADDRESS ADDR
19 코드 정보를 나타내는 기호의
체계 CD
CD 구분코드
20 포인트 가점, 득점 POINT PNT 점수
21 전화번호 전화번호 TELEPHONE TEL
22 핸드폰 손으로 들고 다니는
전화기
MOBILE
PHONE
MPHN 휴대폰
23 회원 어떤 회를 구성하는
사람들 MEMBER
MEMB
3.4. 표준용어사전 정의
업무적으로 사용하는 용어에 대한 표준을 정의한다.
1) 표준용어사전 정의
표준단어에 있는 단어의 조합을 통해 표준용어를 정의한다.
표준용어 영문명
개수 CNT
결재방법코드 SIGN_MTHD_CD
구매가격 BUY_AMT
구매포인트 BUY_PNT
도서 BOOK
도서명 BOOK_NM
도서번호 BOOK_NO
배송방법코드 DELIV_MTHD_CD
배송번호 DELIV_NO
배송지상세주소 DELIV_PLAC_ADDR
배송지우편번호 DELIV_PLAC_ZIP
배송지전화번호 DELIV_TEL_NO
배송지주소 DELIV_ADDR
배송지핸드폰번호 DELIV_ MPHN_NO
상세주소 DETA_ADDR
우편번호 ZIP_NO
이메일 EMAIL
전화번호 TEL_NO
주문 ORDER
Embarcadero Technologies
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
주문목록 ORDER_LST
주문번호 ORDER_NO
주문일자 ORDER_DT
주민번호 REG_NO
주소 ADDR
핸드폰번호 MPHN_NO
회원 MEBER
회원명 MEMB_NM
회원번호 MEMB_NO
2) 표준용어사전을 논리모델에 적용
이와 같이 정리된 표준용어를 논리 모델에 적용해보자.
① 우선, 위에서 정의한 용어사전을 “표준용어.csv” 파일로 저장한다.
② Auto_Naming 매크로를 실행하면 다음과 같은 실행화면이 나타난다.
[Open] 버튼을 클릭하여 “표준용어.csv” 파일을 선택한 후 [Excute] 버튼을 클릭하면 물리명이 자동으로 변환된다.
Unmatch words 영역에 용어사전에 없는 논리명이 하나도 없고, 오른쪽 영역에서 논리(한글)명에 해당하는
물리(영문)명이 모두 변환된 것을 확인할 수 있다.
Embarcadero Technologies - 7 -
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
데이터
표준화
시스템
3.5. 표준도메인 정의
표준도메인은 컬럼에 대한 성질을 그룹핑 한 개념으로 표준 도메인을 컬럼에 적용함으로써 데이터 타입 및 길이
를 일관되게 정의할 수 있다.
1) 표준도메인 정의
① 모든 속성의 접미어를 분리해 보면서 공통으로 발생하는 접미어를 분리하여 하나로 만든다.
엔티티명 속성명 도메인명 도메인명
도서 도서번호 도서번호 금액
도서 도서명 명 개수
주문 주문번호 주문번호 결재방법코드
주문 주문일자 일자 도서번호
주문 결재방법코드 결재방법코드 명
주문 배송방법코드 배송방법코드 배송방법코드
주문 배송번호 배송번호 배송번호
주문 배송지우편번호 우편번호 상세주소
주문 배송지주소 주소 수량
주문 배송지상세주소 상세주소 우편번호
주문 배송지전화번호 전화번호 이메일
주문 배송지핸드폰번호 핸드폰번호 일자
주문 회원번호 회원번호 전화번호
주문목록 주문번호 주문번호 주문번호
주문목록 도서번호 도서번호 주민번호
주문목록 구매가격 금액 주소
주문목록 개수 수량 핸드폰번호
회원 회원번호 회원번호 회원번호
회원 회원명 명
주민번호 주민번호
회원 전화번호 전화번호
회원 핸드폰번호 핸드폰번호
회원 이메일 이메일
회원 우편번호 우편번호
회원 주소 주소
회원 상세주소 상세주소
회원 구매포인트 수량
Tip) 이때, 엔티티명, 속성명 목록은 Export Meta Data to Excel Version 2.1 매크로를 실행하면 쉽게 얻을 수 있
다.
② 분리된 접미어를 의미가 비슷한 것끼리 묶어(문자, 숫자, 날짜) 이름을 부여한다. 이때 코드와 번호에 해당하
는 도메인은 개별로 부여한다.
③ 각 도메인별로 데이터 타입과 길이를 지정한다.
Embarcadero Technologies
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
도메인구분 도메인명 도메인타입 비고
번호 도서번호 VARCHAR(10) YYYYMM+SEQ(4)
배송번호 VARCHAR(8)
전화번호 VARCHAR(18) ‘-‘포함할 수 있음
주문번호 VARCHAR(14) YYYYMM+SEQ(8)
회원번호 VARCHAR(6)
주민번호 VARCHAR(13) ‘-‘제외
우편번호 CHAR(6)
코드 결재방법코드 CHAR(2)
배송방법코드 CHAR(2)
문자 명 VARCHAR(40)
이메일 VARCHAR(100)
주소 VARCHAR(100) 시도군, 읍면동
상세주소 VARCHAR(100) 나머지 주소
날짜 일자 DATE
숫자 금액_숫자10 NUMERIC(10) 일반금액
수량 NUMERIC(7)
Tip) 이때 논리 모델에 대한 도메인타입은 다양한 Target DBMS로 물리모델 변환이 가능하도록 공통된 타입을
사용한다. 논리 데이터 타입은 크게 문자, 숫자, 날짜로 나뉘어지며 VARCHAR, CHAR, NUMERIC, DATE로 정의한
다. 물리 모델 매핑시 오라클의 경우 VARCHAR2, CHAR, NUMBER, DATE의 형태로 매핑된다. 논리 모델과 물리
모델 간의 데이터타입 매핑 정보는 Tools Datatype Mapping Editor 메뉴를 클릭하여 Datatype Mapping
Editor에서 확인이 가능하다.
2) 표준도메인을 논리모델에 적용
이와 같이 정리된 도메인을 논리 모델에 적용해보자.
① ER/Studio에서 도메인을 하나하나 정의할 수도 있지만, Import Domains from Excel 매크로를 활용하면 엑
셀로 정의한 내용을 일괄적으로 손쉽게 적용할 수 있다.
② 다음과 같이 도메인 정보를 정의한 후 “도메인일괄생성.xls”로 저장한다
Embarcadero Technologies - 9 -
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
데이터
표준화
시스템
이때 주의할 점은 폴더명과 도메인명이 일치해서는 안 된다.
③ Import Domains from Excel 매크로를 실행하면 다음과 같은 실행화면이 나타난다.
[Browse] 버튼을 클릭하여 위에서 작업한 “도메인일괄생성.xls” 파일을 열고, [OK] 버튼을 클릭해보자. 참고로,
[Get Sample Sheet] 버튼을 클릭하면 ②에서 작업한 엑셀 Sample 파일이 다운로드 된다.
④ 그럼, 다음과 같이 모델에 도메인이 일괄 생성될 것이다.
⑤ 다음으로 각 엔티티의 속성에 도메인을 할당한다.
이 역시 Entity Editor에서 속성 하나 하나씩 도메인을 연결할 수도 있지만, 매크로를 통해 일괄 바인딩 해보도록
하자.
⑥ 다음과 같이 속성과 도메인 정보를 매핑하여 “도메인일괄바인딩.xls”로 저장한다.
Embarcadero Technologies
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
⑦ Domain Bindings Import From Excel 매크로를 실행하면, 다음과 같은 실행화면이 나타난다.
[Browse] 버튼을 클릭하여 위에서 작업한 “도메인일괄바인딩.xls” 파일을 열고, [OK] 버튼을 클릭하면 엑셀 정보의
내용이 모델에 적용된다.
⑧ Diagram and Object Display Option 대화상자에서 Datatype, Domain 옵션을 체크하면
다음과 같이 도메인이 일괄 바인딩 된 것을 확인할 수 있다.
3.6. 표준코드 정의
표준코드는 도메인의 한 유형으로 도메인 값(코드 값)이 이미 정의되어 있는 도메인이다. 즉, 코드에 대한 표준은
다른 표준과는 달리 데이터 값, 즉 코드 값까지 이미 정의해야 한다.
코드유형 코드명 코드 순번 코드 값
결재방법코드 현금 1 01
카드결재 2 02
무통장입금 3 03
배송방법코드 우편 1 01
택배 2 02
3.7. 물리 모델 작성
지금까지 표준용어사전과 표준도메인을 정의한 후 논리 모델에 적용했다.
물리 모델을 생성하게 되면 컬럼명은 표준용어사전에 있는 영문명으로 데이터 타입은 도메인의 데이터 타입으
로 자동 생성된다.
표준화 작업이 명칭 통일로 명확한 의사소통 증대, 데이터 품질 향상, 정보시스템 간 인터페이스를 원활히 수행
Embarcadero Technologies - 11 -
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
데이터
표준화
시스템
할 수 있다는 많은 이점이 있지만, 처음에는 어렵고 시간이 오래 걸리는 작업처럼 인식될 수 있다. 하지만, 물리
모델 작업 시간을 단축시키고, 유지보수 시에도 생산성을 향상시킬 수 있다.
① 다음과 같이 database를 Oracle로 지정하여 물리 모델로 변환해 보자.
② 그럼, 다음과 같이 표준용어사전에 의한 물리(영문)명과 표준도메인에 의한 데이터 타입이 생성되게 된다.
3.8. 표준준수여부 확인
ER/Studio를 사용하여 데이터 모델링하고, 그것을 기초로 하여 운영 DBMS에 스키마를 생성하게 된다. 만일 데
이터표준화 내용을 준수하지 않았다면 데이터베이스 스키마 작업을 수행할 수 없도록 해야 한다. 이를 위해 데이
터베이스 스키마 생성 작업에 대해서는 별도의 승인 절차(표준준수 검사 후 생성)를 거쳐 진행되어야 한다.
스키마 생성 이후에도 주기적인 데이터모델과의 비교를 통해 운영 데이터베이스에 대한 표준준수 여부도 확인
해야 한다.
1) 데이터모델에 대한 표준준수여부 확인
데이터모델에 대해서는 표준용어사전, 표준도메인, 표준코드 사용여부 등의 표준준수 여부를 주기적으로 체크한
다.
① 논리 모델/물리 모델에 대한 표준용어사전 준수여부를 체크하기 위해 Auto_Naming 매크로를
실행하면, 다음과 같은 실행화면이 나타난다.
Embarcadero Technologies
데브기어 기술자료 tech.devgear.co.kr 데브기어 홈페이지 www.devgear.co.kr 문의 [email protected]
ER/Studio를 활용한 데이터 표준화 시스템 구축방안
② [Verify] 버튼을 클릭하면 다음과 같이 표준용어사전을 위배한 속성/컬럼 들에 대한 목록이 엑셀 파일로 생성
된다.
③ 표준도메인 준수여부를 체크하기 위해 Domain Bindings Import From Excel 매크로를 실행하면, 다음과 같은
실행화면이 나타난다.
왼쪽 영역에 도메인 목록이 나타나며 오른쪽 영역에는 도메인에 바인딩 되지 않은 속성/컬럼의 목록이 나타난다.
왼쪽 영역에서 도메인을 선택하고, 오른쪽 영역에서 매핑 할 속성/컬럼을 선택한 후 [Bind] 버튼을 클릭하여 도메인
바인딩 작업을 할 수 있다.
[Save] 버튼을 클릭하면 도메인에 바인딩 되지 않은 속성/컬럼 목록 정보를 파일로 저장할 수 있다.
2) 운영 데이터베이스에 대한 표준준수여부 확인
일반적으로 Case Tool을 사용해 모델링하고 자동으로 스키마를 생성하여 데이터베이스를 구축하지만, 이후 변경
에 대해서는 데이터베이스에 만 이루어지는 경우가 많다.
데이터모델이 데이터베이스로 반영된 이후, Compare&Merge Utility를 통해 데이터모델과 데이터베이스의 매핑
여부도 주기적으로 확인하여, 데이터모델과 데이터베이스를 일치시켜야 한다.
그리고 표준을 준수하지 않은 경우에는 변경 영향도를 분석하여, 운영 데이터베이스와 프로그램들을 단계적으로
변경해 나가야 한다.
엠바카데로 테크놀로지는, 1993년에 설립한 데이터베이스 툴 제작사입니다. 2008년에 볼랜드의 개발툴 부문 「CodeGear」를
합병하였습니다. 현재는 애플리케이션 개발자와 데이터베이스 기술자가 다양한 환경에서 소프트웨어 애플리케이션을 설계, 구
축, 실행하기 위한 툴을 제공하는 최대 규모의 독립계 툴 제작사입니다. 미국 기업의 총수입 랭킹 「포춘 100」중 90개 기업과
전세계 300만 이상의 고객이, 엠바카데로의 RAD Studio®, Delphi®、C++Builder® 등 개발툴 제품과 ER/Studio®、
DBArtisan®, RapidSQL®, DB PowerStudio® 등 데이터 모델링 및 DB관리 제품을 채용해, 생산성의 향상과 혁신적인 소프트웨
어 개발을 실현하고 있습니다. 엠바카데로 테크놀로지스는, 샌프란시스코에 본사를 두고, 세계 각국에 지사를 전개하고 있습니
다. 보다 자세한 내용은, http://www.devgear.co.kr를 참고하시기 바랍니다.