디지털 도서관과 메타데이터 표준화
DESCRIPTION
디지털 도서관과 메타데이터 표준화. 2004. 11. 19 한국과학기술정보연구원 (KISTI) 서태설 [email protected]. 목 차. 메타데이터 표준화의 필요성 디지털도서관의 개요 디지털도서관의 당면 문제점 메타데이터 표준화 디지털도서관을 위한 메타데이터 메타데이터의 개요와 발전과정 주요 문헌정보 메타데이터 메타데이터 표준화 전략 메타데이터 상호운용성 MDR 에 의한 메타데이터 표준화. 1. 메타데이터 표준화의 필요성. 1960 년이전. 1960 년이후. 1990 년이후. - PowerPoint PPT PresentationTRANSCRIPT
2004-11-19 디지털도서관 컨퍼런스
디지털 도서관과디지털 도서관과메타데이터 표준화메타데이터 표준화
2004. 11. 19한국과학기술정보연구원 (KISTI)
2004-11-19 디지털도서관 컨퍼런스
목 차1. 메타데이터 표준화의 필요성
디지털도서관의 개요
디지털도서관의 당면 문제점
메타데이터 표준화
2. 디지털도서관을 위한 메타데이터 메타데이터의 개요와 발전과정
주요 문헌정보 메타데이터
3. 메타데이터 표준화 전략 메타데이터 상호운용성
MDR 에 의한 메타데이터 표준화
2004-11-19 디지털도서관 컨퍼런스
1960 년이전
수작업 검색(2 차정보 )
검색
Data Card
54 년 검색시스템
1960 년이후
온라인 검색(2 차정보 )
검색시간효율성
DB Schema
60 년초 TSS69 년 ARPANet81 년 LAN
시기
검색
시장요구
데이터
주요기술발전
1990 년이후
Web 검색( 원정보 )
검색시간효율성
편리성 / 감성
Simple DTD DB Schema
93 년 모자이크94 년 Netscape
200? 년
차세대 Web 검색( 원정보 +…)
검색시간효율성
편리성 / 감성의미 / 활용성
Metadata
Semantic Web
1. 메타데이터 표준화의 필요성
디지털도서관의 개요 (1/4)
전통적 도서관 디지털도서관 가상도서관정보센터
정보 검색 기술의 발전과정정보 검색 기술의 발전과정
자료 : 서태설 외 , 지식콘텐트의 표준과 기술동향 , 한국과학기술정보연구원 , 2003. 12.
2004-11-19 디지털도서관 컨퍼런스
1. 메타데이터 표준화의 필요성
디지털도서관의 개요 (2/4)
과거
InternetInternet
현재
2004-11-19 디지털도서관 컨퍼런스
디지털도서관의 개요 (3/4)
명칭 디지털도서관 , 전자도서관 , 가상도서관
개념 자료의 디지털화 + 네트워크에 의한 접근
기능 자원의 전자화된 목록을 통한 탐색 디지털 데이터 , 정보 , 지식의 제공 네트워크를 통한 커뮤니케이션
1. 메타데이터 표준화의 필요성
자료 : 한상완 외 , “ 국가디지털도서관 구축계획에 관한 연구” , 한국문헌정보학회지 , 제 30 권 제 3 호 , 1996
2004-11-19 디지털도서관 컨퍼런스
효과 폭증하는 정보의 효율적 관리 정보의 신속한 검색과 전달 분산된 정보를 활용한 새로운 서비스 창출 다양한 형태의 ( 멀티미디어 ) 정보 제공 정보의 지역적 불균형 (digital divide) 해소 정보의 중복 구축 방지
1. 메타데이터 표준화의 필요성
디지털도서관의 개요 (4/4)
자료 : 심효정 , “ 디지털도서관의 정책과 제도의 분석” , 정보관리연구 , 제 34 권 제 1 호 , 2003
2004-11-19 디지털도서관 컨퍼런스
디지털도서관의 당면 문제 (1/3)
검색 및 출력 양식의 불일치검색 및 출력 양식의 불일치(( 국가전자도서관국가전자도서관 ))
1. 메타데이터 표준화의 필요성
2004-11-19 디지털도서관 컨퍼런스
디지털도서관의 당면 문제 (2/3)
데이터 요소 및 형식의 불일치데이터 요소 및 형식의 불일치 (KISTI)(KISTI)
1. 메타데이터 표준화의 필요성
Adonis(1993-2002)
해외학술지수집대상리스트
Swetscan(1994-)
Ebsco(1993-)
CrossRef
해외도입 DB
데이터요소데이터요소 // 형식 분석형식 분석
Oracle DB
데이터 변환
Adonis표준데이터포멧파일
Swetscan표준데이터포멧파일
Ebsco표준데이터포멧파일
CrossRef표준데이터포멧파일
해외도입 DB표준데이터포멧파일
Work table 생성
참조
ADONIS
JTIActa Obstetricia et Gynecologica ScandinavicaISN0001-6349YPB2002VON81IUN11PGR995-1000ATIMonoamniotic twins: Diagnosis and management
CrossRef
journal title="Journal of Neuroscience" Research"
issns="03604012,10974547"
year="2001"
volume="66" issue="4"
page="612"
atitle="Role of taurine in regulation of intracellular ...
2004-11-19 디지털도서관 컨퍼런스
디지털도서관의 당면 문제 (3/3)
데이터 오류 및 중복 발생데이터 오류 및 중복 발생 (KISTI)(KISTI)
1. 메타데이터 표준화의 필요성
표준데이터포멧파일 오류데이터 ?
통합 DB
중복데이터 ?
오류 DB
중복 DB
항목누락데이터 ?
Y
N
오류코드부여
Y
N Y
N
순번 입수처 총종수 대상종수
1 Adonis - -
2 Swetscan 7,728 7,728
3 Ebsco 8,029 2,005
4 CrossRef 6,299388(5,911
)
5 해외도입 - -
6 기타 790 -
2004-11-19 디지털도서관 컨퍼런스
메타데이터 표준화 (1/3)
정보의 표현 방법정보의 표현 방법
1. 메타데이터 표준화의 필요성
유형제목
페이지
권호
사용언어잡지명
:
Journal
디지털도서관의 …pp. 17-31
제 34 권 제 1 호
KO
정보관리연구
:
Object Property Representation
논문
2004-11-19 디지털도서관 컨퍼런스
메타데이터 표준화 (2/3)
데이터 요소 및 형식의 불일치데이터 요소 및 형식의 불일치
1. 메타데이터 표준화의 필요성
항목명 (property) 의 불일치 표현 (representation) 의 불일치
명칭 표기의 차이
다른 항목 선택
명칭 세분화
값 표기의 차이단위의 차이
유형제목
페이지
권호
사용언어잡지명
종류표제쪽수
권
발행국가저널명
호
Journal
디지털도서관의 …pp. 17-31
제 34 권 제 1 호
KO
정보관리연구
J
전자도서관의 …P. 17-31
Vol. 34
한국정보관리연구
No. 1
불일치유형
불일치유형
2004-11-19 디지털도서관 컨퍼런스
메타데이터 표준화 (3/3)
메타데이터 표준화의 효과메타데이터 표준화의 효과
1. 메타데이터 표준화의 필요성
A 기관 B 기관 C 기관
데이터표준유무 < 있음 > < 없음 > < 없음 >
‘ 항목명’표기예 차량가격 가격 공식가격
‘ 항목값’표기예 1000 10,000 10,000,000
‘ 항목단위’표기예 만원 천원 원
‘ 항목길이’표기예 5 자리 6 자리 9 자리
정보생산 / 유통기관
A DB
정보생산 / 유통기관
C DB
정보생산 / 유통기관
B
DB
검색 비효율
정보상호운용 불가
정보생산 / 유통기관
A DB
정보생산 / 유통기관
B DB
정보생산 / 유통기관
C DB
메타데이터 표준
정보자원 속성 , 명세 , 의미 등에 대한 메타데이터 등록
검색효율성대폭 증가
정보 상호운용 가능
A 기관 B 기관 C 기관
데이터표준유무 <MDR 참조 >
‘ 항목명’표기예 가격
‘ 항목값’표기예 10,000
‘ 항목단위’표기예 천원
‘ 항목길이’표기예 6 자리
2004-11-19 디지털도서관 컨퍼런스
메타데이터의 개요와 발전과정 (1/3)2. 디지털도서관을 위한 메타데이터
메타데이터의 정의메타데이터의 정의정의자 정의 대상
Herry (1996) 데이터에 대한 데이터 (data about data) 데이터Lange & Winkler (1997)
전자자원을 記述하는데 사용되는 데이터 요소 전자자원
Iannella (1998) 데이터에 대한 구조화 (structured) 된 데이터 데이터
메타데이터의 개념은 이미 오래 전부터 있어왔다 . 사물에 대한 의사전달 및 데이터 양식 , 스키마 등
HTML 에 기반한 웹 문서에는 메타데이터가 매우 취약하다 . XML 은 이 부분을 강화한 것이다 .
이제 새로운 가능성을 가지고 메타데이터를 이야기 하는 시대가 열리고 있다 . 시멘틱 웹
2004-11-19 디지털도서관 컨퍼런스
메타데이터의 개요와 발전과정 (2/3)2. 디지털도서관을 위한 메타데이터
메타데이터의 기능 Metadata identifies and describes an information
object; it also documents how that object behaves, its function and use, its relationship to other information object and how it should be managed.
메타데이터의 유익 Effectiveness of searching Cataloging + Relationship System independence
Anne J. Gilliland-Swetland, Introduction to Metadata, Getty In- formation Institute., 1998
2004-11-19 디지털도서관 컨퍼런스
메타데이터의 개요와 발전과정 (3/3)2. 디지털도서관을 위한 메타데이터
AACR2
MARC
FRBR
DC
TEI IH
ONIX InternationalONIX
EPICS
INDECS
ONIX Int. 1.3 ONIX Int. 2.0
MODS
문헌정보 메타데이터의 발전과정문헌정보 메타데이터의 발전과정
1995
2002
1965
2000
2004-11-19 디지털도서관 컨퍼런스
주요 문헌정보 메타데이터 (1/8)2. 디지털도서관을 위한 메타데이터
MARC (MAchine Readable Cataloging)MARC (MAchine Readable Cataloging)
MARC 형식은 시스템간의 레코드 교환을 위한 표준적인 목록
레코드 형식 ( 구조 ) 으로서 정보 자원의 기술 (description) 이라는
측면에서 도서관의 목록 레코드를 메타데이터로 보는 관점
1965 년 LC MARC 로 출발 , USMARC 로 개정
MARC 는 1971 년에는 ANSI Z39.2, 1973 년에는 ISO 2709 로 채택
USMARC -> CANMARC, UKMARC, KORMARC 등
1999 년 USMARC 과 CANMARC 이 통합되면서 MARC21
간결성 , 효율성 , 표현력 , 융통성에서 제한적이고 , 인증
데이터 , 네트워크 환경 등을 반영하지 못하며 , 구조가 복잡함 .
2004-11-19 디지털도서관 컨퍼런스
Leader 01041cam 2200265 a 4500 Control No. 001 ###89048230#/AC/r91 Control No. ID 003 DLC DTLT 005 19911106082810.9 Fixed Data 008 891101s1990 maua j 001 0 eng LCCN 010 ## $a ###89048230 ISBN 020 ## $a 0316107514 : $c $12.95 Title 245 10 $a Make the team. $p Soccer : $b a heads up guide to super soccer! / $c Richard J. Brenner. Variant Title 246 30 $a Heads up guide to super soccer Edition 250 ## $a 1st ed. Publication 260 ## $a Boston : $b Little, Brown, $c c1990.
제어필드
데이터필드
리더
주요 문헌정보 메타데이터 (2/8)2. 디지털도서관을 위한 메타데이터
MARC MARC 레코드 사례레코드 사례
2004-11-19 디지털도서관 컨퍼런스
주요 문헌정보 메타데이터 (3/8)2. 디지털도서관을 위한 메타데이터
DC(Dublin Core)DC(Dublin Core)
모든 네트워크 자원을 기술하려는 시도로 , 확장성 , 구문
독립성 , 선택성 , 수정가능성 등의 기준에 따라 누구나 쉽게
작성하도록 15 개의 데이터 기술 요소만 제안
1995 년 3월 OCLC 와 NCSA 가 Dublin 워크숍에서 시작
2000 년 7월 한정어 (Canberra Qualifier) 의 도입
2002 년 2월 DCMI 는 Dublin Core Metadata Element Set, v.1.
1 를 발표 이래 세계 각국 표준으로 채택 : CWA 13874, ANSI/NI
SO Z39.85, UK e-Government, ISO 15836:2003
너무 단순해서 디지털도서관용으로는 제한적임 .
2004-11-19 디지털도서관 컨퍼런스
주요 문헌정보 메타데이터 (4/8)2. 디지털도서관을 위한 메타데이터
DC 15DC 15 개 기본 요소개 기본 요소Subject 자원의 주제나 그 내용을 기술하는 키워드 혹은 구절Creator 자원의 내용에 책임을 진 개인이나 단체 ( 예 : 저자 )
Title creator 나 publisher 가 자원에 부여한 제목Publisher 자원을 현재의 형태로 이용 가능하게 만든 실체 ( 예 : 출판사 )
Contributor 저자 이외의 기여한 인물이나 기관 ( 예 : 번역자 )
Date 자원이 현재 형태로 가능하게 된 날짜Type 자원의 범주나 장르 ( 예 : 기술보고서 )
Format 자원의 데이터 표현 형식 ( 예 : ASCII)
Identifier 자원을 고유하게 식별할 수 있는 문자열이나 숫자 ( 예 : URL)
Relation 다른 자원과의 관계 .( 예 : chapters in a book)
Sources 해당 자원의 출처가 된 정보자원 Language 자원의 내용을 기술한 언어 ( 예 : 영어 )
Coverage 자원의 지리적 , 시간적 특성을 나타내는 요소Description 요약 정보를 포함한 자원의 내용에 관한 정보 ( 예 : 초록 )
Rights 저작권의 사용 권한에 관한 내용
2004-11-19 디지털도서관 컨퍼런스
인쇄책 , 전자책 , CD, DVD 등을 포함하는 다양한 미디어 제품에
대한 유통 메타데이터
Amazon.com, Wiley, Cambridge University Press 등에서 사용 . 미국 /
영국 70여개 기관 회원
250여개 element; 매우 상세한 명세로 주관적 해석이 개입될 여부가
없음 . 예 )<title> 에 대한 사항이 6-7 개
현재 Version 2.1
IT 산업에 필요한 정보 제공
주요 문헌정보 메타데이터 (5/8)2. 디지털도서관을 위한 메타데이터
ONIX (ONine Information eXchange) InternationalONIX (ONine Information eXchange) International
2004-11-19 디지털도서관 컨퍼런스
<?xml version="1.0"?><!DOCTYPE ONIXmessage SYSTEM"http://www.editeur.org/onix/2.0/short/onix-international.dtd"><ONIXmessage> <header> ... </header> <product> ... </product> <product> ... </product> ...</ONIXmessage>
<?xml version="1.0"?><!DOCTYPE ONIXmessage SYSTEM"http://www.editeur.org/onix/2.0/short/onix-international.dtd"><ONIXmessage> <header> ... </header> <product> ... </product> <product> ... </product> ...</ONIXmessage>
<ONIXmessage><header><FromCompany>www.deu.ac.kr</FromCompany><FromPerson>[email protected]</FromPerson><ToCompany>EDItEUR</ToCompany><ToPerson>David Martin</ToPerson><MessageNumber>1213</MessageNumber><SentDate>2004070161330</SentDate><MessageNote> 샘플 자료를 보냅니다 .</MessageNote><DefaultLanguageOfText>kor</DefaultLanguageOfText></header>
Header( 메시지 )
……………<Product> <RecordReference>1234567890</RecordReference> <NotificationType>03</NotificationType> <ISBN>0816016356</ISBN> <ProductForm>BB</ProductForm> <DistinctiveTitle>British English, A to Zed</DistinctiveTitle>
<Contributor> <ContributorRole>A01</ContributorRole> <PersonNameInverted>Schur,Norman W</PersonNameInverted> <BiographicalNote>A Harvard graduate in …· </BiographicalNote> </Contributor>
: : :
<BASICMainSubject>REF008000</BASICMainSubject>
<PublicationDate>1987</PublicationDate> <Height>9.25</Height> <Width>6.25</Width> <Thickness>1.2</Thickness>
Product( 제품 )
주요 문헌정보 메타데이터 (6/8)2. 디지털도서관을 위한 메타데이터
ONIXONIX 의 구조 예의 구조 예자료 : 이창열 , “ONIX 메타데이터 체계와 구현” , KISTI 내부세미나 , 2004
2004-11-19 디지털도서관 컨퍼런스
주요 문헌정보 메타데이터 (7/8)2. 디지털도서관을 위한 메타데이터
MODS (Metadata Object Description Schema)MODS (Metadata Object Description Schema)
MARC, DC, ONIX, IMS, TEI 등을 절충하여 상호운용성과 정밀성을 모두 만족시킨 디지털도서관 영역의 범용 서지정보 표준 메타데이터 2002 년 7월 Library of Congress 가 공식발표 ( 현재 버전 3.0) MARC-compatible: MARC 필드의 일부분 포함 , 언어형식의 태그
사용 XML schema 기반 : MARC 21 의 축약형 XML 버전 (MARCXML) 19 개의 상위요소와 64 개의 하위요소
METS (Metadata Encording and Transmission Standard) 와 함께 사용됨으로써 디지털도서관의 요구에 부합
자료 : 이수상 , “MODS- 디지털 도서관의 서지정보 표준 메타데이터” , KISTI 내부세미나 , 2004
2004-11-19 디지털도서관 컨퍼런스
요소 기술내용 요소 기술내용Titleinfo 제목관련정보 note 주기name 자원의 책임자 , 기여자 subject 주제 및 주제관련키워드typeOfResource 자원의 범주 classification 자원의 분류정보genre 자원의 유형 relateditem 관련된 자원origininfo 출판자 정보와 날짜정보 identifier 자원 식별자
language 자원 기술 언어 location 자원접근정보physicalDescription 자원의 데이터표현형식 accessCondition 저작권관련내용abstract 초록 extension 확장요소tableOfContents 목차 recordinfo 레코드정보targetAudence 자원이용자 - -
MODSMODS 의 상위 메타데이터 요소의 상위 메타데이터 요소
주요 문헌정보 메타데이터 (8/8)2. 디지털도서관을 위한 메타데이터
자료 : R. Gartner, MODS: Metadata Object description Schema, Libraries and the Academy. Vol. 3. No. 1., 2003
2004-11-19 디지털도서관 컨퍼런스
메타데이터의 상호운용성 (1/4)3. 메타데이터 표준화 전략
메타데이터 상호운용성 정의와 방법메타데이터 상호운용성 정의와 방법
정의 : 서로 다른 메타데이터를 사용하는 시스템들이 각각의
메타데이터를 이해할 수 있는 능력 (ALCTS 1998)
상호 운용성의 3 요소 : 구문 , 구조 , 의미
다양한 메타데이터 표준의 혼재로 상호운용 필요성 제기
방법 :
하나의 메타데이터로 통합 : MARC21, MODS
다양한 메타데이터 인정 : Crosswalk, RDF
메타데이터 레지스트리 : ISO/IEC 11179
2004-11-19 디지털도서관 컨퍼런스
USMARC 과 DC,TEI, EAD 의 매핑 테이블 , DC 와 다른 메타데이터
형식과의 참조 테이블 , 공통 메타데이터 기술집합과의 매핑
http://ukoln.bath.ac.uk/metadata/interoperability/ 참조
문제점
의미상의 일치를 위해서는 전문가의 지적 능력이 필요
메타데이터의 잦은 수정으로 인한 유지관리의 부담
정확한 1:1 대응이 되지 않는 부분
메타데이터의 상호운용성 (2/4)3. 메타데이터 표준화 전략
상호참조 테이블상호참조 테이블 (Crosswalk)(Crosswalk) 방법방법
2004-11-19 디지털도서관 컨퍼런스
공존하는 다양한 메타데이터 형식의 상호운용성 지원 W3C 에서 개념적인 차원의 통합 구조인 RDF를 개발 , 구현
http://www.w3.org/RDF/ 참조
RDF
의미Metadata Initiatives
구문XML
구조RDF 모델
스미카 1DC
스미카 1MARC
스미카 1관리메타데이터
XMLnamespace
메타데이터의 상호운용성 (3/4)3. 메타데이터 표준화 전략
범용적 메타데이터 통합 구조범용적 메타데이터 통합 구조
2004-11-19 디지털도서관 컨퍼런스
통제적인 방법로서 ISO/IEC JTC1/SC32 에서 표준화 메타데이터 작성 지침 제공
데이터 요소 ( 메타데이터 ) 의 생성 , 등록 , 관리를 지원함으로써 시스템들 또는 조직들간의 정보 공유를 지원
http://metadata-stds.org/11179/
참조
Registrar Control Committee
Registration Authority
Executive Committee
Read-only Users
Metadata Registry
Submitters
Submitting Organization
Stewards
Responsible Organization
Registrar Control Committee
Registration Authority
Executive Committee
Read-only Users
Metadata RegistryMetadata Registry
Submitters
Submitting Organization
SubmittersSubmitters
Submitting Organization
Stewards
Responsible Organization
StewardsStewards
Responsible Organization
메타데이터의 상호운용성 (4/4)3. 메타데이터 표준화 전략
메타데이터 레지스트리메타데이터 레지스트리 (MDR) (MDR) 방법방법
2004-11-19 디지털도서관 컨퍼런스
메타데이터참조
표준 메타데이터 적용
정보이용자
검색
DL-MDR
DB정보개발자정보개발자정보개발자DB
DB
기술위원회
표준화 실무작업반
메타데이터표준개발요청
MDR 에 의한 메타데이터 표준화 (1/5)3. 메타데이터 표준화 전략
디지털도서관의 메타데이터 디지털도서관의 메타데이터 표준화 개념표준화 개념
2004-11-19 디지털도서관 컨퍼런스
메타데이터표준 및
제작 지침에따라
데이터베이스구축
해당 분야의메타데이터 제공
각 기관의정보제작 담당자
정기교육
데이터베이스설계 제공
데이터베이스품질 평가
정보이용자
DBDB
DB
과학기술도서관과학기술도서관
공공도서관공공도서관
의학도서관의학도서관
………….………….
MDR
KISTI ………
국회도서관국립중앙도서관
의학도서관………
:……………..
DBDB
DB
DBDB
DB
DBDB
DB
고품질의일관성 있는
정보 수집
MDR 에 의한 메타데이터 표준화 (2/5)3. 메타데이터 표준화 전략
MDRMDR 의 활용체계와 효과의 활용체계와 효과
2004-11-19 디지털도서관 컨퍼런스
정보화사업계획
정보표준화
의뢰사업수행
기술위원회
표준화 실무작업반
정보표준화
평가사업완료
DL-MDR
MDR 에 의한 메타데이터 표준화 (3/5)3. 메타데이터 표준화 전략
요구되는 제도적 장치요구되는 제도적 장치
2004-11-19 디지털도서관 컨퍼런스
MDR 에 의한 메타데이터 표준화 (4/5)3. 메타데이터 표준화 전략
KISTIKISTI 의 사례의 사례
사용자 인터페이스 개발 사용자 관리 도구
스키마 셋 관리 도구
( 스키마 셋 제안 , 스키마 셋
투표 , 스키마 셋 관리 )
데이터 요소 관리 도구( 요소 기본 관리 , 요소 상태 ,
평가 및 이력 , 요소 버전 관리 ,
데이터 요소 개념 관리 , 개념 도메인 관리 , 객체 클래스 관리 )기관 정보 관리 도구
MDR 기본 기능 ( 등록 , 평가 및 요소 표준화 기능 )
http://isv.kisti.re.kr/mdr/참조
2004-11-19 디지털도서관 컨퍼런스
Steward
RegistrarCommittee
ControlCommittee
Submitter
SuperAdministrator
DivisionAdministrator
분야별 MDR
.
.
.
•과학 기술 분야
•산업 기술 분야
•정보 통신 분야
•교육 분야
GeneralUser
GeneralUser
GeneralUser
….
MetaData Repository
정보통신분야MDR
산업기술분야MDR
과학기술분야MDR
분야별데이터베이스
Common Format
교육분야MDR
. . . .
. . . .
MDR 에 의한 메타데이터 표준화 (5/5)3. 메타데이터 표준화 전략
KISTIKISTI 의 사례의 사례
2004-11-19 디지털도서관 컨퍼런스
Thank You
연락처 : [email protected]
제 2 회 메타데이터 표준화 세미나 일시 2004 년 12 월 10 일 (금요일 ) 09:30 ~
17:30
장소 과학기술단체총연합회관중강당 ( 약도참조 )
더 자세한 더 자세한 내용을 알려면…내용을 알려면…