20100407 박진호 d_lifecycle_kisti

109
디디디 디디디디디 디디디디 (Digital Archiving) 2010.04.07 국국국국국국국 국국국국국국국국 국국국국국 국국국 디디디디 디디 디디디 디디디디 디디디

Upload: glorykim

Post on 26-May-2015

274 views

Category:

Documents


6 download

DESCRIPTION

디지털 정보자원의 아카이빙-OASIS프로젝트

TRANSCRIPT

Page 1: 20100407 박진호 d_lifecycle_kisti

디지털 정보자원의 아카이빙 (Digital Archiv-ing)

2010.04.07 국립중앙도서관 디지털총괄기획과 전문연구관 박진호

생명주기 기반 관리의 필요성과 방향성

Page 2: 20100407 박진호 d_lifecycle_kisti

Preserved Flower

[http://www.flickr.com/photos/8897269@N08/541851097/]

2

Page 3: 20100407 박진호 d_lifecycle_kisti

목차

1. 용어의 정의

2. 고민의 시작

3. 국립중앙도서관 프로젝트

4. 생명주기 기반 정보자원 처리

5. KISTI 가 주목해야할 프로젝트 및 사례

6. 결론 및 제언

3

Page 4: 20100407 박진호 d_lifecycle_kisti

Archives, Digital Archives,Digital Lifecycle

4

Page 5: 20100407 박진호 d_lifecycle_kisti

1. 용어의 정의

• 아카이브에 대한 최근의 정의들

– 디지털을 통해 공유되고 있는 막대한 양의 자료와 정보들에 대해 운영자관심별 혹은 정보 내용 별로 구분되어 저장 , 관리 , 공유되고 있는 웹사이트

– 인터넷상의 호스트 컴퓨터로 데이터나 소프트웨어를 보존하고 있는 곳

– 대규모 기록이나 자료의 수집

– 디지털화한 데이터를 압축하는 기술이나 방법

– 인터넷상의 호스트 컴퓨터로 데이터나 소프트웨어를 보존하고 있는 곳

5

Page 6: 20100407 박진호 d_lifecycle_kisti

1. 용어의 정의

• 아카이브

– 전통적으로 정부조직 , 공공기관 , 회사들이 공공 혹은 사적인 정보 소비자들이 이용할 수 있도록 기록을 보존하는 시설이나 조직

• 정보에 접근하는 자들의 이해를 도와야 하고 , 정보의 진본성과

장기간의

안정성을 보장해야 함

6

Page 7: 20100407 박진호 d_lifecycle_kisti

1. 용어의 정의

• 디지털 아카이빙 (Digital Archiving)

– 지속적인 가치를 가졌다고 판단되는 디지털 객체를 장기간 관리하는 활동 또는 가치 있는 디지털 정보자원을 선별하여 디지털 콘텐츠와 여러 기능들을 디지털 정보자원의 생명주기별 보존 관리하여 미래 이용자들이 어려움 없이 정보를 활용할 수 있도록 하는 전반적인 작업

– 디지털환경에서의 아카이브는 다양한 디지털 정보자원의 소장 및 보존 , 접근 기능을 지닌 시스템 또는 그러한 기능을 가진 프로그램 자체

[ 출처 : Lord & MacDonald, e-Science Data Curation Report, 2003]

7

Page 8: 20100407 박진호 d_lifecycle_kisti

1. 용어의 정의

• 디지털 큐레이션 (Curation)

– 디지털 정보 ( 자산 ) 의 유지 , 보존과 관련된 활동

• the preservation and maintenance of digital assets

• 디지털 정보 ( 자산 ) 의 아카이빙 , 수집 , 유지 , 영구보존활동

• 현재 및 미래의 이용자들이 활용할 수 있도록 디지털 정보자원의

장기보존을 위한 프로세스

[ 출처 : http://www.dcc.ac.uk]

8

Page 9: 20100407 박진호 d_lifecycle_kisti

1. 용어의 정의

• 큐레이션 관점에서 Digital Archiving

– Digital archiving 은 curation 활동을 의미하며 , 다음의 활동( 과정 ) 을 보장해야 함

• 정확한 데이터의 선택

• 정확한 데이터의 저장

• 접근 가능한 데이터

• 논리적 물리적 데이터 통합이 지속적으로 유지됨

• 데이터는 안전하고 확실함

[ 출처 : Lord & MacDonald, e-Science Data Curation Report, 2003]

9

Page 10: 20100407 박진호 d_lifecycle_kisti

1. 용어의 정의

• 큐레이션 관점에서 Digital Preservation

– Digital preservation 은 아카이빙 활동의 일환

– 기술적인 변화에 상관없이 데이터에 지속적으로 접근 가능해야 하고 ,

이해할 수 있어야 함

– 메타데이터를 포함한 콘텐츠 파일을 갖고 있어야 함

– 디지털의 발전에 따른 퇴화 / 기존의 디지털 자료 보호

– 기술변화에 대항하여 데이터의 진본성 유지

[ 출처 : Lord & MacDonald, e-Science Data Curation Report, 2003]

10

Page 11: 20100407 박진호 d_lifecycle_kisti

2. 고민의 시작

• 문제는 디지털

– 디지털정보 생산량이 연평균 57% 씩 성장해 2010 년에는 9,880 억 GB 의 정보가 생산될 것으로 전망

– 이는 한 사람이 일년간 만들어 내는 정보는 150GB 에 이르며 이를 300 페이지 책으로 환산하면 1 만 3,300 권에 달하는 분량이다 .

– 2007 년 국내 생성 · 복제 정보 총량 : 약 2701PB • MP3 파일로는 6752 억 5 천만곡• 1 메가바이트 용량인 500 페이지 책으로 환산하면 서울시 면적

전체를 1.5m 높이로 쌓을 수 있는 분량 (2 조 7000 억권 )

– 전세계 인구 1 인당 평균 생산량 : 150GB– 한국 인구 1 인당 생산량 : 330GB

[ 출처 : EMC, IDC ‘ 전세계 디지털정보 성장 전망 보고서’ ]

11

Page 12: 20100407 박진호 d_lifecycle_kisti

2. 고민의 시작

• “ How Much Information, 2003, UC Berkeley”

“ 얼마나 많은 정보가 세상에서 생겨나고 있는가 ?” http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/index.htm

Stored InformationStored Information Information FlowsInformation Flows

PaperPaper FilmFilm MagneticMagnetic OpticalOptical BroadcastBroadcast TelephonyTelephony InternetInternet

[ 지식정보의 구분 ]

• 2002 년 한 해에 새로운 정보로서 약 5 엑사바이트의 프린트 , 필름 , 마그네틱 , 옵티컬 저장 매체 생산

• 2002 년 한 해 생산정보가 지난 3 년보다 2 배 이상 많음• 2002 년 한 해에 약 18 엑사바이트의 새로운 전화 , 라이오 , TV, 인터넷 정보가 저장

12

Page 13: 20100407 박진호 d_lifecycle_kisti

3. 국립중앙도서관 프로젝트

3.1. OASIS 프로젝트

3.2. 디지털장서관리시스템

13

Page 14: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• 온라인 자료 수집 및 보존 프로젝트 (OASIS)– Online Archiving and Searching Internet Source– 디지털 지적 창작물들은 짧은 기간 동안 공개되었다가 사라져

버리는 소멸성을 가짐

– 이러한 디지털 자원의 수집과 보존을 위해 2003 년 10 월 유네스코에서는 인터넷 지식자원의 보존 및 이용에 관한 내용을 " 디지털 유산 보존 헌장 " 에서 천명함

– 또한 세계 각국의 주요 도서관은 90 년대 중반부터 이미 인터넷 지적 자원을 수집하고 보존하는 프로젝트를 추진하여 현재 다양한 연구 성과들을 발표

– 국가적인 차원에서 디지털자원의 수집과 보존을 등한시 한다면 미래세대에 있어서 현 세대는 잊혀진 암흑의 시대로 구분될 수 있음을 경고

14

Page 15: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• 주요추진 내용

추진연도 추진내용

2001.11. 온라인저작물 수집ㆍ보존 시스템 구축 ISP 및 시범시스템 개발

2003.10.

대통령이 국무회의시 디지털자원 수집ㆍ보존에 대한 추진지시

한국 관련 온라인 디지털자원의 망라적 수집 장관보고

도서관정책 집행업무 이관에 대비한 준비현황 기관장 회의 시 보고

2003.12. 온라인 디지털자원 수집 전담팀 구성 및 운영

2006.02. OASIS 홈페이지 대국민 서비스 실시

2008.10.국제인터넷정보자원보존기구 (IIPC - International Internet Preservation Consortium) 정회원 가입

15

Page 16: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• 추진 실적

수집유형 2004 년도 2005 년도 2006 년도 2007 년도 2008 년도 2009 년도 2010 년도 합계

웹 문서

( 개별자원 )39,032 47,553 42,958 79,261 108,956 65,952 117,000 500,712

홈페이지 1,064 2,706 20,767 21,251 3,114 134 3,000 52,036

계 40,096 50,259 63,725 100,512 112,070 66,086 120,000건 552,748

※ 서비스자료 ( 저작권이용허락자료 ) : 53,292건

16

Page 17: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• 수집 보존 프로세스

17

Page 18: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• 해외 사례

프로젝트 명 설명

PANDORA

• http://pandora.nla.gov.au• 호주 국립도서관이 1996 년부터 추진중인 웹자원의 수집 / 보존

프로젝트 , 선도적인 모범사례

MINERVA • http://www.loc.gov/minerva)• 2000 년 의회도서관에서 사이트수집의 실험차원에서 추진되었으

며 , 9. 11 테러 때 주요사이트를 수집 / 서비스 중임

Wayback Machine

• http://www.archive.org• 비영리 법인 Internet Archive 사가 1996 년부터 전세계 주요

웹사이트를 웹로봇 (Wayback Machine) 을 통하여 자동수집하고 있으며 , 국내 90 년 중반의 주요기관 웹사이트 검색가능 함

WARP• http://warp.ndl.go.jp• 2002 년 3 월부터 일본 국회도서관에서 추진중인 웹자원 수집 /

보존 프로젝트

UK Web Archive• http://www.webarchive.org.uk/ukwa/• 영국국립도서관 2010 년 처음 공개

18

Page 19: 20100407 박진호 d_lifecycle_kisti

19

Page 20: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• IIPC(International Internet Preservation Consortium)

– 2003 년 7 월 호주 , 캐나다 , 덴마크 , 핀란드 , 프랑스 , 아이슬랜드 , 이탈리아 , 노르웨이 , 스웨덴 , 영국의 국가도서관과 미의회도서관 , Internet Archive( 미국 ) 는 미래 세대를 위해 인터넷 콘텐츠를 보존하기 위한 국제적인 협력의 중요성을 인지 (초기 프랑스 국립도서관 주도 )

– 12 개 기관이 프로젝트에 필요한 자금을 지원하고 컨소시엄에 참여함 . 초기 3 년까지 12 개 기관만으로 운영하다가 이 후 전 세계의 도서관 , 기록관 , 박물관 , 문화유산기관으로 확장함

– 컨소시엄의 목적은 전 세계의 인터넷 콘텐츠에 장기적인 접근 , 보존 , 수집이 가능하도록 하는 것임

20

Page 21: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• IIPC(International Internet Preservation Consortium)

– IIPC 핵심목표• 각 국의 법적 테두리 안에서 협력 작업을 수행하여 인터넷 콘텐츠의

선정 , 수집 , 보존 및 접근 제공을 위한 해결책의 파악 및 개발 촉진• 각 국의 장서개발 정책과 맞추어 합법적이 국제적 인터넷 콘텐츠

아카이브 활성화• 인터넷 콘텐츠의 수집 , 보존 및 접근을 돕는 선도 사업의 국제적

지지 획득

– 사업추진방안• 표준의 개발 및 권장 • 웹 사이트 획득 , 아카이빙 , 접근 제공을 위한 상호운용성이 있는

도구 및 기법 개발• 학술회의 및 교육 사업 , 출판 등을 통해 인터넷 보존 문제와 선도

사업에 대한 인식 고취 21

Page 22: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• IIPC(International Internet Preservation Consortium)– IIPC 참여기관

지역 기관

아시아

• Jewish National and University Library (Israel)• National Diet Library, Japan • National Library Board, Singapore• National Library of China• National Library of Korea

유럽

• Biblioteca de Catalunya (Library of Catalonia)• Biblioteca Nazionale Centrale di Firenze (National Library of Italy,

Florence)• Biblioteka Narodowa (National Library of Poland) • Bibliotheque nationale de France (National Library of France)• British Library (U.K.) • Deutsche Nationalbibliothek (German National Library)• European Archive Foundation• Hanzo Archives Ltd. (U.K.) • Ina (Institut National de l'Audiovisuel) (France) • Kansalliskirjasto (National Library of Finland)• Koninklijke Bibliotheek (National Library of the Netherlands) • Kungl. biblioteket (National Library of Sweden)

22

Page 23: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

지역 기관

유럽

• Landsbokasafn Islands – Haskolabokasafn (National and University Library of Iceland)

• Nacionalna i sveučilišna knjižnica u Zagrebu (National and Univer-sity Library in Zagreb, Croatia)

• Narodna in univerzitetna knjižnica (National and University Library, Slovenia)

• Národní knihovna České republiky (National Library of the Czech Republic)

• Nasjonalbiblioteket (National Library of Norway)• National Archives (U.K.)• National Library of Scotland• Netarchive.dk (Royal Library and the State and University Library,

Aarhus)• Österreichische Nationalbibliothek (Austrian National Library) • Schweizerische Nationalbibliothek (Swiss National Library)• Virtual Knowledge Studio – Royal Netherlands Academy for Arts

and Sciences

• IIPC(International Internet Preservation Consortium)– IIPC 참여기관

23

Page 24: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

지역 기관

북미

• Bibliothèque et Archives Nationales du Québec (BAnQ)• California Digital Library (U.S.)• Internet Archive (U.S.)• Library and Archives Canada• Library of Congress (U.S.)• United States Government Printing Office• University of North Texas Libraries (U.S.)

오세아니아 • National Library of Australia• National Library of New Zealand

전 세계 38 개 기관의 참여

• IIPC(International Internet Preservation Consortium)– IIPC 참여기관

24

Page 25: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• IIPC 2010 년 작업반 (Working Group)

지역 기관

Harvesting

• 하베스팅 작업반의 주요 목표는 웹 하베스팅 기술의 개발임• 현재까지는 Internet Archives 사의 Heritrix 웹 크롤러의 개발과

활용에 중점을 두고 있음 . 주요 작업영역은 Smart Crawler 의 개발임 .

− 스마트 크롤러의 개발과 하베스팅 성능 개선− WARC 파일 포맷의 개발과 지원− 벌크 혹은 선택적 하베스팅 정보의 공유를 위한− 크롤러의 기능적 요청사항− Deep web 하베스팅− 비디오 , 스트리밍 미디어의 하베스팅

Access

• Access 작업반은 웹아카이브에 접근 제공과 관련된 쟁점사항들을 다룸

• IIPC 회원국 중 공동으로 대처 가능한 회원들이 직접 참여하여 , 실제 아카이빙 작업 중 겪게되는 문제와 경험을 공유함

• 또한 법적 , 윤리적 , 경제적 관점에서의 접근에 대한 기술 연구− 접근을 위한 이용자의 요구사항 정의 및 이해− 웹 아키이브 검색의 진보적인 방법과 전문검색 방법− 아카이브 웹사이트 내에서의 멀티미디어 접근− 웹 아카이브 콘텐츠와 구조 분석 툴− 기술 감독 (Technology watch)25

Page 26: 20100407 박진호 d_lifecycle_kisti

3.1. OASIS 프로젝트

• IIPC 2010 년 작업반 (Working Group)

지역 기관

Preservation

• 보존 작업반은 웹 아카이브의 접근성과 콘텐츠 보존지원을 위한 정책 , 실행계획 수립을 담당

• 웹 아카이브를 활용하여 디지털 자원을 사용하는 • 웹 아카이브 접근성 , 콘텐츠 보존을 위한 정책 , 실행계획 등 수립

Standards Working Group 폐지WARC file format, 미래를 위한 타 표준 , API, 메타데이터 등에 대한 연구 / 조사

26

Page 27: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 디지털도서관 건립과 디지털 정보자원의 일원화 된 관리

추진

– 모든 유형의 디지털 정보자원을 하나의 관리시스템에서 담당

– OASIS 등 기존 시스템의 통합

27

Page 28: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 임무– “ 물리적 공간 / 가상공간을 동시에 가지면서 별도의 독립된

조직을 통해 망라적으로 디지털정보자원 수집 보존∙ 하여 후대 전승 , 서비스하기 위한 독립된 디지털도서관 정보시스템 구축”

• 별도의 독립된 조직 : 디지털 정보자원만 전담하여 업무를

추진하는 새로운 조직구성원이 도서관의 기존 정보자원 처리 방식

( 업무 흐름 ) 과 새로운 디지털 정보자원 처리방식을 융합하여

활용가능한 새로운 웹 기반 정보시스템 구축

• 망라적 : 디지털 형태로 제작 , 유통 , 서비스되는 Born-Digital

자료와 기존에 이미 유통되고 있는 학술정보 ( 전자책 , 전자저널 )

그리고 웹을 통해 유통되고 있는 새로운 흐름 , 유형의 디지털

정보를 모두 다룰 수 있어야 함

28

Page 29: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 임무• 수집 / 보존 프로세스 : 완전한 하나의 프로세스를 갖추도록 구성

S/W S/W

Process

1. 수집

수집경로 및 유형 정의

2. 보존

관리 / 서비스

3. 전승

영구적 보존

4. 서비스

이중화

DRM 등

29

Page 30: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 임무• 수집 / 보존 프로세스 : 완전한 하나의 프로세스를 갖추도록 구성

H/WH/W

입수입수

영구보존영구보존 서비스서비스

S/W S/W

수집 보존 전승 서비스

관리관리

연계연계

30

Page 31: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 기본 설계

디지털장서관리시스템디지털정보 입수 영구보존 (StorageFarm)

이용자서비스

영구보존시스템

H/W INFRA

장서수집기 장서등록기

콘텐츠관리기콘텐츠관리기

메타데이터

연계

DRM

31

Page 32: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 정보 입수

모든유형 /포맷

제작

구독

구입

납본

협력

웹(Web)

Con-tents

Site

보상금

32

Page 33: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 정보 관리 장서 수집기

수집메타원문통합

TRIAL 서비스 수서 평가 재 구독 라이센스 관리 기타자료 관리

장서 등록기

장서 메타 관리 커뮤니티 관리 제공 DB관리

MetadataRegistry

콘텐츠 관리기

콘텐츠 관리 원문 관리 라이센스 관리

통합콘텐츠메타

통합메타

FRBR 기반Ontology 구축

Transformation

Content-BasedRouting

Web Service

JMS

Adapter

통합연동 (ESB)

SDL엔진

입수

SDL엔진 메타구조 관리기

메타구조 관리 메타정보 반입 메타정보 반출

표준메타데이터

보존

서비스

DRM

33

Page 34: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 영구보존

보존

영구보존시스템영구보존시스템

영구보존영구보존

H/W INFRAH/W INFRA

ISO 14721 OAIS 적용

관리 / 서비스

영구보존

비상 , 재난 복구

Storage Layer1- 관리 / 서비스

Storage Layer2- 영구보존

비상 , 재난 복구 등 -LTO

34

Page 35: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 이슈 사항– 이용자의 요구사항 : 미래의 이용자 , 현재의 이용자는 어떤 서비스 ,

어떤 정보를 요구할 것인가 ?

– 메타데이터 처리 : 입수 , 관리 , 서비스 , 영구보존에 사용할 메타데이터는 어떻게 처리해야 하는가 ?( 생명주기와 관련된 재처리 시 메타데이터 )

– 성문화된 정책과 전략 수립 필요• 디지털정보자원의 입수 , 관리 , 서비스 , 영구보존 등 전반에 대한 정책

수립 필요• 타 시스템 ( 리파지토리 등 ) 과의 연계를 위한 전략 필요

– 디지털정보자원 자체의 보호 ( 보안 )• 레코드의 생명주기 동안 하드웨어 / 소프트웨어 환경이 지속적으로 변화• 스토리지 장치의 취약성 ( 디스크 등 )

• 장치의 노후화• 데이터 품질저하• 하드웨어 / 소프트웨어의 노후화

35

Page 36: 20100407 박진호 d_lifecycle_kisti

3.2. 디지털 장서관리시스템

• 이슈 사항– 물리적인 인프라의 구성은 어떻게 할 것인가 ?

• 스토리지 이중화 , 가상화• 백업시스템 구성• DR 센터 구성 (DR 간 연계 )

– 어떤 표준 , 어떤 시스템을 적용할 것인가 ?• Open standards

• Open source

• Open Archives

• Open access

• Open storage

• Open repositories

36

Page 37: 20100407 박진호 d_lifecycle_kisti

37

구분 오아시스 원문 / 민간 DB 데이터베이스 기타 디지털장서관리

현재크기 11,160(GB) 12,043(GB) 1,489(GB) 596(GB) 0(GB)

연간증가량 3,740(GB) 900(GB) 85(GB) 58(GB) 7,800(GB)

~2008 년 총량 16,022(GB) 13,033(GB) 1,583(GB) 660(GB) 0(GB)

~2009 년 총량 27,205(GB) 15,112(GB) 1,779(GB) 794(GB) 7,800(GB)

~2010 년 총량 46,604(GB) 18,389(GB) 2,088(GB) 1,005(GB) 18,720(GB)

~2011 년 총량 76,685(GB) 22,984(GB) 2,522(GB) 1,301(GB) 44,928(GB)

~2012 년 총량 120,653(GB) 29,028(GB) 3,093(GB) 1,691(GB) 92,539(GB)

~2013 년 총량 182,673(GB) 36,666(GB) 3,814(GB) 2,183(GB) 170,115(GB)

필요용량 182,673(GB) 36,666(GB) 3,814(GB) 2,183(GB) 170,115(GB)

여유율보정 219,208(GB) 43,999(GB) 4,577(GB) 2,620(GB) 204,138(GB)

RAID 보정 274,010(GB)  54,999(GB) 5,721(GB) 5,240(GB) 408,276(GB)

총 용량 274(TB) 55(TB) 6(TB) 6(TB) 408(TB)

합계 749TB

3.2. 디지털 장서관리시스템

• 물리적 인프라에 대한 고민

37

Page 38: 20100407 박진호 d_lifecycle_kisti

38

3.2. 디지털 장서관리시스템

• 서비스에 초점을 둔 시스템 설계• 업무와 맞지 않는 시스템 설계

– 디지털도서관 운영조직의 업무에 맞고 디지털의 기본적인 속성 ( 생성에서 소멸까지 ) 을 반영할 수 있어야 함

– 생명주기에 대한 고민 시작

38

Page 39: 20100407 박진호 d_lifecycle_kisti

4. 생명주기 기반 정보자원 처리

39

Page 40: 20100407 박진호 d_lifecycle_kisti

4.1 정의

• 디지털 생명주기 (Digital Lifecycle) 기반 정보자원 처리

– 시간 경과에 상관없이 지속적으로 서비스가 가능한 형태로

( 재현 가능한 형태 ) 디지털 정보를 유지 관리

– 대상

• 정보 : 보존 및 이용가치가 있는 디지털 형태의 모든 정보

• 소프트웨어 : 정보를 생성 , 관리하기 위한 개발 및 상용 툴

• 하드웨어 : 정보 , 소프트웨어를 운영 , 관리 , 보존하기 위한 물리적

장치

탄생 소멸

>

>

40

Page 41: 20100407 박진호 d_lifecycle_kisti

4.2. 배경

• 도서관법 개정– 「도서관법」일부개정법률안 (김소남의원 대표발의 , 2008.7.24)

– 「도서관법」일부개정법률안 ( 정병국의원 대표발의 , 2008.11.6) • 이상 2건의 법률안을 법안심사소위 (2009.2.3) 위원회의 대안으로 제안

– 「도서관법」일부개정법률안 문방위에서 심사 보고한 위원회 대안으로 의결 (09.2.4)

– 「도서관법」일부개정법률안 국회 본회의 통과 (2009.3.2)

– 「도서관법」개정 공포․ (2009.3.25)

– 「도서관법 시행령ㆍ시행규칙」일부개정령 ( 안 ) 제출 및 입법예고(2009.6.10)

– 「도서관법 시행령 (9.21)· 시행규칙 (9.23)」법률 시행(2009.9.26)

– 고시 준비 중

41

Page 42: 20100407 박진호 d_lifecycle_kisti

4.2. 배경

• 도서관법 주요 개정 내용– 도서관자료의 정의 ( 제 2 조 제 2 호 )

• “도서관자료”의 범위를 인쇄자료 , 필사자료 , 시청각자료 , 마이크로 형태자료 , 전자자료 그밖에 온라인 자료를 도서관자료의 범위에 포함

– 온라인 자료의 수집 ( 제 20 조의 2) • 국립중앙도서관은 국가차원의 보존가치가 높은 온라인 자료를 수

집 , 보존하고 , 수집이 제한되는 경우 등에는 협조 요청

• 온라인 자료 수집 과정에서 개인정보침해 발생시 당사자의 정정 ·삭제 요구 , 행정심판 청구 , 행정소송 제기 등 권리구제 방안 대비

42

Page 43: 20100407 박진호 d_lifecycle_kisti

4.2. 배경

• 온라인 자료 수집 고시 ( 안 )– 보존을 위한 수집대상 온라인 자료의 선정 , 종류 , 형태– 수집 방법 및 보상

종류 : 저작권법 참조 및 활용

형태 : ISO, ECMA, KS 등 표준 및 사실상 표준 ( 시장 표준 )

준수

43

Page 44: 20100407 박진호 d_lifecycle_kisti

4.3. 고려사항

• 도서관법 개정에 따른 국립중앙도서관 디지털도서관 시스템 개편

– 첫 번째 고려 사항

• 메타데이터 ( 관리 메타데이터 , 보존 메타데이터 , 서비스 메타데이터 )

• 영구보존을 위한 하드웨어 인프라 구축 ( 스토리지 이중화 , 백업 이중화 )

• DR(Disaster Recovery) 센터 구축

• 영구보존 , 서비스를 위한 포맷 표준화 (DRM 등 고려 )

44

Page 45: 20100407 박진호 d_lifecycle_kisti

4.3. 고려사항

• 도서관법 개정에 따른 국립중앙도서관 디지털도서관 시스템 개편– 문제점

• “디지털”이 갖는 속성에 대한 이해 부족• 1 회적 , 평면적 정보처리에 집중

– 보존에서의 순환구조에만 집중 ( 파일 포맷 , 소프트웨어 집중 )

– 공간적 , 하드웨어적 접근

• 조직 , 직제 등 업무 프로세스 재정립– 기존 아날로그 ( 서적 등 ) 정보관리와 유사한 형태의 접근

• 성문화된 정책 부재– 디지털 정보 선정 / 관리지침 , 보존지침 , 성과평가 지침 등 정보 = 디지털 , 정보생산 도구 = 디지털 , 정보저장 도구

= 디지털 ,

관리시스템 = 디지털

45

Page 46: 20100407 박진호 d_lifecycle_kisti

4.4. 해결방안

• 거대 정보시스템의 세분화

– 기존 시스템의 분화

– 도서관법 개정 내용에 따른 업무지원이 가능하도록 개편

– 신규 업무 영역 개발 및 전문화

• 디지털 생명주기 파악

– 시스템에서 생명주기 지원이 가능하도록 개편

• 신규 관리시스템 자체가 하나의 거대 “디지털 정보 자원”

46

Page 47: 20100407 박진호 d_lifecycle_kisti

5

4.4. 해결방안

• 거대 정보시스템의 세분화

입수 관리

영구보존

서비스

1 2

3

4

47

Page 48: 20100407 박진호 d_lifecycle_kisti

4.4. 해결방안

• 생명주기적 접근 및 적용

– 정보 , 소프트웨어 , 하드웨어의 생명주기

• 정보생명주기 : 도서관법 개정에 따라 보상금 적용 등 문제를

감안하여

비용처리를 수반한 정보생명주기 모형 조사– ISO 14721 OAIS 모형이 가장 대표적이나 , 모형 자체가 너무 방대하고 현재의

국립중앙도서관 조직 / 인력 체계로 구성하기에 어려움이 있음

• 소프트웨어 , 하드웨어 : 국립중앙도서관의 입장 ( 구매자 ) 에서

기업의 제품

생명주기 모형 조사 (Product Life Cycle)

– 그 동안의 소프트웨어 , 하드웨어의 기술적 관찰과 보존을 위한 메타데이터 정보

업데이트 등은 완성된 제품이 시장에 나오고 활성화 된 후 최종 제품에 대한

수동적인 접근으로

보다 능동적인 접근 필요48

Page 49: 20100407 박진호 d_lifecycle_kisti

4.5. 사례 조사

• LIFE(Lifecycle Information for E-Literature)

– JISC(Joint Information Systems Committee) 와

RIN(Research Information Networks) 의 자금 지원하에

런던대학 (UCL, University College London) 과 영국국립도서관

(the British Library) 공동 수행

• 디지털 생명주기를 모델화 하는 것과 5, 10 년 혹은 20 년 후까지

디지털 정보를 보존하기 위한 방법론 개발

• LIFE 는 디지털 콜렉션을 보유한 기관이 이를 효과적으로 보존할 수

있도록 함

• LIFE 1 기 , 2 기 , 3 기 ( 현재 진행중 ): 기존 업무 프로세스에 기반한

1 기 모형에 초점을 둠

49

Page 50: 20100407 박진호 d_lifecycle_kisti

4.5. 사례 조사

• LIFE(Lifecycle Information for E-Literature)

L T

Aq I T

M T

AcT

S T

P T

= + + + + +

[L= 0 에서 T 시간 까지 총 생명주기 비용 , Aq: Acquisition, I: Ingest, M: Metadata, Ac: Ac-cess, S: Storage, P: Preservation]

50

Page 51: 20100407 박진호 d_lifecycle_kisti

4.5. 사례 조사

• LIFE(Lifecycle Information for E-Literature)– The Generic LIFE Preservation Model

• Preservation = t*TEW + (t/ULE + PON)*(CRS+UME+PPA+QAA)

Preservation = TechWatch

Frequency of Action

Preservation Action+ *

Monitoring formats and software for obso-

lescence

Updating and manag-ing metadata

(Representation In-formation)

The number of preservation ac-tions within the

time period calcu-lated

Updates of object and

event Meta-data

Cost of Preservation Action Tool

Execution of the preser-vation Ac-

tion

QA if results

51

Page 52: 20100407 박진호 d_lifecycle_kisti

4.5. 사례 조사

• Product Life Cycle

Product Ini-tiation

FeasibilityDesign and

PlanDevelop-

mentTesting

Launch Operation

Decommissioning

Product Initiation

FeasibilityDesign

and PlanDevelop-

mentTesting

Launch Operation

Decommissioning

1. 제품 개발

2. 제품 운영

3. 제품 중지 (폐기 )

52

Page 53: 20100407 박진호 d_lifecycle_kisti

4.5. 사례 조사

• DCC Curation Center

– 디지털 큐레이션 (Digital Curation)

• 디지털 자원을 제공 , 보존 , 유지 , 수집 , 아카이빙

• 현재와 미래에 이용될 신뢰할 수 있는 디지털 정보를 유지하고 ,

가치를 부여하는 것

• 이 정의는 디지털 아키이빙과 보존 과정을 의미하는 것으로

보이지만 , 우수한 데이터 생산과 관리에 필요한 과정 , 새로운

정보와 지식이 되도록 데이터에 가치를 부여하는 것까지 모두

포함하는 용어

53

Page 54: 20100407 박진호 d_lifecycle_kisti

4.5. 사례 조사

• Digital Curation Center(http://www.dcc.ac.uk/)

54

Page 55: 20100407 박진호 d_lifecycle_kisti

55

4.5. 사례 조사

• Digital Curation Center(http://www.dcc.ac.uk/)

구분 내용

Data• 디지털의 형태를 가진 모든 정보• 디지털 개체와 구조화된 데이터베이스 시스템을 모두

포함

Full life-cycle ac-tion

Description and repre-sentation in-formation

• 관리 , 기술 , 설명 , 구조 , 보존 메타데이터• 디지털 자원과 메타데이터의 이해와 렌더링을 위한 표현정보

Preservation planning

• 생명주기 내 모든 행위를 제어하기 위한 실행계획

Community watch and participation

• 관련된 단체 활동에 대한 관찰• 표준 , 도구 , 소프트웨어 개발에 참여

Curate and preserve

• 생명주기 동안 큐레이션과 보존을 원활히 하기 위한 관리 행위 계획

55

Page 56: 20100407 박진호 d_lifecycle_kisti

56

4.5. 사례 조사

• Digital Curation Center(http://www.dcc.ac.uk/)

구분 내용

Sequen-tial action

Conceptu-alise

• 데이터의 생성 , 수집 , 저장에 관한 계획

Create or re-ceive

• 데이터의 생성 시점에서 관리 , 기술 , 구조 , 보존 메타데이터가 모두 포함되어야 함

• 접수되는 데이터의 메타데이터 수집을 위한 명확한 정책 필요

Appraise and select

• 데이터를 평가하고 장기보존에 적합한지 선택 ( 지침 , 정책 , 법적 요구사항 )

Ingest• 기록관 , 저장소 , 데이터 센터로 데이터 전송 ( 지침 ,

정책 , 법적 요구사항 )

Store • 데이터를 완전하게 보관 (표준 )

Access, use and reuse

• 예상 이용자가 데이터에 접근할 수 있도록 함 (접근제어 , 승인절차 )

Transform • 기존 데이터로부터 새로운 데이터 생성 ( 마이그레이

션 , 부분 발췌 , 발행 등 )

56

Page 57: 20100407 박진호 d_lifecycle_kisti

57

4.5. 사례 조사

• Digital Curation Center(http://www.dcc.ac.uk/)

구분 내용

Occa-sional ac-tion

Dispose• 장기보존에 부적합한 데이터 처리 ( 지침 , 정책 , 법적

요구사항 )

Reappraise • 부적합 데이터의 향후 활용과 재선택을 위한 재생

Migrate • 데이터를 다른 포맷으로 마이그레이션• 하드웨어 , 소프트웨어 의존성의 탈피를 위한 경우

포함

57

Page 58: 20100407 박진호 d_lifecycle_kisti

4.5. 사례 조사

• The information life cycle

– 모든 정보의 가치는 동일하지 않고 라이프 사이클상에서 매 시점마다 차별화된 가치를 가짐 .

– 정보 수명주기 관리 (Information Lifecycle Management) 는 정보의 계획에서부터 폐기에 이르기까지 전체 라이프 사이클 기간에 걸쳐 저렴한 비용으로 데이터 접근과 저장을 최적화하고 관리하는 프로세스[IBM]

• 지식관리 , 정보관리 등과 연계하여 적용

• 하드웨어 , 소프트웨어 등 주요 기업

• 주로 데이터베이스 , 스토리지 등 유지 , 관리에 적용☞ 기관의 정책과 표준 적용 , 준수 등 필요

58

Page 59: 20100407 박진호 d_lifecycle_kisti

4.5. 사례 조사

• The information life cycleC

reate

/cap

ture

Ind

ex &

Cla

ssif

y

Sto

re/m

an

ag

e

Retr

ieve/p

ub

lish

Pro

cess

Arc

hiv

e

Destr

oy

Policies and Standards

[Steve Dale, 2009]

59

Page 60: 20100407 박진호 d_lifecycle_kisti

관리시스템 내 생명주기 사이클(LIFE, ILM)

[무형 정보 / 소프트웨어 , 유형 하드웨어 ]

매체유형 , 포맷별 생명주기 사이클

4.6. 디지털생명주기 프레임워크

디지털 생명주기 정책 , 표준

구입

구독

OASIS

제작

납본

협력

CD/DVD

Text

Image

Video

입수유형별생명주기 사이클

영구보존 생명주기( 정보 , 소프트웨어 ,

하드웨어 )

서비스 생명주기

Tech Watch

디지털장서관리시스템 생명주기

(OAIS)

(DCC) (PL)

60

Page 61: 20100407 박진호 d_lifecycle_kisti

4.7. 위험요소 ( 해결 과제 )

• 비용 : 폐기 없이 영구보존에 들어가는 막대한 비용의 산정– 보존 비용 대비 경제성 평가에 취약– 초기 입수 비용 대비 시간 경과에 따른 보존 비용 감당의 어려움

• 외부 전문기업 , 제품에 대한 정보 연계– 소프트웨어 , 하드웨어 등 외부 조직에 의한 …

• 유동적 조직체계– 순환보직 , 정보조직 개편 등에 영향을 받음– 외부 기업 등 제품의 변화 양상 등 ( 생명주기 변화 )– 하드 , 소프트에 대한 정보원의 변화 등

• 새로운 매체의 출현• 업무기반 프로세스 점검 필요

– ITA/EA

• 정보의 가치 평가– 영구보존할 것인가 .. 필요한 정보인가 .. 국가도서관으로서는 불가능

61

Page 62: 20100407 박진호 d_lifecycle_kisti

5. KISTI 가 주목해야할 프로젝트 및 사례

62

Page 63: 20100407 박진호 d_lifecycle_kisti

5.1. InterPARES

• InterPARES(International Research on Permanent Authen-tic Records in Electronic Systems)

– 목적 : 진본전자기록의 장기적 보존을 위한 국제 다국적 연구프로젝트

• InterPARES 1 Project(1999~2001 년 ) : 진본 전가기록을

장기적으로 보존하기위한 이론적 방법론 개발

• InterPARES 2 Project(2002~2006 년 ) : 전자기록물의 생명주기 전

과정에 걸친 신뢰성 , 정확성 확보방안 조사 연구 (예술활동 ,

과학활동 , 전자정부활동 전자기록물 연구 )

• InterPARES 3 Project(2007~2012) : 중소규모 기록관을

테스트베드로하여 전자기록의 진본성을 확인하기 위한 InterPARES

1/2 결과 활용 방안 탐구

63

Page 64: 20100407 박진호 d_lifecycle_kisti

5.1. InterPARES

• InterPARES 1 Project(1999~2001)

– 배경 • 진본 전가기록을 장기적으로 보존하기위한 이론적 방법론 개발 • 장기보존의 정책 , 전략 , 표준 모델 체계화

– 연구영역 • 진본성 : 전자기록의 진본성에 대한 접근과 관리를 위한 개념적

요구사항 확인 • 평 가 : 장기적으로 보존할 가치가 있는 전자기록을 결정하는

과정에서 디지털기술이 평가방법에 어떻게 작용하는지 , 전통적인 기록과 같은 방법으로 수행하거나 또는 상이한 평가 방법을 적용하는 방법론 개발

• 보존 : 진본 전자기록에 대한 보존 방법 개발 • 전략 : 진본 전자기록을 장기보존하기 위한 국제적 , 국가적 ,

기관간의 유기적인 정책 , 전략 , 표준 프레임워크 개발

64

Page 65: 20100407 박진호 d_lifecycle_kisti

5.1. InterPARES

• InterPARES 1 Project(1999~2001)

– 주요 기능 및 활용 • 행정업무 처리에 관한 문서관리시스템이나 데이터베이스에서

생성되거나 유지되는 기록의 진본성 보존에 관한 연구 • 디지털 사운드의 장기보존에 관한 연구

– 성과물 및 활용방안 • 진본성의 개념적 요구사항 , 진본 전자기록의 수집 , 보존 방법

65

Page 66: 20100407 박진호 d_lifecycle_kisti

5.1. InterPARES

• InterPARES 2 Project(2002~2006)

– 배경 • 진본성에 관한 이슈 , 기록의 생성에서 장기적 보존까지 전자기록

생명주기의 전 과정에 걸쳐 신뢰성과 정확성을 확보할 방안에 관한 조사 연구

• 전자시스템에서 운영되는 진본 기록을 장기적으로 보존하기 위한 방안에 관한 연구

• 경험적이고 상호작용적이며 동적인 컴퓨터 기술에 기반 한 디지털 환경에서 생산된 예술 , 과학 및 전자정부분야에서 발생한 전자기록 보존

– 중점연구내용 • 중점연구내용 1 : 예술 활동으로부터의 전자기록 연구 ( 창작과정과 관련

활동에 관한 기록을 조사 )

• 중점연구내용 2 : 과학 활동으로부터의 전자기록 연구 (신뢰성 , 정확성 , 진본성의 개념 연구 )

• 중점연구내용 3 : 전자정부활동으로부터의 전자기록 연구 ( 전자기록 사례 보존 방법과 목적 평가 )

66

Page 67: 20100407 박진호 d_lifecycle_kisti

5.1. InterPARES

• InterPARES 2 Project(2002~2006)

– 성과물 • 전자기록 , 정확성 진본성 개념 등 디지털 환경에 적용할 개념 구체화 • 개인이나 조직이 생산한 기록의 진본성을 입증하는 데 필요한 요건 • 신뢰할 만하고 정확한 기록 생산방법 , 진본 기록을 유지하고 보존하기위한 방법 • 메타데이터 스키마 레지스트리 , 보존 메타데이터 요소들의 권고안 • 전자기록의 실제 사례나 생산 , 유지 , 장기보존의 연구에 근거하여 기록보존자와

디지털기록 생산자를 대상으로 설계한 2 세트의 가이드라인 • 전자 기록의 생성 , 관리 , 보존의 관점에서 정책 , 전략 , 표준 개발을 위한 2

개의 프레임워크 • 보존 모델의 워크플로우 , 비즈니스 프로세스 모델 등 보존 관련 2 개의 모델 • 보존 모델의 워크플로우 , 비즈니스 프로세스 모델 등 보존 관련 2 개의 모델 • 전문용어 데이터베이스 : InterPARES 프로젝트에 사용된 용어정의 • 지적재산권법 , 개인정보보호법 , 기록관리법 등 다양한 법률 관련 연구 • InterPARES 에서 사용된 개념이 다른 분야에서 어떻게 응용되고 해석되는지에

관한 연구

67

Page 68: 20100407 박진호 d_lifecycle_kisti

5.1. InterPARES

• InterPARES 3 Project(2007~)

– 배경 • 중소규모 기록관을 테스트베드로하여 전자기록의 진본성을

확인하기 위한 InterPARES 1/2 결과 활용 방안 탐구

– 주요기능 및 활용 • 전자 기록의 장기보존에 필요한 이론 , 방법론 , 전략 개발

– 프로그램이 운영되는 문화적 , 법적 , 행정적 , 기능별 맥락 – 전자기록을 생산하는 조직이나 개인의 특성 – 생산된 기록의 유형과 그 기록의 기록상 (documentary) 또는

기술상의 특징 – 재정 및 인적자원의 제한 – 기록 생산자와 보존 담당자의 조직 문화 – 훈련된 전문가 또는 교육 프로그램의 접근

68

Page 69: 20100407 박진호 d_lifecycle_kisti

5.1. InterPARES

• InterPARES 3 Project(2007~)

– 주요기능 및 활용 • InterPARES 1, 2 의 결과를 중소규모의 기록 관리기관이나

프로그램에 곧바로 적용하려면 다음과 같은 조건이 충족되어야 함 – 조정 , 통제 , 감사 , 주체의 지원 – 권장하는 방법 또는 전략의 주요사항 적용 – 각 기록 또는 데이터에 대한 구체적인 실천 계획으로의 변환 – 담당자에 필요한 능력과 기술개발

69

Page 70: 20100407 박진호 d_lifecycle_kisti

5.1. InterPARES

• InterPARES 3 Project(2007~)

– 성과물 활용방안• 중소규모 기록관리 기관 또는 프로그램을 위한 정책 , 전략 , 절차와 기록을 위한 지침 • 프로젝트 과정에서 수행되는 개별 사례 연구를 위한 실천 계획 • 서로 다른 기관과 환경 , 국가에서 연구된 개별 사례로부터 도출한 Action Plan 의 유효성 , 응용가능성 , 적용가능성 분석

• 기록의 생명주기의 각 단계별 보존을 위한 Action Plan 비교 • 생산일 , 최종 열람일 , 전달설비 , 운영시스템 , 소프트웨어 , 장비 등 • 특수 유형의 전자기록에 필요한 보존 요건 지침 • 선택된 보존 활동의 성공을 평가하기 위한 모델 • 다양한 유형의 기록보존 프로그램 , 기록물 , 시스템 등을 위한 비용 -편익 모델 • 다양한 유형의 기록보존 방법 또는 그 방법의 부재로 개인 또는 사회에 나타나는 결과를

식별하기 위한 윤리모델 • 중소규모 기록 관리기관 또는 프로그램에 본 연구 결과물을 무료로 제공하는 웹사이트 • 회의자료 , 심포지엄 , 참고 출판물에서 소개된 전자기록 보존에 대한 이론적 , 방법론적 지식을

정리한 자료 • 기록관리 기관 또는 프로그램 , 전문가 협회 , 대학 프로그램을 위한 모듈과 IT 전문가 , 판매

상 , 서비스 공급자 , 인사 및 회계 담당자와 같은 비기록관리전문가를 위한 홍보 및 교육 모듈 • 핵심규제 , 통제 , 감사 , 정책결정자에게 제시할 Position Paper

70

Page 71: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• ISO 14721 Space data and information transfer systems -Open archival information system - Reference model– 1999 년 NASA(National Aeronautics and Space Administration),

CCSDS(Consultative Committee for space Data Systems) 제안– 2002 년 ISO 표준으로 확정 공포 ( 미국 중심으로 남미 , 유럽

10 여개 국가의 우주 항공국들이 공동 수행 )

– 현재 디지털 아카이빙 관련 거의 모든 기관들이 참조하고 있는 모형

– KISTI 의 초기 프로젝트 추진 시 반드시 고려해야하는 사항들이 모두 반영되어 있음

71

Page 72: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• ISO 14721 Space data and information transfer systems -Open archival information system - Reference model– Content Management

• 콘텐츠를 만들고 이용하기 위해 사용하는 도구 , 방법 , 기술 등을 지칭

– Records Management• 정의된 생명주기에 적합하도록 콘텐츠를 보존하기 위해 사용하는

도구 , 방법 , 기술 등을 지칭

– Archives• 레코드의 보존 , 장기 저장 (storage- 기억장치 ) 을 위해 사용하는

저장소 (Repository)

72

Page 73: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• OAIS 참조모형은 개념적으로 최상위 차원에서 디지털아카이빙을 정의하는 것으로 앞으로 구축될 디지털 아카이브는 참조모형이 제시한 기능과 환경을 따라야 하지만 적용시키려는 모 기관의 목적 , 시스템환경 및 제반 환경과 같은 다양한 요소들을 고려하여 개발되어야 함

73

Page 74: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• 기본 모형

OAISProducer

Management

Information 이 Package 형태로 소통 = IP

IP IPIP

Consumer

74

Page 75: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• Information Package

IP

ContentInformation

PreservationDescriptionInformation

콘텐츠 정보 : 보존대상( 기관의 정책 등에 따라 결정 )

보존기술정보 : 시간 경과 후에도 콘텐츠 정보를 이해할

수 있도록 함

metadata

75

Page 76: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• Information Package

ContentInformation

PreservationDescriptionInformation

Packaging Information

Package 1

DescriptiveInformation

about Package1

76

Page 77: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• Information Package

PreservationDescriptionInformation

인증정보 (Fixty Information)

CI 의 물리적 / 논리적 무결성인코딩 오류점검 (validation/

verification keys)

문맥정보 (Context Information)

다른 CI 와의 관련성

출처정보 (Provenance Information)

CI 의 기원 , 출처 . 원본에 관한 신뢰성

참조정보 (Reference Information)

CI 의 식별자 제공 . 이용자가 관심있는 콘텐츠 정보에 접근가능하도록 함

77

Page 78: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• Information Package

OAISProducer ConsumerIP IPIP

DIP PI

CI PDI Management

SIP

AIP

DIP

78

Page 79: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• Information Package

ArchivalStorage

Ingest Access

Preservation Planning

Administrator

DataManagement

PRODUCER

CONSUMER

queries

result setsorder

SIP AIP AIP DIP

Descriptiveinfo

Descriptiveinfo

79

Page 80: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• Ingest

– SIP입수– 입수한 SIP 진본성 및 품질확인 (quality scan)

– AIP 생성– AIP 로부터 DI 추출– AIP 는 아카이브 보존기능으로 전송– DI 는 데이터관리 기능으로 전송

보존

흡수 접근

보존계획

운영

데이터관리PRODUCER

CONSUMER

SIP AIP AIP DIP

DI DI

80

Page 81: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• 보존

– 흡수 기능으로부터 AIP입수– AIP 를 장기보존 (permanent storage) 로 전송 , 적절한 보존전략선정 (

포맷이전 , 또는 하드웨어 에뮬레이션 등 ), 적절한 보존매체 선정 : 온라인 , 오프라인 보존 포함

– 정기적 매체이전 (periodic refreshment) : 새로운 저장매체로 정기적으로 이전 시킴 . 정기적 / 지속적인 백업 수행 ,

– 예기치 못한 재난 방지를 위해 물리적으로 분리된 공간에 복제본 저장(Disaster Recovery)

– 오류점검 : 아카이브 보존기간 동안 AIP 의 논리적 , 물리적 무결성 보존을 위하여 주지적으로 CI 와 PDI 의 오류 여부 점검

– 접근기능으로부터 요청이 있을 경우 저장된 AIP 의 복제본을 접근기능으로 전송

보존

흡수 접근

보존계획

운영

데이터관리PRODUCER

CONSUMER

SIP AIP AIP DIP

DI DI

81

Page 82: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• 데이터관리

– 흡수 기능으로부터 기술정보 입수– 기술정보와 시스템 정보가 수록된 데이터베이스 유지 / 관리– 접근모듈로부터 질문을 받아 결과를 생성

보존

흡수 접근

보존계획

운영

데이터관리PRODUCER

CONSUMER

SIP AIP AIP DIP

DI DI

82

Page 83: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• 접근

– 데이터관리모듈로부터 기술정보를 , 아카이브 보존 모듈로부터 AIP 를 입수

– DIP 를 생성– 이용자의 질문과 요구사항들을 받아서 해당 DIP 전송

보존

흡수 접근

보존계획

운영

데이터관리PRODUCER

CONSUMER

SIP AIP AIP DIP

DI DI

83

Page 84: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• 운영

– 생산자와의 data submission 관련 정책적 협상– OAIS 의 핵심모듈 정기적 점검 및 업데이트– 시스템 하드웨어 , 소프트웨어 관련 기술 점검 및 모니터링– 아카이브 내 콘텐츠 무결성 점검 및 업데이트– 아카이브 관련 정책과 구체적 절차 점검 및 업데이트– 이용자 요구사항 점검 및 모니터링 , 시스템에 반영

보존

흡수 접근

보존계획

운영

데이터관리PRODUCER

CONSUMER

SIP AIP AIP DIP

DI DI

84

Page 85: 20100407 박진호 d_lifecycle_kisti

5.2. OAIS 참조모델

• 보존계획

– 생산자와 이용자 커뮤니티의 요구사항 점검– 최근 기술변화 점검

• 요구사항에 부합하는 기술변화 점검 : 데이터포맷 , 미디어선정 , 선호하는 소프트웨어패키지 , 새로운 컴퓨터 플랫폼 , 아카이브와의 커뮤니케이션 메커니즘

• 새롭게 출현하는 디지털기술 , 정보표준 , 컴퓨팅 플랫폼 ( 소프트웨어 , 하드웨어 ) 점검하여 , 매체이전 고려

– 보존전략과 표준개발• 생산자 , 이용자 커뮤니티 , 최근 정보기술의 경향과 변화를 조사 / 파악하여 현

보존시스템을 수정 , 업그레이드하고 , 향후 중장기적으로 적절한 보존전략과 표준을 개발

– 패키징 디자인과 마이그레이션 계획 개발• 새로운 정보패키지 디자인

보존

흡수 접근

보존계획

운영

데이터관리PRODUCER

CONSUMER

SIP AIP AIP DIP

DI DI

85

Page 86: 20100407 박진호 d_lifecycle_kisti

5.3. XML.gov( 접근전략관점 )

• 기록 보존소는 수년 간 전자 레코드 ( 전자기록 ) 을 보존해왔음• 대부분의 전자기록은 단지 텍스트형태의 제한된 범위에 의해서 행해져 왔음• 실질적으로 최근에 생산되는 모든 전자 기록물은 위기에 처해있음• 역사적 가치가 있는 복잡하고 막대한 전자기록물은 가까운 미래에

보관되어야 함• 1990 년 중반에서 2001 년까지의 연방정부의 웹사이트의 대부분의 기록은 돌이킬 수 없을 정도로 손실되었음

• 전자기록물의 장기보존을 위한 실행 가능한 ( 실용적인 ) 전략은 지속적으로 막대한 요구 , 모든 포맷 , 소프트웨어 , 하드웨어 패러다임 , 문서 형태 혹은 레코드 키핑 실행 변화 등의 새로운 개입을 반복하지 않는 해결책을 요구함

• 장기보존을 위한 솔루션은 아직까지 없다고 보는 것이 옳음 . 아카이브는 다양한 접근과 조합을 시도해야 함

보존을 위한 전략 구성은 보통 마이그레이션 , 애뮬레이션 , 표준화 (XML 등 ) 3가지로 XML.gov 는 이에 대한 구체적인 고려사항과 접근점에 대해 참고할 만 함

86

Page 87: 20100407 박진호 d_lifecycle_kisti

5.3. XML.gov( 접근전략관점 )

• 접근전략 1: Technology Preservation– 기록에 대한 접근을 보장하기 위해 오래된 정보 시스템을 유지– 기술보존은 점점 더 어려워지고 비용문제도 발생함– 노화 애플리케이션은 사용자 친숙도의 부족 문제를 증가시킴– 노화되고 쇠퇴한 스토리지 미디어를 포함하고 있어야 함– 목록작업 ( 카달로깅 ) 과 메타데이터 처리문제– 확장성– 단기간의 솔루션만으로 해결해야 함

• 접근전략 2: emulation– 오래된 소프트웨어의 기능을 모방한 ( 일반적 ) 운영 체제와 하드웨어 .

– 지적 재산권문제의 증가– 노화 애플리케이션과 사용자 친숙도 부족 문제– 잠재적인 Y2K 유형 소프트웨어의 위험– 복합적 컴포넌트를 포함한 작업은 실패할 위험성 증가 – 대규모 아카이빙에 아직 적용되지 않음

87

Page 88: 20100407 박진호 d_lifecycle_kisti

5.3. XML.gov( 접근전략관점 )

• 접근전략 3: Migration– 하나의 포맷에서 다른 포맷으로 주기적으로 디지털자료의 전송– 레코드의 경솔한 변조 위험 : 레코드가 복잡 (complex) 할 수록

위험은 더 높아짐– 원래 소프트웨어와 파일 포맷에 대한 상세한 지식의 필요– 지속적인 프로세스 필요– 광범위하게 사용되기 어려움– 특정한 레코드에 대해서만 비용효과적

• 접근전략 4: Encapsulation– 새로운 디지털 객체를 창조하기 위해 여러 개의 요소들을 결합– 보통 XML 컨테이너에 캡슐화함 – 다양한 포맷 , 메타데이터 혹은 뷰어안에 레코드를 포함하고

있어야 함– 기록을 자신의 원래 형태대로 남아있게 함

88

Page 89: 20100407 박진호 d_lifecycle_kisti

5.3. XML.gov( 접근전략관점 )

• 접근전략 5: Conversion to standard formats– ASCII 나 XML등과 같은 표준 형식으로 기록 변환 – 하드웨어나 소프트웨어에 대한 의존도 감소 (XML, ASCII)

– 선택 표준의 장수 (longevity) 에 의존적임– 널리 사용되는 다른 형식을 포함할 수 있는가 ? 판단 (word,

PDF)

– 변환된 기록의 기능적 손실을 막을 수 있는가 ? 판단– 복합적 파일 (complex file) 에 어려움이 있는가 ? 판단 Open Document Format(ODF Vs Open XML)

• 접근전략 6: Documenting archived records– 전자장서를 묘사하기 위해 필요한 정보 ( 메타데이터 ) 콜렉션

생산

89

Page 90: 20100407 박진호 d_lifecycle_kisti

5.4. 호주 국립기록관 Xena

• 개요– XENA 는 XML Electronic Normalising of Archives 의 약자임– XENA 소프트웨어는 디지털보존 과정에서 사용되는 핵심 소프트웨어 애플리케이션으로 독립형으로 존재하지만 , 기록보존소에서는 API 로써 사용함

– Xena 는 전자문서를 원래 형태로부터 국립기록관에의해서 보존용으로 사용하기에 적합한 개방되고 완벽한 문서 형태로 변환함 ( 비트스트림 , 노말라이즈드 )

– 변환 결과는 데이터 객체 (object) 는 AIPs(Archival Information Packages) 로서 회부됨

– 비트스트림 버전

• 유형– 비트스트림 버전 : Xena 는 기록물의 원래 복사본을 메타데이터로 둘러싸인

비트스림을 만들며 , 원본의 하드웨어 , 운영체제 , 소프트웨어에서만 읽을 수 있는 모든 정보를 포함한다 .

– 노말라이즈드 버전 : 노말라이즈드 버전 , 제나는 또한 메타데이터로 싸여있다 . (wrapped in metadata).

– 노말라이징 버전 : 기록을 오리지날 포맷으로부터 개방 형 표준 기반 포맷으로 변환한다 . 노말리아즈 버전은 기록물의 원 포맷을 고려하지 않는다 . 노말라이징 버전은 계속해서 원본에 근접하게 변환이 되도록 기능 개선을 수행할 예정이다 .

90

Page 91: 20100407 박진호 d_lifecycle_kisti

5.4. 호주 국립기록관 Xena

• 특징– 호주국립기록관은 내부용 디지털 보존 소프트웨어로 개발하였으나 개인이나

다른 조직들에서도 유용하게 사용가능 함– 아카이브 조직의 자체적인 디지털보존 프로그램 개발에 Xena 활용– 정부기관 등은 기록관리시스템과 Xena 를 통합하여 전자기록물 노말라이즈에 활용하여 접근성과 보존성을 위한 기록물 저장소 배치나 캡처에 활용

– 개인이나 기타 사용자들은 미래 컴퓨팅 시스템에서 접근 가능하도록 현재 사용하고 있는 전자문서 등을 Xena 를 통해 포맷 변환 가능함

– Xena 는 광범위한 플랫폼과 애플리케이션에 적용가능함– 현재 , 기록물은 오피스 문서 , 이메일 , 이미지 등을 개방형 파일포맷으로

변환 가능함– ☞ 지원가능 포맷 : AIFF, BMP, CSS, CSV, CUR, DOC, FLAC, GIF, gzip,

HTML, jar, JPEG, MP3, MacBinary, MPP, ODP, ODS, ODT, PCX, PDF, PNG, PPS, PPT, PSD, RTF, sql, SVG, SXC, SXI, SXW, SYLK, tar, tar.gz, TIFF, TSV, TXT, war, WAV, WPD, WRI, XBM, XHTML, XLS, XML, XSLT, zip

– 기존 바이너리 포맷 데이터에 대한 변환 고려 필요

91

Page 92: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• 좋은 디지털 자료의 기준– 진본성 , 신뢰성 , 접근가능성 등 장기보존을 위한 기존의 원칙들

이외에 Born Digital 자료 ,

– 가치 있는 디지털자료로서의 다양한 기준과 원칙들을 분석

92

Page 93: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• NISO: A Framework of Guidance for Good Digital Collection– 개요

• 우수한 디지털 컬렉션을 구축을 위해 미국정보표준화기구가 발표한 4 가지 핵심개체에 대한 지침으로 미국박물관도서관기구 (IMLS) 지원으로 추진 ( 현재 3 판 발행 ).

• 컬렉션이 지침에서 제시한 4 가지 기본 개체• Collection, Object, Metadata, Initiatives 4 개 기본 개체에 대한 기본 원칙 설명

– 목적• 우수 디지털 컬렉션 구축을 위한 핵심 구성요소와 활동 설명• 우수 디지털 컬렉션을 생산하고 관리하기 위한 지역의 성공적인 실무 사례 개발을

지원• 디지털 컬렉션 구축을 위한 우수실무사례의 지속적인 개발을 위한 지역사회 참여 장려

– 주요대상• 디지털 컬렉션을 개발하기 위한 사업을 계획하고 실행하는 문화유산기관• 우수 디지털 컬렉션 개발을 지원하는 단체• * “우수” = 유용성 , 접근성 , 적합성 , 비용대 가치 , 지속가능성 , 신뢰성을 충족해야함때문에 “우수”는 상호운용성 , 재이용성 , 지속성 , 검증 , 문서화 , 지적재산권 보호 등의 모든 요소를 충족시켜야 함

93

Page 94: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• NISO: A Framework of Guidance for Good Digital Collection

• 서비스는 3 개 개념의 질적 우수성이 충족되면 자연스럽게 상승되는 요소임 마찬가지로 위 4 가지 요소의 충족은 자연스럽게 우수한 보존성을 보장함

개념 정의

Collection 객체들이 조직화된 그룹

Object 디지털 자료

Metadata 객체와 컬렉션에 대한 정보

Initiative 컬렉션을 구축하고 관리하기 위한 프로그램 혹은 프로젝트

94

Page 95: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• NISO: A Framework of Guidance for Good Digital Collection

Collection 원칙

원칙 1 우수 디지털 컬렉션은 분명한 장서개발정책에 따라 구축

원칙 2컬렉션은 컬렉션의 특징 즉 , 범위 , 형식 , 접근 제한 , 소유권 , 컬렉션의 진본성 , 무결성 , 해석에 영향을 미치는 주요 정보 등을 이용자가 알 수 있도록 기술

원칙 3 자원을 전체 생명주기 동안 적극적으로 관리

원칙 4광범위하게 이용가능하며 이용을 방해하는 불필요한 요소가 없어야 힘( 컬렉션은 신체가 불편한 이용자가 쉽게 접근할 수 있어야 하며 , 적응할수 있는 기술로써 효과적으로 이용할 수 있어야 함 )

원칙 5 우수한 컬렉션은 지적재산권을 존중함

원칙 6우수한 컬렉션은 유용성에 대해 표준화된 측정값이 기록되어지는 메커니즘으로 이용데이터나 기타 데이터를 공급함

원칙 7 우수한 컬렉션은 상호 운용이 가능함

원칙 8 우수한 컬렉션은 이용자의 자체 워크플로 (workflow) 와 통합됨

원칙 9 우수한 컬렉션은 시간이 흘러도 유지됨

95

Page 96: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• NISO: A Framework of Guidance for Good Digital Collection

Object 원칙

원칙 1 우수한 객체는 현재와 장래에 의도된 이용을 지원하는 포맷으로 존재함

원칙 2 우수한 객체는 보존할 수 있다 .

원칙 3 우수한 객체는 지역적 상황을 벗어나도 의미 있고 유용함

원칙 4우수한 객체는 객체의 현주소로 변환될 수 있는 영구적이며 세계적으로 고유한 식별자 명칭이 부여됨

원칙 5 우수한 객체는 진본성을 인증받을 수 있음

원칙 6 우수한 객체는 관련된 메타데이터를 가짐

96

Page 97: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• NISO: A Framework of Guidance for Good Digital Collection

Metadata 원칙

원칙 1컬렉션 내의 자료들 , 컬렉션의 이용자들 , 컬렉션의 현재와 미래의 이용에 적합한 방식으로 공동체 표준 (community standards) 을 따름

원칙 2 우수한 메타데이터는 상호운용성을 지원한다 .

원칙 3우수한 메타데이터는 객체를 기술하고 관련된 객체를 연결하기 위해 전거제어와 내용 표준을 사용함

원칙 4 우수한 메타데이터는 디지털 객체의 이용 조건과 기간에 대한 명확한 설명을 포함함

원칙 5 우수한 메타데이터는 컬렉션 내 객체의 장기적인 제공과 보존을 지원함

원칙 6우수한 메타데이터 레코드는 그 자체가 객체이므로 우수한 객체의 질적 특성인 권위성 , 진본성 , 보존성 , 영속성 , 유일식별성 등을 포함해야만 함

97

Page 98: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• NISO: A Framework of Guidance for Good Digital Collection

Initiative 원칙

원칙 1 우수한 디지털 이니셔티브는 실체가 있는 설계와 계획 요소를 가짐

원칙 2우수한 디지털 이니셔티브는 목표를 달성하기 위하여 필요한 전문적 지식을 지닌 직원을 적절하게 고용함

원칙 3 우수한 디지털 이니셔티브는 프로젝트 관리를 위하여 우수실무사례를 따름

원칙 4 우수한 디지털 이니셔티브는 평가 계획을 가짐

원칙 5우수한 디지털 이니셔티브는 스스로를 마케팅하며 이니셔티브 과정 및 성과에 대한 정보를 널리 배포함

원칙 6우수한 디지털 이니셔티브는 디지털 컬렉션과 관련 서비스의 전체적인 생명주기를 고려함

98

Page 99: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• 미의회도서관 디지털장서개발정책 _ 전자자원지침– 개요

• 전자자원이 급속한 발전에 대비 2 년에 한 번 지침 검토• 지침은 일반적인 내용으로 자원 수집 범위에 제한을 두지 않으며 ,

기술 발전 속도에 상관없이 필요한 자원을 이용할 수 있도록 함• 전자자원역시 영구적인 접근을 보존해야함• 특정 자원의 전자 , 아날로그 자료가 모두 존재할 경우 양 쪽 모두를

영구보존 함• 정보에 대한 방문 접근과 원격접근을 위해 보장할 수 있도록

보존해야 함• 전자자원 제공자가 더 이상 자료를 제공할 수 없을 경우 LC 가

자료를 수집하거나 영구보존할 수 있도록 협의• 전자자원은 웹사이트 , 온라인 데이터베이스 , 전자저널 ,

전자단행본 , 전자통합자원 , 모든 형태를 저장하고 있는 물리적 매체 등을 포함

99

Page 100: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• 미의회도서관 디지털장서개발정책 _ 전자자원지침– 정의

• 전자자원 : 컴퓨터를 통해 이용할 수 있는 모든 저작• 입수 (acquire) : 의회도서관이 공식계약 , 라이선스 또는 기타 협정 ( 이들 전자자원을

LC 의 소장 및 보유 여부를 결정하는 협정 ) 을 체결하여 제공하는 전자자원 또는 도서관의 입수 절차 (예를 들어 구매 , 기증 ,교환 ,납본 ,ISSN 요청 , 이전 ) 에 의해 입수한 전자자원

• 수집 (Collect) : LC 가 소장하고 영구적으로 보존하기 위해 선정된 전자자원• 링크 : LC 의 웹 자원이나 서지레코드에서 원격으로 데이터에 접근하게 해주는

포인터• 아카이브 (Archive): LC 가 관리하거나 혹은 LC 의 이익을 위해 안정적이고 영구적인

디지털 저장소에서 전자자원을 우지하는 과정

– 상세기준• 콘텐츠 : 전자자원은 규정된 목표에 부합하고 명백한 연구 가치를 가져야 한다 .

• 부가가치 : 전자자원을 대학에서 이용할 수 있도록 하고 LC 의 재택근무직원이 자원에 접근할 수 있도록 우선순위를 둠 )

• 접근가능성 : 서버의 신뢰성 , 접근을 위해 등록이 필요하다면 , 그것이 적절한지 평가해야 하며 개인정보보호정책이 수반되어야 함 , 필요한 경우 플러그인 소프트웨어를 위해 출처에 대한 링크를 제공해야 함

100

Page 101: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• 미의회도서관 디지털장서개발정책 _ 전자자원지침– 상세기준

• 디자인 , 이용자 인터페이스 , 내항성 : 조직화와 자료 탐색의 용이성 , 검색 및 도움말 기능 , 사이트맵의 존재여부 , 완벽하게 기능하는 디자인 요소 , 쉽게 이용할 수 있도록 도와주는 쌍방향 기능 ,

• 표준 : 유료 자원은 보편적인 기술표준과 컴퓨터 설비 기준을 따름• 영구적 보존 : 전자자원은 의회도서관 소장 장서의 일부로서 전자자원의

영구보존 결정을 위한 기준이 다른 매체와 동일하며 , 전자자원의 영구적 보존은 연구자와 의회의 연구목적을 충족시키고자 하는 의회도서관의 사명에 기반을 둠

• LC 가 가능한 전자자원을 입수하거나 직접 생산하여 장기간의 연구 가치를 지닌 전자자원에 대한 영구적인 접근을 제공

• 전자자원의 영구적 보유 범위에는 관련서지메타데이터 , 관리 메타데이터 및 보존 메타데이터까지 포함

• LC 가 디지털 리포지토리를 개발하고 기타 신뢰받는 디지털 리포지토리와 협의하여 전자자원으로의 접근을 보장할 수 있음

101

Page 102: 20100407 박진호 d_lifecycle_kisti

5.5. 좋은 디지털 자료

• 미의회도서관 디지털장서개발정책 _ 전자자원지침– 보존 우선순위

• LC 가 생산한 전자자원으로 아메리칸 메모리 (American Memory), 웹 아카이브 , 포탈 투 더 월드 (Portals to the World)등과 같이 다른 형태로는 존재하지 않는 전자자원

• 다른 형태로는 존재하지 않는 전자자원• LC 가 더 이상 수집하지 않는 인쇄 자료의 전자판• 부가가치를 지닌 전자적 등가물• LC 가 디지털화한 자료• 입수한 유일한 전자자원• 컴퓨터 프로그램 : LC 의 영구적인 장서를 위해 컴퓨터 기술의

발전과• 역사를 실제로 보여주는 대표적인 소프트웨어들을 선정• 원격 이용하거나 직접 방문으로 이용하기 위해 필요한 소프트웨어를

보존하기 위해 컴퓨터프로그램과 허가를 구할 것임

102

Page 103: 20100407 박진호 d_lifecycle_kisti

6. 결론 및 제언

Page 104: 20100407 박진호 d_lifecycle_kisti

결론 및 제언

• 디지털 아카이빙 프로젝트 진행

– 정보시스템을 구축하기 위한 사업의 일환으로 생각하면 실패

• 조직의 업무프로세스 , 직원의 역량 , 성문화된 정책 , 구체화된

전략 , 명확한 대상 , 명확한 이용자 , 명확한 관리자 등 정의

• 정보시스템은 디지털 아카이빙 업무 (Business) 가 보다 효과적으로

진행될 수 있도록 도와주는 종합적인 툴 (Data, System, Application,

Security)

ITA/EA 의 본래 의미를 생각해 보십시오 .

104

Page 105: 20100407 박진호 d_lifecycle_kisti

결론 및 제언

• 디지털 아카이빙 프로젝트 진행

– 디지털 객체에 붙어 있는 다양한 또 다른 디지털들을 고려

• 디지털 정보를 만드는 도구 : 디지털 (Office Program)

• 디지털 정보를 관리하는 도구 : 디지털 ( 아카이빙 시스템 , 업무관리 시스템 )

• 디지털 정보를 담고 있는 도구 : 디지털 ( 서버 / 스토리지 )

• 디지털 정보를 이용하는 도구 : 디지털 (Web Browser, PDF Reader)

디지털 아카이빙 시스템도 디지털입니다 . 이 것도 보존하고 관리해야합니다 .

디지털 아카이빙 시스템에 마지막은 존재하지 않습니다 . 기술이 발달하면

다시

꺼내서 관리정보입력 , 마이그레이션 등 과정을 거쳐야 합니다 .

105

Page 106: 20100407 박진호 d_lifecycle_kisti

결론 및 제언

• 기존 정보자원 관리와 확연히 다른 업무를 요구하는가 ?

– 현재 디지털 정보 , 웹 정보들이 아직까지 앉고 있는 많은

문제들을 그대로 앉고 있음

• 데이터 관리 , 호환성유지 , 검색 활용을 위한 MDR 의 필요성 (DC,

MODS, PREMEIS, METS)

• 관리 , 향후 활용을 위한 조직화 (XML Schema, RDF/OWL)

106

Page 107: 20100407 박진호 d_lifecycle_kisti

결론 및 제언

• 우리 기관의 정보지만 혼자서는 절대 해결 못하는 문제들

107

Page 108: 20100407 박진호 d_lifecycle_kisti

참고자료

• 박진호 . 2007. 국립디지털도서관 운영방안 .『 전국도서관대회』 , 2007 년 10 월 11 일 . [ 제주도 : 제주국제컨벤션센터 ]

• 박진호 . 2007. 국립디지털도서관 장서개발정책 (NDL CDP).『 제 10 회 디지털도서관 컨퍼런스』 , 2007 년 11 월 29 일 .[ 서울 : 코엑스 ]

• 박진호 . 2009. 디지털 생명주기 기반 정보자원처리 . 『 2009 추계 한국정보관리학회 학술발표회』 , 2009 년 11 월 13 일 .[ 서울 : 이화여자대학교 ECC]

• 박진호 . 2008. 디지털도서관의 정보자원 처리 방안 . 『제 11 회 디지털도서관 컨퍼런스』 , 2008 년 11 월 5 일 .[ 서울 : 코엑스 ]

• 박진호 . 디지털정보자원아카이빙 . 2008, 2009 년 국립중앙도서관 사서교육훈련과정 강의자료 .

• http://www.dlib.org/dlib/january00/01hodge.html• http://www.life.ac.uk/2/documentation.shtml• http://www.slideshare.net/stephendale/information-management-life-cycle-presentat

ion• http://www.life.ac.uk/ • http://www.slideshare.net/maheshpanchal1/splc• http://www.flickr.com/photos/gauravonomics/3208349922/sizes/o/• http://www.flickr.com/photos/8897269@N08/541851097• http://www.flickr.com/photos/frankdouwes/4029186481/sizes/l/

108

Page 109: 20100407 박진호 d_lifecycle_kisti

감사합니다 .