링크드 데이터 구축 공정 가이드...

80
Linked Open Data 링크드 데이터 구축 공정 가이드 v1.0 2014. 4

Upload: phamkhanh

Post on 19-Apr-2018

233 views

Category:

Documents


11 download

TRANSCRIPT

Linked

Open

Data

링크드 데이터

구축 공정 가이드 v10

(100-775) 서울시 중구 청계천로14 한국정보화진흥원

TEL 02-2131-0114 FAX 02-2131-0109

2014 4

2 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개요

Ⅱ 링크드 데이터 구축 공정

Ⅲ 태스크별 상세내용

1 추진 목표 및 배경 82 가이드의 구성 103 기대효과 11

1 전체공정도 142 세부공정도 15

1 준비단계 222 구축 및 발행단계 25

C O N T E N T S

3

Ⅳ 산출물 상세내용1 산출물 내용 정의 302 산출물 내역 313 산출물별 상세 내역 및 샘플 32

[부록 1] 링크드 데이터 선정기준 참고자료 66[부록 2] URI 생성 및 관리 지침 67[부록 3] 링크드 데이터 발행 후 체크리스트 74

4 링크드 데이터 구축 공정 가이드 v10

링크드 데이터란 무엇인가

현재의 웹은 거의 모든 정보들이 생산 유통 재생산 폐기 등이 이루어지는 거대한

정보 생태계임

-이생태계는웹페이지(HTML)형식으로다양한도큐먼트들이연결되어이루

어져있음

-이미웹은거대한정보플랫폼으로모든정보들이웹에존재하고정보탐색활

동이이루어지고있음

현재웹에서웹페이지에표현되는정보들은이미구조화되어있는데이터베이

스에서추출된정보가기계적해석을거쳐단순히사람이읽고이해할수있는

문자소리영상이미지등의형태로표현됨

-각각의데이터베이스에존재하는데이터들은다양한데이터베이스관리시스

템기술규칙메타데이터를사용하는갇힌형태(silo)로존재

-데이터베이스의정보는HTML로웹상에표현되나실제활용가치가높은데이

터는데이터베이스에만존재(웹에존재하지않음)

-개방되는데이터들은특정이용자의요구가있을경우에개방되거나XLS

CSVPDF등의파일단위혹은OpenAPI로제공되지만비표준적인메타데이

터사용으로재활용성이떨어지고웹이라는플랫폼을벗어나는구조임

링크드 데이터는 웹이라는 거대한 정보 플랫폼 위에 기존 웹을 구성하는 핵심 개념

기술인 HTTP URI를 그대로 활용하고 표준기술규칙을 활용함으로써 웹을 누구나

활용할 수 있는 거대한 데이터베이스로 활용이 가능하도록 함

-웹을데이터베이스로활용함으로써다양한데이터수집을위한행정적기술

적노력감소

링크드 데이터 구축 공정 가이드 v10

5

bullbullbull

-도큐먼트간의연결이아니라도큐먼트를구성하는개념(주제사람장소시

간등)간의연결을통해서동일한객체간의식별이가능하도록하고소유하지

않고있는외부데이터와의연결을통해서보다풍부한정보탐색환경이가능

하도록함

-기존웹(도큐먼트간의연결)이단순히사람이읽고활용할수있는문자형태

정보간의실제적인연결인반면링크드데이터를통한데이터간의연계는데

이터를기반으로하는새로운정보서비스창출이가능하도록함

6 링크드 데이터 구축 공정 가이드 v10

개요PART 1

7

1 추진 목표 및 배경

2 가이드의 구성

3 기대효과

8 링크드 데이터 구축 공정 가이드 v10

1) 추진 목표

본 가이드는 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이

터를 웹에 발행하고자하는 기관이나 사업자들에게 표준적인 링크드 데이터 구축 및

발행 공정을 제공함

-때문에본가이드에서는시맨틱웹(SemanticWeb)링크드데이터(Linked

Data)에대한일반적인이해를돕기위한내용을포함하지는않음

-시맨틱웹링크드데이터에대한이해는『알기쉬운시맨틱웹링크드데이

터』참조

본 가이드는 링크드 데이터 사업을 추진하고자하는 기관에서 이를 수행하고자 하는

전문업체가 선정된 이후 작업공정을 대상으로 함

일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고

체계적이고 효율적인 구축 과정 제공

링크드 데이터 구축 사업 추진에 실체적으로 적용 가능한 가이드 개발

sns1 추진 목표 및 배경

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

2 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개요

Ⅱ 링크드 데이터 구축 공정

Ⅲ 태스크별 상세내용

1 추진 목표 및 배경 82 가이드의 구성 103 기대효과 11

1 전체공정도 142 세부공정도 15

1 준비단계 222 구축 및 발행단계 25

C O N T E N T S

3

Ⅳ 산출물 상세내용1 산출물 내용 정의 302 산출물 내역 313 산출물별 상세 내역 및 샘플 32

[부록 1] 링크드 데이터 선정기준 참고자료 66[부록 2] URI 생성 및 관리 지침 67[부록 3] 링크드 데이터 발행 후 체크리스트 74

4 링크드 데이터 구축 공정 가이드 v10

링크드 데이터란 무엇인가

현재의 웹은 거의 모든 정보들이 생산 유통 재생산 폐기 등이 이루어지는 거대한

정보 생태계임

-이생태계는웹페이지(HTML)형식으로다양한도큐먼트들이연결되어이루

어져있음

-이미웹은거대한정보플랫폼으로모든정보들이웹에존재하고정보탐색활

동이이루어지고있음

현재웹에서웹페이지에표현되는정보들은이미구조화되어있는데이터베이

스에서추출된정보가기계적해석을거쳐단순히사람이읽고이해할수있는

문자소리영상이미지등의형태로표현됨

-각각의데이터베이스에존재하는데이터들은다양한데이터베이스관리시스

템기술규칙메타데이터를사용하는갇힌형태(silo)로존재

-데이터베이스의정보는HTML로웹상에표현되나실제활용가치가높은데이

터는데이터베이스에만존재(웹에존재하지않음)

-개방되는데이터들은특정이용자의요구가있을경우에개방되거나XLS

CSVPDF등의파일단위혹은OpenAPI로제공되지만비표준적인메타데이

터사용으로재활용성이떨어지고웹이라는플랫폼을벗어나는구조임

링크드 데이터는 웹이라는 거대한 정보 플랫폼 위에 기존 웹을 구성하는 핵심 개념

기술인 HTTP URI를 그대로 활용하고 표준기술규칙을 활용함으로써 웹을 누구나

활용할 수 있는 거대한 데이터베이스로 활용이 가능하도록 함

-웹을데이터베이스로활용함으로써다양한데이터수집을위한행정적기술

적노력감소

링크드 데이터 구축 공정 가이드 v10

5

bullbullbull

-도큐먼트간의연결이아니라도큐먼트를구성하는개념(주제사람장소시

간등)간의연결을통해서동일한객체간의식별이가능하도록하고소유하지

않고있는외부데이터와의연결을통해서보다풍부한정보탐색환경이가능

하도록함

-기존웹(도큐먼트간의연결)이단순히사람이읽고활용할수있는문자형태

정보간의실제적인연결인반면링크드데이터를통한데이터간의연계는데

이터를기반으로하는새로운정보서비스창출이가능하도록함

6 링크드 데이터 구축 공정 가이드 v10

개요PART 1

7

1 추진 목표 및 배경

2 가이드의 구성

3 기대효과

8 링크드 데이터 구축 공정 가이드 v10

1) 추진 목표

본 가이드는 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이

터를 웹에 발행하고자하는 기관이나 사업자들에게 표준적인 링크드 데이터 구축 및

발행 공정을 제공함

-때문에본가이드에서는시맨틱웹(SemanticWeb)링크드데이터(Linked

Data)에대한일반적인이해를돕기위한내용을포함하지는않음

-시맨틱웹링크드데이터에대한이해는『알기쉬운시맨틱웹링크드데이

터』참조

본 가이드는 링크드 데이터 사업을 추진하고자하는 기관에서 이를 수행하고자 하는

전문업체가 선정된 이후 작업공정을 대상으로 함

일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고

체계적이고 효율적인 구축 과정 제공

링크드 데이터 구축 사업 추진에 실체적으로 적용 가능한 가이드 개발

sns1 추진 목표 및 배경

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

3

Ⅳ 산출물 상세내용1 산출물 내용 정의 302 산출물 내역 313 산출물별 상세 내역 및 샘플 32

[부록 1] 링크드 데이터 선정기준 참고자료 66[부록 2] URI 생성 및 관리 지침 67[부록 3] 링크드 데이터 발행 후 체크리스트 74

4 링크드 데이터 구축 공정 가이드 v10

링크드 데이터란 무엇인가

현재의 웹은 거의 모든 정보들이 생산 유통 재생산 폐기 등이 이루어지는 거대한

정보 생태계임

-이생태계는웹페이지(HTML)형식으로다양한도큐먼트들이연결되어이루

어져있음

-이미웹은거대한정보플랫폼으로모든정보들이웹에존재하고정보탐색활

동이이루어지고있음

현재웹에서웹페이지에표현되는정보들은이미구조화되어있는데이터베이

스에서추출된정보가기계적해석을거쳐단순히사람이읽고이해할수있는

문자소리영상이미지등의형태로표현됨

-각각의데이터베이스에존재하는데이터들은다양한데이터베이스관리시스

템기술규칙메타데이터를사용하는갇힌형태(silo)로존재

-데이터베이스의정보는HTML로웹상에표현되나실제활용가치가높은데이

터는데이터베이스에만존재(웹에존재하지않음)

-개방되는데이터들은특정이용자의요구가있을경우에개방되거나XLS

CSVPDF등의파일단위혹은OpenAPI로제공되지만비표준적인메타데이

터사용으로재활용성이떨어지고웹이라는플랫폼을벗어나는구조임

링크드 데이터는 웹이라는 거대한 정보 플랫폼 위에 기존 웹을 구성하는 핵심 개념

기술인 HTTP URI를 그대로 활용하고 표준기술규칙을 활용함으로써 웹을 누구나

활용할 수 있는 거대한 데이터베이스로 활용이 가능하도록 함

-웹을데이터베이스로활용함으로써다양한데이터수집을위한행정적기술

적노력감소

링크드 데이터 구축 공정 가이드 v10

5

bullbullbull

-도큐먼트간의연결이아니라도큐먼트를구성하는개념(주제사람장소시

간등)간의연결을통해서동일한객체간의식별이가능하도록하고소유하지

않고있는외부데이터와의연결을통해서보다풍부한정보탐색환경이가능

하도록함

-기존웹(도큐먼트간의연결)이단순히사람이읽고활용할수있는문자형태

정보간의실제적인연결인반면링크드데이터를통한데이터간의연계는데

이터를기반으로하는새로운정보서비스창출이가능하도록함

6 링크드 데이터 구축 공정 가이드 v10

개요PART 1

7

1 추진 목표 및 배경

2 가이드의 구성

3 기대효과

8 링크드 데이터 구축 공정 가이드 v10

1) 추진 목표

본 가이드는 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이

터를 웹에 발행하고자하는 기관이나 사업자들에게 표준적인 링크드 데이터 구축 및

발행 공정을 제공함

-때문에본가이드에서는시맨틱웹(SemanticWeb)링크드데이터(Linked

Data)에대한일반적인이해를돕기위한내용을포함하지는않음

-시맨틱웹링크드데이터에대한이해는『알기쉬운시맨틱웹링크드데이

터』참조

본 가이드는 링크드 데이터 사업을 추진하고자하는 기관에서 이를 수행하고자 하는

전문업체가 선정된 이후 작업공정을 대상으로 함

일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고

체계적이고 효율적인 구축 과정 제공

링크드 데이터 구축 사업 추진에 실체적으로 적용 가능한 가이드 개발

sns1 추진 목표 및 배경

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

4 링크드 데이터 구축 공정 가이드 v10

링크드 데이터란 무엇인가

현재의 웹은 거의 모든 정보들이 생산 유통 재생산 폐기 등이 이루어지는 거대한

정보 생태계임

-이생태계는웹페이지(HTML)형식으로다양한도큐먼트들이연결되어이루

어져있음

-이미웹은거대한정보플랫폼으로모든정보들이웹에존재하고정보탐색활

동이이루어지고있음

현재웹에서웹페이지에표현되는정보들은이미구조화되어있는데이터베이

스에서추출된정보가기계적해석을거쳐단순히사람이읽고이해할수있는

문자소리영상이미지등의형태로표현됨

-각각의데이터베이스에존재하는데이터들은다양한데이터베이스관리시스

템기술규칙메타데이터를사용하는갇힌형태(silo)로존재

-데이터베이스의정보는HTML로웹상에표현되나실제활용가치가높은데이

터는데이터베이스에만존재(웹에존재하지않음)

-개방되는데이터들은특정이용자의요구가있을경우에개방되거나XLS

CSVPDF등의파일단위혹은OpenAPI로제공되지만비표준적인메타데이

터사용으로재활용성이떨어지고웹이라는플랫폼을벗어나는구조임

링크드 데이터는 웹이라는 거대한 정보 플랫폼 위에 기존 웹을 구성하는 핵심 개념

기술인 HTTP URI를 그대로 활용하고 표준기술규칙을 활용함으로써 웹을 누구나

활용할 수 있는 거대한 데이터베이스로 활용이 가능하도록 함

-웹을데이터베이스로활용함으로써다양한데이터수집을위한행정적기술

적노력감소

링크드 데이터 구축 공정 가이드 v10

5

bullbullbull

-도큐먼트간의연결이아니라도큐먼트를구성하는개념(주제사람장소시

간등)간의연결을통해서동일한객체간의식별이가능하도록하고소유하지

않고있는외부데이터와의연결을통해서보다풍부한정보탐색환경이가능

하도록함

-기존웹(도큐먼트간의연결)이단순히사람이읽고활용할수있는문자형태

정보간의실제적인연결인반면링크드데이터를통한데이터간의연계는데

이터를기반으로하는새로운정보서비스창출이가능하도록함

6 링크드 데이터 구축 공정 가이드 v10

개요PART 1

7

1 추진 목표 및 배경

2 가이드의 구성

3 기대효과

8 링크드 데이터 구축 공정 가이드 v10

1) 추진 목표

본 가이드는 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이

터를 웹에 발행하고자하는 기관이나 사업자들에게 표준적인 링크드 데이터 구축 및

발행 공정을 제공함

-때문에본가이드에서는시맨틱웹(SemanticWeb)링크드데이터(Linked

Data)에대한일반적인이해를돕기위한내용을포함하지는않음

-시맨틱웹링크드데이터에대한이해는『알기쉬운시맨틱웹링크드데이

터』참조

본 가이드는 링크드 데이터 사업을 추진하고자하는 기관에서 이를 수행하고자 하는

전문업체가 선정된 이후 작업공정을 대상으로 함

일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고

체계적이고 효율적인 구축 과정 제공

링크드 데이터 구축 사업 추진에 실체적으로 적용 가능한 가이드 개발

sns1 추진 목표 및 배경

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

5

bullbullbull

-도큐먼트간의연결이아니라도큐먼트를구성하는개념(주제사람장소시

간등)간의연결을통해서동일한객체간의식별이가능하도록하고소유하지

않고있는외부데이터와의연결을통해서보다풍부한정보탐색환경이가능

하도록함

-기존웹(도큐먼트간의연결)이단순히사람이읽고활용할수있는문자형태

정보간의실제적인연결인반면링크드데이터를통한데이터간의연계는데

이터를기반으로하는새로운정보서비스창출이가능하도록함

6 링크드 데이터 구축 공정 가이드 v10

개요PART 1

7

1 추진 목표 및 배경

2 가이드의 구성

3 기대효과

8 링크드 데이터 구축 공정 가이드 v10

1) 추진 목표

본 가이드는 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이

터를 웹에 발행하고자하는 기관이나 사업자들에게 표준적인 링크드 데이터 구축 및

발행 공정을 제공함

-때문에본가이드에서는시맨틱웹(SemanticWeb)링크드데이터(Linked

Data)에대한일반적인이해를돕기위한내용을포함하지는않음

-시맨틱웹링크드데이터에대한이해는『알기쉬운시맨틱웹링크드데이

터』참조

본 가이드는 링크드 데이터 사업을 추진하고자하는 기관에서 이를 수행하고자 하는

전문업체가 선정된 이후 작업공정을 대상으로 함

일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고

체계적이고 효율적인 구축 과정 제공

링크드 데이터 구축 사업 추진에 실체적으로 적용 가능한 가이드 개발

sns1 추진 목표 및 배경

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

6 링크드 데이터 구축 공정 가이드 v10

개요PART 1

7

1 추진 목표 및 배경

2 가이드의 구성

3 기대효과

8 링크드 데이터 구축 공정 가이드 v10

1) 추진 목표

본 가이드는 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이

터를 웹에 발행하고자하는 기관이나 사업자들에게 표준적인 링크드 데이터 구축 및

발행 공정을 제공함

-때문에본가이드에서는시맨틱웹(SemanticWeb)링크드데이터(Linked

Data)에대한일반적인이해를돕기위한내용을포함하지는않음

-시맨틱웹링크드데이터에대한이해는『알기쉬운시맨틱웹링크드데이

터』참조

본 가이드는 링크드 데이터 사업을 추진하고자하는 기관에서 이를 수행하고자 하는

전문업체가 선정된 이후 작업공정을 대상으로 함

일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고

체계적이고 효율적인 구축 과정 제공

링크드 데이터 구축 사업 추진에 실체적으로 적용 가능한 가이드 개발

sns1 추진 목표 및 배경

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

7

1 추진 목표 및 배경

2 가이드의 구성

3 기대효과

8 링크드 데이터 구축 공정 가이드 v10

1) 추진 목표

본 가이드는 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이

터를 웹에 발행하고자하는 기관이나 사업자들에게 표준적인 링크드 데이터 구축 및

발행 공정을 제공함

-때문에본가이드에서는시맨틱웹(SemanticWeb)링크드데이터(Linked

Data)에대한일반적인이해를돕기위한내용을포함하지는않음

-시맨틱웹링크드데이터에대한이해는『알기쉬운시맨틱웹링크드데이

터』참조

본 가이드는 링크드 데이터 사업을 추진하고자하는 기관에서 이를 수행하고자 하는

전문업체가 선정된 이후 작업공정을 대상으로 함

일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고

체계적이고 효율적인 구축 과정 제공

링크드 데이터 구축 사업 추진에 실체적으로 적용 가능한 가이드 개발

sns1 추진 목표 및 배경

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

8 링크드 데이터 구축 공정 가이드 v10

1) 추진 목표

본 가이드는 링크드 데이터(Linked Data) 원칙에 맞추어 기존에 보유하고 있는 데이

터를 웹에 발행하고자하는 기관이나 사업자들에게 표준적인 링크드 데이터 구축 및

발행 공정을 제공함

-때문에본가이드에서는시맨틱웹(SemanticWeb)링크드데이터(Linked

Data)에대한일반적인이해를돕기위한내용을포함하지는않음

-시맨틱웹링크드데이터에대한이해는『알기쉬운시맨틱웹링크드데이

터』참조

본 가이드는 링크드 데이터 사업을 추진하고자하는 기관에서 이를 수행하고자 하는

전문업체가 선정된 이후 작업공정을 대상으로 함

일관성 있는 공정관리를 통해 시행착오 최소화 및 품질제고

체계적이고 효율적인 구축 과정 제공

링크드 데이터 구축 사업 추진에 실체적으로 적용 가능한 가이드 개발

sns1 추진 목표 및 배경

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

9

2) 추진 배경

한국정보화진흥원은 『데이터베이스구축방법론』을 통해 다양한 종류의 디지털화

대상 자료를 효율적으로 구축할 수 있는 체계적인 방법을 제공하고 있음

링크드 데이터 사업은 단순히 기존 데이터베이스를 새로운 형태의 파일로 변환하는

작업을 넘어서 웹을 데이터베이스로 누구나 활용할 수 있도록 하기 위한 작업으로

기존의 『데이터베이스구축방법론』의 범위에 포함되지 않음

때문에 본 가이드는『데이터베이스구축방법론』의 형태적인 장점을 취하되 웹에 데

이터를 공유하고 연결하여 재활용하기 위한 링크드 데이터 구축 방법에 초점을 두

어 현장에서 실제 링크드 데이터 변환과 발행에 직접 활용할 수 있도록 구성하였음

본 가이드는 2013년 국가DB사업을 통해 수행한 한국사와 생물정보 LOD(Linked Open Data)

사업을 바탕으로 공통된 구축공정을 도출하여 구성함

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

10 링크드 데이터 구축 공정 가이드 v10

1) 개요

본 가이드는 정보자원의 효율적 활용을 위한 데이터 웹 구축을 위해 웹에 공개 가능

한 데이터를 발굴하고 링크드 데이터로 변환하는 활동을 지원하기 위해 표준화된

구축공정을 제공함

이를 위해 링크드 데이터 구축을 위한 구축 절차도 산출물 품질확인지침을 핵심내

용으로 구성함

가이드의 링크드 데이터 구축과 발행은 단계-세그먼트-태스크의 체계를 가짐

-단계는링크드데이터구축과발행을위한기본단계로준비단계구축단계

발행단계등록단계로구성함

-세그먼트는단계별로원천자료유형에따라수행되어야하는표준적인작업

절차를의미함

-태스크는각세그먼트별로수행되어야할세부작업내용검토사항및작성되

어야하는산출물내역으로구성됨

태스크 색인 방법

-태스크색인은백단위세자리숫자와원천자료유형(향후세구분이필요할경

우추가하며현재단계에서는공통요소로통일함)을구분한코드로구성됨

sns2 가이드의 구성

3

단계

2

세그먼트

1

태스크

C

원천자료유형

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

11

링크드 데이터 사업 추진을 위한 기준정보를 제공하여 다양한 링크드 데이터 사업

에 적용하고 향후 개선을 통해 완성도 높은 가이드라인으로 발전

공공정보 개방 링크드 데이터에 대한 관심과 사업화가 시작되는 시점에서 실제 사

업을 준비 추진하는 기관에서 실제 적용 가능한 실무 가이드 제공으로 업무 효율성

제고

정보화 사업 추진 프로세스를 고려한 실무지침으로 현장 업무에 직접 활용 가능

sns3 기대효과

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

12 링크드 데이터 구축 공정 가이드 v10

링크드 데이터 구축 공정

PART 2

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

13

1 전체공정도

2 세부공정도

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

14 링크드 데이터 구축 공정 가이드 v10

sns1 전체공정도

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

15

1) 자료준비단계

sns2 세부공정도

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

16 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

17

2) 구축 및 발행단계

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

18 링크드 데이터 구축 공정 가이드 v10

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

19

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

20 링크드 데이터 구축 공정 가이드 v10

태스크별 상세내용PART 3

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

21

1 준비단계

2 구축 및 발행단계

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

22 링크드 데이터 구축 공정 가이드 v10

sns1 준비단계

세그먼트 태스크번호 태스크 정의 주요활동 산출물

현황조사

110C

111C 요구사항 분석

사용자 요구사항 분석

- RFP 사업수행계획서의 명시

된 요구사항 체계화

요구사항분석서

112C 기초 조사

내부 데이터 분석

- 링크드 데이터에 적합한 내부

자원의 파악 (데이터 형태 분

류 등)

외부 데이터 분석 1)

- 연계가능한 도메인에 대한 고

려 (적합성 협조가능 공개 여

부 등)

기초현황조사서

원천데이터 목록

구축

대상선정

120C

121C 기준 정의

링크드 데이터 구축 기준 정의

- 링크드 데이터 구축 대상 데

이터 선정 기준 마련

- 데이터 발행을 위한 구축 및

공개 범위 정의

122C구축 대상 자료

세부 조사

대상데이터 상세 조사

- 선정기준표

- 구축 대상 데이터에 대한 저

작권 조사

- 원천 데이터의 형태 조사

- 원천 데이터 내 사용가능한

메타데이터의 특징 조사

선정 데이터 조사

서(부록1참조)

123C구축 대상

자료 선정

구축 대상 자료 선정

- 구축 및 연계 대상 및 건수 확정

1)외부데이터는현재변환대상데이터가다른기관과연계되어있는경우혹은본사업의추진대상이2개이상기관간의공동추진인경우의데이터로새로운외부데이터와의인터링킹을의미하지않음

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

23

세그먼트 태스크번호 태스크 정의 주요활동 산출물

구축

대상선정

120C

124C 구축방안 정의

구축대상 자료에 대한 구축방

안 정의

- 링크드 데이터 구축 및 서비

스 방향 설정

- 데이터 모델링 가이드 확립

구축계획서

계획수립

130C

131C 요건정의

링크드 데이터 구축 및 서비스

시 고려사항 및 요건 정의

- 원천 데이터 입수 시 고려사

항 및 요건 정의

- 구축 대상의 형태 및 포맷 정의

- 의미관계 모델링 설계를 위한

제약 및 규칙 정의

- 데이터 변환 및 연계 시 고려

해야 할 사항을 정의

- 2)자료 검사 및 품질(원천데이

터에 대한) 요건 정의

- 서비스를 위한 저작권 처리방

안 정의

132C 공정설계

구축대상별 상세 공정 설계

- 자료 준비 및 실행 단계에 대

한 계획 수립

- 구축 각 단계에 대한 태스크

및 작업 내용 정의

- 단계별 공정 산출물 정의

- 각 단계별 사용툴(및 장비) 선정

공정도

133C시범 데이터

구축

시범 데이터 구축

- 시범 구축 대상 데이터 선정

- 시범 데이터 자료 준비

- 모델링 가이드에 따른 테스트

모델링 수행

- 시범 데이터 결과물에 따른

모델링 지침 및 산출물 보완

- 실 구축 중 발생 예상 문제점

정의 및 해결방안 준비 (원천

데이터의 구조적 데이터 양적

문제로 변환 후 재활용 연계

등에 문제 발생 가능성 파악)

시범데이터

구축 보고서

2)원천데이터구축의세부지침은데이터베이스구축방법론30을참조

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

24 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

실행계획

210C211C

구축 대상

데이터

반출계획

수립

구축 대상 데이터 반출에 따른

계획안 정의

- 구축 대상 데이터 보유 기관

및 담당자와 반출에 따른 협

의 진행

- 구축 대상 데이터 반출에 따른

시기 방법 조건에 대한 정의

- 반출에 따른 지침 확립

구축 대상

데이터 반출지침서

212C 연계 계획 수립

외부 데이터 연계를 위한 계획

수립

- 연계를 위한 외부 링크드

데이터 목록 정의

- 대상 데이터의 건수 및

내용 확인

- 외부 데이터 연계를 위한

모델링 가이드 보완

데이터 준비

220C

221C

구축 대상

데이터

목록작성

원천데이터 목록 작성

- 반입되는 원천데이터에 대한

목록 작성

- 데이터에 대한 중복성 검토

- 관리번호(제어번호) 부여 구축 대상

데이터목록

222C

구축 대상

데이터 이관

점검

구축 대상 데이터 이관 점검

- 구축 대상 데이터 보수 구축

대상 데이터의 목록 변경 및

대체

원천데이터

반입

230C

231C 데이터 반입

반입 데이터 확인

- 구축 대상 목표데이터 목록표에

근거한 반입 자료량 확인

- 미 반입 추가 반입 될 데이터에

대한 확인 인수인계증

232C 추가 반입

추가 반입 작업

- 반입 시 누락되거나 잘못된

자료에 대한 추가 반입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

25

sns

세그먼트 태스크번호 태스크 정의 주요활동 산출물

명세화

310C

311C목적 및

범위설정

링크드 데이터로 구축하고자

하는 목적과 범위 설정

구축 명세서

312C 도메인기술 해당 도메인의 특징 등을

상세 기술

313C 시나리오구성 관리자 이용자 시나리오 구성

314C

적합질의

(competency

questions) 구성

추론 등 링크드 데이터로 변환

하는 시스템이 응답해야하는

적합질의를 구성 3)

용어설계

410C

411C 기존 체계분석

데이터모델 온톨로지 현황조사

기 구축된 표준 데이터모델 온

톨로지 확인 및 재활용 확인

- 기존에 존재하는 온톨로지

어휘집 분석온톨로지

어휘 분석서

412C 어휘분석

구축 대상 데이터가 사용하고

있는 어휘분석

- 기관에서 정의한 어휘

사용 여부 조사

- 표준어휘집 사용 여부 조사

413C 용어선정 변환대상 용어선정

414C표준용어집

구축

국내외 표준 용어집 선정

- 원천데이터를 가장 잘 표현할

수 있는 용어집 선정

- 기관에서 정의한 어휘 선정 표준 용어집

415C 용어 매핑

원천데이터 용어를 표준용어로

매핑

- 매핑규칙 구축

3)단순변환데이터제공의경우적합질의생략(RDFaMicroData등)

2 구축 및 발행단계

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

26 링크드 데이터 구축 공정 가이드 v10

세그먼트 태스크번호 태스크 정의 주요활동 산출물

온톨로지

설계

510C

511C 모델정의 도메인 개념 모델 정의 개념 모델명세서

512C 계층화 클래스 계층화 상향식

하향식 조합식

온톨로지모델

명세서

513C 관계정의 속성 관계 정의

514C제약설계

(restriction)

클래스 제약(class restrictions)

설계

속성 제약(property restrictions)

설계

데이터변환

(RDF화)

610C

611C 매핑규칙 점검 원천데이터와 변환대상 데이터

요소 간의 매핑 규칙 점검

612C 변환규칙 점검 변환기를 통해 변환될

변환규칙 점검

613C 데이터 변환 데이터 변환 수행

614C 인스턴스 생성 인스턴스 생성

615C 일관성 확인 온톨로지 일관성 확인

616C 유효성 검증 온톨로지 데이터 검증서

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

27

세그먼트 태스크번호 태스크 정의 주요활동 산출물

저장 및 발행

710C

711C데이터

저장방식 결정

데이터 저장방식 결정

- 관계형DB RDF 저장소

file시스템

712C 데이터 저장 데이터 저장

713C데이터

발행 방식 결정

데이터 발행방식 결정

- RDB2RDF

- RDFa활용 CMS

- 링크드 데이터 인터페이스

- 웹서버(Web Server)

714C 데이터 발행 데이터 발행 발행명세서

등록

720C721C

추후 국내 데이터 등록 플랫폼

구축 후 추가 예정

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

28 링크드 데이터 구축 공정 가이드 v10

산출물 상세내용PART 4

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

29

1 산출물 내용 정의

2 산출물 내역

3 산출물별 상세 내역 및 샘플

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

30 링크드 데이터 구축 공정 가이드 v10

산출물에 대한 기본 정의 및 특징 정의

산출물의 항목별 상세내용 정의

-항목별상세내용에서정의된항목은기본적으로필요한항목중심으로정리

sns1 산출물 내용 정의

sns

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

31

번호 산출물명 정의

011 요구사항 분석서서비스(또는 데이터)구축을 위한 사용자 요구사항에 대한 분석

제안요청서 사업수행계획서의 요구사항의 체계화

012 기초현황조사서 요구사항분석 후 실제 구축 대상 데이터에 대한 현황조사 분석서

013 원천데이터 목록 사업범위에 포함되는 구축대상 데이터 리스트

014 선정데이터조사서구축대상 데이터의 선정기준 제공기관 건수 유형 및 입수가능 여

부 등의 현황 조사 결과

015 구축 계획서 구축대상 데이터 및 구축 방안 등에 대한 계획 수립

016 공정도DB구축 방법론을 활용하여 수집 구축 자료검사단계까지 전 과정

을 포함하는 공정 산출물 및 담당을 기술

017 시범데이터 구축 보고서 모델링 가이드에 따른 온톨로지 시범 데이터 구축

018구축 대상 데이터

반출 지침서구축 대상 데이터 반출에 따른 계획 및 작업 순서를 정의

019 구축 대상 데이터 목록 원천데이터 중 실제 본 사업에서 구축할 수 있는 실제 데이터 목록

110 인수인계증 자료의 반입과 반출을 관리하는 양식

021 구축 명세서

사업 대상 데이터를 기반으로 하는 링크드 데이터 구축 목적 범위

도메인의 특징 관리자이용자 시나리오 적합질의 구성 등 구체적

인 목적과 방법에 대한 명세서

022 온톨로지 어휘분석서기존에 존재하는 유사한 유형의 도메인에 속하는 온톨로지 및 표준

어휘집 분석

023 표준용어집국내외 표준용어집 조사결과와 원천데이터 어휘집을 중심으로 최

종 결정된 표준용어집

024 개념 모델 명세서 온톨로지 개념 모델에 대한 정의

025 온톨로지 모델 명세서 본 사업에 필요한 온톨로지 모델 구축에 대한 명세서

026 데이터 검증서 구축된 데이터의 품질 및 적합질의 검증

027 발행 명세서 웹으로 발행된 데이터의 명세서

sns2 산출물 내역

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

32 링크드 데이터 구축 공정 가이드 v10

1) 준비단계

1-1) 요구사항 분석서

정의 사업수행을위한사용자요구사항분석

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 요구사항 체계화

-요구사항식별번호

-출처구분(제안요청서사업수행계획서등)

-수행방법

-담당자

-관련산출물등기술

sns3 산출물별 상세 내역 및 샘플

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

33

활용예

요구사항분석서

관리번호 사업명

작성자명 작성일

No 요구사항 출처 수행방법 담당자 관련산출물

1XX소장예술가정보데

이터의RDF변환제안요청서 개발 홍길동 온톨로지명세서

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

34 링크드 데이터 구축 공정 가이드 v10

1-2) 기초 현황조사서

정의 요구사항분석후실제구축대상데이터에대한현황조사분석서

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 현황 분석

-RFP상에기술된대상데이터의실제기술환경조사

-대상데이터관련하드웨어소프트웨어현황조사

-대상데이터반입반출관련기술환경조사

-타데이터베이스혹은서비스와연계현황조사

-대상데이터의활용가능여부(저작권등)조사

-대상데이터의서비스제공형태조사(파일형태등)

2 메타데이터 현황 분석

-대상데이터활용메타데이터현황조사(국제표준혹은해당기관에서필요에의해정의

한요소등조사)

3 분석결과

-RFP등기제시된현황과차이점문제점등발견시기술

-차이점문제점해결방안등기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

35

1-3) 원천데이터 목록

정의 사업범위에포함되는구축대상데이터리스트

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

36 링크드 데이터 구축 공정 가이드 v10

활용예

원천데이터목록

관리번호 사업명

작성자명 작성일

구분데이터

형태분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

37

1-4) 선정 데이터 조사서

정의 구축대상데이터의제공기관건수유형및입수가능여부등의현황조사결과

특징

필요시기 구축대상데이터조사및선정시

필수선택 필수

작성자 주관기관제공기관공동

작성량 1부

관리항목

1제공기관제공기관명

2제공기관담당자명데이터제공기관담당자명

3제공기관연락처데이터제공기관담당자연락처

4작성일보고서작성일

기술항목

1 데이터형태

-구조반구조비구조등원천데이터의형태를기입

2 분류

-데이터의형태또는주제분류를기입

3 데이터건수

-구축데이터형태별제공건수

4 데이터 포맷

-데이터베이스또는파일포맷등

5 반출 데이터 형태

-반출가능한데이터형태기술

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

38 링크드 데이터 구축 공정 가이드 v10

활용예

선정데이터조사서

제공기관명

담당자명 연락처

작성일

구분데이터형태

분류명데이터건수

데이터 포맷

반출형태 비고

국보 구조 국보 300 RDB CSV반출가능데이터만CSV형태로제공

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

39

1-5) 구축 계획서

정의 구축대상데이터및구축방안등에대한계획수립

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 주관기관

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 구축 개요

2 구축 대상 및 범위

-기존구축현황기술

-구축대상및범위기술

3 구축 방안

-자료형태별구축방안기술(예구조비구조등원천데이터의형태에따른구축방안

제시

-원천데이터의파일포맷(엑셀MARCTXTXML등)의RDF화

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

40 링크드 데이터 구축 공정 가이드 v10

활용예

구축계획서

사업명

작성기관명 사업자명

작성자명 작성일

구축자료 유형

1 구축 목적 -본사업의목적필요성추진배경기대효과등을기술한다

2 구축 대상 및 범위

-기존구축현황을기술한다

-본사업의구축대상및범위를기술한다

제공기관

제공건수

자료형태

데이터포맷

3 구축 방안-자료형태별구축방안을기술한다-품질요건검사절차시기검사담당등을기술한다

4 표준화 방안 -데이터수집구축시에기준이되는표준을기술한다

5 모델링 가이드 -데이터모델링시고려해야하는사항에대한기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

41

1-6) 공정도

정의DB구축방법론을활용하여수집구축자료검사단계까지전과정을포함하는공정산

출물및담당을기술

특징

필요시기 사업을준비하는시점

필수선택 필수

작성자 공정관리자

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 단계

-구축단계기술

2 태스크 및 태스크 번호

-DB구축방법론을참조하여해당태스크기술

-태스크는선별및확장이가능함

3 작업내용

-각태스크별작업내용기술

4 산출물

-각태스크별산출물

5 담당

-각태스크별책임자관리자

6 사용 툴

-작업시툴을사용하는경우기술

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

42 링크드 데이터 구축 공정 가이드 v10

활용예

공정도

사업명

작성기관명 사업자명

작성자명 작성일

단계태스크

(태스트번호)작업내용 산출물 담당 사용 툴

현황조사기초조사(111C)

포괄적인조사로현재보

유하고있는정보자원에

대한전수조사를실시

아직국내LOD는초기단

계로LOD로발행했을때

효과가큰데이터가무엇

인지에대한정확한전수

조사필요

원천데이터목록

MS

오피스EXCEL

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

43

1-7) 시범데이터 구축 보고서

정의 모델링가이드에따른온톨로지시범데이터구축

특징

필요시기 구축대상별상세공정설계이후

필수선택 필수

작성자 온톨로지설계자및개발자

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시범 구축 대상 데이터 선정

-구축대상선정시논의된구축대상자료를기반으로실제구축될시범데이터의범위

선정

2 시범 데이터 자료 준비

-선정된범위에합당한내외부데이터를수집

3 모델링 가이드에 따른 테스트 모델링 수행

-논의된서비스방향및대상데이터에적합한온톨로지모델설계

-전체서비스가아닌단위서비스에한해테스트모델구축

4 시범 데이터 결과물에 따른 모델링 지침 및 산출물 보완

-설계된테스트온톨로지모델을기반으로샘플데이터구축

-샘플데이터의검수

5 실 구축 중 발생 예상 문제점 정의 및 해결방안 준비

-샘플데이터검수결과에따른예상문제점정의및해결방안모색

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

44 링크드 데이터 구축 공정 가이드 v10

활용예

시범데이터구축보고서

관리번호 사업명

작성자명 작성일

1st_Property 2nd_Property Domain Range 설명

Person_Name Person String 상세이름

aliasName Person String 이칭

bonghoName Person String 봉호

buName Person String 부명

changedName Person String 개명

childhoodName Person String 아명

choName Person String 초명

jaName Person String 자

myohoName Person String 묘호

nickName Person String 호아호

penName Person String 필명

posthumousName Person String 시호

realName Person String 본명

데이터 설명 구축 파일

aliasName 이칭 aliasName_fi0000

anotherName_KOR 이명(한국어) anotherName_KOR_fi0000

bonghoName 봉호 bonghoName_fi0000

Career 관직직업정보 Career_fi0000

changedName 개명 changedName_fi0000

childhoodName 아명 childhoodName_fi0000

choName 초명 choName_fi0000

1 테스트 모델 설계

-인물의상세이름제공을위한테스트모델설계

2 시범 데이터 구축

-테스트모델에따른시범데이터구축

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

45

1-8) 구축 대상 데이터 반출 지침서

정의 구축대상데이터반출에따른계획및작업순서를정의

특징

필요시기 자료구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1사업명사업명칭

2작성자명작성기관명작성사업자명작성자명

3작성일작성일

기술항목

1 목적

-데이터반출대한목적및개요정의

2 작업방법

-각공정별작성순서상세기재

3 예외사항 처리 방법

-데이터반출시발생되는예외사항처리방법에대한기재

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

46 링크드 데이터 구축 공정 가이드 v10

1-9) 구축 대상 데이터 목록

정의 확정된구축대상데이터리스트

특징

필요시기 구축단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1데이터형태

-구조반구조비구조등원천데이터의형태를기입

2데이터세부사항

-메타데이터항목을기입(분류유형시대일자등)

3소장기관

-데이터의보유기관을기입

4 내외부 정보

-내부데이터또는외부연계데이터에대한기입

5 건수

-데이터의건수기입

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

47

활용예

구축대상데이터목록

관리번호 사업명

작성자명 작성일

구분데이터형태

분류 유형 입력일 소장기관 내외부 건수

주소 구조 지리 텍스트 20xxxxxx XXX 내부 200건

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

48 링크드 데이터 구축 공정 가이드 v10

1-10) 인수인계증

정의 자료의반입과반출을관리하는양식

특징

필요시기 자료의반출과반입이발생하는시점

필수선택 필수

작성자 작업자프로젝트관리자공동

작성량 서식당1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 관리번호 작업대상자료의고유번호

2 청구번호 데이터를보유한기관에서사용하는청구번호를기입

3 비고 자료의반입과반출하면서자료의특이사항을기록

4 대출자 자료를빌려가는사람이서명

5 대여자 자료를대여해주는사람이서명

6 자료명 자료의명칭기록

7 자료 수량 자료의수량기록(예건등)

8 반입일 자료를반입하는날짜

9 예정 반납일 자료를사용하고반납하는예정일기록

10 반출일 자료를반출하는날짜

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

49

활용예

인수인계증

관리번호 사업명

작성자명 작성일

청구번호 관리번호 데이터명 자료수량 비고

0511박49 263987 박문제12집1939년19월 10

상기데이터를(인수인계)하였음을확인하며자료손상없이

(인수인계)가되었음을확인합니다

주관기관(확인)

주관사업자(확인)

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

50 링크드 데이터 구축 공정 가이드 v10

2) 구축 및 발행 단계

2-1) 구축 명세서

정의 링크드데이터구축목적범위도메인의특징등기술

특징

필요시기 구축및발행단계

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 도메인 분석

-해당도메인의특징등을상세분석

2 목적 및 범위 설정

-링크드데이터로구축하고자하는목적과범위설정

3 사용자 선정

-시스템이용자및관리자구성

4 해당 사업에 필요한 인력 정보

-개발자및필요인력구성

5 사업수준 정의

-해당사업의LOD발행수준정의

6 기타 사업 관련 정보 설정

-해당사업에관련된필요한내용기술

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

51

활용예

구축명세서

관리번호 사업명

작성자명 작성일

1 분야

구축분야명기술

2 담당

시스템담당

데이터담당(원천데이터분석온톨로지설계트리플변환등)

자문담당

등을기재

3 목적

LOD(LinkedOpenData)구축을위한목적을기술

4 구축 범위

LOD(LinkedOpenData)를적용하기위한데이터및시스템의범위를기술

5 원천데이터

LOD(LinkedOpenData)를적용하는대상이되는원천데이터의데이터명특징및관계등

을기술

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

52 링크드 데이터 구축 공정 가이드 v10

2-2) 온톨로지 어휘분석서

정의 기존에존재하는유사한유형의도메인에속하는온톨로지및표준어휘집분석

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 해당 데이터 도메인 기술

-원천데이터가갖는도메인특징범위등기술

2 현황조사

-해당도메인에속하는국내외표준온톨로지조사

-표준온톨로지에서활용하고있는표준어휘집조사

-온톨로지모델및어휘집의도입가능성(적합성)여부조사

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

53

활용예

온톨로지어휘분석서

관리번호 사업명

작성자명 작성일

1 원천데이터의 특징

-본사업대상원천데이터는인간문화재로ldquo사람rdquo을주객체로함

2 해외 온톨로지 분석

-국제적으로사람객체를표현하기위한표준으로FOAF모델활용

3 표준 어휘집

-FOAF어휘집을주로활용함

4 적합성 여부

-사람이라는객체를표현하기에는적합하고다른객체와인터링킹이가능하나인간문화재를

표현하기위한속성은부족함

-이를위해별도로속성과하위클래스를정의하고공표하는것이필요함

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

54 링크드 데이터 구축 공정 가이드 v10

2-3) 표준용어집

정의 표준용어집

특징

필요시기 자료의구축을시작하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 국내외 표준 용어집 선정

-원천데이터를가장잘표현할수있는용어집선정

-기관에서정의한어휘선정

2 시스템 표준용어집 구축

3 원천데이터 용어를 표준용어로 매핑

-매핑규칙구축

-매핑규칙에따른원천데이터용어들의표준화

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

55

활용예

표준용어집

관리번호 사업명

작성자명 작성일

용어 예시 비고 현재활용용어 선정표준용어

표제어 충선왕(忠宣王) title dctitle

본명 왕장(王璋)

왕명으로발음이없

는한자일경우(조선

왕실)조선왕조실록

사이트의음을사용

호아호

필명

아명

개명

창씨명

가명

자 중앙

종교명

성별

초명 왕원

시호 충선(忠宣)

봉호

묘호

이칭익지례보화(益智禮普化)

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

56 링크드 데이터 구축 공정 가이드 v10

2-4) 개념 모델 명세서

정의 온톨로지개념모델에대한정의

특징

필요시기 LOD에필요한온톨로지모델을구축하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 시스템의 도메인 및 목적에 적합한 개념 모델정의

-작성된시나리오고려

-활용가능개념모델분석

2 표준용어집을 활용하여 개념 모델 어휘 정의

3 원천데이터에 해당하는 내용들의 계층적 지식표현

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

57

활용예

개념모델명세서

관리번호 사업명

작성자명 작성일

1구조도

2명세

상위 개념

개념 (한글명)

개념 (영문명)

개념 설명

관계 (한글명)

관계 (영문명)

관계 설명

관계 대상

관계 특징

주체 Agent

행위를하는주체에대한개념으로사람그룹등을포함

성별 gendermalefenale과같은

성별을나타내기위한관계

단일값을갖는관계

생일 birthday출생과관련된날짜를기술하기위한관계

날짜역관계가단일값을갖는관계

개인메일

mbox메일주소를기술하기

위한관계

나이 age 나이를나타내는관계 숫자

Agent

사람 Person사람을나타내는개념

이름 firstName 사람의이름 문자열

성별 lastName 사람의성 문자열

그룹 Group

사람으로구성된단체를나타내는개념

멤버 member그룹을구성하는하위

집합요소Agent

문서Document

문서의형태로표현될수있는모든것들을포함하는개념

주제 topic해당문서가나타내는

모든요소Thing

page관계와역관계

Document

이미지 Image

Document의하위클래스이면서이미지를표현하기위한개념

묘사 depicts

이미지와이미지가묘사하고있는사물과의관계를기술하기위한

속성

Thingdepiction관계와역관계

썸네일 thumbnail전체크기의이미지와이미지는대표하는작은이미지와의관계

Image

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

58 링크드 데이터 구축 공정 가이드 v10

2-5) 온톨로지 모델 명세서

정의 본사업에필요한온톨로지모델구축에대한명세서

특징

필요시기 개념명세서를작성후온톨로지모델구축을실행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 클래스 정의

-같은분야의활용가능한관련온톨로지분석

-개념모델을기반으로한클래스들의정의

-정의된클래스들의계층화상향식하향식조합식

2 속성 정의

-클래스에필요한속성정의

-원천데이터에서제공되는내용들을기반으로구축

-구축된클래스속성들의계층화상향식하향식조합식

3 모델검증

-구축된모델에대한검증

-W3C표준에맞춰무결성검증

-작성된시나리오를해결가능한지에대해검증

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

59

활용예

온톨로지모델명세서

관리번호 사업명

작성자명 작성일

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

60 링크드 데이터 구축 공정 가이드 v10

2-6) 데이터 검증서

정의 구축된데이터의품질및적합질의검증

특징

필요시기 LOD데이터구축후유효성을검증해야하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 적합질의에 따른 유효성 검증

-적합질의를해결하고자작성된SPARQL에따른검증

-시나리오가해결되었는지에대한검증

-구축된LOD데이터들의원천데이터의내용을잘반영했는지에대한검증

-단위테스트및통합테스트로이루어짐

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

61

활용예

데이터검증서

관리번호 사업명

작성자명 작성일

작업권한 시험항목 검증방법

관리자 데이터수집및저장내외부데이터를수집하기위한수집및수집된데이

터저장을위한기능개발

관리자 LOD모델관리및검증개발된LOD모델에대한추가삭제변경등의관리

기능및적합성검증개발

관리자LOD인스턴스저장및

검증

구축된LOD인스턴스를저장하고적합성을검증하기

위한기능개발

관리자 SPARQL처리기시맨틱질의언어인SPARQL을지원하기위한기능을

개발

관리자 LOD발행및관리 LOD발행및관리를위한기능개발

관리자 LOD통계정보서비스 LOD발행및이용에관한통계정보제공기능개발

관리자LOD검색브라우징다

운로드서비스

LOD를활용하기위한편이도구개발(검색브라우

징다운로드서비스)

관리자 인물관련서비스구축된데이터를활용한인물중심시맨틱웹서비스

개발

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

62 링크드 데이터 구축 공정 가이드 v10

2-7) 발행명세서

정의 LOD데이터구축이끝난후LOD서비스를발행하는시점

특징

필요시기 LOD데이터구축이끝난후LOD서비스를발행하는시점

필수선택 필수

작성자 주관기관프로젝트관리자공동

작성량 1부

관리항목

1관리번호주관기관에서사용하고있는관리번호를이용

2사업명사업명칭

3작성자보고서작성자명

4작성일보고서작성일

기술항목

1 데이터 저장방식의 결정

-관계형DBAPIRDF저장소RDF파일등데이터저장방식을결정

2 데이터 발행방식의 결정

-RDF2RDF(예D2R)

-RDFa활용CMS

-링크드데이터인터페이스(예Pubby)

-웹서버(Webserver)

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별 상

세내

용Ⅳ

산출

물 상

세내

용부

63

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

64 링크드 데이터 구축 공정 가이드 v10

부록

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

65

[부록 1] 링크드 데이터 선정기준 참고자료

[부록 2] URI 생성 및 관리 지침

[부록 3] 링크드 데이터 발행 후 체크리스트

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

66 링크드 데이터 구축 공정 가이드 v10

1 개요

링크드 데이터 사업을 추진하고자하는 기관의 보유 데이터 중 링크드 데이터로 개

방했을 때 효과가 가장 큰 데이터와 개발할 수 있는 데이터를 식별하기 위해서 기본

적으로 확인해야하는 선정기준

2 선정기준

공개하고자 하는 데이터가 높은 이용가치를 가지고 있는가

데이터에 대한 저작권 문제는 없는가

개인정보에 위배되지 않는가

구축 후 오픈된 라이선스(Creative Commons와 같은)로 활용이 가능한가

데이터 제공자는 참조사이트를 보유하고 있는가

데이터의 확보가 가능한가

데이터 오픈에 대한 정책을 보유하고 있는가

sns[부록 1]링크드 데이터 선정기준 참고자료

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

67

부록

1 배경

웹에서 URI는 웹페이지나 특정 개체(PDF 등 특정 파일)를 식별하는 데 활용되지만

실세계의 개념 객체를 나타내기도 함

-웹은URI를단일한글로벌식별체계로활용함

링크드 데이터에서 HTTP URI는 URI에 의해서 식별가능한 정보자원에 대한 탐색과

역참조를 지원함

-링크드데이터에서는기존의문서중심의웹이아니라데이터가중심이되는

웹으로현재문서를구성하는다양한개념과객체를웹에서식별가능하도록

하고구체적으로정의함

-체계적인URI생성할당관리는이용자의데이터탐색과구조분석을용이하

게함

그러나 URI 생성과 관리는 표준적인 체계가 존재하지는 않음

본 가이드에서의 URI 생성 및 관리지침은 권고 사항으로 반드시 준수하여야하는 표

준 원칙은 아니지만 현재 Open Data Linked Data 발행 시 일반적으로 준수되고 있

는 사항들로 향후 링크드 데이터 프로젝트 결과물이 웹에서 보다 효율적으로 운용

될 수 있도록 하고 타 데이터셋과 상호운용성을 원활하게 할 수 있음

-URI생성지침은223BestPracticesURIConstruction4)DesigningURISetsfor

theUKPublicSector5)를참조함

4)httpwwww3org2011gldwiki223_Best_Practices_URI_Construction5)httpswwwgovukgovernmentpublicationsdesigning-uri-sets-for-the-uk-public-sector

sns[부록 2]URI 생성 및 관리 지침

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

68 링크드 데이터 구축 공정 가이드 v10

2 URI 생성을 위한 사전 확인 리스트

본격적인 URI 설계 전에 서비스하고자 하는 데이터의 유형과 URI 부여를 위해 아래

사항을 확인함

-URI로제시표현하고자하는정보는구체적으로무엇인가

-다운로드가능한정보자원을가리키기위한것인가(PDFCSVRDFTTL

ZIP)

-실세계에존재하는객체(개념)를식별하기위한것인가(학교부서등)

-실세계에존재하는객체(개념)에관한정보를가리키기위한것인가

-추상적인어떤것을식별하기위한것인가(지위서비스관계)

-개념을정의하기위한것인가(용어집의용어혹은메타데이터요소)

-이러한것들을지칭하는비URI형태의명칭혹은식별자가존재하는가(다른

정보시스템에서사용하고있는것들)

-이러한것들을지칭하기위한URI가이미존재하는가

-정보자원에새로운URI를부여할경우이를관리할수있는권한은누가갖고

있는가

-URI구문과관련된특별한사항이나요구사항들이있는가

-이해관계자가쉽게URI를기억하거나활용할수있는가그럴정도로직관적

인가

-생성된URI가지칭하는자원을충분히이해할수있을정도로쉬운가

-URI가관련된다른URI를추측할수있는구조를가질필요가있는가

-URI를장기적으로지속적으로유지하기위한요구사항은무엇인가

-URI를변경해야하는주기가존재하는가(정기적조직변경업무변경등)

-URI에서표현하는용어혹은분류가공식적인가(법적으로보장된공식적인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

69

조직명혹은표준적인학명등)

-비공식적인명칭의사용도가능한가

3 URI 유형 구분

링크드 데이터로 발행하기 위한 자원의 유형에 따라 이를 표현하기 위한 URI 유형을

아래와 같이 구분함

각 자원의 유형별로 별도의 URI로 구분하고 각 URI 유형별로 별도의 URI 규칙을 따름

자원 유형 URI 유형 정의와 범위

실세계의lsquo어떤것rsquo

IdentifierURI

lsquo어떤것rsquo은실세계에물리적으로존재하거나추상적인객체

개념을의미함

물리적객체사람학교도로

추상적객체정부부문인종(민족)이벤트

문서나저작물들또한실세계의객체에속함

실세계의객체나개념은웹에존재하지않지만그것에관한

정보는존재

URI구문을생성할때객체에대한정보와객체자체를지칭

하는것을구분할수있도록해야함(DBpedia의Resource와

Page구분참조)

실세계에존재하는객체개념에대한웹에존재하

는정보

DocumentURI

실세계의객체나개념에관한정보제공을목적으로개별적

인lsquoidentifierURIrsquo가정보제공자(publisher)에의해서할당되

어명시적으로링크되어웹에존재하는문서6)에부여함

RepresentationURI

lsquoDocumentURIrsquo제공자가하나이상의형태(format)에대한

정보를제공하는경우로각각의형태는representationURI

에의해서명명화됨으로써구분할수있음

형태에따라서일부의representationURI는기계가독형문서

에명명하여명명된자원에관한더많은연결(link)을제공할

수있음

하나의집합(set)안에포함되어있는각식별자들의

색인

ListURI하나의집합(set)에포함되어있는IdentifierURI의목록을제

공함

개념정의 OntologyURI

개념의정의를제공해줄필요또한있음

실세계의객체개념은그객체개념들의개별적인인스턴스

를식별하기때문에개념의정의를제공해줄필요가있음

6)document를문서로번역한것으로실제로이미지동영상등다양한포맷들도포함하는개념

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

70 링크드 데이터 구축 공정 가이드 v10

자원 유형 URI 유형 정의와 범위

객체개념간의관계

OntologyURI

RDF구문의각부분은URI로명명이가능함

이는실세계의객체개념간의관계를포함하고있음

온톨로지URI는온톨로지내부의연결관계를맺어주고보다

나은reasoning이가능하도록함

URIset SetURI

URIset은하나의출처로부터관리되는하나의개념에대해서

URI를활용해서출판된참조데이터의집합을의미한다예를

들어각각의학교각각의도로등은별도의분리된URI셋으

로구성된다

URIset에명명된URI식별자유형은셋(집합)의품질특성을

제공하기위해명명함

4 URI 설계 원칙

HTTP를 활용해서 URI가 해석가능 하도록 함(resolve)

명시적인 URI의 형태를 나타개기 위해 일관된 경로 구조를 사용

데이터 발행자(publisher)는 데이터셋이 다른 분야 혹은 관련된 분야에서 재사용이

가능한지 여부를 확인해야 함

URI 셋은 재사용이 가능한 잠재적 수명(유효기간 등)을 명시해야 함

URI 셋은 최소한 10년 이상 재사용이 가능하도록 해야 함

여러 가지의 Representation URI를 사용할 수 있는 경우 내용협상(contents

negotiation)으로 가장 적절한 표현을 제공할 수 있는 Document URI를 제공해야 함

최소한 기계가독형 Representation URI를 제공해야함

적절한 경우 사람이 읽을 수 있는 형태의 Representation URI를 HTML안에 포함시

켜야함

단일 Document URI를 위해서 활용 가능한 각각의 Representation URI를 탐색할 수

있는 방법을 제공해야함

URI set은 일반적인 어휘를 사용해서 데이터 품질 특성 권한 인증관련 정보를 제공

해야 함

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

71

URI 구조에는 session ID와 같이 변경될 가능성이 있는 것을 포함시켜서는 안됨

URI 경로 구조는 사람이 읽을 수 있는 형태로 URI가 대표하고 있는 내용을 합리적으

로 이해할 수 있어야 함

5 각 유형별 URI 설계(안)

URI설계는제안사항으로사업을추진하는기관의정책과정보화환경에따라

독자적으로설계가가능함

1) URI 기본 구조 설정

기본적으로 링크드 데이터 기반 서비스는 기존에 사용하고 있는 대표 도메인명을

활용하며 기존 도메인에 data 서비스 페이지임을 인지할 수 있도록 lsquodatarsquo라는 용어

를 부기할 것을 권장함

단 링크드 데이터 프로젝트를 추진하는 주체(기관)의 유형에 따라 다음 3가지의 경

우별로 별도의 세부지침을제시함

- 유형1특정도메인을대표하는기관의경우(예국립중앙도서관대한민

국정부국립민속박물관등)

- 유형2 특정도메인을대표하나정형화된조직구조를갖추고있어하나의

조직(도메인)으로분류되는경우(예기획재정부안전행정부등)단데이

터서비스가최상위조직을통해서대표적으로이루어지고하위조직이별

도의서비스체계가없을경우에적용그외개별단위서비스가필요한경

우유형1을준수함

- 유형3 그외일반적인조직유형(기업등)에속하는경우

유형1의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]lt예httpdatahomepagegokrgt

-2안http[기존도메인]datalt예httpwwwhomepagegokrdatagt

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

72 링크드 데이터 구축 공정 가이드 v10

유형2의 기본 URI 구조는 다음과 같이 함

-1안http[지식분야]data[기존도메인]

예httpeducationdatagokrgt

-2안http[기존도메인]data[지식분야]

예httpdatagokrdataeducationgt

유형3의 기본 URI 구조는 다음과 같이 함

-1안httpdata[기존도메인]

예httpdatahomepagecokrgt

-2안http[기존도메인]data

lt예httphomepagecokrdatagt

-3안7)httpdata[기존도메인][지식도메인]

예httpdatahomepagecokreducationgt

http[기존도메인]data[지식도메인]

예httphomepagecokrdataeducationgt

2) URI 유형별 구조 설계

1)의 기본 설계를 기본 도메인[base domain]으로 하여 각 유형별로 URI를 아래와 같

은 약어로 표현함

URI 유형 약어 표현

IdentifierURI [basedomain]id

DocumentURIRepresentationURI

[basedomain]doc

OntologyURI [basedomain]def

SetURI [basedomain]set

7)개방될데이터의지식도메인이여러가지일경우

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

73

Document URI Representation URI는 파일확장자를 반드 시 표현하여 해당 정보자

원의 유형을 식별할 수 있도록 함

-예시[basedomain]docguidelinehwp

Identifier URI 구조 상세 설계

-기본구조[basedomain]idconceptreference

[basedomain]conceptreferenceid

-구조예시[basedomain]idlibrary011001

[basedomain]library011001id

conceptreference는표현하고자하는개념과실제객체사이의쌍으로

데이터의구조를상세하게표현가능함(예한국시도군구등)

Document URI 구조 상세 설계

-기본구조[basedomain]docconceptreference

-구조예시[basedomain]docschool011001

Representation URI 구조 상세 설계

-기본구조[basedomain]docconceptreference파일명파일확장자

-구조예시[basedomain]docschool011001schoolrdf

개념을 정의하기 위한 URI(온톨로지 스키마)

-기본구조[basedomain]defconcept

-구조예시[basedomain]defschool

URI set

-기본구조[basedomain]setconcept

-구조예시[basedomain]setschool

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

74 링크드 데이터 구축 공정 가이드 v10

1 대상

링크드 데이터로 출판된 데이터셋에 대한 품질 체크리스트로 출판된 데이터셋이 기

대 수준을 충족하는가를 확인하기 위한 기준

항목별로 필수 권고 선택사항으로 구분함

현재의 체크리스트는 LATC Dataset Publishing Checklist를 참조하여 작성됨

2 체크리스트

1) 링크드 데이터 서비스 페이지는 이용자가 데이터를 활용하는데 필요한 정

보를 구체적으로 잘 설명하고 있어야 함

11)링크드데이터서비스페이지(웹사이트)는데이터셋에대한구체적인설명

을포함하고있는가

필수 서비스하고있는데이터가무엇에관한것인가에대한설명

필수 서비스하고있는데이터의출처(source)에대한설명(원데이터에대한링

크(위치정보))

필수 서비스하고있는데이터의라이센스저작권에대한설명

권고 제공하고있는데이터로이용자가할수있는것에대한설명(데이터를제

공하는이유에대한설명포함)

권고 데이터를업데이트하는주기(일월없음등)에대한설명과마지막업데

이트일자에대한정보

권고 원천데이터의변환과정에대한설명

sns[부록 3]링크드 데이터 발행 후 체크리스트

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅲ

태스

크별

Ⅳ 산

출물

상세

내용

부록

75

Ⅱ 링

크드

데이

구축

공정

선택 데이터출판에활용한소프트웨어에대한설명이나데이터변환에활용된

소스코드에대한설명및링크정보

12)데이터접근에대한정보를표현하고있는가

권고 SPARQL접점과질의폼제공여부확인

권고 RDF데이터덤프다운로드제공여부확인

권고 데이터셋을제공받을수있는구문에대한정보제공여부(RDFXML

TurtleRDFa등)

선택 SPARQL덤프resolvableURIs을통해서제공받는데이터들의차이가무

엇인지에대한설명

13)제공하고있는데이터셋에대한예제정보를제공하고있는가

필수 예제

권고 다른데이터셋으로링크가가능한예제URIs

권고 SPARQL질의예제

선택 객체모델을보여줄수있는Turtlesnippet

14)모델링과데이터크기에관한정보제공을하고있는가

필수 전체트리플크기에관한정보

필수 연결된다른데이터셋이무엇이고얼마나많은링크를가지고있는가에

대한정보

권고 SPARQL질의예제

권고 어떤객체(entities)들이기술되어있으며얼마나많은종류를가지고있는

가에대한정보

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

76 링크드 데이터 구축 공정 가이드 v10

권고 어떤용어집을사용하였는가에대한정보

선택 다양한유형의객체에대한URI패턴정보

선택 데이터셋스키마에대한다이어그램정보

15)데이터셋서비스에대한홍보와운영에관한정보를포함하고있는가

필수 브랜드로고와링크정보를제공하고있는지와서비스를지원운영하고

있는주체에대한정보제공

16)제한사항과향후데이터서비스에대한작업등정보를제공하고있는가

필수 권고선택등제안된모든사항에대한기준을충족하고있는지여부를확

인하여부족한부분에대한향후제공계획등정보제공

2) 링크드 데이터 서비스는 제공하고 있는 기능을 점검할 수 있는 기능을 제공

해야하고 표준을 준수하고 있는지 여부를 확인할 수 있어야 함

21)내용협상과해석가능한URI(ResolvableURIs)제공여부를확인할수있는

지확인

필수 모든예제자원에대한URIresolve확인(HTTP200반환성공여부)

예)curl-ihttpexample-uri

권고 HTTP내용협상확인

예)curl-HldquoAccepttexthtmlrdquohttpexample-uri

권고 RDF내용협상이가능한지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAccepttextturtlerdquohttpexample-uri

권고 내용협상의구현이완료되었는지확인

예)curl-HldquoAcceptapplicationrdf+xmlrdquohttpexample-uri

curl-HldquoAcceptapplicationrdf+xmltexthtmlq=01rdquohttpexample-uri

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

77

curl-HldquoAccepttexthtmlq=01applicationrdf+xmlrdquohttpexample-uri

필수 반환된RDF는RDF파서나유효성검증도구로분석이가능해야함

22)연결확인

필수 다른데이터셋과연결되어있는예제의URI해석(resolve)가가능해야함

23)SPARQL접점(Endpoint)기능점검

권고 SPARQL예제질의문이모두정상적으로작동하는지확인

권고 단순SPARQL질의가작동해야함

예)SELECTspoLIMIT10

SELECTDISTINCTtypeWHERExatype

3) RDF를 활용하여 표현하고 있는 데이터는 재사용과 표준을 준수하고 있는

지 확인

권고 자연어문자열로표현된값들은영문한글등대상을잘표현할수있는

적절한언어를사용하고있는지확인

권고 숫자와날짜등특정표현을위해적절한속성유형구분(XSDdatatype)

을활용하고있는가

예)rdftype과적절한레이블(rdfslabeldctitleskosprefLabel)

권고 공백노드가존재하는지여부확인

선택 모든예제자원은RDF로기계가독형표현을가지고있는지확인

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

78 링크드 데이터 구축 공정 가이드 v10

4) 기존 용어집의 사용과 표준용어집 활용에 관한 점검

41)기존용어집의재사용

필수 재사용된용어집이정확한네임스페이스를사용하고있는지여부

필수 클래스와속성들이기존용어집에정확하게정의되어있는지확인오표

기된클래스와속성명이존재하는지확인

42)자기정의용어집

권고 클래스와속성의URI해석(URIresolve)이가능한지확인

권고 클래스와속성들이적절한레이블을가지고있는지확인

권고 용어집의접두부(네임스페이스URI검색)가정상적으로등록되어있는지

확인

선택 모든클래스와속성이용어집과일치하는지확인

선택 속성이domain과range를가지고있는지확인

선택 클래스속성URIs로부터용어집문서를가리키고있는rdfsisDefinedBy

가존재하는지여부확인

5) 현재 대부분의 링크드 데이터는 기존에 존재하는 데이터의 변환으로 구성

되지만 인터링킹을 통해서 새로운 정보관계를 생성하므로 연결상태를 확인

하고 대상 플랫폼을 확인해야 함

선택 연결된대상데이터셋들이특정플랫폼에존재하는지와상태확인

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

Ⅰ 개

요Ⅱ

링크

드 데

이터

구축

공정

Ⅲ 태

스크

별Ⅳ

산출

물 상

세내

용부

79

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다

2014년 4월 인쇄

2014년 4월 발행

발행인 장광수

발행처 한국정보화진흥원 지식자원활용부

집행필 이병하 이동철 김택훈 박진호

주행소 서울시 중구 청계천로 14

연락처 (02) 2131-0114

인행쇄 (사)장애인생산품판매지원협회 인쇄사업소

lt비매품gt

링크드 데이터구축 공정 가이드 v10

1 본 보고서는 2013년 국가DB사업으로 수행한 LOD구축사업(한국사 생물정보)의 결과로 만들었습니다

2 본 보고서의 내용은 한국정보화진흥원의 공식 견해와 다를 수 있습니다

3 본 보고서의 내용에 대한 무단전재를 금하며 가공middot인용할 때는 출처를 밝혀 주시기 바랍니다