대한민국, 잇다!
DESCRIPTION
대한민국, 잇다! : 대한민국의 모든 데이터를 의미적으로 연결하고 활용하기 위한 시작점 오픈데이터와 링크드데이터를 활용한 국가 기반 데이터의 모델링에 대한 설명TRANSCRIPT
대한민국,����������� ������������������ 잇다!����������� ������������������ ����������� ������������������ ����������� ������������������
대한민국의����������� ������������������ 모든����������� ������������������ 데이터를����������� ������������������ 의미적으로����������� ������������������ 연결하고����������� ������������������ 활용하기����������� ������������������ 위한����������� ������������������ 시작점����������� ������������������ ����������� ������������������
2013����������� ������������������ Korea����������� ������������������ Semantic����������� ������������������ Web����������� ������������������ Conference����������� ������������������
Open����������� ������������������ Knowledge����������� ������������������ Foundation����������� ������������������ Korea,����������� ������������������ 2013����������� ������������������
Open����������� ������������������ Knowledge����������� ������������������ Foundation����������� ������������������ Korea����������� ������������������ Overview����������� ������������������ |����������� ������������������ 참여,����������� ������������������ 공유,����������� ������������������ 협업을����������� ������������������ 위한����������� ������������������ 활동����������� ������������������
2
오픈데이터데이 (2월) OKF 해커톤 (6월, 7월) OKF 해커톤 대구(9월) KSWC (11월)
http://okfn.kr����������� ������������������ https://www.facebook.com/groups/OKFNKorea/����������� ������������������ https://www.facebook.com/OKFNKorea����������� ������������������
가격����������� ������������������ 대중교통����������� ������������������
3
교육시설����������� ������������������ 쇼핑����������� ������������������
24/7����������� ������������������ 생활의����������� ������������������ 변화와����������� ������������������ 다차원����������� ������������������ 의사결정의����������� ������������������ 시대����������� ������������������
Question 집을����������� ������������������ 선택할����������� ������������������ 때,����������� ������������������ 무엇이����������� ������������������ 중요한����������� ������������������ 고려요소인가요?����������� ������������������
오픈����������� ������������������ 데이터����������� ������������������ 세계����������� ������������������ 지표����������� ������������������ Overview:����������� ������������������ Reality����������� ������������������ Check����������� ������������������
4
12 대한민국����������� ������������������ 순위����������� ������������������
Source: h*p://www.opendataresearch.org/project/2013/odb
오픈����������� ������������������ 데이터의����������� ������������������ 현재����������� ������������������ Overview:����������� ������������������ Reality����������� ������������������ Check����������� ������������������
5
-����������� ������������������ 수없이����������� ������������������ 공개될����������� ������������������ 데이터의����������� ������������������ 품질은����������� ������������������ 좋은가?����������� ������������������ -����������� ������������������ 낮은����������� ������������������ 품질로����������� ������������������ 서비스를����������� ������������������ 보장할����������� ������������������ 수����������� ������������������ 있는가?����������� ������������������
-����������� ������������������ 상용����������� ������������������ 데이터와����������� ������������������ 비교해����������� ������������������ 품질이����������� ������������������ 좋은가?����������� ������������������ -����������� ������������������ 파편화된����������� ������������������ 데이터에����������� ������������������ 대한����������� ������������������ 참조가����������� ������������������ 가능한가?����������� ������������������
-����������� ������������������ 오픈����������� ������������������ 데이터를����������� ������������������ 활용해서����������� ������������������ 만들고����������� ������������������ 싶은����������� ������������������ 것은?����������� ������������������ -����������� ������������������ 오픈����������� ������������������ 데이터를����������� ������������������ 활용해����������� ������������������ 만들����������� ������������������ 수����������� ������������������ 있는����������� ������������������ 수익모델은?����������� ������������������
3 2 1 파편화된����������� ������������������ 데이터����������� ������������������ 낮은����������� ������������������ 품질의����������� ������������������ 데이터����������� ������������������ 활용����������� ������������������ 시나리오의����������� ������������������ 부재����������� ������������������
빅데이터����������� ������������������ (Big����������� ������������������ Data),����������� ������������������ 공공����������� ������������������ 데이터����������� ������������������ (Public����������� ������������������ Data),����������� ������������������ 오픈����������� ������������������ 데이터����������� ������������������ (Open����������� ������������������ Data),����������� ������������������ 링크드����������� ������������������ 데이터����������� ������������������ (Linked����������� ������������������ Data)����������� ������������������ …⋯����������� ������������������ 모두����������� ������������������ 데이터에����������� ������������������ 대한����������� ������������������ 이야기입니다.����������� ������������������
오픈데이터����������� ������������������ 활성화를����������� ������������������ 위한����������� ������������������ 기술����������� ������������������ Overview����������� ������������������ |����������� ������������������ 기술����������� ������������������
6
데이터����������� ������������������ 활용성����������� ������������������ 데이터����������� ������������������ 접근성����������� ������������������
백서����������� ������������������ Machine- Readable HWP,PDF����������� ������������������ XLS����������� ������������������ CSV����������� ������������������
Linked����������� ������������������ Data����������� ������������������
Data Filter Visualize Story
Linked����������� ������������������ Data����������� ������������������
7
웹에����������� ������������������ 존재하는����������� ������������������ 다양한����������� ������������������ 정보자원을����������� ������������������ 노출����������� ������������������ (exposing),����������� ������������������ 공유����������� ������������������ (sharing),����������� ������������������ 연결����������� ������������������ (connecting)하기����������� ������������������ 위한����������� ������������������ 방법.����������� ������������������ ����������� ������������������
����������� ������������������ 사전적����������� ������������������ 의미에서����������� ������������������ "Linked"는����������� ������������������ 링크로����������� ������������������ 연결된이란����������� ������������������ 의미를����������� ������������������ 뜻하기����������� ������������������ 때문에����������� ������������������
"링크로����������� ������������������ 연결된����������� ������������������ 의미적����������� ������������������ 데이터"로����������� ������������������ 해석될����������� ������������������ 수����������� ������������������ 있다.����������� ������������������ ����������� ������������������
왜����������� ������������������ 연결하는가?����������� ������������������
8
9
10
11
외래키����������� ������������������ (foreign����������� ������������������ key)����������� ������������������
12
테이블들의����������� ������������������ 관계를����������� ������������������ 설정하는����������� ������������������ 빌딩����������� ������������������ 블록의����������� ������������������ 역할을����������� ������������������ 제공하며,����������� ������������������ 데이터베이스����������� ������������������ 테이블들����������� ������������������ 간에����������� ������������������ 참조����������� ������������������ 무결성을����������� ������������������ 보장하기����������� ������������������ 위해����������� ������������������ 사용된다����������� ������������������
owl:sameAs����������� ������������������
13
서로����������� ������������������ 연결된����������� ������������������ 개체가����������� ������������������ 같은����������� ������������������ 것임을����������� ������������������ 정의하기����������� ������������������ 위한����������� ������������������ 속성����������� ������������������
h*p://music.naver.com/ar>st/home.nhn?ar>stId=138437
h*p://music.daum.net/ar>st/main?ar>stDetailId=192914
연결의����������� ������������������ 조건����������� ������������������
14
15
어디에����������� ������������������ 연결하나?����������� ������������������
16
17
18
4,000,000����������� ������������������ things����������� ������������������
����������� ������������������ …⋯����������� ������������������ including����������� ������������������ 832,000����������� ������������������ persons,����������� ������������������ 639,000����������� ������������������ places����������� ������������������ (including����������� ������������������ 427,000����������� ������������������ populated����������� ������������������ places),����������� ������������������ 372,000����������� ������������������ creative����������� ������������������ works����������� ������������������ (including����������� ������������������ 116,000����������� ������������������ music����������� ������������������ albums,����������� ������������������ 78,000����������� ������������������ films����������� ������������������ and����������� ������������������ 18,500����������� ������������������ video����������� ������������������ games),����������� ������������������ 209,000����������� ������������������ organizations����������� ������������������ (including����������� ������������������ 49,000����������� ������������������ companies����������� ������������������ and����������� ������������������ 45,000����������� ������������������ educational����������� ������������������ institutions),����������� ������������������ 226,000����������� ������������������ species����������� ������������������ and����������� ������������������ 5,600����������� ������������������ diseases.����������� ������������������
데이터����������� ������������������ ����������� ������������������ =����������� ������������������ ����������� ������������������
인프라스트럭처����������� ������������������ 19
20
21
예제:����������� ������������������ 행정구역분류체계����������� ������������������
22
예제:����������� ������������������ 행정구역분류체계����������� ������������������
대한민국,����������� ������������������ 잇다!����������� ������������������ 목표����������� ������������������
23
-����������� ������������������ 오픈데이터의����������� ������������������ 정제를����������� ������������������ 통한����������� ������������������ 품질����������� ������������������ 개선����������� ������������������ -����������� ������������������ 정제된����������� ������������������ 데이터의����������� ������������������ Linked����������� ������������������ Data����������� ������������������ 구현����������� ������������������
-����������� ������������������ 온톨로지����������� ������������������ 기반����������� ������������������ 데이터����������� ������������������ 모델링����������� ������������������ -����������� ������������������ URI를����������� ������������������ 기반으로����������� ������������������ 서로����������� ������������������ 다른����������� ������������������ 데이터의����������� ������������������ 연계����������� ������������������
-����������� ������������������ Cross-domain����������� ������������������ 데이터����������� ������������������ 연계를����������� ������������������ 통한����������� ������������������ 시나리오����������� ������������������ 개발����������� ������������������ -����������� ������������������ 데이터����������� ������������������ 매쉽업을����������� ������������������ 위한����������� ������������������ 인터페이스����������� ������������������ 지원����������� ������������������
3 2 1 연결된����������� ������������������ 데이터����������� ������������������ 정제된����������� ������������������ 데이터����������� ������������������ 시나리오����������� ������������������ 지원����������� ������������������
lod.datahub.kr����������� ������������������
24
데이터����������� ������������������ 분석����������� ������������������ 및����������� ������������������ 변환����������� ������������������ Linked����������� ������������������ Data����������� ������������������ ����������� ������������������ 시스템����������� ������������������ 구현����������� ������������������
LOD����������� ������������������ 데이터허브����������� ������������������ |����������� ������������������ 구축����������� ������������������ 방법����������� ������������������
25
데이터����������� ������������������ 모델링����������� ������������������ 데이터����������� ������������������ 상세화����������� ������������������
공공����������� ������������������ 영역의����������� ������������������ 오픈����������� ������������������ 데이터를����������� ������������������ Linked����������� ������������������ Data로����������� ������������������ 변환����������� ������������������
1 2 3 4
-����������� ������������������ 행정구역����������� ������������������ -����������� ������������������ 도로명코드����������� ������������������ -����������� ������������������ 전국����������� ������������������ 초중고등학교����������� ������������������ -����������� ������������������ 전국����������� ������������������ 대학교����������� ������������������ -����������� ������������������ 전국����������� ������������������ 병원����������� ������������������ -����������� ������������������ 도로명주소����������� ������������������ 기반����������� ������������������ ����������� ������������������ ����������� ������������������ ����������� ������������������ 우편주소����������� ������������������ ����������� ������������������
-����������� ������������������ 공통����������� ������������������ 항목����������� ������������������ 추출����������� ������������������ -����������� ������������������ RDF����������� ������������������ 어휘����������� ������������������ 검토����������� ������������������ 및����������� ������������������ 공통����������� ������������������ 어휘����������� ������������������ 추출����������� ������������������ -����������� ������������������ 데이터별����������� ������������������ 온톨로지����������� ������������������ 모델링����������� ������������������ -����������� ������������������ 온톨로지����������� ������������������ 명세서����������� ������������������ 개발����������� ������������������ -����������� ������������������ Named����������� ������������������ Entity����������� ������������������ URI����������� ������������������ 설계����������� ������������������ 규칙����������� ������������������ 명세서����������� ������������������ 개발����������� ������������������
-����������� ������������������ Linked����������� ������������������ Data����������� ������������������ 설계����������� ������������������ -����������� ������������������ SameAs����������� ������������������ 관계����������� ������������������ 도출����������� ������������������ ����������� ������������������ *����������� ������������������ 동일한����������� ������������������ 관계����������� ������������������ 표현����������� ������������������ -����������� ������������������ seeAlso����������� ������������������ 관계����������� ������������������ 도출����������� ������������������ ����������� ������������������ *����������� ������������������ 추가����������� ������������������ 정보����������� ������������������ 표현����������� ������������������ -����������� ������������������ 데이터����������� ������������������ 연결����������� ������������������ ����������� ������������������ *����������� ������������������ 내부����������� ������������������ 데이터����������� ������������������ 간����������� ������������������ 연계����������� ������������������ ����������� ������������������ *����������� ������������������ 외부����������� ������������������ 데이터����������� ������������������ 연계����������� ������������������ ����������� ������������������
-����������� ������������������ RDF����������� ������������������ 데이터����������� ������������������ 유효성����������� ������������������ 검사����������� ������������������ -����������� ������������������ RDF����������� ������������������ 파일����������� ������������������ 생성����������� ������������������ -����������� ������������������ SPARQL����������� ������������������ Endpoint����������� ������������������ 구현����������� ������������������ -����������� ������������������ Relationship����������� ������������������ Visualization����������� ������������������ 구현����������� ������������������
데이터포털����������� ������������������ 연계����������� ������������������ 오픈소스연계����������� ������������������ Schema.org����������� ������������������ 연계����������� ������������������ LOD����������� ������������������ 연계����������� ������������������
오픈소스����������� ������������������ 기반����������� ������������������ 시스템����������� ������������������ 구축����������� ������������������
26
����������� ������������������ 코리아데이터허브����������� ������������������
Raw����������� ������������������ Data����������� ������������������
RDF����������� ������������������ 4Store����������� ������������������ SPARQL����������� ������������������ Endpoint����������� ������������������
시각화����������� ������������������ ����������� ������������������ 도구����������� ������������������
Linked����������� ������������������ Data����������� ������������������ 시스템����������� ������������������ 응용����������� ������������������ 시스템����������� ������������������
온톨로지����������� ������������������ 모델����������� ������������������
온톨로지명세����������� ������������������ Neologism����������� ������������������
Data����������� ������������������ API����������� ������������������ 검색����������� ������������������ ����������� ������������������ 도구����������� ������������������
탐색����������� ������������������ ����������� ������������������ 도구����������� ������������������
LOD����������� ������������������ 데이터허브����������� ������������������ |����������� ������������������ 시스템����������� ������������������
27
28
29
다양한 옵션에 따라 데이터를 탐색할 수 있는 도구
데이터 사이의 의미적 관계를 시각적으로 보여주는 도구
SPARQL Endpoint를����������� ������������������ 통한����������� ������������������ 데이터����������� ������������������ 질의����������� ������������������ 및����������� ������������������ 검색
3 2 1 시맨틱 관계 탐색 데이터����������� ������������������ 브라우저 시맨틱 질의/검색
오픈소스����������� ������������������ 기반����������� ������������������ 시스템����������� ������������������ 구축����������� ������������������ LOD����������� ������������������ 데이터허브����������� ������������������ |����������� ������������������ 도구����������� ������������������
30
협업을����������� ������������������ 통한����������� ������������������ 진화����������� ������������������ LOD����������� ������������������ 데이터허브����������� ������������������ |����������� ������������������ 시스템����������� ������������������ 연계����������� ������������������
h"ps://groups.google.com/forum/#!forum/korea-‐lod-‐datahub
URIs����������� ������������������ for����������� ������������������ Ontology����������� ������������������ Vocabulary����������� ������������������ 모델링����������� ������������������ 규칙����������� ������������������
31
Vocabulary
Vocabulary����������� ������������������ ����������� ������������������ -����������� ������������������ /def/{vocabulary}����������� ������������������ Classes����������� ������������������ ����������� ������������������ -����������� ������������������ /def/{vocabulary}/{class}����������� ������������������ Document����������� ������������������ ����������� ������������������ -����������� ������������������ /def/{vocabulary}/{property}����������� ������������������
Class
http://lod.datahub.kr/def/cf/����������� ������������������
http://lod.datahub.kr/def/cf/12-Museum����������� ������������������
Facility http://lod.datahub.kr/def/facility/collects����������� ������������������
*����������� ������������������ Class의����������� ������������������ 첫글자는����������� ������������������ 영문����������� ������������������ 대문자,����������� ������������������ Property는����������� ������������������ 소문자를����������� ������������������ 사용함����������� ������������������
303����������� ������������������ See����������� ������������������ other����������� ������������������
URIs����������� ������������������ for����������� ������������������ Real-World����������� ������������������ Things����������� ������������������ 모델링����������� ������������������ 규칙����������� ������������������
32
Culture Facilities
Things����������� ������������������ ����������� ������������������ -����������� ������������������ /id/{type}/{id}����������� ������������������ ����������� ������������������ -����������� ������������������ /id/{type}/{id}/{child-type}/{child-id}����������� ������������������ Document����������� ������������������ ����������� ������������������ -����������� ������������������ /doc/{type}/{id}����������� ������������������ ����������� ������������������ -����������� ������������������ /doc/{type}/{id}/{child-type}����������� ������������������
List
http://lod.datahub.kr/id/facility����������� ������������������
http://lod.datahub.kr/doc/facility����������� ������������������
303����������� ������������������ See����������� ������������������ other����������� ������������������
Facility http://lod.datahub.kr/id/facility/123456����������� ������������������
*����������� ������������������ id����������� ������������������ 형식����������� ������������������ 및����������� ������������������ 값에����������� ������������������ 대한����������� ������������������ 의사결정����������� ������������������ 필요����������� ������������������
Data on the Web Summary
Data is information about things
33
Data is something machines can process
Data drives applications (e.g. web sites, mobile services)
Data is relations among things
Open Data starts with making available the data that you already have, in whatever format.
• Equal access for all • Licensing, legal issues • Transparency • Changing the way government works
Open Data vs Linked Data Summary
Open Data
Linked Data • URIs • HTTPs • RDF vocabularies • Standards
34
For more information contact Open Knowledge Foundation Korea via http://okfn.kr http://lod.datahub.kr