대한민국, 잇다!

35

Click here to load reader

Upload: haklae-kim

Post on 13-Jan-2015

463 views

Category:

Technology


4 download

DESCRIPTION

대한민국, 잇다! : 대한민국의 모든 데이터를 의미적으로 연결하고 활용하기 위한 시작점 오픈데이터와 링크드데이터를 활용한 국가 기반 데이터의 모델링에 대한 설명

TRANSCRIPT

Page 1: 대한민국, 잇다!

대한민국,����������� ������������������  잇다!����������� ������������������  ����������� ������������������  ����������� ������������������  

대한민국의����������� ������������������  모든����������� ������������������  데이터를����������� ������������������  의미적으로����������� ������������������  연결하고����������� ������������������  활용하기����������� ������������������  위한����������� ������������������  시작점����������� ������������������  ����������� ������������������  

2013����������� ������������������  Korea����������� ������������������  Semantic����������� ������������������  Web����������� ������������������  Conference����������� ������������������  

Open����������� ������������������  Knowledge����������� ������������������  Foundation����������� ������������������  Korea,����������� ������������������  2013����������� ������������������  

Page 2: 대한민국, 잇다!

Open����������� ������������������  Knowledge����������� ������������������  Foundation����������� ������������������  Korea����������� ������������������  Overview����������� ������������������  |����������� ������������������  참여,����������� ������������������  공유,����������� ������������������  협업을����������� ������������������  위한����������� ������������������  활동����������� ������������������  

2

오픈데이터데이 (2월) OKF 해커톤 (6월, 7월) OKF 해커톤 대구(9월) KSWC (11월)

http://okfn.kr����������� ������������������  https://www.facebook.com/groups/OKFNKorea/����������� ������������������  https://www.facebook.com/OKFNKorea����������� ������������������  

Page 3: 대한민국, 잇다!

가격����������� ������������������   대중교통����������� ������������������  

3

교육시설����������� ������������������   쇼핑����������� ������������������  

24/7����������� ������������������  생활의����������� ������������������  변화와����������� ������������������  다차원����������� ������������������  의사결정의����������� ������������������  시대����������� ������������������  

Question 집을����������� ������������������  선택할����������� ������������������  때,����������� ������������������  무엇이����������� ������������������  중요한����������� ������������������  고려요소인가요?����������� ������������������  

Page 4: 대한민국, 잇다!

오픈����������� ������������������  데이터����������� ������������������  세계����������� ������������������  지표����������� ������������������  Overview:����������� ������������������  Reality����������� ������������������  Check����������� ������������������  

4

12 대한민국����������� ������������������  순위����������� ������������������  

Source:  h*p://www.opendataresearch.org/project/2013/odb  

Page 5: 대한민국, 잇다!

오픈����������� ������������������  데이터의����������� ������������������  현재����������� ������������������  Overview:����������� ������������������  Reality����������� ������������������  Check����������� ������������������  

5

-����������� ������������������  수없이����������� ������������������  공개될����������� ������������������  데이터의����������� ������������������  품질은����������� ������������������  좋은가?����������� ������������������  -����������� ������������������  낮은����������� ������������������  품질로����������� ������������������  서비스를����������� ������������������  보장할����������� ������������������  수����������� ������������������  있는가?����������� ������������������  

-����������� ������������������  상용����������� ������������������  데이터와����������� ������������������  비교해����������� ������������������  품질이����������� ������������������  좋은가?����������� ������������������  -����������� ������������������  파편화된����������� ������������������  데이터에����������� ������������������  대한����������� ������������������  참조가����������� ������������������  가능한가?����������� ������������������  

-����������� ������������������  오픈����������� ������������������  데이터를����������� ������������������  활용해서����������� ������������������  만들고����������� ������������������  싶은����������� ������������������  것은?����������� ������������������  -����������� ������������������  오픈����������� ������������������  데이터를����������� ������������������  활용해����������� ������������������  만들����������� ������������������  수����������� ������������������  있는����������� ������������������  수익모델은?����������� ������������������  

3 2 1 파편화된����������� ������������������  데이터����������� ������������������   낮은����������� ������������������  품질의����������� ������������������  데이터����������� ������������������   활용����������� ������������������  시나리오의����������� ������������������  부재����������� ������������������  

Page 6: 대한민국, 잇다!

빅데이터����������� ������������������  (Big����������� ������������������  Data),����������� ������������������  공공����������� ������������������  데이터����������� ������������������  (Public����������� ������������������  Data),����������� ������������������  오픈����������� ������������������  데이터����������� ������������������  (Open����������� ������������������  Data),����������� ������������������  링크드����������� ������������������  데이터����������� ������������������  (Linked����������� ������������������  Data)����������� ������������������  …⋯����������� ������������������  모두����������� ������������������  데이터에����������� ������������������  대한����������� ������������������  이야기입니다.����������� ������������������  

오픈데이터����������� ������������������  활성화를����������� ������������������  위한����������� ������������������  기술����������� ������������������  Overview����������� ������������������  |����������� ������������������  기술����������� ������������������  

6

데이터����������� ������������������  활용성����������� ������������������  데이터����������� ������������������  접근성����������� ������������������  

백서����������� ������������������  Machine- Readable HWP,PDF����������� ������������������   XLS����������� ������������������   CSV����������� ������������������  

Linked����������� ������������������  Data����������� ������������������  

Data Filter Visualize Story

Page 7: 대한민국, 잇다!

Linked����������� ������������������  Data����������� ������������������  

7

웹에����������� ������������������  존재하는����������� ������������������  다양한����������� ������������������  정보자원을����������� ������������������  노출����������� ������������������  (exposing),����������� ������������������  공유����������� ������������������  (sharing),����������� ������������������  연결����������� ������������������  (connecting)하기����������� ������������������  위한����������� ������������������  방법.����������� ������������������  ����������� ������������������  

����������� ������������������  사전적����������� ������������������  의미에서����������� ������������������  "Linked"는����������� ������������������  링크로����������� ������������������  연결된이란����������� ������������������  의미를����������� ������������������  뜻하기����������� ������������������  때문에����������� ������������������  

"링크로����������� ������������������  연결된����������� ������������������  의미적����������� ������������������  데이터"로����������� ������������������  해석될����������� ������������������  수����������� ������������������  있다.����������� ������������������  ����������� ������������������  

Page 8: 대한민국, 잇다!

왜����������� ������������������  연결하는가?����������� ������������������  

8

Page 9: 대한민국, 잇다!

9

Page 10: 대한민국, 잇다!

10

Page 11: 대한민국, 잇다!

11

Page 12: 대한민국, 잇다!

외래키����������� ������������������  (foreign����������� ������������������  key)����������� ������������������  

12

테이블들의����������� ������������������  관계를����������� ������������������  설정하는����������� ������������������  빌딩����������� ������������������  블록의����������� ������������������  역할을����������� ������������������  제공하며,����������� ������������������  데이터베이스����������� ������������������  테이블들����������� ������������������  간에����������� ������������������  참조����������� ������������������  무결성을����������� ������������������  보장하기����������� ������������������  위해����������� ������������������  사용된다����������� ������������������  

Page 13: 대한민국, 잇다!

owl:sameAs����������� ������������������  

13

서로����������� ������������������  연결된����������� ������������������  개체가����������� ������������������  같은����������� ������������������  것임을����������� ������������������  정의하기����������� ������������������  위한����������� ������������������  속성����������� ������������������  

h*p://music.naver.com/ar>st/home.nhn?ar>stId=138437  

h*p://music.daum.net/ar>st/main?ar>stDetailId=192914  

Page 14: 대한민국, 잇다!

연결의����������� ������������������  조건����������� ������������������  

14

Page 15: 대한민국, 잇다!

15

Page 16: 대한민국, 잇다!

어디에����������� ������������������  연결하나?����������� ������������������  

16

Page 17: 대한민국, 잇다!

17

Page 18: 대한민국, 잇다!

18

4,000,000����������� ������������������  things����������� ������������������  

����������� ������������������  …⋯����������� ������������������  including����������� ������������������  832,000����������� ������������������  persons,����������� ������������������  639,000����������� ������������������  places����������� ������������������  (including����������� ������������������  427,000����������� ������������������  populated����������� ������������������  places),����������� ������������������  372,000����������� ������������������  creative����������� ������������������  works����������� ������������������  (including����������� ������������������  116,000����������� ������������������  music����������� ������������������  albums,����������� ������������������  78,000����������� ������������������  films����������� ������������������  and����������� ������������������  18,500����������� ������������������  video����������� ������������������  games),����������� ������������������  209,000����������� ������������������  organizations����������� ������������������  (including����������� ������������������  49,000����������� ������������������  companies����������� ������������������  and����������� ������������������  45,000����������� ������������������  educational����������� ������������������  institutions),����������� ������������������  226,000����������� ������������������  species����������� ������������������  and����������� ������������������  5,600����������� ������������������  diseases.����������� ������������������  

Page 19: 대한민국, 잇다!

데이터����������� ������������������  ����������� ������������������  =����������� ������������������  ����������� ������������������  

인프라스트럭처����������� ������������������  19

Page 20: 대한민국, 잇다!

20

Page 21: 대한민국, 잇다!

21

예제:����������� ������������������  행정구역분류체계����������� ������������������  

Page 22: 대한민국, 잇다!

22

예제:����������� ������������������  행정구역분류체계����������� ������������������  

Page 23: 대한민국, 잇다!

대한민국,����������� ������������������  잇다!����������� ������������������  목표����������� ������������������  

23

-����������� ������������������  오픈데이터의����������� ������������������  정제를����������� ������������������  통한����������� ������������������  품질����������� ������������������  개선����������� ������������������  -����������� ������������������  정제된����������� ������������������  데이터의����������� ������������������  Linked����������� ������������������  Data����������� ������������������  구현����������� ������������������  

-����������� ������������������  온톨로지����������� ������������������  기반����������� ������������������  데이터����������� ������������������  모델링����������� ������������������  -����������� ������������������  URI를����������� ������������������  기반으로����������� ������������������  서로����������� ������������������  다른����������� ������������������  데이터의����������� ������������������  연계����������� ������������������  

-����������� ������������������  Cross-domain����������� ������������������  데이터����������� ������������������  연계를����������� ������������������  통한����������� ������������������  시나리오����������� ������������������  개발����������� ������������������  -����������� ������������������  데이터����������� ������������������  매쉽업을����������� ������������������  위한����������� ������������������  인터페이스����������� ������������������  지원����������� ������������������  

3 2 1 연결된����������� ������������������  데이터����������� ������������������   정제된����������� ������������������  데이터����������� ������������������   시나리오����������� ������������������  지원����������� ������������������  

Page 24: 대한민국, 잇다!

lod.datahub.kr����������� ������������������  

24

Page 25: 대한민국, 잇다!

데이터����������� ������������������  분석����������� ������������������  및����������� ������������������  변환����������� ������������������  Linked����������� ������������������  Data����������� ������������������  ����������� ������������������  시스템����������� ������������������  구현����������� ������������������  

LOD����������� ������������������  데이터허브����������� ������������������  |����������� ������������������  구축����������� ������������������  방법����������� ������������������  

25

데이터����������� ������������������  모델링����������� ������������������   데이터����������� ������������������  상세화����������� ������������������  

공공����������� ������������������  영역의����������� ������������������  오픈����������� ������������������  데이터를����������� ������������������  Linked����������� ������������������  Data로����������� ������������������  변환����������� ������������������  

1 2 3 4

-����������� ������������������  행정구역����������� ������������������  -����������� ������������������  도로명코드����������� ������������������  -����������� ������������������  전국����������� ������������������  초중고등학교����������� ������������������  -����������� ������������������  전국����������� ������������������  대학교����������� ������������������  -����������� ������������������  전국����������� ������������������  병원����������� ������������������  -����������� ������������������  도로명주소����������� ������������������  기반����������� ������������������  ����������� ������������������  ����������� ������������������  ����������� ������������������  우편주소����������� ������������������  ����������� ������������������  

-����������� ������������������  공통����������� ������������������  항목����������� ������������������  추출����������� ������������������  -����������� ������������������  RDF����������� ������������������  어휘����������� ������������������  검토����������� ������������������  및����������� ������������������  공통����������� ������������������  어휘����������� ������������������  추출����������� ������������������  -����������� ������������������  데이터별����������� ������������������  온톨로지����������� ������������������  모델링����������� ������������������  -����������� ������������������  온톨로지����������� ������������������  명세서����������� ������������������  개발����������� ������������������  -����������� ������������������  Named����������� ������������������  Entity����������� ������������������  URI����������� ������������������  설계����������� ������������������  규칙����������� ������������������  명세서����������� ������������������  개발����������� ������������������  

-����������� ������������������  Linked����������� ������������������  Data����������� ������������������  설계����������� ������������������  -����������� ������������������  SameAs����������� ������������������  관계����������� ������������������  도출����������� ������������������  ����������� ������������������  *����������� ������������������  동일한����������� ������������������  관계����������� ������������������  표현����������� ������������������  -����������� ������������������  seeAlso����������� ������������������  관계����������� ������������������  도출����������� ������������������  ����������� ������������������  *����������� ������������������  추가����������� ������������������  정보����������� ������������������  표현����������� ������������������  -����������� ������������������  데이터����������� ������������������  연결����������� ������������������  ����������� ������������������  *����������� ������������������  내부����������� ������������������  데이터����������� ������������������  간����������� ������������������  연계����������� ������������������  ����������� ������������������  *����������� ������������������  외부����������� ������������������  데이터����������� ������������������  연계����������� ������������������  ����������� ������������������  

-����������� ������������������  RDF����������� ������������������  데이터����������� ������������������  유효성����������� ������������������  검사����������� ������������������  -����������� ������������������  RDF����������� ������������������  파일����������� ������������������  생성����������� ������������������  -����������� ������������������  SPARQL����������� ������������������  Endpoint����������� ������������������  구현����������� ������������������  -����������� ������������������  Relationship����������� ������������������  Visualization����������� ������������������  구현����������� ������������������  

데이터포털����������� ������������������  연계����������� ������������������   오픈소스연계����������� ������������������  Schema.org����������� ������������������  연계����������� ������������������   LOD����������� ������������������  연계����������� ������������������  

Page 26: 대한민국, 잇다!

오픈소스����������� ������������������  기반����������� ������������������  시스템����������� ������������������  구축����������� ������������������  

26

����������� ������������������  코리아데이터허브����������� ������������������  

Raw����������� ������������������  Data����������� ������������������  

RDF����������� ������������������   4Store����������� ������������������  SPARQL����������� ������������������  Endpoint����������� ������������������  

시각화����������� ������������������  ����������� ������������������  도구����������� ������������������  

Linked����������� ������������������  Data����������� ������������������  시스템����������� ������������������   응용����������� ������������������  시스템����������� ������������������  

온톨로지����������� ������������������  모델����������� ������������������  

온톨로지명세����������� ������������������  Neologism����������� ������������������  

Data����������� ������������������  API����������� ������������������  검색����������� ������������������  ����������� ������������������  도구����������� ������������������  

탐색����������� ������������������  ����������� ������������������  도구����������� ������������������  

LOD����������� ������������������  데이터허브����������� ������������������  |����������� ������������������  시스템����������� ������������������  

Page 27: 대한민국, 잇다!

27

Page 28: 대한민국, 잇다!

28

Page 29: 대한민국, 잇다!

29

다양한 옵션에 따라 데이터를 탐색할 수 있는 도구

데이터 사이의 의미적 관계를 시각적으로 보여주는 도구

SPARQL Endpoint를����������� ������������������  통한����������� ������������������  데이터����������� ������������������  질의����������� ������������������  및����������� ������������������  검색

3 2 1 시맨틱 관계 탐색 데이터����������� ������������������  브라우저 시맨틱 질의/검색

오픈소스����������� ������������������  기반����������� ������������������  시스템����������� ������������������  구축����������� ������������������  LOD����������� ������������������  데이터허브����������� ������������������  |����������� ������������������  도구����������� ������������������  

Page 30: 대한민국, 잇다!

30

협업을����������� ������������������  통한����������� ������������������  진화����������� ������������������  LOD����������� ������������������  데이터허브����������� ������������������  |����������� ������������������  시스템����������� ������������������  연계����������� ������������������  

h"ps://groups.google.com/forum/#!forum/korea-­‐lod-­‐datahub  

Page 31: 대한민국, 잇다!

URIs����������� ������������������  for����������� ������������������  Ontology����������� ������������������  Vocabulary����������� ������������������  모델링����������� ������������������  규칙����������� ������������������  

31

Vocabulary

Vocabulary����������� ������������������  ����������� ������������������  -����������� ������������������  /def/{vocabulary}����������� ������������������  Classes����������� ������������������  ����������� ������������������  -����������� ������������������  /def/{vocabulary}/{class}����������� ������������������  Document����������� ������������������  ����������� ������������������  -����������� ������������������  /def/{vocabulary}/{property}����������� ������������������  

Class

http://lod.datahub.kr/def/cf/����������� ������������������  

http://lod.datahub.kr/def/cf/12-Museum����������� ������������������  

Facility http://lod.datahub.kr/def/facility/collects����������� ������������������  

*����������� ������������������  Class의����������� ������������������  첫글자는����������� ������������������  영문����������� ������������������  대문자,����������� ������������������  Property는����������� ������������������  소문자를����������� ������������������  사용함����������� ������������������  

303����������� ������������������  See����������� ������������������  other����������� ������������������  

Page 32: 대한민국, 잇다!

URIs����������� ������������������  for����������� ������������������  Real-World����������� ������������������  Things����������� ������������������  모델링����������� ������������������  규칙����������� ������������������  

32

Culture Facilities

Things����������� ������������������  ����������� ������������������  -����������� ������������������  /id/{type}/{id}����������� ������������������  ����������� ������������������  -����������� ������������������  /id/{type}/{id}/{child-type}/{child-id}����������� ������������������  Document����������� ������������������  ����������� ������������������  -����������� ������������������  /doc/{type}/{id}����������� ������������������  ����������� ������������������  -����������� ������������������  /doc/{type}/{id}/{child-type}����������� ������������������  

List

http://lod.datahub.kr/id/facility����������� ������������������  

http://lod.datahub.kr/doc/facility����������� ������������������  

303����������� ������������������  See����������� ������������������  other����������� ������������������  

Facility http://lod.datahub.kr/id/facility/123456����������� ������������������  

*����������� ������������������  id����������� ������������������  형식����������� ������������������  및����������� ������������������  값에����������� ������������������  대한����������� ������������������  의사결정����������� ������������������  필요����������� ������������������  

Page 33: 대한민국, 잇다!

Data on the Web Summary

Data is information about things

33

Data is something machines can process

Data drives applications (e.g. web sites, mobile services)

Data is relations among things

Page 34: 대한민국, 잇다!

Open Data starts with making available the data that you already have, in whatever format.

•  Equal access for all •  Licensing, legal issues •  Transparency •  Changing the way government works

Open Data vs Linked Data Summary

Open Data

Linked Data •  URIs •  HTTPs •  RDF vocabularies •  Standards

34

Page 35: 대한민국, 잇다!

For more information contact Open Knowledge Foundation Korea via http://okfn.kr http://lod.datahub.kr