linked open data

36
Linked Open Data 山本 泰智 ライフサイエンス統合データベースセンター @yayamamo

Upload: yayamamo-dbcls-kashiwanoha

Post on 11-Apr-2017

658 views

Category:

Documents


1 download

TRANSCRIPT

Linked Open Data

山本 泰智ライフサイエンス統合データベースセンター

@yayamamo

1. factual information (as measurements or statistics) used as a basis for reasoning, discussion, or calculation

2. information output by a sensing device or organ that includes both useful and irrelevant or redundant information and must be processed to be meaningful

3. information in numerical form that can be digitally transmitted or processed

--- Merriam-Webster

Data

データは素材 (原材料)

1. 推論や議論、または計算するための事実2. 意味あるものとするために処理することが必須

データはどう保存される?

NASA Goddard Photo and Video

Gain a directory to ever-changing government information available on the Internet. Government-related indexes, finding aids, pathfinders, resource guides, and search engines are identified. Published by Bernan.

Now with more than 4,800 entries, including over * 250 sites from international governmental organizations and other countries* 150 U.S. state government sites * 540 U.S. Congressional member sites and email address* 1,400 individual government publicationsURLs and content descriptions are verified and updated for all entries.

The first edition was included in “Selected Reference Books of 1997” in College and Research Libraries, March 1998, p. 182.

http://www.notess.com/write/gioti/

“Because comparing sites on the Internet is difficult, this book allows a user to identify and compare potential sites prior to even going online...an excellent resource.”— Journal of Government Information

2003年の話

1. factual information (as measurements or statistics) used as a basis for reasoning, discussion, or calculation

2. information output by a sensing device or organ that includes both useful and irrelevant or redundant information and must be processed to be meaningful

3. information in numerical form that can be digitally transmitted or processed

Data

3. デジタル送信や処理ができる数値化された情報

複製、加工がし易い

多元的なデータを用いた推論、議論、計算がし易い

デジタルデータの方が望ましい?

データ統合 (Data Integration / Mashup)

多くの情報源から得られたデータを統合して可視化

データ統合をし易い方がデータの価値を高められるのではないか?

http://forbesindia.com/blog/technology/data-deluge-needs-smarter-storage/

デジタルデータは膨大

散在するデジタルデータを効率良く見つけ

効率良くデータ統合をしたい

コンピューターを用いて

既に成功しているウェブに習い

データのウェブを実現しよう

ウェブ (World Wide Web)

インターネットを介してアクセスできるリンクしたドキュメント群

http://www.

Mariano Real Pérez

データのウェブ

インターネットを介してアクセスできるリンクしたデータ

Linked Data

Uniform Resource Locator (URL)

http://www.ishikawa-nct.ac.jp/blg/blg/20130529-1354.html

リンクする、つまり、

ある文書から別の文書へ関連付ける

各文書をネット上で曖昧無く指し示せることが必要

ウェブを構成する技術標準

HyperText Transfer Protocol (HTTP)

HyperText Markup Language (HTML)

ウェブのリンクを表現するための記法

ネットを介したウェブを実現するための通信規約

Uniform Resource Locator (URL)

+

Linked Dataを構成する技術標準

HyperText Transfer Protocol (HTTP)

Resource Description Framework (RDF)

データのリンクを表現するための記法

ネットを介してリンクするデータを実現するための通信規約

Uniform Resource Identifier (URI)

個々のデータを区別するための記法

Linked Data

Use URIs as names for things

Use HTTP URIs so that people can look up those names.

When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL)

Include links to other URIs. so that they can discover more things.

--- Tim Berners-Leehttp://www.w3.org/DesignIssues/LinkedData.html

複製、加工がし易いデジタルデータ

デジタルデータは二次利用がし易い

データ統合をし易い方がデータの価値を高められるのではないか?

著作権の関係

二次利用を容易にできるとは限らない

二次利用を容易にする法的基盤

Open Data Commons Open Database License (ODbL)

オープンなデータOpen Data

“A piece of data or content is open if anyone is free to use, reuse, and redistribute it — subject only, at

most, to the requirement to attribute and/or share-alike.”

http://opendefinition.org/

誰もが自由に使い、再利用し、再配布できるならば、それはオープン

DataLinked?

Open?

Yes

Yes Linked Open Data(LOD) Open Data

Linked Data

Linked Open Data

Linked Data which is released under an open licence, which does not impede its reuse for free.

--- Tim Berners-Leehttp://www.w3.org/DesignIssues/LinkedData.html

5 Star Linked Open Data mugnot just linked data, but linked *open* data$13.19http://www.cafepress.com/w3c_shop.597992118

LINKED DATA STANDARDS

ティム・バーナーズ=リーが示す次のウェブ (http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html) 中のプレゼン資料を見て筆者が作成

RDF

全てのデータを主語、述語、目的語の三つ組みで表現する

主語はURIか空白ノードで表現する

述語はURIで表現する

目的語はリテラルか空白ノードで表現する

http://ja.dbpedia.org/resource/東京都

%E6%9D%B1%E4%BA%AC%E9%83%BD

http://ja.dbpedia.org/ontology/country

http://ja.dbpedia.org/resource/日本

%E6%97%A5%E6%9C%AC

主語

述語

目的語

http://ja.dbpedia.org/property/name

東京都 目的語

述語

LODの基本的な仕組み

分野を跨いだオープンデータのリンクが容易にできる

dbpedia:Japan* dbpedia:Tokyo*

dbpedia/owl:capital*

dbpedia/owl:leaderName*

dbpedia:Shintarō_Ishihara*owl:sameAs*

h>p://data.nyAmes.com/59436095099277148161*

DBpedia�

NYTimes�

dbpedia:Naoki_Inose

語彙 (≒URIセット) の選択も自由

LODクラウド

分野を跨いでオープンデータをリンクすることで、多元的なデータセットから成るLODクラウドが形成されている

RDF����

RDF����

RDF����

����

��������

DBpedia�NYTimes�

BBC�

LODの特徴

だれでもWeb上でデータを公開できる

語彙を自由に選んでデータを表現できる

だれでもデータに情報を付加できる

データの選択や加工の自由度が高い

お互いにデータを公開し、共有することで、これらの利便性が高まる

LOD構築にまつわる課題

URIの設計

既存語彙の検索と選択

既存語彙のライセンス

適切なデータモデルの選択

http://patterns.dataincubator.org/book/

RDFデータを構築し公開する際に参考となる資料

RDFデータを利用する際に参考となる資料

LOD構築周辺

作る良いエディタ

置く良いレポジトリ

探す良い検索サービス

使う良いライセンス

散在するデジタルデータを効率良く見つけ

効率良くデータ統合をしたい

コンピューターを用いて

RDFを検索するための標準化された問合せ言語

SPARQL (スパークル)

SPARQL Protocol and RDF Query Language

LODの利用と公開

LODクラウド(ウェブ空間)

LOD公開 LOD利用アプリケーション

検索エンジン

SPARQLエンドポイント RDFダンプ

LOD公開ツール

RDFストア 既存データ(RDB,CSV...)

RDFストアRDFファイル

ユーザインターフェースなどへ出力

C. Bizer, et. al(著), 萩野(訳), Linked Dataの仕組み, 情報処理,vol.52,no.3, 2011

参考文献

「Linked Open Dataとは」LODチャレンジ実行委員会http://www.slideshare.net/lodjapan/linked-open-data-10164445

Q?