linked data in japan/semantic conference in japan 2010

48
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo} Linked Data ののののののののの のの のの 国国国国国国国国 国国国国 国国国国国国国国国国国 [email protected]

Upload: hideaki-takeda

Post on 24-May-2015

2.554 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data の現状と日本の課題

武田 英明

国立情報学研究所東京大学 人工物工学研究センター

[email protected]

Page 2: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data

Linked Data とは何か Linked Data の現状

Linking Open Data (LOD) Linked Data の使い方

検索エンジン ブラウザ アプリ

日本における Linked Data の課題

Page 3: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data

Linked Data とは何か Linked Data の現状

Linking Open Data (LOD) Linked Data の使い方

検索エンジン ブラウザ アプリ

日本における Linked Data の課題

Page 4: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data

Linked Data とは “ Web of Data” RDF で公開されるデータ 外部から参照可能 (dereferenceable)

Linked Data, TBL, http://www.w3.org/DesignIssues/LinkedData.html

Page 5: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Semantic Web の階梯 RDF (Resource Description Framework)

最も原始的な意味記述の枠組みを提供ー> SVO モデル Entity-Relation Model( 実体関連モデル) セマンティックネット

RDF Schema RDF に最も原始的な概念記述の仕組みを追加

class-subclass 関係,制約 OWL (Web Ontology Language)

記述論理 (description logics) に基づいた概念とその関係を記述する言語

Rule-ML …

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

もっと上へ、もっと上へ

Page 6: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Semantic Web の階梯 抽象問題から具体問題への回帰

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

クラスに関する記述

インスタンスに関する記述

オントロジー

Linked Data

Page 7: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Semantic Web の階梯 オントロジー

クラスに関する記述 RDFS 、 OWL オントロジー構築の課題

オントロジー構築はそもそも大変 一貫性、網羅性、論理性

複数オントロジーの統合・関連付けはもっと大変

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

クラスに関する記述

インスタンスに関する記述

オントロジー

Linked Data

Page 8: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Semantic Web の階梯 Linked Data

インスタンスに関する記述=個々の事物に関する記述 RDF + (RDFS, OWL) Linked Data の記述における利点

書きやすい(事実に関する記述が主) リンクしやすい(同)

Linked Data の記述における問題点 複雑な記述は難しい それでもクラス定義は必要(→オントロジー)

Tim Berners-Lee   http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

クラスに関する記述

インスタンスに関する記述

オントロジー

Linked Data

Page 9: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data

Linked Data のための 4 条件 事柄の名前に URI を使うこと Use URIs as names for things

すべてのモノ,コトに URI を! 名前の参照が HTTP URI でできること

Use HTTP URIs so that people can look up those names. DOI とかいった URN は使わないでね

URI を参照したときに関連情報が手に入るようにWhen someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)

理解可能なデータを提供してね. 外部へのリンクも含めよう

Include links to other URIs. so that they can discover more things.

Web のようにリンクでつながるデータを作ろうLinked Data, TBL, http://www.w3.org/DesignIssues/LinkedData.html

Page 10: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data

Linked Data とは何か Linked Data の現状

Linking Open Data (LOD) Linked Data の使い方

検索エンジン ブラウザ アプリ

日本における Linked Data の課題

Page 11: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linking Open Data (LOD)

公開された Linked Data を集めるプロジェクト 主要な Linked Data (データ変換)

Dbpedia (Wikipedia) : 百科事典 , 2.7 億文 Geonames :地名と緯度経度 , 9300 万文 MusicBrainz :音楽 WordNet :辞書 DBLP bibliography :論文の書誌, 2800 万文 US Census Data: 米国国勢調査 (2000 年 ), 10 億文

(クロール) FOAF (Friend Of A Friend) :個人と個人関係のプロファイ

ル (ラッパー)

Flickr Wrapper

Page 12: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Dbpedia の例

Page 13: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

131 億文1.41 万個のリンク

Page 14: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

131 億文1.41 万個のリンク

Life Science and Health Care

Geographic informationPapers

Web-based Information

Music

Page 15: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

LOD の発展 (1)

As of March 2008

Page 16: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

LOD の発展 (2)

Page 17: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

LOD の発展 (3)

Page 18: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

131 億文1.41 万個のリンク

LOD の発展 (4)

Page 19: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data

Linked Data とは何か Linked Data の現状

Linking Open Data (LOD) Linked Data の使い方

検索エンジン ブラウザ アプリ

日本における Linked Data の課題

Page 20: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data Search Engine

Link Data 汎用サーチエンジン Swoogle Watson SWME

http://swse.deri.org/ Sindice

http://sindice.com/ 特殊サーチ

Sameashttp://sameas.org/

Page 21: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

http://sameas.org/

Page 22: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 23: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data Browser

データを Web ページのようにみていくツール システム

Mablesリンクを順に表示

Tabulator Firefox plugin 版/ online 版1 ページの中にどんどん情報を追加

Sig.maRDF のソースを同時提示して、操作可能

Page 24: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 25: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Tabulator

Page 26: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 27: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data Mashup

Things Things Things Things Things

Linked Data Browser

Linked Data Mashup

Linked Data Search Engine

Page 28: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

How to use Linked Data

Semantic Data Mash-up Applications

SemaPlorerhttp://btc.isweb.uni-koblenz.de/

Dbpedia Mobilehttp://wiki.dbpedia.org/DBpediaMobile

Bio2RDFhttp://bio2rdf.org/

Page 29: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

DBpedia Mobile

Page 30: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Bio2RDF

Bio 系のリソース検索 RDF でないものは勝手に

RDF 化

Page 31: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Bio2RDF

Page 32: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Web API と Linked Data の比較 Linked Data のメリット

統一されたインタフェースRDF / SPARQL endpoint

意味の明示 サイトを越えた連携

sameAs Linked Data のデメリット

速度 意味解釈の曖昧さ データの信頼性

由来新鮮さ

Page 33: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Linked Data

Linked Data とは何か Linked Data の現状

Linking Open Data (LOD) Linked Data の使い方

検索エンジン ブラウザ アプリ

日本における Linked Data の課題

Page 34: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

日本における Linked Data

課題 日本語の壁

URI ハブの欠如

Dbpedia RDF の普及の遅さ

RDFa

我々の取り組み WordNet 日本語版 RDF

ことはぶ

CiNii RDF

Page 35: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

日本語 WordNet RDF

日本語 WordNet (verson 0.9) NICT による WordNet の日本語化 Word の翻訳のみ( synset はそのまま)

49,655 概念 (synset 数 ) 87,133 words 語 146,811 語義 (synset と単語のペア )

日本語 WordNet RDF 日本語 WordNet の RDF 化 RDF/OWL Representation of WordNet, W3C Working Draft 19

June 2006 を WordNet 3.0 用に変更 HTML および RDF で表示 SUMO との統合

Page 36: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 37: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 38: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

“ ことはぶ /KotoHub” のコンセプト すべての言葉に URI を! 言葉から定義へのハブ

ネット上に散在している日本語辞書・百科事典・用語集のリポジトリ

Dictionary of Dictionary 分野を跨いだ横断検索 専門家によって編纂された知識体系と,ユーザ参加型コミュニティによって生成された知識体系の融合

Page 39: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 40: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

辞書のソース Wikipedia 日本語版 : 549,521 語

http://download.wikimedia.org/jawiki/20090423/jawiki-20090423-pages-meta-history.xml.bz2 kotobank.jp : 333,780 語

http://kotobank.jp はてなキーワード : 247,690 語

http://d.hatena.ne.jp/images/keyword/keywordlist_furigana_with_kid.csv Yahoo! 百科事典 : 98,056 語

http://100.yahoo.co.jp/ ニコニコ大百科 (仮 ) : 48,911 語

http://dic.nicovideo.jp/m/a/a Weblio: 953,828 語

http://www.weblio.jp/ WordNet 日本語版 0.9: 227,753 語 ( うち日本語 85,966 語 ); 50,739 概念 ; 151,831 語義

http://nlpwww.nict.go.jp/wn-ja/ IPA 辞書 2.7: 231,900 語

http://sourceforge.jp/projects/ipadic/

のべ単語数 : 2,691,439 語 ; 正規化済み : 2,113,688 語 ; 読み : 546,364 語

Page 41: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 42: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

RDF による Web サービス連携http://wordnet.jp/kotohub/term/愛 .rdf

<?xml version='1.0' encoding='UTF-8'?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"   xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"    xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:linked="http://wordnet.jp/kotohub/ns/linked/0.1/" xml:lang="ja"> <rdf:Description rdf:about="http://wordnet.jp/kotohub/term/愛 "> <foaf:isPrimaryTopicOf rdf:resource="http://wordnet.jp/kotohub/term/愛 " /> <rdfs:seeAlso rdf:resource="http://dic.nicovideo.jp/a/愛 " /> <rdfs:seeAlso rdf:resource="http://ja.wikipedia.org/wiki/愛 " /> <rdfs:seeAlso rdf:resource="http://ja.wikipedia.org/wiki/愛 _(TBSテレビドラマ ) " /> <rdfs:seeAlso rdf:resource="http://100.yahoo.co.jp/detail/愛 /" /> <rdfs:seeAlso rdf:resource="http://kotobank.jp/word/愛 " /> <rdfs:seeAlso rdf:resource="http://www.weblio.jp/content/愛 " /> <rdfs:seeAlso rdf:resource="http://wordnet.jp/jp09/instances/word-愛 " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/あい " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ちか " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ めぐみ " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/まな " /> </rdf:Description></rdf:RDF>

Page 43: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

CiNii RDF

CiNii: NII が提供する論文目録データベースサービス 約 1300 万件

この各論文のメタデータを RDF で提供

Page 44: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 45: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 46: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 47: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

Page 48: Linked Data in Japan/Semantic Conference In Japan 2010

Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}

まとめ Linked Data は Web of Data

機械のため Web つながることで広がる新しい世界

cf. Web, SNS 敷居の低い Semantic Web

今すぐに参加できる Semantic Web 今すぐにつかえる Semantic Web

様々な問題点はあるが、それは普及してから考えましょう