linked data in japan/semantic conference in japan 2010
TRANSCRIPT
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data の現状と日本の課題
武田 英明
国立情報学研究所東京大学 人工物工学研究センター
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data
Linked Data とは何か Linked Data の現状
Linking Open Data (LOD) Linked Data の使い方
検索エンジン ブラウザ アプリ
日本における Linked Data の課題
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data
Linked Data とは何か Linked Data の現状
Linking Open Data (LOD) Linked Data の使い方
検索エンジン ブラウザ アプリ
日本における Linked Data の課題
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data
Linked Data とは “ Web of Data” RDF で公開されるデータ 外部から参照可能 (dereferenceable)
Linked Data, TBL, http://www.w3.org/DesignIssues/LinkedData.html
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Semantic Web の階梯 RDF (Resource Description Framework)
最も原始的な意味記述の枠組みを提供ー> SVO モデル Entity-Relation Model( 実体関連モデル) セマンティックネット
RDF Schema RDF に最も原始的な概念記述の仕組みを追加
class-subclass 関係,制約 OWL (Web Ontology Language)
記述論理 (description logics) に基づいた概念とその関係を記述する言語
Rule-ML …
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
もっと上へ、もっと上へ
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Semantic Web の階梯 抽象問題から具体問題への回帰
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
クラスに関する記述
インスタンスに関する記述
オントロジー
Linked Data
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Semantic Web の階梯 オントロジー
クラスに関する記述 RDFS 、 OWL オントロジー構築の課題
オントロジー構築はそもそも大変 一貫性、網羅性、論理性
複数オントロジーの統合・関連付けはもっと大変
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
クラスに関する記述
インスタンスに関する記述
オントロジー
Linked Data
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Semantic Web の階梯 Linked Data
インスタンスに関する記述=個々の事物に関する記述 RDF + (RDFS, OWL) Linked Data の記述における利点
書きやすい(事実に関する記述が主) リンクしやすい(同)
Linked Data の記述における問題点 複雑な記述は難しい それでもクラス定義は必要(→オントロジー)
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
クラスに関する記述
インスタンスに関する記述
オントロジー
Linked Data
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data
Linked Data のための 4 条件 事柄の名前に URI を使うこと Use URIs as names for things
すべてのモノ,コトに URI を! 名前の参照が HTTP URI でできること
Use HTTP URIs so that people can look up those names. DOI とかいった URN は使わないでね
URI を参照したときに関連情報が手に入るようにWhen someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)
理解可能なデータを提供してね. 外部へのリンクも含めよう
Include links to other URIs. so that they can discover more things.
Web のようにリンクでつながるデータを作ろうLinked Data, TBL, http://www.w3.org/DesignIssues/LinkedData.html
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data
Linked Data とは何か Linked Data の現状
Linking Open Data (LOD) Linked Data の使い方
検索エンジン ブラウザ アプリ
日本における Linked Data の課題
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linking Open Data (LOD)
公開された Linked Data を集めるプロジェクト 主要な Linked Data (データ変換)
Dbpedia (Wikipedia) : 百科事典 , 2.7 億文 Geonames :地名と緯度経度 , 9300 万文 MusicBrainz :音楽 WordNet :辞書 DBLP bibliography :論文の書誌, 2800 万文 US Census Data: 米国国勢調査 (2000 年 ), 10 億文
(クロール) FOAF (Friend Of A Friend) :個人と個人関係のプロファイ
ル (ラッパー)
Flickr Wrapper
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Dbpedia の例
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
131 億文1.41 万個のリンク
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
131 億文1.41 万個のリンク
Life Science and Health Care
Geographic informationPapers
Web-based Information
Music
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
LOD の発展 (1)
As of March 2008
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
LOD の発展 (2)
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
LOD の発展 (3)
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
131 億文1.41 万個のリンク
LOD の発展 (4)
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data
Linked Data とは何か Linked Data の現状
Linking Open Data (LOD) Linked Data の使い方
検索エンジン ブラウザ アプリ
日本における Linked Data の課題
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data Search Engine
Link Data 汎用サーチエンジン Swoogle Watson SWME
http://swse.deri.org/ Sindice
http://sindice.com/ 特殊サーチ
Sameashttp://sameas.org/
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
http://sameas.org/
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data Browser
データを Web ページのようにみていくツール システム
Mablesリンクを順に表示
Tabulator Firefox plugin 版/ online 版1 ページの中にどんどん情報を追加
Sig.maRDF のソースを同時提示して、操作可能
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Tabulator
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data Mashup
Things Things Things Things Things
Linked Data Browser
Linked Data Mashup
Linked Data Search Engine
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
How to use Linked Data
Semantic Data Mash-up Applications
SemaPlorerhttp://btc.isweb.uni-koblenz.de/
Dbpedia Mobilehttp://wiki.dbpedia.org/DBpediaMobile
Bio2RDFhttp://bio2rdf.org/
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
DBpedia Mobile
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Bio2RDF
Bio 系のリソース検索 RDF でないものは勝手に
RDF 化
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Bio2RDF
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Web API と Linked Data の比較 Linked Data のメリット
統一されたインタフェースRDF / SPARQL endpoint
意味の明示 サイトを越えた連携
sameAs Linked Data のデメリット
速度 意味解釈の曖昧さ データの信頼性
由来新鮮さ
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Linked Data
Linked Data とは何か Linked Data の現状
Linking Open Data (LOD) Linked Data の使い方
検索エンジン ブラウザ アプリ
日本における Linked Data の課題
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
日本における Linked Data
課題 日本語の壁
URI ハブの欠如
Dbpedia RDF の普及の遅さ
RDFa
我々の取り組み WordNet 日本語版 RDF
ことはぶ
CiNii RDF
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
日本語 WordNet RDF
日本語 WordNet (verson 0.9) NICT による WordNet の日本語化 Word の翻訳のみ( synset はそのまま)
49,655 概念 (synset 数 ) 87,133 words 語 146,811 語義 (synset と単語のペア )
日本語 WordNet RDF 日本語 WordNet の RDF 化 RDF/OWL Representation of WordNet, W3C Working Draft 19
June 2006 を WordNet 3.0 用に変更 HTML および RDF で表示 SUMO との統合
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
“ ことはぶ /KotoHub” のコンセプト すべての言葉に URI を! 言葉から定義へのハブ
ネット上に散在している日本語辞書・百科事典・用語集のリポジトリ
Dictionary of Dictionary 分野を跨いだ横断検索 専門家によって編纂された知識体系と,ユーザ参加型コミュニティによって生成された知識体系の融合
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
辞書のソース Wikipedia 日本語版 : 549,521 語
http://download.wikimedia.org/jawiki/20090423/jawiki-20090423-pages-meta-history.xml.bz2 kotobank.jp : 333,780 語
http://kotobank.jp はてなキーワード : 247,690 語
http://d.hatena.ne.jp/images/keyword/keywordlist_furigana_with_kid.csv Yahoo! 百科事典 : 98,056 語
http://100.yahoo.co.jp/ ニコニコ大百科 (仮 ) : 48,911 語
http://dic.nicovideo.jp/m/a/a Weblio: 953,828 語
http://www.weblio.jp/ WordNet 日本語版 0.9: 227,753 語 ( うち日本語 85,966 語 ); 50,739 概念 ; 151,831 語義
http://nlpwww.nict.go.jp/wn-ja/ IPA 辞書 2.7: 231,900 語
http://sourceforge.jp/projects/ipadic/
のべ単語数 : 2,691,439 語 ; 正規化済み : 2,113,688 語 ; 読み : 546,364 語
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
RDF による Web サービス連携http://wordnet.jp/kotohub/term/愛 .rdf
<?xml version='1.0' encoding='UTF-8'?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:linked="http://wordnet.jp/kotohub/ns/linked/0.1/" xml:lang="ja"> <rdf:Description rdf:about="http://wordnet.jp/kotohub/term/愛 "> <foaf:isPrimaryTopicOf rdf:resource="http://wordnet.jp/kotohub/term/愛 " /> <rdfs:seeAlso rdf:resource="http://dic.nicovideo.jp/a/愛 " /> <rdfs:seeAlso rdf:resource="http://ja.wikipedia.org/wiki/愛 " /> <rdfs:seeAlso rdf:resource="http://ja.wikipedia.org/wiki/愛 _(TBSテレビドラマ ) " /> <rdfs:seeAlso rdf:resource="http://100.yahoo.co.jp/detail/愛 /" /> <rdfs:seeAlso rdf:resource="http://kotobank.jp/word/愛 " /> <rdfs:seeAlso rdf:resource="http://www.weblio.jp/content/愛 " /> <rdfs:seeAlso rdf:resource="http://wordnet.jp/jp09/instances/word-愛 " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/あい " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ちか " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/ めぐみ " /> <linked:yomi rdf:resource="http://wordnet.jp/kotohub/term/まな " /> </rdf:Description></rdf:RDF>
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
CiNii RDF
CiNii: NII が提供する論文目録データベースサービス 約 1300 万件
この各論文のメタデータを RDF で提供
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
Hideaki Takeda @ {National Institute of Informatics, The University of Tokyo}
まとめ Linked Data は Web of Data
機械のため Web つながることで広がる新しい世界
cf. Web, SNS 敷居の低い Semantic Web
今すぐに参加できる Semantic Web 今すぐにつかえる Semantic Web
様々な問題点はあるが、それは普及してから考えましょう