図書館データとlinked open...
DESCRIPTION
TRANSCRIPT
図書館データとLinked Open Data
国立情報学研究所大向 一輝
自己紹介
•情報学の研究機関 + 大学への情報インフラ提供
• インターネット回線 + 学術情報サービス
• 図書・雑誌 + 論文
•ウェブ研究者 + サービス提供者
国立国会図書館( 1 )
収集・保存
大学・研究図書館
( 1000 以上)
研究・教育
公共図書館( 3000 以上)
一般利用
国立情報学研究所
…
図書館の仕事
•外から見ると…
• 閲覧・貸出・レファレンスなど
•中から見ると…
• 収集・整理・保存・利用
•仕事を支える「図書館データ」
• 何があるのか?
• どの書架にあるのか?
• 目録の作成・維持管理
•電子化
• 目録カードから OPAC へ
出典:国立国会図書館ウェブサイト
撮影:大向一輝
つながる図書館
•近くの図書館にない資料は相互貸借で入手可能だが…
• 何が「ない」のか?
• どの図書館にあるのか?
• 図書館データの共有
•ネットワーク化
• 地域:自治体レベルの取り組み
• 国立国会図書館+都道府県(+ α ):ゆにかねっと
• 大学・研究図書館: NACSIS-CAT
• 世界: WorldCat
• カーリル
つながる図書館
ウェブと図書館
•ウェブ:インターネット=世界規模の通信用ネットワークにおける情報公開・共有インフラ
• コストの劇的な低下による一般ユーザの参加とビジネス化
• 検索エンジンの高度化とソーシャルメディアの登場
•あらゆる分野で行われるデータ共有
• 旅行・化粧品・レシピ・オークションなど
• 公式サイトから口コミまで
•図書館とウェブ
• Web OPAC の提供
• 黒船?ライバル?無視?
• ウェブとともに歩む道はないか?出典: web2logo.com
データ共有の技術
•現状のデータ共有は分野ごと
•本来情報は分野を超えてつながっている
• ただし頭の中でだけ
• 知っている人は知っている、知らない人は知らない
• コンピュータにはわからない
• 知識の差を埋めるには?
• 新たな使い方を発見するには?
•情報のつながりをウェブ上で表現するための技術
• Linked Open Data ( LOD )
作品
作品
図書
Linked Open Data
友人
在住
人物
作品
作品
Linked Open Data
舞台
観光地
観光地
観光
友人
在住作品
作品
Linked Open Data
現実のデータ
同じ?
関係ある?
同じ?
Linked Open Data の技術
•異なるデータベース上のデータ同士をつなぐ
• 識別する
• 同じものに同じアドレスをつける
• 関係づける
• リンクし、その意味(理由)を記述する
•ウェブの仕組みそのもの
• ウェブページとハイパーリンク
• 「文書のウェブ」から「データのウェブへ」
同じ!
Linked Open Data (詳細)
著者
春陽堂 1907
出版者 出版年
テーマ
作家 N 作品 B
地域 M
dc:creator
dc:publisher dc:date
foaf:topic
主語 述語 目的語http://library.jp/B dc:creator http://library.jp/Nhttp://library.jp/B dc:publisher 春陽堂http://library.jp/B foaf:topic http://visitor.jp/M
坊っちゃん
タイトルdc:title
夏目漱石名前
foaf:name
図書館サービスhttp://library.jp
観光サイトhttp://visitor.jp
Linked Open Data (さらに詳細)
<rdf:Description rdf:about="http://ci.nii.ac.jp/ncid/BB02488158#entity"> <foaf:isPrimaryTopicOf rdf:resource="http://ci.nii.ac.jp/ncid/ BB02488158.rdf"/>
<dc:title>セマンティック Webプログラミング</dc:title> <dc:title xml:lang="ja-hrkt">セマンティック Web プログラミング </dc:title> <dcterms:alternative>Programming the semantic web </dcterms:alternative> <dc:creator> トビー・セガラン著 ; 玉川竜司訳</dc:creator> <dc:publisher> オライリー・ジャパン </dc:publisher> <dc:language>jpn</dc:language> <dc:date>2010</dc:date> <foaf:topic rdf:resource="http://ci.nii.ac.jp/books/search?q= セマンティックウェブ " dc:title="セマンティックウェブ "/> <cinii:ncid>BB02488158</cinii:ncid> <dcterms:hasPart rdf:resource="urn:isbn:9784873114521"/></rdf:Description><rdf:Description rdf:about="http://ci.nii.ac.jp/ncid/BB02488158#entity"> <foaf:maker> <foaf:Person rdf:about="http://ci.nii.ac.jp/author/DA15839119"> <foaf:name> 大向 , 一輝 </foaf:name> <foaf:name xml:lang="ja-hrkt"> オオムカイ , イッキ </foaf:name> </foaf:Person> </foaf:maker></rdf:Description>
“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/”
つながるデータ
つながるデータ
国立国会図書館アメリカ議会図書館
Wikipedia日本語版 Wikipedia英語版
図書館データと LOD
•図書館データへの(再)注目
• 国立国会図書館の図書: 989万点
• 大学・研究図書館の図書: 1009万点(日本語は 1/3 )
• 古典籍・絶版・流通に乗らないもの…
• 国立国会図書館の個人名・団体名: 99万件
• 大学・研究図書館の著者名: 161万件
• 同姓同名を含まない
• 国立国会図書館の件名: 10万件
• シソーラス:上位・下位・関連語
•正確性・網羅性・メンテナンス体制
• 職能・コミュニティの存在
図書館データと LOD
•識別子の維持・管理
• VIAF (バーチャル国際典拠ファイル)
• 著者データの共有
• 世界中の図書館で同じ作者に同じ識別子を与える
• 各国語版のあらゆる著作を集められる可能性
• ISSNセンター
• 雑誌の識別子
• 紙の雑誌と電子の雑誌の関係
• 研究・教育には必須
• 名寄せの重要性
• 誌名の変更・合併・分離…
世界の動向
•Europeana
• ヨーロッパ 36 カ国の図書館・美術館・文書館・映像音声アーカイブを 2900万件を横断検索
• LOD でのデータ公開
• 「公共財」の開放
オープンデータの潮流
•オープンガバメント・ガバメント 2.0
• 政府・行政機関のデータ提供
• G8 オープンデータ憲章
• 電子行政オープンデータ戦略
• 内閣官房・総務省・経済産業省
• 鯖江市・横浜市・千葉市など
• 行政サービス向上・透明性・コミュニケーション
• イノベーション
オープン
再利用
非独占
識別子
LOD
オープンデータの事例
•データシティさばえ(福井県鯖江市)
• 日本のオープンデータのさきがけ
• http://www.city.sabae.fukui.jp/pageview.html?id=11552
•Open DATA METI (経済産業省)
• 白書・統計データのカタログサイト
• http://datameti.go.jp/
•世界のオープンデータ活用事例( OKFJ )
• 32 カ国・約 400 事例
• http://okfn.jp/2013/01/21/opendatacases/
LODチャレンジ
http://lod.sfc.keio.ac.jp/
受賞作品 – アプリケーション部門
•LinkData (http://linkdata.org/)
•テーブルデータを RDF形式に変換・公開
• LOD 公開のインフラ
• CityData ・ LinkData App などの派生プロジェクト
受賞作品 – データセット部門
•saveMLAK (http://savemlak.jp/)
•ボランティアによる社会教育施設(図書館・博物館・文書館・公民館)の被災情報共有
• 実質的に入手可能な唯一の施設リスト
受賞作品 – データセット関連
•データセット部門優秀賞
• Location Site of Japanimation ( cheese-factory.net )
• アニメの舞台となった地域・スポットの位置情報
•オープン・ガバメント賞
• ヨコハマ・アート LOD (横浜市芸術文化振興財団)
• アート関連イベント名称・開催地・時間情報
•公共 LOD賞
• 公園トイレ情報(鯖江市情報統計課)
•CiNii賞
• Biomasspedia (東京大学)
• 生物関連情報と論文情報の紐付け
作家の歩み
http://kyoto-city.net/ayumi/index.php
まとめ
•図書館を支えるデータからウェブを支えるデータへ
•他の情報源とつながることで
• 相手のデータを豊穣に
• 自分のデータを豊穣に
• 新たな価値を発見する
•“Information wants to be free, and linked.”
大向 一輝(国立情報学研究所)
http://researchmap.jp/i2k
[email protected] Twitter:@i2k