subject-centric, linked and structured テヒチキボチフ...
TRANSCRIPT
Subject-centric, Linked and Structured
トピックマップ及びΨ(PSI)
2010年9月9日
株式会社ナレッジ・シナジー
内藤 求 ([email protected])
Ψ http://psi.ontopedia.net/Motomu_Naito
http://www.knowledge-synergy.com/
1
目 次
1.トピックマップとは
2.情報/知識の管理方法
3.トピックマップとその関連技術
4.適用分野、適用事例
5.トピックマップ利用のメリット
6.お知らせ、関連サイト
2
1.トピックマップとは
・ 情報/知識を利用者の概念体系に合わせて分類、整理、構造化、体系化するための情報技術
・ サイバースペースにおける高度に構造化された索引
・ 知的活動をこれまでよりも人に優しく支援することを目指す
・ ISOの標準
- 1990年代の初期に、XML の基となったSGMLの作成者を中心に構想された
- 以下の規格群からなる
データモデル、構文、問合せ言語、制約言語、
その他
3
トピックマップによる情報/知識の組織化
現在
膨大な情報が孤立して存在している
主題主題主題主題、、、、主題間主題間主題間主題間のののの関係関係関係関係にににに合合合合わせてわせてわせてわせて情報情報情報情報をををを体系化体系化体系化体系化、、、、組織化組織化組織化組織化
トピックマップトピックマップトピックマップトピックマップはははは、、、、情報実体情報実体情報実体情報実体からからからから独立独立独立独立それそれそれそれ自体自体自体自体がががが共有共有共有共有、、、、交換交換交換交換、、、、流通可能流通可能流通可能流通可能
トピックマップトピックマップトピックマップトピックマップ
4
2.情報/知識の管理方法
(1) メタデータ (文書中心)
情報オブジェクトについてのデータ
(2) 主題に基づく分類方法 (主題中心)
他の主題との関係で主題を位置づけ
・ Taxonomies (タクソノミ)
・ Thesauri (シソーラス)
・ Faceted classification (ファセット分類法)
・ Topic Maps (トピックマップ)
・ cf: Ontology (オントロジ)
(出展: 以下2章は、Metadata? Thesauri? Taxonomies? Topic Maps! : Making sense of it all,
http://www.ontopia.net/topicmaps/materials/tm-vs-thesauri.html, Lars Marius Garshol より)
5
2.1 メタデータ
・ データについてのデータ
・ 文書やWebページなどの情報リソース(オブジェクト)についてのデータ
・ 情報リソースの管理に有効、
・ “ほぼこんな主題” のものを見つけたい場合の効果は限定的
・ 例:Dublin Core
Title Creator Subject Description Publisher
Contributor Date Type Format Identifier
Source Language Relation Coverage Rights
(出展: 以下2章は、Metadata? Thesauri? Taxonomies? Topic Maps! : Making sense of it all,
http://www.ontopia.net/topicmaps/materials/tm-vs-thesauri.html, Lars Marius Garshol より)
6
2.2 主題に基づく分類法(1) Taxonomies (タクソノミ)
・ 主題(概念)間の関係は、広義-狭義関係のみ
・ 主題(概念)の階層的な分類
例:動物界
脊椎動物門
ホ乳網
サル目(霊長目)
ウサギ目
ネズミ目
クジラ目
ヒト科
ホモ属
サピエンス種
7
主題に基づく分類法(2) Thesauri (シソーラス)
・ 定義された複数の主題(概念)間の関係
- 主題(概念)の階層的な分類
広義語(BT: Broader Term)-狭義語(NT: Narrower Term)- 関連語(RT: Related Term)- 反義語(AT: Antonym)- 同義語(SY: Synonym)- “を見よ”参照、優先語(USE)- “を見よ”参照、非優先語(UF: Use For)- 最上位語(TT: Top Term)
・ 語の意味の説明
- スコープノート(SN: Scope Note)・ 標準の例: ISO 2788, ISO 5964
8
主題に基づく分類法(3) Faceted classification (ファセット分類法)
・ 複数の軸によって分類
(Ranganathan は、personality, matter, energy, space, time の5つのファセットを提案)
例:本のタイトル “昭和中期の日本の田舎の家”
- personality(最重要ファセット、事物): 建築
- matter(物質、部分や性質): 木材
- energy(動作): 設計
- space(空間): 日本の田舎
- time(時代): 昭和中期
9
主題に基づく分類法(4) Topic Maps (トピックマップ) No.1
・主題(トピック:Topics) と関連(Associations) の集合
・主題に関係する情報リソースへのリンク (出現: Occurrence) を持つ
・規格で定義された2種類の主題間の関係
- supertype-subtype (上位-下位)
- type-instance
に加えて、新しい関係 (関連) を自由に定義可能
・主題を一意に識別する機構を持つ
(名前で識別するのでなく、IRI: Internationalized Resource Identifier or URI: Uniform Resource Identifier で識別)
・有効範囲 (スコープ:Scope) の指定機能を持つ
・マージ機能を持つ
・具体化 (Reification) も容易
10
主題に基づく分類法(4) Topic Maps (トピックマップ) No.2
動物界
脊椎動物門
ホ乳網
サル目(霊長目)
イルカ
フリッパー
サンディ
人
酸素
大気
陸上
水中
クジラ目
地球系
supertype-subtype
supertype-subtype
supertype-subtype
supertype-subtype
supertype-subtype
supertype-subtype
type-instance
type-instance
仲良し
棲む
構成する
住む
包む
含む
取り込む
構成する
構成する
含む
取り込む
11
主題に基づく分類法(cf.) Ontology (オントロジ)
・ いろいろな定義が存在
・ コンピュータ科学で用いられるOntology「人間が対象世界をどのように見ているかという根源的な問題意識をもって物事をその成り立ちから解きあかし、それをコンピュータと人間が理解を共有できるように書き記したもの」
・ Ontology の構成物
- Ontology の本質である、対象世界から基本概念を切り出した結果としての「概念」の集合
- 概念の is-a 関係 (上位・下位関係) による階層化
- is-a 関係以外で必要となる概念間の関係
- 抽出した概念と関係の定義、あるいは意味制約の公理化
(出展: オントロジー工学、溝口理一郎著、ISBN4-274-20017-5 より)
12
3.トピックマップとその関連技術
・ 利用可能なトピックマップ関連技術
(1) Topic Maps・ 意味的に構造化されたデータ
(2) Published Subjects・ 任意の主題をグローバルに同定
(3) 分類、体系化された知識 (主題)(4) Remote Access Protocol
・ ネットワーク上でのfragmentの交換、統合、フィルタリング(5) Query Language
・ Topic Mapsの問合せ、更新
13
(1) 本の索引(インデックス)・ 目次以外に “情報” へのアクセス手段を提供
(2) 多くの本に対して
・ 共通の索引があると便利
索引索引索引索引
ISO ・・・ 本1 70-71, 234-236
本2 45, 120-131
OASIS ・・・ 本1 41-45, 211-228, 308
本2 16-33, 88-90, 267
本3 52-65, 155-158
W3C ・・・ 本1 26, 69, 274-275
:
:
3.1 トピックマップ
14
(3) サイバースペースにも適用可能
・ デジタル情報の索引があったら!! → Topic Maps
デジタルデジタルデジタルデジタル情報情報情報情報のののの索引索引索引索引
ISO ・・・ IRI1, IRI2,
OASIS ・・・ IRI3, IRI4,
:
:
PSI ・・・ IRIa, IRIb,
Topic Maps ・・・ IRIc, IRId,
XML ・・・ IRIe, IRIf
:
情報空間情報空間情報空間情報空間
15
Let’s look at some TAOsin the Omnigator…
Topic Mapsの基本モデル
• 出現出現出現出現 (Occurrences)– 主題に関連する情報リソースへのリンク
• 情報情報情報情報プールプールプールプール
– 任意の型、フォーマット、ロケーション
information
• Knowledge layer をををを構成構成構成構成するするするする:
knowledge
• トピックトピックトピックトピック (Topics)– 問題領域でのキーとなる主題群を表現
プッチーニ
トスカ
Lucca
蝶々夫人
• 関連関連関連関連 (Associations)– 主題間の関係を表現
作曲作曲作曲作曲したしたしたした
生生生生まれたまれたまれたまれた
作曲作曲作曲作曲したしたしたした
= The TAO of Topic Maps (トピックマップトピックマップトピックマップトピックマップ道道道道)– トピック、関連、出現は型を持ち、その型自身ト
ピック
(出展:Towards Seamless Knowledge, Steve Pepper より)
16
トピックマップアプリケーションの例
17
3.2 Published Subjects (公開された主題)Published Subjects は、トピック (主題) を識別、同定可能にする仕組みで、
ネットワーク上で永続的に公開し、トピックの共有/交換を容易にすることを目的にしている。
・ トピックマップ標準に含まれているメカニズム
・ 主題にIRI (URI) を割り当てて、主題識別 (2つの主題を同一とする、
又は、1つの主題をもう一方の主題と区別する) を可能にする
・ コンピュータ、人間の両方に主題識別のメカニズムを提供
- Published Subject Identifier (PSI): コンピュータが利用可能な主題識別子
- Published Subject Descriptor (PSD) or Published Subject Indicator :
人が主題の識別に利用可能な主題についての記述
・ コンピュータ内の情報リソース、実世界の対象物の両方に適用可能
・ 誰でも公開可、いいものが生き残る
18
主題主題主題主題::::Motomu Naito のののの PSI とととと PSD のののの例例例例http://psi.ontopedia.net/Motomu_Naito (所在は、ONTOPEDIA社の PSI Server 上)
PSD
PSI
19
3.3 分類、体系化された知識 (主題)・ 既に多くのものが存在している 例:
- NDLSH (National Diet Library Subject Headings)国立国会図書館件名標目表
- NDLC (National Diet Library Classification)国立国会図書館分類表
- LCSH (Library of Congress Subject Headings)データ形式: RDF
- UNSPSC (Universal Standard Products and Services Classification)製品およびサービスの分類体系データ形式:Topic Map (http://www.techquila.com/tm-samples.html)
- SWEET (Semantic Web for Earth and Environmental Terminology )地球環境に関するターミノロジデータ形式:OWL (http://sweet.jpl.nasa.gov/index.html)
- ISO 19115 Geographic information -- Metadata地理情報、データ形式:PDF・・・・
・ Published Subjects としてとしてとしてとして公開公開公開公開されることがされることがされることがされることが望望望望まれるまれるまれるまれる
20
3333....4444 Remote Access Protocol・ ネットワーク上の他マシンに存在するトピックマップへの
アクセス、フラグメントの交換を可能にするプロトコル・ 今は、まだ標準がない・ 標準が必要・ いくつかの提案、実装がなされている
- TMRAP (Ontopia社)- TopicMapster (techquila社)
21
TMRAP・ TMRAP (Topic Maps Remote Access Protocol) は、
Web サービスインターフェース・ リモートにあるTopic Maps フラグメントの検索が可能・ HTTP, SOAP の2種類のプロトコルを利用可能・ メソッド
- get-topic- get-topic-page- get-tolog- add-fragment- delete-topic
22
3.5 Query Language (問合せ言語)
• Topic Maps の問合せ、更新
• ISO 18048: TMQL
– ISO SC34にてCD (Committee Draft)
• 現在 draft の状態
– tolog をベース
– 推論付きのグラフ-マッチング
– path 表現能力
– select 文風の検索式
– Xquery風の出力構築能力(FLWR式)
23
tolog• Ontopia社社社社ののののトピックマップトピックマップトピックマップトピックマップ問合問合問合問合せせせせ言語言語言語言語
– 基本的には、トピックマップに適合させた Datalog– 6 年以上利用され続けている
– いくつかの商用アプリケーションで利用
– オープンソースである TM4J engine の中でも実装
• 基本的基本的基本的基本的なななな特性特性特性特性
– グラフマッチング (Datalog 節)– AND/OR/NOT のサポート
– 推論ルールのサポート
– 集計機能 (SQL 風)– ソート機能 (SQL 風)
• 拡張予定拡張予定拡張予定拡張予定
– 文字列述語と比較述語
24
Seamless Knowledge トピックマップ及び関連技術の組合せにより実現可能
T
T
T
T
T 同同同同じ じ じ じ PSI PSI PSI PSI をををを参照参照参照参照しているしているしているしているトピックトピックトピックトピックはははは、、、、同同同同じじじじ主題主題主題主題をををを表表表表しているしているしているしている
Topic Maps orOntology
参照
Published Subject Indicator
Published Subject Indicator
Topic Maps orOntology
Topic Maps orOntology
参照
参照
参照
T
TT
T
T TT
TT
T
T
T
T
T
TTT
T T T T T T T T
T
T
T
T
TT
T
T
TT
イルカイルカイルカイルカ
サンディサンディサンディサンディ
同同同同じ じ じ じ PSI PSI PSI PSI をををを参照参照参照参照しているしているしているしているトピックトピックトピックトピックはははは、、、、同同同同じじじじ主題主題主題主題をををを表表表表しているしているしているしている
同同同同じじじじ主題主題主題主題をををを持持持持つつつつトピックトピックトピックトピックはははは、、、、マージマージマージマージされるされるされるされる。。。。それによりそれによりそれによりそれにより、、、、複数複数複数複数トピックマップトピックマップトピックマップトピックマップをををを連結連結連結連結するするするすることができることができることができることができる。。。。
トピックマップトピックマップトピックマップトピックマップ
トピックマップトピックマップトピックマップトピックマップ
PSI Server
トピックマップトピックマップトピックマップトピックマップ
フラグメントフラグメントフラグメントフラグメント交換交換交換交換
フラグメントフラグメントフラグメントフラグメント交換交換交換交換
識別識別識別識別されたされたされたされた主題主題主題主題ののののネットワーキングネットワーキングネットワーキングネットワーキング( Identified Subjects Networking ) のののの提案提案提案提案
PSI Server
25
特化、専門化された半クローズドな Web アプリケーションが
識別された主題に基づいて緩やかに連携
26
4444....適用分野適用分野適用分野適用分野、、、、適用事例適用事例適用事例適用事例
適用分野の例・ 共通語彙の提供・ 意味検索・ 情報/知識の構造化、体系化、組織化・ 情報/知識管理・ コンテンツ管理・ 情報抽出・ Webポータル・ 製造管理・ 情報公開・ 学習支援・ その他
27
適用事例適用事例適用事例適用事例
以下以下以下以下ののののサイトサイトサイトサイトでででで多多多多くのくのくのくの適用事例適用事例適用事例適用事例をみることができるをみることができるをみることができるをみることができる・ fuzzzy.com
http://www.fuzzzy.com/tag/?id=2238・ Ontopia’s success stories
http://www.ontopia.net/success.jsp・ トピックマップ適用事例トピックマップ
http://www.garshol.priv.no/tmcase1/・ AToMS – Asian Topic Maps Summit 2007
http://www.knowledge-synergy.com/news/atoms2007-program.html・ TMJP – Topic Maps Japan 2010
http://www.knowledge-synergy.com/events/tmjp2010-program.html・ TOPICMAPS.COMMUNITY
http://www.topicmaps.com/tmc/・ TMRA (Topic Maps Research and Applicaitons)
http://tmra.de/2010/
28
学習支援学習支援学習支援学習支援のののの例例例例
・ Everyday Physics on Web (EPW), 松浦先生, 東京学芸大学http://tm.u-gakugei.ac.jp:8080/epw/
・ 人文知を再配置する, 東京大学http://www.knowledge-synergy.com/events/documents/TMJP2010u-tokyo100201.pdf
・ BrainBank Learning, Cerpus社, ノルウェーhttp://cmc.ihmc.us/papers/cmc2004-013.pdf
・ Common portal for the University of Bergen, University of Bergen, ノルウェーhttp://www.uib.no/en
・ Bridging the Gap between Educational Psychology and Information Sciences -Topic Maps in Elearning, Concordia University, カナダ
http://www.topicmaps.com/tm2007/venkatesh.pdf・ Open Educational Topic Maps: A Text-oriented Perspective, University of Southern Denmark, デンマーク
http://www.informatik.uni-leipzig.de/~tmra/2007/slides/johnsen_TMRA2007.pdf・ Polyscopic Topic Maps in Flexible E-learning and Collaborative Knowledge Creation, University of Oslo, ノルウェー
http://www.topicmaps.com/tm2007/karabeg.ppt
29
トピックマップアプリケーショントピックマップアプリケーショントピックマップアプリケーショントピックマップアプリケーションののののデモデモデモデモ
・ トピックマップ適用事例トピックマップ・ NDLSH トピックマップ・ LCSHトピックマップ・ Lars Marius’s photos トピックマップ・ その他
30
5555....トピックマップ利用のメリット
・ 概念、意味レベルでの情報操作・ 情報実体とメタデータの分離
- 情報実体の変更なしに情報の組織化、体系化が可能- 概念体系のメタレイアでのモデル化が容易- ディジタルコンテンツの整理、分類、管理に有効
・ 主題を文脈 (Context) とともに管理可能・ 主題の厳密な識別が可能 → 多義性問題を解決・ 直観的な馴染みやすさ・ 標準に準拠
- 情報資源の永続性の確保- 多様なツール選択、利用が可能- プラットフォーム、ベンダー等に非依存
・ 情報資源に対する多様な視点の設定および視点間のナビゲートが可能
・ 利用者視点での情報の組織化が可能 (personalization)
31
(1) イベント・ TMRA 2010 (2010.9.29 - 10.1ドイツ、ライプチヒ)
http://tmra.de/2010/
(2)トピックマップ関連サイト・ ナレッジ・シナジー (www.knowledge-synergy.com)・ Ontopia Project (http://code.google.com/p/ontopia/)・ Ontopia’s Blog (http://ontopia.wordpress.com/)・ Ontopia社 (http://www.ontopia.net/)・ ONTOPEDIA’s PSI Server (http://psi.ontopedia.net/)・ Subj3ct (https://subj3ct.com/)・ Topic Map Lab (http://www.topicmapslab.de/)・ Topic Maps case examples (http://www.garshol.priv.no/tmcase1/)・ Fuzzzy.com (http://www.fuzzzy.com/tag/?id=2238)・ TOPICMAPS.COMMUNITY (http://www.topicmaps.com/tmc/)・ Larsblog (www.garshol.priv.no/blog)・ Lars Marius’s photos (http://www.garshol.priv.no/tmphoto/)・ SC34 WG3 (www.isotopicmaps.org)・ TMAPI (www.tmapi.org)
6666....お知らせ、関連サイト No.1
32
(3) Book
・ 本「トピックマップ入門」、東京電機大学出版局、ISBN4-501-54210-1
・ Scaling Topic Maps, Lutz Maicher, Lars Marius Garshol (Eds.), Springer, ISSN 0302-9743, ISBN 978-3-540-70873-5
・ Leveraging the Semantics of Topic Maps, Lutz Maicher, Alexander Sigel, Lars Marius Garshol (Eds.), Springer, ISSN 0302-9743, ISBN 978-3-540-71944-1
・ Charting the Topic Maps Research and Applications Landscape, Lutz Maicher, Jack Park (Eds.), Springer, ISSN 0302-9743, ISBN 3-540-32527-1
(4) ツール・ Ontopia (2010.9.5日 に現在、version5.1.0)
http://code.google.com/p/ontopia/よりダウンロード可能トピックマップ作成、トピックマップWebアプリケーション開発、運用ツール
・ tmphoto (2009.8.13日 現在、version 0.1 a3 ) 写真のタグ付け、トピックマップ生成、トピックマップWebアプリケーション生成
お知らせ、関連サイト No.2
33
(5) トピックマップ講習
・ コース
- トピックマップ入門
- トピックマップ作成手順
- トピックマップ作成演習
- トピックマップ生成 DB2TM
- トピックマップ問合せ言語 tolog
- トピックマップWebアプリケーション開発 Navigator Framework
- トピックマップモデリング
お知らせ、関連サイト No.3