知識モデリング →psm(problem solving methods) の体系化...
TRANSCRIPT
中粒度メソッドリポジトリのイメージ
Select
Abstract Insatiate
Compare Specify Assign
Sort Classify
Match Specializes Compute
Merge
Generalize Assemble
Transform
Replace Propagate Predict
Obtain Receive Provide Present
3
task diagnosis
diagnosis
task method through
generate-and-test
decomposition
cover obtain
predict compare
inferences transfer function
9
complaint
causal actual
cover model obtain finding
expected
hypothesis predict finding compare
manifestation
model result
10
engine does
complaint not start
state dependency
rules gas dial = normal
causal actual
cover model obtain finding
expected
hypothesis predict finding compare
empty fuel tank gas dial = zero/low
manifestation manifestation
rules model not equal result
11
オントロジーとは?
• 情報系のオントロジーは,哲学のオントロジーとは異なる
• 概念(化)の明示的仕様
– concepts
– properties and attributes of concepts
– constraints on properties and attributes
– Individuals (often, but not always)
• カタログ – Amazon.com product catalog
• タキソノミィ(Taxonomies) – Yahoo! categories
• ターミノロジィ – Unified Medical Language System (UMLS)
– UNSPSC - terminology for products and services
16
オントロジーの形式度
• 非形式的
• 準非形式的
• 準形式的
• 形式的
:自然言語で自由に表現されるもの
:人工の形式言語で表現されるもの
:健全性や完全性を持つ形式的意味
論によって定義されたもの
:制限付き構造化された形式の
自然言語で表現されたもの
17
オントロジーの分類
• 3つの軸による分類
形式度 情報量
汎用性 固有性
General
Generic
Specific
1st Level 2nd
Level 3rd Level
Light Weight Middle
Weight Heavy Weight
• General 最も一般的なレベル • Generic 対象領域があるが やはりかなり一般的 • Specific 特定領域に固有
各レベルの 情報を利用して 切り分けを 明確にする
19
General Ontology
• WordNet(プリンストン大学で開発.名詞が
約10万語.IS-A,HAS-Aが定義.フリー)
http://www.cogsci.princeton.edu/cgi-
bin/webwn
• CYC(米国MCCで開発)
• EDR(日本電子化辞書)
20
WordNet
• http://wordnet.princeton.edu/
• 最新版:ver.3.0 for Unix-like system
– Windows版はver.2.1
• 約11万7千のsynset(同義語の集合)
• 約15万語(名詞,動詞,形容詞,副詞)
• synset間には,品詞ごとにいくつかの関係が定義されている
22
WordNet: synset(名詞)間の主な関係
• hypernym
– X hypernym Y → XはYの上位概念(synset)
• hyponym
– X hyponym Y → XはYの下位概念(synset)
• holonym
– X holonym Y → XはYを持つ(has-a)
• meronym
– X meronym Y → XはYの一部(part-of)
23
Cyc • 世界最大の知識ベース
– 2007年現在,約20万概念の定義,100万以上の主張を記述
• マイクロ理論 (microtheories)
– 部分世界の内部だけで整合性を保持
• OpenCyc
– Cycのオープンソース版
– http://opencyc.org/
– 試用版: • http://www.yamaguti.comp.ae.keio.ac.jp:3602/cgi-bin/cyccgi/cg?cb-
start
26
OpenCycの特徴 • 固有の用語は「#$」ではじまる
• 「#$is-a」関係はinstance-ofを意味する
• 「#$genls」関係はis-a関係を意味する
• 「Mt」はマイクロ理論( microtheories )の省略
• WordNetのsynsetとの対応関係を定義
– Mt : WordNetMappingMt のsynonymousExternalConcept
• OpenCyc KB Browser
– sourceforge.netからダウンロード可能
– Windows版とLinux版
27
EDR電子化辞書の概念
・識別子 ・日本語と英語の 見出しの集合 ・意味(説明) ・読み ・品詞
概念
電子計算機 コンピュータ コンピューター
電算機
computer brain box
computery electronic brain
電子回路を用いて計算,判断,記憶などを自動的に行う装置
an electronic device that speedily and automatically performs calculations, makes judgments and memorizes large amounts of information
コンピュータという概念
概念A
概念B
概念C
概念D
0ffcb7
30
EDR概念記述辞書:その他の関係
• object: 動作・変化の影響を受ける対象 – 食べる—object→りんご
• agent: 有意志動作を引き起こす主体 – 食べる—agent→父
• goal: 事象の主体または対象の最後の位置 – 行く—goal→東京
• implement: 有意志動作における道具・手段 – 切る—implement→ナイフ
• a-object: 属性をもつ対象 – 赤い—a-object→トマト
• place: 事象の成立する場所 – 遊ぶ—place→部屋
• scene: 事象の成立する場面 – 演じる—scene→ドラマ
• cause: 事象の原因,理由 – 死んだ—cause→インフルエンザ
動詞的概念が名詞的概念を 支配する場合の格関係を中心に
8種類の概念関係を記述
32
①言葉(概念)
分類階層木
②言葉(=固有表現、具体物)ネットワーク
33
織田信長
本能寺
墓所
濃姫 妻
法華宗本門流
日本の
寺院
建築物
日本の神
農民 武士
宗派
1415年
創建年
歴史上の身分
神
天文3年5月12日
生誕
豊臣秀吉
主君
本蓮寺
宗派
日本の城
岐阜城
建立
1347年
創建年 人・もの・
こと分析
分け方
領域オントロジー
階層性
+
関係性
領域性
+
利用目的 http://www.wikipediaontology.org/wikiont.html
34
医療分野のオントロジー:SNOMED-CT
すべての概念は「SNOMED CT Concept」
という最上位概念の下位概念になっている
SNOMED CT Concept
所見 Finding 疾患 Disease 処置 Procedure ・・・・・
• 「所見」「疾患」「処置」などの最上位概念のすぐ下の概念を、「カテゴリー」と呼び、全部で19種類ある。
すべての概念(34万)はいずれかのカテゴリーに属する
19のカテゴリー
35
ビジネスプロセスオントロジー
Process Handbook (MIT)
商品を販売する サービスを販売する
販売する
何を売るか(What)で具体化
店舗で販売する ネットで販売する
店で販売する
どのように売るか(how)で具体化
Modifyを体系化
オントロジー開発工程
1.Scope決定(利用目的,タスク:検索改善、KM、QA…)
2.再利用(ワードネット,オントロジー検索エンジン)
3.用語枚挙(自然言語処理)
4.クラス定義
5.プロパティ定義:テーマによって標準的語彙がある
6.制約定義
7.インスタンス定義
8.Scopeから考えて4-7は妥当か? Go to 4
determine
scope consider
reuse enumerate
terms define
classes define
properties define
constraints create
instances
36