セマンティックwebの方向性と課題 - jeita...1 hideaki takeda / national institute of...
TRANSCRIPT
1
Hideaki Takeda / National Institute of Informatics
セマンティックWebの方向性と課題
武田英明国立情報学研究所総合研究大学院大学
takeda@nii.ac.jp
Hideaki Takeda / National Institute of Informatics
概要Semantic Webの位置付けSemantic Webの実現方法
RDFRDF SchemaDAML+OIL(OWL)
Semantic Webの課題
2
Hideaki Takeda / National Institute of Informatics
The Semantic Webの目的"The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation."
The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila
The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.
http://www.w3.org/2001/sw/
Hideaki Takeda / National Institute of Informatics
Semantic WebWebを通じてさまざまな情報交換の実現
自動化統合
データの再利用
自動化統合
データの再利用
3
Hideaki Takeda / National Institute of Informatics
Next Generation Web?Webの進化
HTML: 表示のためのWebXML:シンタックスをもったWeb?? :セマンティックスをもったWeb
なぜセマンティックスをWebのメカニズムの中に組み込なねばならないか人間のためのWebから人間と機械のためのWeb ヘcf. 機械ためだけのWeb
Hideaki Takeda / National Institute of Informatics
なぜXMLでは不十分か
“person”, “name”とは何を意味するのか.“name”と“名前”は同じなのだろうか.(同一性)これは“person”の記述して十分なのだろうか(拘束条件)…
結局,シンタックスだけは解決つかない
<person><name> Hideaki Takeda</name><age> 20</age>
</person>
<個人><名前>Hideaki Takeda</名前><年齢> 20</年齢>
</個人>
4
Hideaki Takeda / National Institute of Informatics
Architecture for the Semantic Web
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
Hideaki Takeda / National Institute of Informatics
どうやって意味を記述するか
情報に関する情報を記述する仕組みが必要メタデータデータに関するデータ
共通に理解し合える仕組みが必要シンタックス(言語,スキーマ)語彙(オントロジー)
5
Hideaki Takeda / National Institute of Informatics
Semantic Webの階梯RDF (Resource Description Framework)最も原始的な意味記述の枠組みを提供ー>SVOモデル
Entity-Relation Model(実体関連モデル)セマンティックネット
RDF SchemaRDFに最も原始的な概念記述の仕組みを追加
class-subclass関係,制約DAML+OILより一般的な概念記述の枠組みを提供多様なクラス表現,多様な制約
DAML-Sプロセスの記述
Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/
Hideaki Takeda / National Institute of Informatics
Semantic Webの発展の流れWeb Communityから意味へ,知識へHTML -> XML -> RDF -> RDF Schema -> DAML+OIL
->XML schema ->
Knowledge Sharing Communityから閉じた知識表現から開いた知識表現へ深さよりも広さを完全性より可能性を
KIF, Ontolinga -> OKBC -> DAML+OIL
6
Hideaki Takeda / National Institute of Informatics
Semantic Webに関する活動W3C Semantic Web Activity標準化Web PeopleRDF, RDFS, …
DAML (DARPA Agent Markup Language)研究プロジェクトAI PeopleDAML, DAML-S …
On-To-Knowledge研究プロジェクトEU fundAI, Software EngineeringOIL
DCMI (Dublin Core Metadata Initiative)標準化図書館系Dublin Core Element Set
Hideaki Takeda / National Institute of Informatics
概要Semantic Webの位置付け
Semantic Webの実現方法RDFRDF SchemaDAML+OIL(OWL)
Semantic Webの課題
7
Hideaki Takeda / National Institute of Informatics
RDF (Resource Description Framework)メタデータを記述する枠組みモデルとシンタックスの分離W3C Recommendation (1999)
Hideaki Takeda / National Institute of Informatics
RDF モデル要素
Resource: URI(Universal Resource Identifier)でさせるもの全てLiteral(文字列)必ずしもWebでアクセス可能である必要はない
Property: resourceを記述する属性(attribute)Resourceと同様にURIあるいはLiteral
Statement: resource, property, valueの3つ組
8
Hideaki Takeda / National Institute of Informatics
RDFモデル文
http://www-kasm.nii.ac.jp/~takedaのcreator “Hideaki Takeda” である
構造
Resource (subject): http://www-kasm.nii.ac.jp/~takedaProperty (predicate): CreatorValue (object): “Hideaki Takeda”
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”Creator
Resource Property Value
Hideaki Takeda / National Institute of Informatics
RDFモデルhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“http://www.nii.ac.jp/staffid/123456であり,それはHideaki Takeda”というnameで[email protected]というemailをもっている.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
Creatorhttp://www.nii.ac.jp/staffid/123456
name email
9
Hideaki Takeda / National Institute of Informatics
RDFモデルhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”というnameで[email protected]というemailをもっている.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
Creator
name email
Hideaki Takeda / National Institute of Informatics
RDFシンタックスhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”である
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”Creator
Resource Property Value<?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://dublincore.org/2001/08/14/dces#">
<rdf:Description about="http://www-kasm.nii.ac.jp/~takeda"> <dc:Creator>Hideaki Takeda</dc:Creator>
</rdf:Description> </rdf:RDF> <rdf:RDF>
<rdf:Description about="http://www-kasm.nii.ac.jp/~takeda"> <dc:Creator rdf:resource=“Hideaki Takeda” />
</rdf:Description> </rdf:RDF>
10
Hideaki Takeda / National Institute of Informatics
RDFシンタックスhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”というnameで[email protected]というemailをもっている.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
Creator
name email
<rdf:RDF> <rdf:Description >
<dc:Creator><rdf:Description resource = " http://www.nii.ac.jp/staffid/123456 " >
<p:name>Hideaki Takeda</p:name> <p:email>[email protected]</p:email>
</rdf:Description></dc:Creator>
</rdf:Description> </rdf:RDF>
Hideaki Takeda / National Institute of Informatics
RDFS (RDF Schema)より強力な知識表現モデルの採用
RDF: ERモデル,セマンティックネットモデルRDF Schema: Frameモデル,オブジェクト指向モデルただし最小限の定義のみProperty中心型定義
RDFとして定義
11
Hideaki Takeda / National Institute of Informatics
RDFSClass定義
rdfs:Resourcerdfs:Classrdf:Propertyrdfs:ConstraintPropertyrdfs:Literal
Property定義rdf:typerdfs:subClassOfrdfs:subPropertyOfrdfs:commentrdfs:labelrdfs:seeAlsordfs:isDefinedBy
ConstraintProperty定義rdfs:range rdfs:domain Resource Description Framework(RDF) Schema Specification 1.0
http://www.w3.org/TR/2000/CR-rdf-schema-20000327/
RDFSのClass階層
Hideaki Takeda / National Institute of Informatics
RDF Schemardfs:Classrdfs:SubclassOfクラスを詳細化したもの複数可推移性
rdf:typeあるクラスのインスタンスのとき
rdf:property属性にあたるもの注意:propertyはグローバル
rdfs:subPropertyOfpropertyを詳細化したもの推移性
Range(値域)
一つ指定できる
Cardinality(個数制限)は
ない
Domain(定義域)
複数指定できる(OR)
12
Hideaki Takeda / National Institute of Informatics
RDF Schema<rdf:RDF xml:lang="en"xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#">
<rdfs:Class rdf:ID="Person"><rdfs:comment>The class of people.</rdfs:comment><rdfs:subClassOf rdf:resource="http://www.w3.org/
2000/03/example/ classes#Animal"/></rdfs:Class><rdf:Property ID="maritalStatus"><rdfs:range rdf:resource="#MaritalStatus"/><rdfs:domain rdf:resource="#Person"/>
</rdf:Property><rdf:Property ID="ssn"><rdfs:comment>Social Security Number</rdfs:comment><rdfs:range
rdf:resource="http://www.w3.org/2000/03/example/classes#Integer"/><rdfs:domain rdf:resource="#Person"/>
</rdf:Property><rdf:Property ID="age"><rdfs:range
rdf:resource="http://www.w3.org/2000/03/example/classes#Integer"/><rdfs:domain rdf:resource="#Person"/>
</rdf:Property><rdfs:Class rdf:ID="MaritalStatus"/><MaritalStatus rdf:ID="Married"/><MaritalStatus rdf:ID="Divorced"/><MaritalStatus rdf:ID="Single"/><MaritalStatus rdf:ID="Widowed"/></rdf:RDF>
Animal
Person
ssnage
maritalStatus
s
d
MaritalStatus
r
“The class of person”
rdfs:comment
Integer
d
r
d
“Social Security Number”
rdfs:comment
t = rdf:typed = rdfs:domainr = rdfs:range= class= class instance= property
Resource Description Framework(RDF) Schema Specification 1.0http://www.w3.org/TR/2000/CR-rdf-schema-20000327/
Married
Divorced
Single
Windowed
t
t
t
t
Hideaki Takeda / National Institute of Informatics
DAML+OILRDFSにより豊富なクラス表現と制約の方法を追加Description LogicのfravorFrame表現のfravor特徴クラスクラス要素:必要条件,必要十分条件の区別が可能クラス表現:プロパティによる制約(クラスのスロット定義の相当)型制限(全称/限量),個数制限,型指定個数制限
クラスの論理演算:和,積,否定プロパティ定義域,値域の複数指定(積)推移性の指定
定義のインポート
13
Hideaki Takeda / National Institute of Informatics
DAML+OILobjectとdatatype
datatype domain: XML Schemaで定義されるものobject domain: DAML+OILで定義されるもの
Hideaki Takeda / National Institute of Informatics
DAML+OILクラス要素 (class element)daml:Class クラス名(URI)
daml:subClassOf class-expressiondaml:disjointWith class-expressiondaml:disjointUnionOf [class-expression]+daml:sameClassAs class-expressiondaml:equivalentTo class-expressionクラス表現のブール演算数え上げ
必要条件
必要十分条件
14
Hideaki Takeda / National Institute of Informatics
DAML+OILクラス表現(Class expression)クラス名数え上げプロパティ制約(property-restriction)クラス表現のブール演算
数え上げ(enumeration)daml:oneOf [instance]+
<daml:oneOf parseType="daml:collection"><daml:Thing rdf:about="#Eurasia"/><daml:Thing rdf:about="#Africa"/><daml:Thing rdf:about="#North_America"/><daml:Thing rdf:about="#South_America "/><daml:Thing rdf:about="#Australia"/>
<daml:Thing rdf:about="#Antarctica"/> </oneOf>
Hideaki Takeda / National Institute of Informatics
DAML+OILプロパティ制約(Property restriction)
daml:onProperty elementクラス表現への特別な制約指定するプロパティが以下の制約を満たしているクラスだけを指示要素の型制約
daml:toClass class-expressionそのプロパティの値域のクラスを指定全称限量子的効果
daml:hasValueそのプロパティの値域を個別のオブジェクトまたはdatatype指定
daml:hasClassそのプロパティの値域に指定される要素が一つでもあることを指定存在限量子的効果
15
Hideaki Takeda / National Institute of Informatics
DAML+OILプロパティ制約(Property restriction) 続き個数制限(Cardinarity)
daml:cardinarity elementdaml:maxCardinarity elementdaml:minCardinarity element
型指定個数制限(Qualified Cardinarity)daml:hasClassQ element
daml:cardinarityQ elementdaml:maxCardinarityQ elementdaml:minCardinarityQ element
Hideaki Takeda / National Institute of Informatics
DAML+OILクラス表現のブール演算
daml:intersectionOf [class-expression]+それらクラス全てに共通なオブジェクト論理積
daml:unionOf [class-expression]+それらクラスいずれかに属するオブジェクト論理和
daml:complementOf class-expressionそのクラスに属さないオブジェクト論理否定
<complementOf><Class>
<unionOf parseType="daml:collection"><Class rdf:resource="#meat"/><Class rdf:resource="#fish"/>
</unionOf></Class>
</complementOf>
16
Hideaki Takeda / National Institute of Informatics
DAML+OILプロパティ要素(property element)rdf:Property property-name
rdfs:subPropertyOfrdfs:domain class-exprssion定義域複数可,その場合はそれらのクラス表現の積
rdfs:range class-expression値域複数可,その場合はそれらのクラス表現の積
rdfs:samePropertyAs propery-namerdfs:equivalentTo propery-namerdfs:inverseOf propery-name逆の関係であることの指定
daml:TransitiveProperty: 推移性daml:UniqeProperty: ひとつのプロパティの値は一つdaml:UnambigiousProperty:一つのクラスはこのプロパティを一つだけ
Hideaki Takeda / National Institute of Informatics
DAML+OILインスタンス (instance)クラスまたはプロパティのインスタンスRDFではrdf:typeさまざまなシンタックス
<continent rdf:ID="Asia"/>
<rdf:Description rdf:ID="Asia"> <rdf:type>
<rdfs:Class rdf:about="#continent"/> </rdf:type>
</rdf:Description>
<rdf:Description rdf:ID="India"> <is_part_of rdf:resource="#Asia"/>
</rdf:Description>
17
Hideaki Takeda / National Institute of Informatics
DAML+OIL記述例<rdf:RDFxmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:daml="http://www.daml.org/2001/03/daml+oil#"xmlns:xsd ="http://www.w3.org/2000/10/XMLSchema#"xmlns:dex ="http://www.daml.org/2001/03/daml+oil-ex#"xmlns:exd ="http://www.daml.org/2001/03/daml+oil-ex-dt#"xmlns ="http://www.daml.org/2001/03/daml+oil-ex#“
>
<daml:Ontology rdf:about=""><rdfs:comment>An example ontology by Takeda, with data types taken from XMLSchema</rdfs:comment><daml:imports rdf:resource="http://www.daml.org/2001/03/daml+oil"/>
</daml:Ontology>
<daml:Class rdf:ID="Animal"><rdfs:label>Animal</rdfs:label><rdfs:comment>This class of animals is illustrative of a number of ontological idioms.</rdfs:comment>
</daml:Class>
DAML+OIL Examplehttp://www.daml.org/2001/03/daml+oil-ex.daml
Hideaki Takeda / National Institute of Informatics
<daml:ObjectProperty rdf:ID="name"><rdfs:domain rdf:resource="#Animal"/><rdfs:range rdf:resource="http://www.w3.org/2000/10/XMLSchema#decimal"/>
</daml:ObjectProperty><daml:DatatypeProperty rdf:ID="age"><rdfs:comment>
age is a DatatypeProperty whose range is xsd:decimal. age is also a UniqueProperty (can only have one age</rdfs:comment><rdf:type rdf:resource="http://www.daml.org/2001/03/daml+oil#UniqueProperty"/><rdfs:range rdf:resource="http://www.w3.org/2000/10/XMLSchema#nonNegativeInteger"/>
</daml:DatatypeProperty><daml:Class rdf:ID="Person"><rdfs:subClassOf rdf:resource="#Animal"/><rdfs:subClassOf><daml:Restriction daml:mincardinality="1">
<daml:onProperty rdf:resource="#name"/></daml:Restriction>
</rdfs:subClassOf></daml:Class><Person rdf:ID="Hideaki"><rdfs:label>Hideaki</rdfs:label><rdfs:comment>Hideaki is a person. His name is Hideaki Takeda and his age is 20.</rdfs:comment><name>Hideaki Takeda</name><age><xsd:integer rdf:value="20"/></age>
</Person></rdf:RDF> DAML+OIL Example
http://www.daml.org/2001/03/daml+oil-ex.daml
18
Hideaki Takeda / National Institute of Informatics
概要Semantic Webの位置付け
Semantic Webの実現方法RDFRDF SchemaDAML+OIL(OWL)
Semantic Webの課題
Hideaki Takeda / National Institute of Informatics
Semantic Webの課題仕様の確定と展開(推論など)[SW関係者]利用者に普及すること[SW関係者,APP関係者,一般ユーザ]よいオントロジーの提供[SW関係者,APP関係者]よいドメインをみつけること[APP関係者]
こういったことは全ての新しい仕様にとって必要だが...SWにとっては本質的.なぜなら[共有]することがSematicWebの存在価値だからc.f. XML: 部分的
19
Hideaki Takeda / National Institute of Informatics
疑問Q:“意味”って表現できるの?Semantic Webのアプローチでは意味とは
[共有]される([概念]とそれら間の[関係])で表現できるもっともプリミティブなレベルでは共有:URI概念,関係:存在することだけ(共有することだけ)
より高度なレベルでは共有:URI+体系としての共有概念,関係:構造をもつ存在
さらには証明信頼
Hideaki Takeda / National Institute of Informatics
より本質的な課題[共有]問題再考
Semantic Webにおける共有URIや定義のインポートしかしこれは楽観的かつ暗黙的,また一様でしかない利用は明示的だが...
共有の“幅”が必要共有の程度,変化へ対応など
人間/機械両用方式の拡張はどこまで可能なのかHTMLの成功神話はどこまで続くか
20
Hideaki Takeda / National Institute of Informatics
自然言語処理コミュニティに対する期待Semantic Webと自然言語処理コミュニティ自然言語処理技術はSWに必要不可欠文の処理(SWに基づいた解析や生成)オントロジー構築オントロジーは言語的,習慣的,文化的
Semantic Webは各国固有の言語,習慣,文化のインターオペラビリティ(相互運用可能性)を要求する中央集権型VS分散型インターオペラビリティそもそも各{言語,習慣,文化}の自律性がなければ議論にならない
自然言語処理コミュニティ対する期待言語のみならず習慣,文化の問題まで含めたオントロジーへのコミットメント工学系では一番近い領域としての期待
Hideaki Takeda / National Institute of Informatics
まとめSemantic Webの位置付けSemantic Webの実現方法
RDFRDF SchemaDAML+OIL
Semantic Webの課題Semantic Web普及への課題意味の共有への課題自然言語処理コミュニティへの期待
21
Hideaki Takeda / National Institute of Informatics