セマンティックwebの方向性と課題 - jeita...1 hideaki takeda / national institute of...

21
Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所 総合研究大学院大学 takedanii.ac.jp Hideaki Takeda / National Institute of Informatics 概要 Semantic Webの位置付け Semantic Webの実現方法 RDF RDF Schema DAML+OIL (OWL) Semantic Webの課題

Upload: others

Post on 17-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

1

Hideaki Takeda / National Institute of Informatics

セマンティックWebの方向性と課題

武田英明国立情報学研究所総合研究大学院大学

takeda@nii.ac.jp

Hideaki Takeda / National Institute of Informatics

概要Semantic Webの位置付けSemantic Webの実現方法

RDFRDF SchemaDAML+OIL(OWL)

Semantic Webの課題

Page 2: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

2

Hideaki Takeda / National Institute of Informatics

The Semantic Webの目的"The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation."

The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila

The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.

http://www.w3.org/2001/sw/

Hideaki Takeda / National Institute of Informatics

Semantic WebWebを通じてさまざまな情報交換の実現

自動化統合

データの再利用

自動化統合

データの再利用

Page 3: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

3

Hideaki Takeda / National Institute of Informatics

Next Generation Web?Webの進化

HTML: 表示のためのWebXML:シンタックスをもったWeb?? :セマンティックスをもったWeb

なぜセマンティックスをWebのメカニズムの中に組み込なねばならないか人間のためのWebから人間と機械のためのWeb ヘcf. 機械ためだけのWeb

Hideaki Takeda / National Institute of Informatics

なぜXMLでは不十分か

“person”, “name”とは何を意味するのか.“name”と“名前”は同じなのだろうか.(同一性)これは“person”の記述して十分なのだろうか(拘束条件)…

結局,シンタックスだけは解決つかない

<person><name> Hideaki Takeda</name><age> 20</age>

</person>

<個人><名前>Hideaki Takeda</名前><年齢> 20</年齢>

</個人>

Page 4: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

4

Hideaki Takeda / National Institute of Informatics

Architecture for the Semantic Web

Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

Hideaki Takeda / National Institute of Informatics

どうやって意味を記述するか

情報に関する情報を記述する仕組みが必要メタデータデータに関するデータ

共通に理解し合える仕組みが必要シンタックス(言語,スキーマ)語彙(オントロジー)

Page 5: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

5

Hideaki Takeda / National Institute of Informatics

Semantic Webの階梯RDF (Resource Description Framework)最も原始的な意味記述の枠組みを提供ー>SVOモデル

Entity-Relation Model(実体関連モデル)セマンティックネット

RDF SchemaRDFに最も原始的な概念記述の仕組みを追加

class-subclass関係,制約DAML+OILより一般的な概念記述の枠組みを提供多様なクラス表現,多様な制約

DAML-Sプロセスの記述

Tim Berners-Lee http://www.w3.org/2002/Talks/09-lcs-sweb-tbl/

Hideaki Takeda / National Institute of Informatics

Semantic Webの発展の流れWeb Communityから意味へ,知識へHTML -> XML -> RDF -> RDF Schema -> DAML+OIL

->XML schema ->

Knowledge Sharing Communityから閉じた知識表現から開いた知識表現へ深さよりも広さを完全性より可能性を

KIF, Ontolinga -> OKBC -> DAML+OIL

Page 6: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

6

Hideaki Takeda / National Institute of Informatics

Semantic Webに関する活動W3C Semantic Web Activity標準化Web PeopleRDF, RDFS, …

DAML (DARPA Agent Markup Language)研究プロジェクトAI PeopleDAML, DAML-S …

On-To-Knowledge研究プロジェクトEU fundAI, Software EngineeringOIL

DCMI (Dublin Core Metadata Initiative)標準化図書館系Dublin Core Element Set

Hideaki Takeda / National Institute of Informatics

概要Semantic Webの位置付け

Semantic Webの実現方法RDFRDF SchemaDAML+OIL(OWL)

Semantic Webの課題

Page 7: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

7

Hideaki Takeda / National Institute of Informatics

RDF (Resource Description Framework)メタデータを記述する枠組みモデルとシンタックスの分離W3C Recommendation (1999)

Hideaki Takeda / National Institute of Informatics

RDF モデル要素

Resource: URI(Universal Resource Identifier)でさせるもの全てLiteral(文字列)必ずしもWebでアクセス可能である必要はない

Property: resourceを記述する属性(attribute)Resourceと同様にURIあるいはLiteral

Statement: resource, property, valueの3つ組

Page 8: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

8

Hideaki Takeda / National Institute of Informatics

RDFモデル文

http://www-kasm.nii.ac.jp/~takedaのcreator “Hideaki Takeda” である

構造

Resource (subject): http://www-kasm.nii.ac.jp/~takedaProperty (predicate): CreatorValue (object): “Hideaki Takeda”

http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”Creator

Resource Property Value

Hideaki Takeda / National Institute of Informatics

RDFモデルhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“http://www.nii.ac.jp/staffid/123456であり,それはHideaki Takeda”というnameで[email protected]というemailをもっている.

http://www-kasm.nii.ac.jp/~takeda

“Hideaki Takeda”

Creatorhttp://www.nii.ac.jp/staffid/123456

[email protected]

name email

Page 9: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

9

Hideaki Takeda / National Institute of Informatics

RDFモデルhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”というnameで[email protected]というemailをもっている.

http://www-kasm.nii.ac.jp/~takeda

“Hideaki Takeda”

Creator

[email protected]

name email

Hideaki Takeda / National Institute of Informatics

RDFシンタックスhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”である

http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”Creator

Resource Property Value<?xml version="1.0"?> <rdf:RDF   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"   xmlns:dc="http://dublincore.org/2001/08/14/dces#">

<rdf:Description about="http://www-kasm.nii.ac.jp/~takeda">    <dc:Creator>Hideaki Takeda</dc:Creator>

</rdf:Description> </rdf:RDF> <rdf:RDF>

<rdf:Description about="http://www-kasm.nii.ac.jp/~takeda">    <dc:Creator rdf:resource=“Hideaki Takeda” />

</rdf:Description> </rdf:RDF>

Page 10: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

10

Hideaki Takeda / National Institute of Informatics

RDFシンタックスhttp://www-kasm.nii.ac.jp/~takedaのcreatorは“Hideaki Takeda”というnameで[email protected]というemailをもっている.

http://www-kasm.nii.ac.jp/~takeda

“Hideaki Takeda”

Creator

[email protected]

name email

<rdf:RDF> <rdf:Description >

   <dc:Creator><rdf:Description resource = " http://www.nii.ac.jp/staffid/123456 " >

   <p:name>Hideaki Takeda</p:name>    <p:email>[email protected]</p:email>

</rdf:Description></dc:Creator>

</rdf:Description> </rdf:RDF>

Hideaki Takeda / National Institute of Informatics

RDFS (RDF Schema)より強力な知識表現モデルの採用

RDF: ERモデル,セマンティックネットモデルRDF Schema: Frameモデル,オブジェクト指向モデルただし最小限の定義のみProperty中心型定義

RDFとして定義

Page 11: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

11

Hideaki Takeda / National Institute of Informatics

RDFSClass定義

rdfs:Resourcerdfs:Classrdf:Propertyrdfs:ConstraintPropertyrdfs:Literal

Property定義rdf:typerdfs:subClassOfrdfs:subPropertyOfrdfs:commentrdfs:labelrdfs:seeAlsordfs:isDefinedBy

ConstraintProperty定義rdfs:range rdfs:domain Resource Description Framework(RDF) Schema Specification 1.0

http://www.w3.org/TR/2000/CR-rdf-schema-20000327/

RDFSのClass階層

Hideaki Takeda / National Institute of Informatics

RDF Schemardfs:Classrdfs:SubclassOfクラスを詳細化したもの複数可推移性

rdf:typeあるクラスのインスタンスのとき

rdf:property属性にあたるもの注意:propertyはグローバル

rdfs:subPropertyOfpropertyを詳細化したもの推移性

Range(値域)

一つ指定できる

Cardinality(個数制限)は

ない

Domain(定義域)

複数指定できる(OR)

Page 12: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

12

Hideaki Takeda / National Institute of Informatics

RDF Schema<rdf:RDF xml:lang="en"xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#">

<rdfs:Class rdf:ID="Person"><rdfs:comment>The class of people.</rdfs:comment><rdfs:subClassOf rdf:resource="http://www.w3.org/

   2000/03/example/ classes#Animal"/></rdfs:Class><rdf:Property ID="maritalStatus"><rdfs:range rdf:resource="#MaritalStatus"/><rdfs:domain rdf:resource="#Person"/>

</rdf:Property><rdf:Property ID="ssn"><rdfs:comment>Social Security Number</rdfs:comment><rdfs:range

rdf:resource="http://www.w3.org/2000/03/example/classes#Integer"/><rdfs:domain rdf:resource="#Person"/>

</rdf:Property><rdf:Property ID="age"><rdfs:range

rdf:resource="http://www.w3.org/2000/03/example/classes#Integer"/><rdfs:domain rdf:resource="#Person"/>

</rdf:Property><rdfs:Class rdf:ID="MaritalStatus"/><MaritalStatus rdf:ID="Married"/><MaritalStatus rdf:ID="Divorced"/><MaritalStatus rdf:ID="Single"/><MaritalStatus rdf:ID="Widowed"/></rdf:RDF>

Animal

Person

ssnage

maritalStatus

s

d

MaritalStatus

r

“The class of person”

rdfs:comment

Integer

d

r

d

“Social Security Number”

rdfs:comment

t = rdf:typed = rdfs:domainr = rdfs:range= class= class instance= property

Resource Description Framework(RDF) Schema Specification 1.0http://www.w3.org/TR/2000/CR-rdf-schema-20000327/

Married

Divorced

Single

Windowed

t

t

t

t

Hideaki Takeda / National Institute of Informatics

DAML+OILRDFSにより豊富なクラス表現と制約の方法を追加Description LogicのfravorFrame表現のfravor特徴クラスクラス要素:必要条件,必要十分条件の区別が可能クラス表現:プロパティによる制約(クラスのスロット定義の相当)型制限(全称/限量),個数制限,型指定個数制限

クラスの論理演算:和,積,否定プロパティ定義域,値域の複数指定(積)推移性の指定

定義のインポート

Page 13: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

13

Hideaki Takeda / National Institute of Informatics

DAML+OILobjectとdatatype

datatype domain: XML Schemaで定義されるものobject domain: DAML+OILで定義されるもの

Hideaki Takeda / National Institute of Informatics

DAML+OILクラス要素 (class element)daml:Class クラス名(URI)

daml:subClassOf class-expressiondaml:disjointWith class-expressiondaml:disjointUnionOf [class-expression]+daml:sameClassAs class-expressiondaml:equivalentTo class-expressionクラス表現のブール演算数え上げ

必要条件

必要十分条件

Page 14: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

14

Hideaki Takeda / National Institute of Informatics

DAML+OILクラス表現(Class expression)クラス名数え上げプロパティ制約(property-restriction)クラス表現のブール演算

数え上げ(enumeration)daml:oneOf [instance]+

<daml:oneOf parseType="daml:collection"><daml:Thing rdf:about="#Eurasia"/><daml:Thing rdf:about="#Africa"/><daml:Thing rdf:about="#North_America"/><daml:Thing rdf:about="#South_America "/><daml:Thing rdf:about="#Australia"/>

<daml:Thing rdf:about="#Antarctica"/> </oneOf>

Hideaki Takeda / National Institute of Informatics

DAML+OILプロパティ制約(Property restriction)

daml:onProperty elementクラス表現への特別な制約指定するプロパティが以下の制約を満たしているクラスだけを指示要素の型制約

daml:toClass class-expressionそのプロパティの値域のクラスを指定全称限量子的効果

daml:hasValueそのプロパティの値域を個別のオブジェクトまたはdatatype指定

daml:hasClassそのプロパティの値域に指定される要素が一つでもあることを指定存在限量子的効果

Page 15: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

15

Hideaki Takeda / National Institute of Informatics

DAML+OILプロパティ制約(Property restriction) 続き個数制限(Cardinarity)

daml:cardinarity elementdaml:maxCardinarity elementdaml:minCardinarity element

型指定個数制限(Qualified Cardinarity)daml:hasClassQ element

daml:cardinarityQ elementdaml:maxCardinarityQ elementdaml:minCardinarityQ element

Hideaki Takeda / National Institute of Informatics

DAML+OILクラス表現のブール演算

daml:intersectionOf [class-expression]+それらクラス全てに共通なオブジェクト論理積

daml:unionOf [class-expression]+それらクラスいずれかに属するオブジェクト論理和

daml:complementOf class-expressionそのクラスに属さないオブジェクト論理否定

<complementOf><Class>

<unionOf parseType="daml:collection"><Class rdf:resource="#meat"/><Class rdf:resource="#fish"/>

</unionOf></Class>

</complementOf>

Page 16: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

16

Hideaki Takeda / National Institute of Informatics

DAML+OILプロパティ要素(property element)rdf:Property property-name

rdfs:subPropertyOfrdfs:domain class-exprssion定義域複数可,その場合はそれらのクラス表現の積

rdfs:range class-expression値域複数可,その場合はそれらのクラス表現の積

rdfs:samePropertyAs propery-namerdfs:equivalentTo propery-namerdfs:inverseOf propery-name逆の関係であることの指定

daml:TransitiveProperty: 推移性daml:UniqeProperty: ひとつのプロパティの値は一つdaml:UnambigiousProperty:一つのクラスはこのプロパティを一つだけ

Hideaki Takeda / National Institute of Informatics

DAML+OILインスタンス (instance)クラスまたはプロパティのインスタンスRDFではrdf:typeさまざまなシンタックス

<continent rdf:ID="Asia"/>

<rdf:Description rdf:ID="Asia"> <rdf:type>

<rdfs:Class rdf:about="#continent"/> </rdf:type>

</rdf:Description>

<rdf:Description rdf:ID="India"> <is_part_of rdf:resource="#Asia"/>

</rdf:Description>

Page 17: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

17

Hideaki Takeda / National Institute of Informatics

DAML+OIL記述例<rdf:RDFxmlns:rdf ="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:daml="http://www.daml.org/2001/03/daml+oil#"xmlns:xsd ="http://www.w3.org/2000/10/XMLSchema#"xmlns:dex ="http://www.daml.org/2001/03/daml+oil-ex#"xmlns:exd ="http://www.daml.org/2001/03/daml+oil-ex-dt#"xmlns ="http://www.daml.org/2001/03/daml+oil-ex#“

>

<daml:Ontology rdf:about=""><rdfs:comment>An example ontology by Takeda,  with data types taken from XMLSchema</rdfs:comment><daml:imports rdf:resource="http://www.daml.org/2001/03/daml+oil"/>

</daml:Ontology>

<daml:Class rdf:ID="Animal"><rdfs:label>Animal</rdfs:label><rdfs:comment>This class of animals is illustrative of a number of ontological idioms.</rdfs:comment>

</daml:Class>

DAML+OIL Examplehttp://www.daml.org/2001/03/daml+oil-ex.daml

Hideaki Takeda / National Institute of Informatics

<daml:ObjectProperty rdf:ID="name"><rdfs:domain rdf:resource="#Animal"/><rdfs:range rdf:resource="http://www.w3.org/2000/10/XMLSchema#decimal"/>

</daml:ObjectProperty><daml:DatatypeProperty rdf:ID="age"><rdfs:comment>

age is a DatatypeProperty whose range is xsd:decimal. age is also a UniqueProperty (can only have one age</rdfs:comment><rdf:type rdf:resource="http://www.daml.org/2001/03/daml+oil#UniqueProperty"/><rdfs:range rdf:resource="http://www.w3.org/2000/10/XMLSchema#nonNegativeInteger"/>

</daml:DatatypeProperty><daml:Class rdf:ID="Person"><rdfs:subClassOf rdf:resource="#Animal"/><rdfs:subClassOf><daml:Restriction daml:mincardinality="1">

<daml:onProperty rdf:resource="#name"/></daml:Restriction>

</rdfs:subClassOf></daml:Class><Person rdf:ID="Hideaki"><rdfs:label>Hideaki</rdfs:label><rdfs:comment>Hideaki is a person. His name is Hideaki Takeda and his age is 20.</rdfs:comment><name>Hideaki Takeda</name><age><xsd:integer rdf:value="20"/></age>

</Person></rdf:RDF> DAML+OIL Example

http://www.daml.org/2001/03/daml+oil-ex.daml

Page 18: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

18

Hideaki Takeda / National Institute of Informatics

概要Semantic Webの位置付け

Semantic Webの実現方法RDFRDF SchemaDAML+OIL(OWL)

Semantic Webの課題

Hideaki Takeda / National Institute of Informatics

Semantic Webの課題仕様の確定と展開(推論など)[SW関係者]利用者に普及すること[SW関係者,APP関係者,一般ユーザ]よいオントロジーの提供[SW関係者,APP関係者]よいドメインをみつけること[APP関係者]

こういったことは全ての新しい仕様にとって必要だが...SWにとっては本質的.なぜなら[共有]することがSematicWebの存在価値だからc.f. XML: 部分的

Page 19: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

19

Hideaki Takeda / National Institute of Informatics

疑問Q:“意味”って表現できるの?Semantic Webのアプローチでは意味とは

[共有]される([概念]とそれら間の[関係])で表現できるもっともプリミティブなレベルでは共有:URI概念,関係:存在することだけ(共有することだけ)

より高度なレベルでは共有:URI+体系としての共有概念,関係:構造をもつ存在

さらには証明信頼

Hideaki Takeda / National Institute of Informatics

より本質的な課題[共有]問題再考

Semantic Webにおける共有URIや定義のインポートしかしこれは楽観的かつ暗黙的,また一様でしかない利用は明示的だが...

共有の“幅”が必要共有の程度,変化へ対応など

人間/機械両用方式の拡張はどこまで可能なのかHTMLの成功神話はどこまで続くか

Page 20: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

20

Hideaki Takeda / National Institute of Informatics

自然言語処理コミュニティに対する期待Semantic Webと自然言語処理コミュニティ自然言語処理技術はSWに必要不可欠文の処理(SWに基づいた解析や生成)オントロジー構築オントロジーは言語的,習慣的,文化的

Semantic Webは各国固有の言語,習慣,文化のインターオペラビリティ(相互運用可能性)を要求する中央集権型VS分散型インターオペラビリティそもそも各{言語,習慣,文化}の自律性がなければ議論にならない

自然言語処理コミュニティ対する期待言語のみならず習慣,文化の問題まで含めたオントロジーへのコミットメント工学系では一番近い領域としての期待

Hideaki Takeda / National Institute of Informatics

まとめSemantic Webの位置付けSemantic Webの実現方法

RDFRDF SchemaDAML+OIL

Semantic Webの課題Semantic Web普及への課題意味の共有への課題自然言語処理コミュニティへの期待

Page 21: セマンティックWebの方向性と課題 - JEITA...1 Hideaki Takeda / National Institute of Informatics セマンティックWebの方向性と課題 武田英明 国立情報学研究所

21

Hideaki Takeda / National Institute of Informatics