owl - jaist 北陸先端科学技術大学院大学 · 2003. 10. 3. · doddle ii: a domain...

21
OWL䈲䉥䊮䊃䊨䉳䊷䈱⺖㗴䉕 ᧄᒰ䈮⸃䈜䉎䈱䈎䋿 ጊญ 㜞ᐔ 䋨㕒ጟᄢቇ䋩 Ꮏ⍮⢻ቇળ⎇ⓥળ⾗ᢱ SIG-SWO-A201-02 Semantic Web 䈱䋹㓏ጀ

Upload: others

Post on 07-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

1

OWL���������

� ��������

�� ��

����

���������SIG-SWO-A201-02

Semantic Web ����

Page 2: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

2

��������

�� �����������

��������

• 90-: ���������Tom Gruber ��������

�� ������(Ontolingua)������(KIF)Generic OntologyCYC, WordNet, EDR…PSMTask Ontology

�� ����������

��Web����

• 95-97: XML as arbitrary

structures

• 97-98: RDF

• 98-99: RDFS (schema) as a

frame-like system

• 00-01: DAML+OIL

• 02-07: OWL

OWL�����

• On-To-Knowledge � OIL ���

• ��EU���� ����� OIL���

• DAML�����OIL����

• ��� DAML+OIL

• ��� DAML+OIL

• W�C� DAML+OIL ���

• WebOnt Working Group ���

! OWL "#$�

���’��

���’��

��’��

��’��

���’�

���’�

���’�

���’��

���’��

��’��

��’��

���’�

���’�

���’�

Page 3: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

3

RDF�S)�OWL���

• class-def• subclass-of• slot-def• subslot-of• domain• range

• class-def• subclass-of• slot-def• subslot-of• domain• range

• class-expressions• AND, OR, NOT

• slot-constraints• has-value, value-type• cardinality

• slot-properties• trans, symm

• class-expressions• AND, OR, NOT

• slot-constraints• has-value, value-type• cardinality

• slot-properties• trans, symm

RDF(S)DAML+OILDAML+OIL

��OWLOWL

Keyword URI

academic department http://www.cs.umd.edu/projects/plus/DAML/onts/cs1.0.daml

academic department http://www.cs.umd.edu/projects/plus/DAML/onts/cs1.1.daml

Academic Positionshttp://www.daml.ri.cmu.edu/ont/homework/cmu-ri-employmenttypes-

ont.daml

access control

primitiveshttp://www.w3.org/2000/10/swap/pim/doc.rdf

acronym http://orlando.drc.com/daml/Ontology/Thesaurus/CALL/current/

activity http://www.kestrel.edu/DAML/2000/12/OPERATION.daml

Actors http://opencyc.sourceforge.net/daml/cyc.daml

Actors http://www.cyc.com/2002/04/08/cyc.daml

Actors http://www.cyc.com/cyc-2-1/cyc-vocab.daml

address book http://www.w3.org/2000/10/swap/pim/contact.rdf

agenda http://www.daml.org/2001/10/agenda/agenda-ont

DAML Ontology Library (Ontology's by Keyword)

http://www.daml.org/ontologies/keyword.html

Page 4: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

4

�������� �� ������������������������������� �������� ��������� �!�� �������������������������������"����#�$� �!�� ��$����

��������$��% �����%�&'��$���$��� �!�� ������������������"������(((����������� )����� �!�� ���� ��������������"����������������� %��� �*!

�����+������) �������&����*!���� �%����*�� ���������� �%����*!���� �%����*�� �����!�������)����� �%����*!

�����,�� $��-���*�����������,�� $��-���*!������+������)*!���� �.�� �������&�������������������������������� �������� ��������� /� �0�� ��1�

���� ������*/� �0�� ��1������� ������*!���� �%����*����� �%����*!��$����%����$������*���22���!�3�����������$����%����$������*!

���� � &�.�� +�*!���� �.�� �������&�������������������������������� �������� ��������� 1���*����� �.�� *!����� � &�.�� +�*!����� �.�� *!

���� �.�� �������&�������������������������������� �������� ��������� -��$���*!���� ������*-��$������� ������*!

���� �%����*����� �%����*!��$����%����$������*������4(!�3�����������$����%����$������*!���� � &�.�� +�*!

���� �.�� �������&�������������������������������� �������� ��������� 5��������6,����*����� �.�� *!����� � &�.�� +�*

���� � &�.�� +�*!������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� �&����*

��������/������)*!�������.�� *!���� �.�� �������&��� ������������"�����7��� %������ ��$���*����� �.�� *!��������.�� *

�������� ��$%�$��*!����� � &�.�� +�*!����� �.�� *!���� �.�� �������&�������������������������������� �������� ��������� 8���&��*

���� ������*8���&������ ������*!���� �%����*����� �%����*!��$����%����$������*���"2�"�!�3�����������$����%����$������*!

���� � &�.�� +�*!������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� �$,$ $���*��������/������)*!

�������.�� *!���� �.�� �������&�������������������������������� �������� ��������� �$,$ $���*����� �.�� *!��������.�� *!�������� ��$%�$��*!

����� � &�.�� +�*!����� �.�� *!���� �.�� �������&�������������������������������� �������� ��������� /�� ���*!

���� ������*/�� ������� ������*!���� �%����*����� �%����*!��$����%����$������*�"�����"!�3�����������$����%����$������*!����� �.�� *!

���� �.�� �������&�������������������������������� �������� ��������� /��)���*!���� ������*/��)������� ������*!���� �%����*����� �%����*!

��$����%����$������*����2�4�!�3�����������$����%����$������*!

���� � &�.�� +�*!���� �.�� �������&�������������������������������� �������� ��������� 6���)���*����� �.�� *!����� � &�.�� +�*!����� �.�� *

���� �.�� �������&�������������������������������� �������� ��������� ���$���*!���� ������*���$������� ������*!���� �%����*����� �%����*!

��$����%����$������*���"���"!�������������$����%����$������*!���� � &�.�� +�*!

���� �.�� �������&�������������������������������� �������� ��������� 8$��&�6,����*����� �.�� *!����� � &�.�� +�*!����� �.�� *!

���� �.�� �������&�������������������������������� �������� ��������� 0�� ���*!

���� ������*0�� ������� ������*!���� �%����*����� �%����*!��$����%����$������*����"��4!�3�����������$����%����$������*!���� � &�.�� +�*!

������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� )����*��������/������)*!�������.�� *!

���� �.�� �������&��� ������������"�����7��� %������ ��$���*����� �.�� *!��������.�� *!�������� ��$%�$��*!����� � &�.�� +�*

����� �.�� *!���� �.�� �������&�������������������������������� �������� ��������� 0��$� �*!

���� ������*0��$� ����� ������*!���� �%����*����� �%����*!��$����%����$������*���23��2!�3�����������$����%����$������*!���� � &�.�� +�*

������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� ����*��������/������)*!

�������.�� ������ �&�%�������������������������������� �������� ��������� 7����*!�������� ��$%�$��*!����� � &�.�� +�*!���� � &�.�� +�*!

������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� ���)�*��������/������)*!�������.��

Baseball Ontology

����������

�� �������(�����

Page 5: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

5

IssueIssue ApproachApproach

A ProcessA Process--Centered Software Engineering Centered Software Engineering

Environment Using OntologiesEnvironment Using Ontologies

GoalGoal

Real software processes

change dynamically...

need the facility to correspond

to changing process dynamically

very difficult to maintain

develop software process ontologies

through the domain analysis using

two case studies

First,

Afterwards,design the system which generate

software processes interactively

with a user

Development of Software Process Ontologies

Step1. Extract real software processes and objects from

the two cases

InventInvent

JoinJoin

AppendAppend

ExtractExtract

C

A+BA

B

inputinput

referencereference

Process

B’or

A’

A��

+

outputoutput

Step2. Organize extracted processes and objects into distinct

groups such that there are more similarity in meaning,

while defining the software process scheme

Step3. Give detailed definitions to each processes

using software process scheme

Page 6: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

6

activityactivity

InventInvent

JoinJoin

AppendAppend

ExtractExtract

Invent with referencesInvent with references

Invent without referencesInvent without references

Join without referencesJoin without references

Extract without referencesExtract without references

Join with referencesJoin with references

Extract with referencesExtract with references

EvaluateEvaluate

ReviewReview

ExamineExamine

Focus on input,output,

and reference roles

Focus on input,output,

and reference rolesFocus on reference,

tool and agent roles

Focus on reference,

tool and agent roles

Process OntologyProcess Ontology

Software Process Ontologies(conceptual hierarchy)

Object Ontology including

about 400 concepts

Process Ontology including

about 250 concepts

Page 7: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

7

Process Ontology Object Ontology

Goal

Object

Goal

Object��

��

��

��

��Start

Object

Start

Object

Retrieve processes

satisfied with constraints

Software Process Automation

using ontologies

Page 8: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

8

A query about S�P

What SEP between the following input and output ?What SEP between the following input and output ?

Input : Requirement Specification from

S/W Subsystems

Output : Detailed Design of Each Component of

S/W Subsystems

Case Study

Initial Software Process Plan CandidatesInitial Software Process Plan Candidates

Requirement

Specification

from

S/W Subsystems

Detailed Design of

Each Components of

S/W Subsystems

Design Basic

Components of

S/W Subsystems

Design Basic

Components of

I/F Subsystems

Design Logical

Aspects of DB

Review All

Basic Designs

Together

Evaluate All

Basic DesignsDesign Physical

Aspects of DB

Specify Testing

S/W Integration

Design Detailed

Components of

S/W Subsystems

Design Detailed

Components of

I/F Subsystems

Specify Testing

Units of S/W

Evaluate All

Detailed Designs

Review All

Detailed Designs

Together

OutputOutput

InputInput

Page 9: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

9

Interim Software Process Plan CandidatesInterim Software Process Plan Candidates

Requirement

Specification

from

S/W Subsystems

Detailed Design of

Each Components of

S/W Subsystems

Design Basic

Components of

S/W Subsystems

Design Basic

Components of

I/F Subsystems

Design Logical

Aspects of DB

Evaluate All

Basic DesignsDesign Physical

Aspects of DB

Specify Testing

S/W Integration

Design Detailed

Components of

S/W Subsystems

Design Detailed

Components of

I/F Subsystems

Specify Testing

Units of S/W

Evaluate All

Detailed Designs

Review All

Detailed Designs

Together

OutputOutput

InputInput

Final Software Process Plan CandidatesFinal Software Process Plan Candidates

Requirement

Specification

from

S/W Subsystems

Detailed Design of

Each Components of

S/W Subsystems

Design Basic

Components of

S/W Subsystems

Design Basic

Components of

I/F Subsystems

Design Logical

Aspects of DB

Evaluate All

Basic DesignsDesign Physical

Aspects of DB

Specify Testing

S/W Integration

Design Detailed

Components of

S/W Subsystems

Design Detailed

Components of

I/F Subsystems

Specify Testing

Units of S/W

Evaluate All

Detailed Designs

Review All

Detailed Designs

Together

OutputOutput

InputInput

Page 10: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

10

Evaluation

Issues and Future work

•The environment can’t allocate human and time resource

•The environment has not the facility that supports the user

to add user’s specific processes

•The methodology for building ontologies has no theoretical

aspects,such as soundness

Applicability

It turned out that the environment generated SPP candidates

good for the user’s query with user interaction

��������

�� ��������� �����(������

Page 11: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

11

How to Build up Domain

Ontologies with Less Cost

• Taking Existing Information Resources

DODDLE Project(a Domain Ontology rapiD DeveLopment Environment)

exploiting a MRD

Constructing up just a conceptual hierarchy

Why not taking MRD

to build up domain ontologies ?

• Good News:

MRD have many concepts.

• Bad News:

The concepts have been defined from the

point of natural language processing

(common sense) and so there are some

concept drift between MRD and specific

domain ontologies.

Page 12: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

12

����������������������������

Concept Drift

���������

�� ���������

������ �������������� �����������������

�������������� �����

����� ��������������

����� �����

������������� �������������� �

Domain

Expert

Extension of Modification

•������������ ������

•Trimmed- Results Analysis

������������

��������

������� ��

������������������

����������������������

�������

DODDLEDODDLE

Page 13: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

13

Best-Match

Internal Node

Root

��������

����

��������

Matched-Results Analysis

A

B C

D

����������

���� �����

00

3

B C D

������������

A

B C

A���������������

����� �����

D

Trimmed-Results Analysis

Page 14: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

14

Acquiring not only Conceptual

Hierarchy but Concept Definitions

DODDLE II Project(Extending DODDLE)

Info. Resource:Domain-Specific Texts

Technique: Co-occurence information

WordSpace

Page 15: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

15

������������

��� ��������

��������

��� ��������

��������

��� �������

������ ���

������

�����������������

�������

�����������������

�������

���������������� �����

WordNet

���

DODDLEDODDLE--IIII

OverviewOverview

�������������

���

�������������

���

������

�����

������������

��� �������

��������

������

���� �������������������� ����������������

• Words and phrases in texts can be expressed by

vector representation containing co-occurrence statistics

Extracting Concept Relationships

from Domain-Specific Texts

WordSpace �Marti A. Hearst, Hinrich Schutze�

… �� … �� …�� … �� …

… �� … �� …�� … �� …

�������������� ����������������� ������

• Inner products among the vectors work as

the similarity between the words and phrases.

high value with similar words

coming up around the concepts

Page 16: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

16

A sum of w in Texts

A sum of W in same synset

Constructing WordSpace������������������������ � �� �!��"#���

$������������������

%��������&�������������&������'�WordSpace ���������!������(������)

*��&��������������������!������������

.. f8 f4 f3 f7 f8

f4 f1 f3 f8 f9 f2

f5 f1 f7 f1 f5 ..

.. f8 f4 f3 f7 f8

f4 f1 f3 f4 f9 f2

f5 f1 f7 f1 f5 ..

Collocation Matrix

���������� �������� ��

��

��

��

����

�� �

��

��

w

w

Texts (4-gram array) Texts (4-gram array) Texts (4-gram vector array)

Vector representation

for each 4-gram

.. f8 f4 f3 f7 f8

f4 f1 f3 f4 w f2

f5 f1 f7 f1 f5 ..

A sum of 4-gram vectors around w

WordNet synset

w1

w3

w2

w4

C

Word Vector W

Context vector w

Vector representation of a concept C

��������������� �����������

����non-TAXONOMY?

����non-TAXONOMY?

����TAXONOMY

����non-TAXONOMY?

������������������ �������

��

Constructing

Concept Specification Template

�� ��

�� ��

�� ��

�� ��

����������������� ������������������� ��

��������������������� ��������������� ��������

��

��

��

�������������������� �� �

������ ������ ��� �������� ������ ��� ��

����������� � � ������������������� � � ��������

Page 17: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

17

DODDLEDODDLE--IIIIalphaalpha on Perl/Tkon Perl/Tk ((UNIX UNIX platformplatform))

The Target Domain

Contracts for the International Sale of Goods(CISG)

The Target Domain

Contracts for the International Sale of Goods(CISG)

A Case Study

Input Terms to TR module

46 Legal Terms from CISG Part-II

Domain-Specific Texts to NonTR module

full text of CISG (about 10,000 words)

Page 18: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

18

Results

46Terms

The paths from Spell Matched Nodes

to the Root of WordNet

Trimmed Model Legal Ontology

Trimming

Initial Model

56Terms 61Terms

377Terms113Terms

Select Best Matches

Modification

Taxonomic Relationships for input terms

constructed from TR Acquisition Module

Page 19: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

19

Support ratio: Support ratio: How match is included in final domain ontology

the intermediate products at each DODDLE activity.

���

����

����

����

����

����

����

���

���

����

�����

������������

��

����������� �� �������������

���

�� ����������

�� ���

�� ����������

�� ���

�������� ��

��������������

� ������������������� ������������� ������� ��������

������� �������� !"�����#"$�% ������������� &''#�#"$�% ���������(��

Support Ratio

Extracting

Concept Relationships

8Extraction frequency of 4-gram (times)

60Context scope (4-grams)

10Collocation scope (4-grams)

setting value for WordSpace

the concept pairs extracted according to context similarity (threshold 0.9993)

Page 20: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

20

Domain Experts Modifying

Concept Specification Templates

������

: proposalTAXONOMY

: timenon-TAXONOMY?

: withdrawalnon-TAXONOMY?

: offereenon-TAXONOMY?

: personnon-TAXONOMY?

: offernon-TAXONOMY?

: effectnon-TAXONOMY?

: actTAXONOMY

: offerornon-TAXONOMY?

���������� ��������������

������

�������������������������

�������������

ex) non-Taxonomic Relationships for “assent”

: offerLEGAL-SEQUENCE

: personAGENT

: withdrawalANTONYM

�������������

��������������� ������������������� ����������

�����������������������

����������������������� ����������

���������������������

Recall & Precision

of Concept Specification Templates

recall

precision

The number of extracted concept pairs

Page 21: OWL - JAIST 北陸先端科学技術大学院大学 · 2003. 10. 3. · DODDLE II: A Domain Ontology Construction Support Environment using MRD and Domain-Specific Texts Legal experts

21

Conclusions

DODDLE II: A Domain Ontology Construction Support

Environment using MRD and Domain-Specific Texts

Legal experts appreciate DODDLE II to some extent.

•How to Decide Threshold for CS

• How to Identify NTR

•Another DM method instead of WordSpace

• Another Case Studies with Large Scale

Future WorkFuture Work

OWL��������

• OWL��������

UML���� ���

• OWL�RDF(S)�RDF

������������

• ����������������

• ������� !"#�$%&'(