owl - jaist 北陸先端科学技術大学院大学 · 2003. 10. 3. · doddle ii: a domain...
TRANSCRIPT
1
OWL���������
� ��������
�� ��
����
���������SIG-SWO-A201-02
Semantic Web ����
2
��������
�� �����������
��������
• 90-: ���������Tom Gruber ��������
�� ������(Ontolingua)������(KIF)Generic OntologyCYC, WordNet, EDR…PSMTask Ontology
�� ����������
��Web����
• 95-97: XML as arbitrary
structures
• 97-98: RDF
• 98-99: RDFS (schema) as a
frame-like system
• 00-01: DAML+OIL
• 02-07: OWL
OWL�����
• On-To-Knowledge � OIL ���
• ��EU���� ����� OIL���
• DAML�����OIL����
• ��� DAML+OIL
• ��� DAML+OIL
• W�C� DAML+OIL ���
• WebOnt Working Group ���
! OWL "#$�
���’��
���’��
��’��
��’��
���’�
���’�
���’�
���’��
���’��
��’��
��’��
���’�
���’�
���’�
3
RDF�S)�OWL���
• class-def• subclass-of• slot-def• subslot-of• domain• range
• class-def• subclass-of• slot-def• subslot-of• domain• range
• class-expressions• AND, OR, NOT
• slot-constraints• has-value, value-type• cardinality
• slot-properties• trans, symm
• class-expressions• AND, OR, NOT
• slot-constraints• has-value, value-type• cardinality
• slot-properties• trans, symm
RDF(S)DAML+OILDAML+OIL
��OWLOWL
Keyword URI
academic department http://www.cs.umd.edu/projects/plus/DAML/onts/cs1.0.daml
academic department http://www.cs.umd.edu/projects/plus/DAML/onts/cs1.1.daml
Academic Positionshttp://www.daml.ri.cmu.edu/ont/homework/cmu-ri-employmenttypes-
ont.daml
access control
primitiveshttp://www.w3.org/2000/10/swap/pim/doc.rdf
acronym http://orlando.drc.com/daml/Ontology/Thesaurus/CALL/current/
activity http://www.kestrel.edu/DAML/2000/12/OPERATION.daml
Actors http://opencyc.sourceforge.net/daml/cyc.daml
Actors http://www.cyc.com/2002/04/08/cyc.daml
Actors http://www.cyc.com/cyc-2-1/cyc-vocab.daml
address book http://www.w3.org/2000/10/swap/pim/contact.rdf
agenda http://www.daml.org/2001/10/agenda/agenda-ont
DAML Ontology Library (Ontology's by Keyword)
http://www.daml.org/ontologies/keyword.html
4
�������� �� ������������������������������� �������� ��������� �!�� �������������������������������"����#�$� �!�� ��$����
��������$��% �����%�&'��$���$��� �!�� ������������������"������(((����������� )����� �!�� ���� ��������������"����������������� %��� �*!
�����+������) �������&����*!���� �%����*�� ���������� �%����*!���� �%����*�� �����!�������)����� �%����*!
�����,�� $��-���*�����������,�� $��-���*!������+������)*!���� �.�� �������&�������������������������������� �������� ��������� /� �0�� ��1�
���� ������*/� �0�� ��1������� ������*!���� �%����*����� �%����*!��$����%����$������*���22���!�3�����������$����%����$������*!
���� � &�.�� +�*!���� �.�� �������&�������������������������������� �������� ��������� 1���*����� �.�� *!����� � &�.�� +�*!����� �.�� *!
���� �.�� �������&�������������������������������� �������� ��������� -��$���*!���� ������*-��$������� ������*!
���� �%����*����� �%����*!��$����%����$������*������4(!�3�����������$����%����$������*!���� � &�.�� +�*!
���� �.�� �������&�������������������������������� �������� ��������� 5��������6,����*����� �.�� *!����� � &�.�� +�*
���� � &�.�� +�*!������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� �&����*
��������/������)*!�������.�� *!���� �.�� �������&��� ������������"�����7��� %������ ��$���*����� �.�� *!��������.�� *
�������� ��$%�$��*!����� � &�.�� +�*!����� �.�� *!���� �.�� �������&�������������������������������� �������� ��������� 8���&��*
���� ������*8���&������ ������*!���� �%����*����� �%����*!��$����%����$������*���"2�"�!�3�����������$����%����$������*!
���� � &�.�� +�*!������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� �$,$ $���*��������/������)*!
�������.�� *!���� �.�� �������&�������������������������������� �������� ��������� �$,$ $���*����� �.�� *!��������.�� *!�������� ��$%�$��*!
����� � &�.�� +�*!����� �.�� *!���� �.�� �������&�������������������������������� �������� ��������� /�� ���*!
���� ������*/�� ������� ������*!���� �%����*����� �%����*!��$����%����$������*�"�����"!�3�����������$����%����$������*!����� �.�� *!
���� �.�� �������&�������������������������������� �������� ��������� /��)���*!���� ������*/��)������� ������*!���� �%����*����� �%����*!
��$����%����$������*����2�4�!�3�����������$����%����$������*!
���� � &�.�� +�*!���� �.�� �������&�������������������������������� �������� ��������� 6���)���*����� �.�� *!����� � &�.�� +�*!����� �.�� *
���� �.�� �������&�������������������������������� �������� ��������� ���$���*!���� ������*���$������� ������*!���� �%����*����� �%����*!
��$����%����$������*���"���"!�������������$����%����$������*!���� � &�.�� +�*!
���� �.�� �������&�������������������������������� �������� ��������� 8$��&�6,����*����� �.�� *!����� � &�.�� +�*!����� �.�� *!
���� �.�� �������&�������������������������������� �������� ��������� 0�� ���*!
���� ������*0�� ������� ������*!���� �%����*����� �%����*!��$����%����$������*����"��4!�3�����������$����%����$������*!���� � &�.�� +�*!
������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� )����*��������/������)*!�������.�� *!
���� �.�� �������&��� ������������"�����7��� %������ ��$���*����� �.�� *!��������.�� *!�������� ��$%�$��*!����� � &�.�� +�*
����� �.�� *!���� �.�� �������&�������������������������������� �������� ��������� 0��$� �*!
���� ������*0��$� ����� ������*!���� �%����*����� �%����*!��$����%����$������*���23��2!�3�����������$����%����$������*!���� � &�.�� +�*
������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� ����*��������/������)*!
�������.�� ������ �&�%�������������������������������� �������� ��������� 7����*!�������� ��$%�$��*!����� � &�.�� +�*!���� � &�.�� +�*!
������� ��$%�$��*!�������/������) ������ �&�%�������������������������������� �������� ��������� ���)�*��������/������)*!�������.��
Baseball Ontology
����������
�� �������(�����
5
IssueIssue ApproachApproach
A ProcessA Process--Centered Software Engineering Centered Software Engineering
Environment Using OntologiesEnvironment Using Ontologies
GoalGoal
Real software processes
change dynamically...
need the facility to correspond
to changing process dynamically
very difficult to maintain
develop software process ontologies
through the domain analysis using
two case studies
First,
Afterwards,design the system which generate
software processes interactively
with a user
Development of Software Process Ontologies
Step1. Extract real software processes and objects from
the two cases
InventInvent
JoinJoin
AppendAppend
ExtractExtract
C
A+BA
B
inputinput
referencereference
Process
B’or
A’
A��
+
outputoutput
Step2. Organize extracted processes and objects into distinct
groups such that there are more similarity in meaning,
while defining the software process scheme
Step3. Give detailed definitions to each processes
using software process scheme
6
activityactivity
InventInvent
JoinJoin
AppendAppend
ExtractExtract
Invent with referencesInvent with references
Invent without referencesInvent without references
Join without referencesJoin without references
Extract without referencesExtract without references
Join with referencesJoin with references
Extract with referencesExtract with references
EvaluateEvaluate
ReviewReview
ExamineExamine
Focus on input,output,
and reference roles
Focus on input,output,
and reference rolesFocus on reference,
tool and agent roles
Focus on reference,
tool and agent roles
Process OntologyProcess Ontology
Software Process Ontologies(conceptual hierarchy)
Object Ontology including
about 400 concepts
Process Ontology including
about 250 concepts
7
Process Ontology Object Ontology
Goal
Object
Goal
Object��
��
��
��
��Start
Object
Start
Object
Retrieve processes
satisfied with constraints
Software Process Automation
using ontologies
8
A query about S�P
What SEP between the following input and output ?What SEP between the following input and output ?
Input : Requirement Specification from
S/W Subsystems
Output : Detailed Design of Each Component of
S/W Subsystems
Case Study
Initial Software Process Plan CandidatesInitial Software Process Plan Candidates
Requirement
Specification
from
S/W Subsystems
Detailed Design of
Each Components of
S/W Subsystems
Design Basic
Components of
S/W Subsystems
Design Basic
Components of
I/F Subsystems
Design Logical
Aspects of DB
Review All
Basic Designs
Together
Evaluate All
Basic DesignsDesign Physical
Aspects of DB
Specify Testing
S/W Integration
Design Detailed
Components of
S/W Subsystems
Design Detailed
Components of
I/F Subsystems
Specify Testing
Units of S/W
Evaluate All
Detailed Designs
Review All
Detailed Designs
Together
OutputOutput
InputInput
9
Interim Software Process Plan CandidatesInterim Software Process Plan Candidates
Requirement
Specification
from
S/W Subsystems
Detailed Design of
Each Components of
S/W Subsystems
Design Basic
Components of
S/W Subsystems
Design Basic
Components of
I/F Subsystems
Design Logical
Aspects of DB
Evaluate All
Basic DesignsDesign Physical
Aspects of DB
Specify Testing
S/W Integration
Design Detailed
Components of
S/W Subsystems
Design Detailed
Components of
I/F Subsystems
Specify Testing
Units of S/W
Evaluate All
Detailed Designs
Review All
Detailed Designs
Together
OutputOutput
InputInput
Final Software Process Plan CandidatesFinal Software Process Plan Candidates
Requirement
Specification
from
S/W Subsystems
Detailed Design of
Each Components of
S/W Subsystems
Design Basic
Components of
S/W Subsystems
Design Basic
Components of
I/F Subsystems
Design Logical
Aspects of DB
Evaluate All
Basic DesignsDesign Physical
Aspects of DB
Specify Testing
S/W Integration
Design Detailed
Components of
S/W Subsystems
Design Detailed
Components of
I/F Subsystems
Specify Testing
Units of S/W
Evaluate All
Detailed Designs
Review All
Detailed Designs
Together
OutputOutput
InputInput
10
Evaluation
Issues and Future work
•The environment can’t allocate human and time resource
•The environment has not the facility that supports the user
to add user’s specific processes
•The methodology for building ontologies has no theoretical
aspects,such as soundness
Applicability
It turned out that the environment generated SPP candidates
good for the user’s query with user interaction
��������
�� ��������� �����(������
11
How to Build up Domain
Ontologies with Less Cost
• Taking Existing Information Resources
DODDLE Project(a Domain Ontology rapiD DeveLopment Environment)
exploiting a MRD
Constructing up just a conceptual hierarchy
Why not taking MRD
to build up domain ontologies ?
• Good News:
MRD have many concepts.
• Bad News:
The concepts have been defined from the
point of natural language processing
(common sense) and so there are some
concept drift between MRD and specific
domain ontologies.
12
����������������������������
Concept Drift
���������
�� ���������
������ �������������� �����������������
�������������� �����
����� ��������������
����� �����
������������� �������������� �
Domain
Expert
Extension of Modification
•������������ ������
•Trimmed- Results Analysis
������������
��������
������� ��
������������������
����������������������
�������
DODDLEDODDLE
13
Best-Match
Internal Node
Root
��������
����
��������
Matched-Results Analysis
A
B C
D
����������
���� �����
00
3
B C D
������������
A
B C
A���������������
����� �����
D
Trimmed-Results Analysis
14
Acquiring not only Conceptual
Hierarchy but Concept Definitions
DODDLE II Project(Extending DODDLE)
Info. Resource:Domain-Specific Texts
Technique: Co-occurence information
WordSpace
15
������������
��� ��������
��������
��� ��������
��������
��� �������
������ ���
������
�����������������
�������
�����������������
�������
���������������� �����
WordNet
���
DODDLEDODDLE--IIII
OverviewOverview
�������������
���
�������������
���
������
�����
������������
��� �������
��������
������
���� �������������������� ����������������
• Words and phrases in texts can be expressed by
vector representation containing co-occurrence statistics
Extracting Concept Relationships
from Domain-Specific Texts
WordSpace �Marti A. Hearst, Hinrich Schutze�
… �� … �� …�� … �� …
… �� … �� …�� … �� …
�������������� ����������������� ������
• Inner products among the vectors work as
the similarity between the words and phrases.
high value with similar words
coming up around the concepts
16
A sum of w in Texts
A sum of W in same synset
Constructing WordSpace������������������������ � �� �!��"#���
$������������������
%��������&�������������&������'�WordSpace ���������!������(������)
*��&��������������������!������������
…
.. f8 f4 f3 f7 f8
f4 f1 f3 f8 f9 f2
f5 f1 f7 f1 f5 ..
…
…
.. f8 f4 f3 f7 f8
f4 f1 f3 f4 f9 f2
f5 f1 f7 f1 f5 ..
…
Collocation Matrix
���������� �������� ��
��
��
��
����
�� �
…
…
��
��
w
w
Texts (4-gram array) Texts (4-gram array) Texts (4-gram vector array)
Vector representation
for each 4-gram
…
.. f8 f4 f3 f7 f8
f4 f1 f3 f4 w f2
f5 f1 f7 f1 f5 ..
…
A sum of 4-gram vectors around w
WordNet synset
w1
w3
w2
w4
C
Word Vector W
Context vector w
Vector representation of a concept C
��������������� �����������
����non-TAXONOMY?
����non-TAXONOMY?
����TAXONOMY
����non-TAXONOMY?
������������������ �������
��
Constructing
Concept Specification Template
�� ��
�� ��
�� ��
�� ��
����������������� ������������������� ��
��������������������� ��������������� ��������
��
��
��
�������������������� �� �
������ ������ ��� �������� ������ ��� ��
����������� � � ������������������� � � ��������
17
DODDLEDODDLE--IIIIalphaalpha on Perl/Tkon Perl/Tk ((UNIX UNIX platformplatform))
The Target Domain
Contracts for the International Sale of Goods(CISG)
The Target Domain
Contracts for the International Sale of Goods(CISG)
A Case Study
Input Terms to TR module
46 Legal Terms from CISG Part-II
Domain-Specific Texts to NonTR module
full text of CISG (about 10,000 words)
18
Results
46Terms
The paths from Spell Matched Nodes
to the Root of WordNet
Trimmed Model Legal Ontology
Trimming
Initial Model
56Terms 61Terms
377Terms113Terms
Select Best Matches
Modification
Taxonomic Relationships for input terms
constructed from TR Acquisition Module
19
Support ratio: Support ratio: How match is included in final domain ontology
the intermediate products at each DODDLE activity.
���
����
����
����
����
����
����
���
���
����
�����
������������
��
����������� �� �������������
���
�� ����������
�� ���
�� ����������
�� ���
�������� ��
��������������
� ������������������� ������������� ������� ��������
������� �������� !"�����#"$�% ������������� &''#�#"$�% ���������(��
Support Ratio
Extracting
Concept Relationships
8Extraction frequency of 4-gram (times)
60Context scope (4-grams)
10Collocation scope (4-grams)
setting value for WordSpace
the concept pairs extracted according to context similarity (threshold 0.9993)
20
Domain Experts Modifying
Concept Specification Templates
������
: proposalTAXONOMY
: timenon-TAXONOMY?
: withdrawalnon-TAXONOMY?
: offereenon-TAXONOMY?
: personnon-TAXONOMY?
: offernon-TAXONOMY?
: effectnon-TAXONOMY?
: actTAXONOMY
: offerornon-TAXONOMY?
���������� ��������������
������
�������������������������
�������������
ex) non-Taxonomic Relationships for “assent”
: offerLEGAL-SEQUENCE
: personAGENT
: withdrawalANTONYM
�������������
��������������� ������������������� ����������
�����������������������
����������������������� ����������
���������������������
Recall & Precision
of Concept Specification Templates
recall
precision
The number of extracted concept pairs
21
Conclusions
DODDLE II: A Domain Ontology Construction Support
Environment using MRD and Domain-Specific Texts
Legal experts appreciate DODDLE II to some extent.
•How to Decide Threshold for CS
• How to Identify NTR
•Another DM method instead of WordSpace
• Another Case Studies with Large Scale
Future WorkFuture Work
OWL��������
• OWL��������
UML���� ���
• OWL�RDF(S)�RDF
������������
• ����������������
• ������� !"#�$%&'(