semantic web

Post on 01-Dec-2014

7.190 Views

Category:

Technology

2 Downloads

Preview:

Click to see full reader

DESCRIPTION

Presentation about semantic web

TRANSCRIPT

Semantic Web

Nội dung chính

• Giới thiệu về Semantic web

• RDF

• Từ vựng

• Truy vấn dữ liệu

• Các ứng dụng

• Kết luận

• Hỏi đáp

Giới thiệu về Semantic web

Web hiện tại và các hạn chế

• Lượng tài nguyên trên web vô cùng lớn .

• HTML chỉ trình bày thông tin chứ khôngmô tả thông tin.

• Thiếu cơ cấu hiệu quả để chia sẻ dữ liệuvì các ứng dụng được phát triển mộtcách độc lập.

=> Cần phải mở rộng thế hệ Web hiện tạiđể máy tính có thể hiểu, tích hợp dữ liệu, cũng như tái sử dụng dữ liệu thông qua các ứng dụng khác nhau.

Semantic web (Web of data)

• Semantic web là một mạng lưới thông tin được liên kết theophương pháp sao cho thông tin có thể dễ dàng được xử lý bởi cácmáy tính trên toàn cầu. Nó được xem là cách mô tả thông tin rấthiệu quả trên World Wide Web, và nó cũng được xem là một cơsở dữ liệu có khả năng liên kết toàn cầu.

• Các công nghệ Semantic Web giúp con người có thể tạo các khodữ liệu trên web, xây dựng bộ từ vựng và viết các luật để xử lý dữliệu.

Semantic web

Cho phép định nghĩa

và liên kết dữ liệu một

cách có ngữ nghĩa.

Chia sẻ dữ liệu giữa

các ứng dụng.

Thông tin sẽ do máy

tự động xử lý.

Đôi nét về cha đẻ của Semantic web

Timothy John Berners-Lee (TimBL)

sinh 08/06/1955 tại London, Anh.

WWW, URIs, HTTP, và HTML,…

Kiến trúc semantic web

Sự phát triển của web

Sự phát triển của web

Tích hợp dữ liệu thô có cấu trúc

• Đặt dữ liệu đa dạng vào một thể hiện trừu tượng.

• Hợp nhất các kết quả đó.

• Truy vấn.

Biểu diễn dữ liệu dưới dạng tập các quan hệ

Hợp nhất dữ liệu

Cơ bản về RDF

RDF(Resource Description Framework)

• RDF là nền tảng của Semantic Web và xử lý metadata, đượcđịnh nghĩa bởi W3C. RDF cho phép trao đổi thông tin giữa cácứng dụng trên Web mà máy có thể hiểu được.

• RDF là mô hình các triplets (các định dạng mà máy tính có khảnăng đọc được như RDF/XML, Turtle, N3, RDFa, Json, …)

Cấu trúc căn bản RDF triplets (RDF statements)

Gồm:

- S (subject): URI

- P (predicate): URI

- O (object): URI hoặc literal

RDF triplets trong RDF/XML

URI

• URI là nền tảng của Semantic Web. Trong khi mọi thànhphần khác của Web gần như có thể được thay thế nhưng URI thì không. URI liên hệ các thành phần của Web lại với nhau

• http://www.w3.org/Addressing/

• uuid:04b749bf-3bb2-4dba-934c-c92c56b709df

• mailto:pw2538@bristol.ac.uk

RDF Schema

• Định nghĩa bộ từ vựng của RDF:

- Các quan hệ: hasName, hasPrice, authorOf, …

- Các class, subclass

- Properties, subproperties

- Domain

- Range

- …

XML

• Cho phép tự thiết kế định dạng tài liệu và sau đó viết một tàiliệu theo định dạng đó.

• Phần cốt yếu của tài liệu XML là bộ từ vựng của các thẻ vàsự kết hợp được cho phép theo khung cố định, nhưng có thểđược xác định thông qua mỗi ứng dụng XML.

XML trong Semantic web

• XML cho phép người dùng thêm cấu trúc tùy ý cho các tàiliệu của họ nhưng không đề cập gì đến ý nghĩa của các cấutrúc. Tên các tag không cung cấp ý nghĩa.

=> Semantic Web chỉ dùng XML cho mục đích cú pháp.

RDF với HTML

Một số giải pháp:

• Sử dụng các microformat và chuyển đổi nội dung vào RDF

• Thêm các triplet vào microdata và chuyển đổi sang RDF

• Thêm các RDF triplet trực tiếp vào XHTML thông qua RDFa

=> HTML + microdata hoặc HTML + RDFa đang dần trởthành source chính của dữ liệu trên web

RDF và CSDL quan hệ

Direct Maping

R2RML

Tích hợp ứng dụng qua Linked Data

Từ vựng (Ontologies)

W3C đề xuất các công nghệ

• RDF và RDF Schema

• SKOS (Simple Knowledge Organization System)

• OWL (Web Ontology Language)

• RIF (Rule Interchange Format)

RDFS

Một số bộ từ vựng chính:

• Dublin Core: creator, date, …

• FOAF: tính cách của con người

• Good Relations: các thuật ngữ về eCommerce

• Creative Commons: các lớp về bản quyền, giấy phép

• schema.org: các sự kiện, tổ chức, địa điểm, đánh giá, …

SKOS

• Tái sử dụng các bộ từ đồng nghĩa, từ theo chuyên đề, từchuyên môn, v.v…

OWL (Web Ontology Language)

• Định nghĩa các bộ từ vựng phức tạp hơn với kiến trúc logic mạnh mẽ

• OWL phức tạp.

Một số dạng OWL

RIF (Rule Interchange Format)

• Tạo framework định nghĩa các luật trong các thuật ngữ và dữliệu.

• RIF định nghĩa một số hình thái ngôn ngữ, tiếng địaphương,..

Truy vấn dữ liệu trong RDF

SPARQL(Protocol And RDF Query Language)

• CSDL quan hệ và XML sử dụng SPARQL để truy cập dữliệu đồ thị RDF.

• SPARQL gửi câu truy vấn và nhận kết quả trả về qua giaothức HTTP và SOAP.

Tính năng của SPARQL

• Trích thông tin trong các dạng của URI, các blank node vàcác plain hay typed literals.

• Trích thông tin từ các đồ thị con.

• Xây dựng một đồ thị RDF mới dựa trên thông tin trong đồthị truy vấn.

VD câu truy vấnTa có một RDF triple sau:

<http://example.org/book/book1>

<http://purl.org/dc/elements/1.1/title> "SPARQL Tutorial" .

Câu truy vấn:

SELECT ?title

WHERE {

<http://example.org/book/book1> <http://purl.org/dc/elements/1.1/title> ?title

}

Kết quả truy vấn:

Title

"SPARQL Tutorial"

Một số cú pháp trong câu truy vấn

• Các giá trị được đặt trong dấu ‘<>’ dùng để chỉ một định danh URI.

• Các giá trị được đặt trong dấu (“ “) là các giá trị literal.

• Biến trong ngôn ngữ truy vấn có giá trị toàn cục. Biến thường bắtđầu với kí tự ‘?’ hoặc ‘$’

• …

Mô hình truy vấn SPARQL

Một số ứng dụng

Search Engine

• Các Search Engine hiện nay hầu hết đều là Keyword Search Engine.

• Nếu Search Engine được tích hợp tri thức để hiểu được ý nghĩa của các từ thì nó sẽ cho kết quả chính xác hơn. Lúc đóviệc tìm kiếm dựa trên khái niệm chứ không phải theo từkhóa.

Framework quản lý tri thức

• Thúc đẩy khả năng tìm kiếm tri thức với độ chính xác cao.

• Tăng khả năng truy cập cấu tạo các nguồn tri thức cần thiếtcho việc giải quyết một vấn đề nào đó.

Internet Agent

• Để hoàn thành công việc, các internet agent yêu cầu cáctrang Web thu thập thông tin và xử lý chúng: so sánh giá cả, tham gia đấu thầu, sắp xếp, và đăng kí công việc…

• => Tự động hóa, hiệu suất cao, giảm chi phí,…

Push System

Các hệ thống push system hiện nay sẽ phát sinh các thông tin từ Web một cách thường xuyên đến các user dựa vào profile của họ.

Tuy nhiên, hiện nay thông tin mà user nhận được thườngkhông phù hợp với yêu cầu của họ. Do đó, cần phải tích hợpsemantic để đánh giá chính xác hơn.

Relationship

Semantic Web còn được dùng để tổ chức lại các trang Web cónội dung liên quan nhau, phục vụ công việc chọn lọc và index.

Mô hình chung Semantic Web

Kết luận

Tài liệu tham khảo

• Ivan Herman, “Tutorial on Semantic Web”, W3C, 2012.

• Nguyễn Thúc Duy Anh và Nguyễn Thị Khánh Hòa, khóaluận cử nhân tin học “Nghiên cứu, tìm hiểu và xây dựng ứngdụng với Semantic Web”, ĐH KHTN, 2005.

• http://www.w3.org/standards/semanticweb/

• www.mdpi.com/journal/futureinternet

• http://www.youtube.com/watch?v=oKiXpO2rbJM

Hỏi đáp

top related