thuyết trình hệ cơ sở dữ liệu phân tán

41
Các thành viên nhóm 1 Họ và Tên MSSV Mai Lê Bảo Nguyên 51202448 Nguyễn Thiên Nam 51202275 Phan Thành Nhân 51202539 Tô Tuấn Nghĩa 51202382

Upload: bhtv28

Post on 29-Jun-2015

388 views

Category:

Data & Analytics


1 download

DESCRIPTION

bài thuyết trình trên lớp về hệ cơ sở dữ liệu phân tán

TRANSCRIPT

Page 1: Thuyết trình Hệ cơ sở dữ liệu phân tán

1

Các thành viên nhómHọ và Tên MSSV

Mai Lê Bảo Nguyên 51202448

Nguyễn Thiên Nam 51202275

Phan Thành Nhân 51202539

Tô Tuấn Nghĩa 51202382

Page 2: Thuyết trình Hệ cơ sở dữ liệu phân tán

2

HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN

ĐỀ TÀI

Page 3: Thuyết trình Hệ cơ sở dữ liệu phân tán

3

I. Các khái niệm

Cơ sở dữ liệu phân tán là tập hợp nhiều cơ sở dữ liệu có liên quan luận lý với nhau được phân tán qua một mạng máy tính, còn hệ quản trị cơ sở dữ liệu phân tán là một phần mềm hệ thống quản lý cơ sở dữ liệu phân tán và làm dữ liệu minh bạch, rõ ràng cho người dùng.

Khái niệm CSDL phân tán

Page 4: Thuyết trình Hệ cơ sở dữ liệu phân tán

4

Sự kết nối các nút cơ sở dữ liệu thông qua một mạng máy tính

Sự tương quan luận lý của các cơ sở dữ liệu kết nối

Không có sự đồng bộ bắt buộc giữa các trạm kết nối với nhau

Sự khác nhau đối với hệ thống đa xử lý

Page 5: Thuyết trình Hệ cơ sở dữ liệu phân tán

5

Khái niệm “trong suốt” được mở rộng từ ý tưởng chung của việc che giấu chi tiết việc thực thi hoạt động khỏi người dùng cuối cùng.

Tính trong suốt

Page 6: Thuyết trình Hệ cơ sở dữ liệu phân tán

6

Các dạng trong suốt

Tổ chức dữ liệu trong suốt

Tổ chức

Trong suốt về nhân bản

Nhân bản

Trong suốt phân đoạn

Phân đoạn

Page 7: Thuyết trình Hệ cơ sở dữ liệu phân tán

7

Sự tự quản quyết định mức độ các trạm độc lập hay cơ sở dữ liệu trong kết nối với cơ sở dữ liệu phân tán có thể tổ hoạt động một các độc lập. Sự tự quản cấp cao giúp tăng sự linh hoạt và tùy chỉnh trong bảo trì một trạm độc lập. Sự tự quản có thể ứng dụng cho thiết kế, giao tiếp và thực thi.

Sự tự quản

Page 8: Thuyết trình Hệ cơ sở dữ liệu phân tán

8

Độ tin cậy và tính sẵn sàng là hai trong số ưu điểm tiềm năng phổ biết nhất của cơ sở dữ liệu phân tán. Độ tin cậy được định nghĩa là sự chắc chắn khi hệ thống hoạt động ở một thời điểm, trong khi tính sẵn sàng là sự chắc chắn khi hệ thống sẵn sàng trong một khoảng thời gian.

Độ tin cậy và tính sẵn sàng

Page 9: Thuyết trình Hệ cơ sở dữ liệu phân tán

9

Ưu điểm của CSDL phân tán

1

2

3

4

Cải thiện sự dễ dàng và linh hoạt trong

phát triển ứng dụng

Tăng độ tin cậy và tính sẵn sàng

Cải thiện hiệu suất

Dễ dàng mở rộng

Page 10: Thuyết trình Hệ cơ sở dữ liệu phân tán

10

Các hàm

bổ sung

của C

SDL phân tá

n

Keeping track of data distributeion. Distributed query processingDistributed transaction managementReplicated data managementDistributed databse recoverySecurityDistributed directory (catalog) management

Page 11: Thuyết trình Hệ cơ sở dữ liệu phân tán

11

Các dạng CSDL phân tán

Hệ cơ sở dữ liệu tập trung truyền thống

Hệ cơ sở dữ liệu phân tán thuần nhất

Hệ cơ sở dữ liệu liên kết

Hệ đa cơ sở dữ liệu

Page 12: Thuyết trình Hệ cơ sở dữ liệu phân tán

12

Kiến trúc song song và kiến trúc phân tánKiến trúc chung của CSDL phân tán thuần nhấtKiến trúc giản đồ CSDL liên kết

Kiến trúc CSDL phân tán

Page 13: Thuyết trình Hệ cơ sở dữ liệu phân tán

13

Phân mảnh dữ liệu

Dữ liệu nào chứa ở trạm nào?

Page 14: Thuyết trình Hệ cơ sở dữ liệu phân tán

14

Phân mảnh dữ liệu

1. Phân mảnh ngangTập hợp các tupleXác định bằng phép CHỌN trong ĐSQH

2. Phân mảnh dọcTập hợp các thuộc tínhXác định bằng phép CHIẾU

3. Phân mảnh hỗn hợpKết hợp 2 loại trên

Page 15: Thuyết trình Hệ cơ sở dữ liệu phân tán

15

1. Phân mảnh ngangTập hợp các tupleXác định bằng phép CHỌN trong ĐSQH

Phân mảnh dữ liệu

Page 16: Thuyết trình Hệ cơ sở dữ liệu phân tán

16

Mỗi phân mảnh chứa một số thuộc tính của quan hệ

Có thể dùng phép chiếu trong ĐSQH

2. Phân mảnh dọcTập hợp các thuộc tínhXác định bằng phép CHIẾU

Phân mảnh dữ liệu

Page 17: Thuyết trình Hệ cơ sở dữ liệu phân tán

17

3. Phân mảnh hỗn hợpKết hợp 2 loại trên

Phân mảnh dữ liệu

Page 18: Thuyết trình Hệ cơ sở dữ liệu phân tán

18

Nhân bản

Sao chép dữ liệu và lưu ở nhiều trạm

Page 19: Thuyết trình Hệ cơ sở dữ liệu phân tán

19

Nhân bản

Ưu điểm Nhược điểm

Sự cố xảy ra ở một trạm chứa r không làm cho r mất trên toàn bộ DBS

Chi phí cao hơn

Nhiều trạm có thể truy vấn r song song

Cập nhật dữ liệu khó khăn hơn

Giảm chi phí truyền dữ liệu

Page 20: Thuyết trình Hệ cơ sở dữ liệu phân tán

20

TRUY VẤN TRONG CSDL PHÂN TÁN

QUERY PROCESSING OPTIMIZATION

IN DDBS

Page 21: Thuyết trình Hệ cơ sở dữ liệu phân tán

21

1. Xử lí truy vấn phân tán

Query mapping Localization

Global Query Optimization

Local Query Optimization

Page 22: Thuyết trình Hệ cơ sở dữ liệu phân tán

22

2. Chi phí truyền dữ liệu

Page 23: Thuyết trình Hệ cơ sở dữ liệu phân tán

23

Chiến lược dùng JOIN

Di chuyển tất cả

Chỉ lấy khi cần

Semijoins

Bloomjoins

Cách nào tốt?

2. Chi phí truyền dữ liệu

Page 24: Thuyết trình Hệ cơ sở dữ liệu phân tán

24

Di chuyển tất cả: truyền toàn bộ quan hệ

Phép kết theta R và S

2. Chi phí truyền dữ liệu

Page 25: Thuyết trình Hệ cơ sở dữ liệu phân tán

25

Xử lí tại R

Gửi yêu cầu tới node S

Gửi yêu cầu đã nhận trở lại R

Chi phí: 2 tin, 18 giá trị

Gửi yêu cầu tới node R

Gửi yêu cầu đã nhận trở lại S

Xử lí tại S

Chi phí: 2 tin, 14 giá trị

2. Chi phí truyền dữ liệu

Page 26: Thuyết trình Hệ cơ sở dữ liệu phân tán

26

Cần gì lấy đó

Phép kết theta R và S

2. Chi phí truyền dữ liệu

Page 27: Thuyết trình Hệ cơ sở dữ liệu phân tán

27

Xử lí tại R

Xử lí tại S

Gửi yêu cầu (tuple của R với B = 7) tới S

Gửi dữ liệu sau khi xử lí (0 tuple của S có B = 7) tới RGửi yêu cầu (tuple của R với B = 1) tới S

Gửi dữ liệu sau khi xử lí (1 tuple của S có B = 1) tới R…

Gửi yêu cầu (tuple của S với B = 9) tới R

Gửi dữ liệu sau khi xử lí (0 tuple của R có B = 9) tới SGửi yêu cầu (tuple của S với B = 1) tới R

Gửi dữ liệu sau khi xử lí (1 tuple của R có B = 1) tới S

Chi phí: 7x2 = 14 tin, 7 + 2x3 = 13 giá trị

Chi phí: 6x2 = 12 tin, 6 + 2x2 = 10 giá trị

2. Chi phí truyền dữ liệu

Page 28: Thuyết trình Hệ cơ sở dữ liệu phân tán

28

Mỗi site được lưu một phần bản sao dữ liệu của các site khác và không có gì đảm bảo bản sao đó phải

là bản cập nhật mới nhất

Tất cả bản sao được nằm ở tất cả các site

Toàn bộ danh mục được lưu trong một site

Lặp lại một phần danh mục

Lặp lại toàn bộ danh mục

Danh mục tập trung

Quả

n lý

các

dan

h m

ục p

hân

tán

Page 29: Thuyết trình Hệ cơ sở dữ liệu phân tán

29

Xu hướng hiện tại

Cloud Computing

Peer – to – peer Datebase Systems

Page 30: Thuyết trình Hệ cơ sở dữ liệu phân tán

30

Cloud Computing

₋ Điện toán đám mây là một mô hình điện toán có khả năng co giãn linh động .

₋ Điện toán đám mây là một dạng hệ thống song song phân tán gồm nhiều máy chủ ảo khác nhau .

₋ Các tài nguyên thường được ảo hóa và được cung cấp như một dịch vụ trên mạng Internet.

Page 31: Thuyết trình Hệ cơ sở dữ liệu phân tán

31

Cloud Computing

- Các loại hình dịch vụ điện toán đám mây

+ IaaS ( Infrastructure as a Service )

+ PaaS ( Platform as a Service)

+ SaaS ( Software as a Service)

+ BPaaS ( Business Process as a Service)- Các mô hình điện toán đám mây : Privite, Public,

Hybrid

Page 32: Thuyết trình Hệ cơ sở dữ liệu phân tán

32

Cloud Computing

₋ Mặt tích cực

+ Tiết kiệm chi phí

+ Dung lượng lớn

+ Giảm thiểu rủi ro

+ Truy cập mọi lúc mọi nơi

₋ Mặt hạn chế

+ An ninh bảo mật chưa tốt

+ Người dung bị phụ thuộc vào công nghệ và chất lượng

+ Chưa có giải pháp hiệu quả khi người dùn không kết nối mạng.

Page 33: Thuyết trình Hệ cơ sở dữ liệu phân tán

33

Trong một kiến trúc không đồng nhất, có ít nhất 1 CSDL không phải là Oracle.

Trong một kiến trúc đồng nhất, cần tối thiểu 2 cơ sở dữ liệu và được lưu trữ trên 1 hoặc nhiều máy.

1 máy chủ CSDL là 1 phần mềm Oracle dùng để quản lý CSDL, và máy khách là ứng dụng yêu cầu lấy thông tin từ máy chủ.

Client-serverKhông đồng nhất

Đồng nhấtCác kiến trúc hỗ trợ

CSDL phân tán trong Oracle

Page 34: Thuyết trình Hệ cơ sở dữ liệu phân tán

34

Kiến trúc đồng nhất

₋ Ẩn giấu vị trí và nền tản của CSDL, nhưng vẫn cho biết CSDL này được lưu trữ trong mạng nội bộ hay từ những đối tượng nằm cách xa.

₋ Sử dụng chung cú pháp.

₋ Tưởng thích với nhiều phiên bản DBMSs.

Page 35: Thuyết trình Hệ cơ sở dữ liệu phân tán

35

Kiến trúc không đồng nhất

₋ Máy chủ CSDL Oracle truy cập vào CSDL không phải Oracle bằng cách sử dụng dịch vụ không đồng nhất (HS) liên kết với một tác nhân (agent).

₋ Người dùng truy cập tới CSDL không phải Oracle bằng cách sử dụng cổng có tính trong suốt của Oracle, sau đó agent là 1 ứng dụng cụ thể.

Page 36: Thuyết trình Hệ cơ sở dữ liệu phân tán

36

Dịch vụ không đồng nhất

₋ HS cung cấp kiến trúc và cơ chế quản lý chung cho các sản phẩm cổng cơ sở dữ liệu Oracle và các thiết bị truy cập không đồng nhất khác.

Page 37: Thuyết trình Hệ cơ sở dữ liệu phân tán

37

Các tác nhân cổng vào trong suốt

₋ Với mỗi HTCSDL không phải Oracle mà ta truy cập, HS có thể phải sử dụng 1 tác nhân cổng vào trong suôt để kết hợp với HTCSDL không phải Oracle đã được đinh rõ.

Page 38: Thuyết trình Hệ cơ sở dữ liệu phân tán

38

Client-server

₋ Một máy khách có thể truy xuất trực tiếp hoặc gián tiếp vào máy chủ CSDL:

₋ Trực tiếp: Máy khách kết nối với 1 máy chủ và truy cập thông tin từ CSDL được chứa trong máy chủ đó.

₋ Gián tiếp: Máy khách kết nối với 1 máy chủ và truy cập thông tin từ CSDL được chứa trong một máy chủ khác.

Page 39: Thuyết trình Hệ cơ sở dữ liệu phân tán

39

DATABASE LINKS

₋ Là một điểm trỏ đến liên kết dùng để xác định đường kết nối từ 1 máy chủ CSDL Oracle đến 1 máy chủ CSDL khác.

₋ Mỗi CSDL phải có 1 tên CSDL toàn cục duy nhất.

₋ Mỗi CSDL trong CSDL phân tán là duy nhất được xác định bởi tên CSDL toàn cục của nó. Tên này có dạng tiền tố là tên vùng mạng được xác định bởi tham số khởi tạo DB_DOMAIN trong việc tạo CSDL + với tên của CSDL được định nghĩa qua các tham số khởi tạo DB_NAME.

Page 40: Thuyết trình Hệ cơ sở dữ liệu phân tán

40

Tên của 1 CSDL được định dạng bắt đầu từ lá của cây và theo các đường dẫn tới gốc.ví dụ, CSDL mfg nằm trong nhánh ivision3 của acme_tools của vùng mạng com.tên CSDL toàn cục cho mfg được tạo ra là:mfg.division3.acme_tools.com

Page 41: Thuyết trình Hệ cơ sở dữ liệu phân tán

41

CẢM ƠN CÔ VÀ CÁC BẠN ĐÃ CHÚ Ý THEO

DÕI

HẾT