thuyết trình hệ cơ sở dữ liệu phân tán
DESCRIPTION
bài thuyết trình trên lớp về hệ cơ sở dữ liệu phân tánTRANSCRIPT
1
Các thành viên nhómHọ và Tên MSSV
Mai Lê Bảo Nguyên 51202448
Nguyễn Thiên Nam 51202275
Phan Thành Nhân 51202539
Tô Tuấn Nghĩa 51202382
2
HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN
ĐỀ TÀI
3
I. Các khái niệm
Cơ sở dữ liệu phân tán là tập hợp nhiều cơ sở dữ liệu có liên quan luận lý với nhau được phân tán qua một mạng máy tính, còn hệ quản trị cơ sở dữ liệu phân tán là một phần mềm hệ thống quản lý cơ sở dữ liệu phân tán và làm dữ liệu minh bạch, rõ ràng cho người dùng.
Khái niệm CSDL phân tán
4
Sự kết nối các nút cơ sở dữ liệu thông qua một mạng máy tính
Sự tương quan luận lý của các cơ sở dữ liệu kết nối
Không có sự đồng bộ bắt buộc giữa các trạm kết nối với nhau
Sự khác nhau đối với hệ thống đa xử lý
5
Khái niệm “trong suốt” được mở rộng từ ý tưởng chung của việc che giấu chi tiết việc thực thi hoạt động khỏi người dùng cuối cùng.
Tính trong suốt
6
Các dạng trong suốt
Tổ chức dữ liệu trong suốt
Tổ chức
Trong suốt về nhân bản
Nhân bản
Trong suốt phân đoạn
Phân đoạn
7
Sự tự quản quyết định mức độ các trạm độc lập hay cơ sở dữ liệu trong kết nối với cơ sở dữ liệu phân tán có thể tổ hoạt động một các độc lập. Sự tự quản cấp cao giúp tăng sự linh hoạt và tùy chỉnh trong bảo trì một trạm độc lập. Sự tự quản có thể ứng dụng cho thiết kế, giao tiếp và thực thi.
Sự tự quản
8
Độ tin cậy và tính sẵn sàng là hai trong số ưu điểm tiềm năng phổ biết nhất của cơ sở dữ liệu phân tán. Độ tin cậy được định nghĩa là sự chắc chắn khi hệ thống hoạt động ở một thời điểm, trong khi tính sẵn sàng là sự chắc chắn khi hệ thống sẵn sàng trong một khoảng thời gian.
Độ tin cậy và tính sẵn sàng
9
Ưu điểm của CSDL phân tán
1
2
3
4
Cải thiện sự dễ dàng và linh hoạt trong
phát triển ứng dụng
Tăng độ tin cậy và tính sẵn sàng
Cải thiện hiệu suất
Dễ dàng mở rộng
10
Các hàm
bổ sung
của C
SDL phân tá
n
Keeping track of data distributeion. Distributed query processingDistributed transaction managementReplicated data managementDistributed databse recoverySecurityDistributed directory (catalog) management
11
Các dạng CSDL phân tán
Hệ cơ sở dữ liệu tập trung truyền thống
Hệ cơ sở dữ liệu phân tán thuần nhất
Hệ cơ sở dữ liệu liên kết
Hệ đa cơ sở dữ liệu
12
Kiến trúc song song và kiến trúc phân tánKiến trúc chung của CSDL phân tán thuần nhấtKiến trúc giản đồ CSDL liên kết
Kiến trúc CSDL phân tán
13
Phân mảnh dữ liệu
Dữ liệu nào chứa ở trạm nào?
14
Phân mảnh dữ liệu
1. Phân mảnh ngangTập hợp các tupleXác định bằng phép CHỌN trong ĐSQH
2. Phân mảnh dọcTập hợp các thuộc tínhXác định bằng phép CHIẾU
3. Phân mảnh hỗn hợpKết hợp 2 loại trên
15
1. Phân mảnh ngangTập hợp các tupleXác định bằng phép CHỌN trong ĐSQH
Phân mảnh dữ liệu
16
Mỗi phân mảnh chứa một số thuộc tính của quan hệ
Có thể dùng phép chiếu trong ĐSQH
2. Phân mảnh dọcTập hợp các thuộc tínhXác định bằng phép CHIẾU
Phân mảnh dữ liệu
17
3. Phân mảnh hỗn hợpKết hợp 2 loại trên
Phân mảnh dữ liệu
18
Nhân bản
Sao chép dữ liệu và lưu ở nhiều trạm
19
Nhân bản
Ưu điểm Nhược điểm
Sự cố xảy ra ở một trạm chứa r không làm cho r mất trên toàn bộ DBS
Chi phí cao hơn
Nhiều trạm có thể truy vấn r song song
Cập nhật dữ liệu khó khăn hơn
Giảm chi phí truyền dữ liệu
20
TRUY VẤN TRONG CSDL PHÂN TÁN
QUERY PROCESSING OPTIMIZATION
IN DDBS
21
1. Xử lí truy vấn phân tán
Query mapping Localization
Global Query Optimization
Local Query Optimization
22
2. Chi phí truyền dữ liệu
23
Chiến lược dùng JOIN
Di chuyển tất cả
Chỉ lấy khi cần
Semijoins
Bloomjoins
Cách nào tốt?
2. Chi phí truyền dữ liệu
24
Di chuyển tất cả: truyền toàn bộ quan hệ
Phép kết theta R và S
2. Chi phí truyền dữ liệu
25
Xử lí tại R
Gửi yêu cầu tới node S
Gửi yêu cầu đã nhận trở lại R
Chi phí: 2 tin, 18 giá trị
Gửi yêu cầu tới node R
Gửi yêu cầu đã nhận trở lại S
Xử lí tại S
Chi phí: 2 tin, 14 giá trị
2. Chi phí truyền dữ liệu
26
Cần gì lấy đó
Phép kết theta R và S
2. Chi phí truyền dữ liệu
27
Xử lí tại R
Xử lí tại S
Gửi yêu cầu (tuple của R với B = 7) tới S
Gửi dữ liệu sau khi xử lí (0 tuple của S có B = 7) tới RGửi yêu cầu (tuple của R với B = 1) tới S
Gửi dữ liệu sau khi xử lí (1 tuple của S có B = 1) tới R…
…
Gửi yêu cầu (tuple của S với B = 9) tới R
Gửi dữ liệu sau khi xử lí (0 tuple của R có B = 9) tới SGửi yêu cầu (tuple của S với B = 1) tới R
Gửi dữ liệu sau khi xử lí (1 tuple của R có B = 1) tới S
Chi phí: 7x2 = 14 tin, 7 + 2x3 = 13 giá trị
Chi phí: 6x2 = 12 tin, 6 + 2x2 = 10 giá trị
2. Chi phí truyền dữ liệu
28
Mỗi site được lưu một phần bản sao dữ liệu của các site khác và không có gì đảm bảo bản sao đó phải
là bản cập nhật mới nhất
Tất cả bản sao được nằm ở tất cả các site
Toàn bộ danh mục được lưu trong một site
Lặp lại một phần danh mục
Lặp lại toàn bộ danh mục
Danh mục tập trung
Quả
n lý
các
dan
h m
ục p
hân
tán
29
Xu hướng hiện tại
Cloud Computing
Peer – to – peer Datebase Systems
30
Cloud Computing
₋ Điện toán đám mây là một mô hình điện toán có khả năng co giãn linh động .
₋ Điện toán đám mây là một dạng hệ thống song song phân tán gồm nhiều máy chủ ảo khác nhau .
₋ Các tài nguyên thường được ảo hóa và được cung cấp như một dịch vụ trên mạng Internet.
31
Cloud Computing
- Các loại hình dịch vụ điện toán đám mây
+ IaaS ( Infrastructure as a Service )
+ PaaS ( Platform as a Service)
+ SaaS ( Software as a Service)
+ BPaaS ( Business Process as a Service)- Các mô hình điện toán đám mây : Privite, Public,
Hybrid
32
Cloud Computing
₋ Mặt tích cực
+ Tiết kiệm chi phí
+ Dung lượng lớn
+ Giảm thiểu rủi ro
+ Truy cập mọi lúc mọi nơi
₋ Mặt hạn chế
+ An ninh bảo mật chưa tốt
+ Người dung bị phụ thuộc vào công nghệ và chất lượng
+ Chưa có giải pháp hiệu quả khi người dùn không kết nối mạng.
33
Trong một kiến trúc không đồng nhất, có ít nhất 1 CSDL không phải là Oracle.
Trong một kiến trúc đồng nhất, cần tối thiểu 2 cơ sở dữ liệu và được lưu trữ trên 1 hoặc nhiều máy.
1 máy chủ CSDL là 1 phần mềm Oracle dùng để quản lý CSDL, và máy khách là ứng dụng yêu cầu lấy thông tin từ máy chủ.
Client-serverKhông đồng nhất
Đồng nhấtCác kiến trúc hỗ trợ
CSDL phân tán trong Oracle
34
Kiến trúc đồng nhất
₋ Ẩn giấu vị trí và nền tản của CSDL, nhưng vẫn cho biết CSDL này được lưu trữ trong mạng nội bộ hay từ những đối tượng nằm cách xa.
₋ Sử dụng chung cú pháp.
₋ Tưởng thích với nhiều phiên bản DBMSs.
35
Kiến trúc không đồng nhất
₋ Máy chủ CSDL Oracle truy cập vào CSDL không phải Oracle bằng cách sử dụng dịch vụ không đồng nhất (HS) liên kết với một tác nhân (agent).
₋ Người dùng truy cập tới CSDL không phải Oracle bằng cách sử dụng cổng có tính trong suốt của Oracle, sau đó agent là 1 ứng dụng cụ thể.
36
Dịch vụ không đồng nhất
₋ HS cung cấp kiến trúc và cơ chế quản lý chung cho các sản phẩm cổng cơ sở dữ liệu Oracle và các thiết bị truy cập không đồng nhất khác.
37
Các tác nhân cổng vào trong suốt
₋ Với mỗi HTCSDL không phải Oracle mà ta truy cập, HS có thể phải sử dụng 1 tác nhân cổng vào trong suôt để kết hợp với HTCSDL không phải Oracle đã được đinh rõ.
38
Client-server
₋ Một máy khách có thể truy xuất trực tiếp hoặc gián tiếp vào máy chủ CSDL:
₋ Trực tiếp: Máy khách kết nối với 1 máy chủ và truy cập thông tin từ CSDL được chứa trong máy chủ đó.
₋ Gián tiếp: Máy khách kết nối với 1 máy chủ và truy cập thông tin từ CSDL được chứa trong một máy chủ khác.
39
DATABASE LINKS
₋ Là một điểm trỏ đến liên kết dùng để xác định đường kết nối từ 1 máy chủ CSDL Oracle đến 1 máy chủ CSDL khác.
₋ Mỗi CSDL phải có 1 tên CSDL toàn cục duy nhất.
₋ Mỗi CSDL trong CSDL phân tán là duy nhất được xác định bởi tên CSDL toàn cục của nó. Tên này có dạng tiền tố là tên vùng mạng được xác định bởi tham số khởi tạo DB_DOMAIN trong việc tạo CSDL + với tên của CSDL được định nghĩa qua các tham số khởi tạo DB_NAME.
40
Tên của 1 CSDL được định dạng bắt đầu từ lá của cây và theo các đường dẫn tới gốc.ví dụ, CSDL mfg nằm trong nhánh ivision3 của acme_tools của vùng mạng com.tên CSDL toàn cục cho mfg được tạo ra là:mfg.division3.acme_tools.com
41
CẢM ƠN CÔ VÀ CÁC BẠN ĐÃ CHÚ Ý THEO
DÕI
HẾT