- 1 -
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN -------***-------
B ÁO C ÁO KHOA H ỌC
Chuyên đề: Xử lí song song
Đề tài: Thuật toán nhánh cận trên môi trường song song
Giáo viên hướng dẫn : Th.s Đỗ Trung Kiên
Sinh viên thực hiện : Nguyền Thị Bích Nhật
Phạm Thị Thuỳ
Trần Thị Thanh Tâm
Bùi Thu Hường
Trần Thị Hoa
Nguyễn Chí Công
Hà Nội, 15/04/2008
- 2 -
MỤC LỤC Chương 1 : TỔNG QUAN VỀ THUẬT TOÁN NHÁNH CẬN....................................................... - 3 -
1.1. Thuật toán nhánh cận ........................................................................................................... - 3 -
1.2. Một số ví dụ cụ thể áp dụng thuật toán nhánh cận ................................................................. - 5 -
Chương 2 : XÂY DỰNG KHUNG THUẬT TOÁN NHÁNH CẬN ............................................... - 7 -
* Nhóm các lớp yêu cầu .......................................................................................................... - 8 -
* Nhóm các lớp cung cấp ...................................................................................................... - 10 -
2.1. Xây dựng khung nhánh cận ................................................................................................ - 12 -
2.1.1. Cấu trúc dữ liệu ........................................................................................................... - 12 -
2.1.2. Thuật toán ................................................................................................................... - 12 -
2.2. Xây dựng khung nhánh cận tuần tự..................................................................................... - 15 -
2.3. Xây dựng khung nhánh cận song song ................................................................................ - 16 -
2.3.1. Lược đồ song song dữ liệu tập trung ............................................................................ - 19 -
2.3.2. Lược đồ song song dữ liệu phân tán............................................................................. - 22 -
2.4. Công cụ phát triển hệ thống ................................................................................................ - 25 -
2.5. Lựa chọn mô hình phát triển hệ thống................................................................................. - 25 -
Chương 3 : SỬ DỤNG THUẬT TOÁN NHÁNH CẬN ĐỂ GIẢI QUYẾT BÀI TOÁN TSP ........ - 27 -
* Bài toán TSP (Bài toán người du lịch) .................................................................................... - 27 -
3.1. Giới thiệu bài toán.............................................................................................................. - 27 -
3.2. Định nghĩa bài toán ............................................................................................................ - 27 -
3.3. Sử dụng thuật toán nhánh cận để giải bài toán TSP............................................................. - 28 -
3.4. Chương trình thực thi ......................................................................................................... - 32 -
- 3 -
Chương 1 : TỔNG QUAN VỀ THUẬT TOÁN
NHÁNH CẬN
Thuật toán nhánh cận là phương pháp chủ yếu để giải các bài toán tối ưu tổ hợp. Ta sẽ
thực hiện việc đánh giá theo từng bước, nếu không có khả năng tìm thấy kết quả tốt hơn
thì sẽ cắt nhánh đó, không thực hiện tìm tiếp mà chuyển ngay sang nhánh khác. Khi đó,
chỉ ghi nhận các kết quả tốt hơn lúc ban đầu. Nghiệm của bài toán sẽ tốt dần lên do khi
tìm ra kết quả tốt hơn ta sẽ cập nhật lại giá trị hiện thời của bài toán.
1.1. Thuật toán nhánh cận
Một trong những bài toán đặt ra trong thực tế là tìm một nghiệm của bài toán thỏa
mãn một số điều kiện nào đó và nghiệm đó là tốt nhất theo một tiêu chí cụ thể, nghiên
cứu lời giải các bài toán tối ưu thuộc về lĩnh vực quy hoạch toán học. mô hình được sử
dụng để tìm kiếm là mô hình cây phân cấp . việc tìm nghiệm của các bài toán thường
phải dựa vào việc liệt kê toàn bộ các cấu hình có thể và đánh giá tìm ra cấu hình tốt
nhất.
Ví dụ: Bài toán người du lịch: không gian trạng thái là N!
Bài toán K- median : không gian trạng thái là )!(!!
knknCk
n
Khi đó, không gian tìm kiếm của bài toán là rất lớn trong khi nhiều trường hợp có
thể loại bỏ được ngay. Điều này gây nên tình trạng lãng phí bộ nhớ và mất rất nhiều
thời gian. Vấn đề đặt ra là trong quá trình liệt kê lời giải cần tận dụng những thông tin
đã có để loại bỏ sớm những phương án chắc chắn không tối ưu. Thuật toán nhánh cận
được sử dụng để khắc phục những vấn đề trên
Tư tưởng cơ bản của thuật toán là trong quá trình tìm kiếm lời giải, ta sẽ phân
hoạch tập các phương án của bài toán thành hai hay nhiều tập con biểu diễn như một
- 4 -
nút của cây tìm kiếm và cố gắng bằng phép đánh giá cận các nút, tìm cách loại bỏ các
nhánh cây (những tập con các phương án của bài toán) mà ta biết chắc chắn không phải
là phương án tối ưu. Mặc dù trong trường hợp tồi nhất thuật toán sẽ trở thành duyệt toàn
bộ, nhưng những trường hợp cụ thể nó rút ngắn đáng kể thời gian tìm kiếm.
Để áp dụng phương pháp nhánh cận đối với 1 tập các bài toán tối ưu chúng ta
cần làm theo các bước sau:
Bước1 ( khởi tạo): L:={П0}, Q: ={П0},bs:= -∞ và T:= (tập hợp rỗng).
Bước 2( tìm kiếm): đi tới Bước 9 nếu L =
đi đến Bước 3 sau khi lựa chọn Пi:= s(Ls) để kiểm tra.
Bước 3 (cập nhật ): Nếu lower_bound(Пi)> bs, thì bs:= lower_bound(Пi) và
T:={σ } với σ là lời giải khả thi của Пi sao cho f(x,σ )= lower_bound(П i). Đi
tới bước 4.
Bước 4 : đi tới Bước 8 nếu Пi G (tập hợp các bài toán bộ phận Пi được giải
trong tiến trình tính toán cận trên của Пi). ngược lại thì đi đến Bước 5.
Bước 5: ( kiểm tra cận trên): đi đến bước 8 nếu cận trên nhỏ hơn bs:
upper_bound(Пi) ≤ bs. Ngược lại đi tới bước 6.
Bước 6: đi tới bước 8 nếu tồn tại một Пk (≠ Пi) Q mà f(Пk) ≥ f(Пi). Ngược lại
đi tới bước 7.
Bước7: (phân nhánh): Phân và cập nhật
. Quay trở lại bước 2.
Bước 8 ( kết thúc bài toán con): gán L:= L - Пi sau đó quay trở lại bước 2.
Bước 9 ( kết thúc toàn bộ ) : Dừng. bs = f(П0) và T lưu trữ một lời giải tối ưu của
П0, nếu bs = - ∞ , П0 không có lời giải
- 5 -
1.2. Một số ví dụ cụ thể áp dụng thuật toán nhánh cận
Bài 1: Bài toán người du lịch( TSP)
• Phát biểu bài toán : Một người du lịch muốn đi thăm quan n thành phố T1 , T2 ,
….., Tn .Xuất phát từ một thành phố nào đó người du lịch muốn đi qua tất cả các
thành phố còn lại, mối thành phố đúng một lần, rồi quay trở lại thành phố xuất
phát. Biết ci,j là chi phí từ thành phố Ti đến thành phố Tj . Hãy tìm hành trình
với tổng chi phí nhỏ nhất
• Xây dựng công thức :
Phương án : = (1, 2, … n) là hoán vị của 1, 2, …, n
Hành trình : T 1 T 2 …… T n
Chi phí : f() = c 1, 2 + c 2, 3 + …. + c n, 1
: tập tất cả các hoán vị
=> min {f() : }
• Tư tưởng của thuật toán nhánh cận:
Cố định thành phố 1
Tìm cực tiểu của hàm :
f(x2, x3, . . , xn) = c[1,x2] + c[x2,x3] + ... + c[xn,1] => min
x2, x3, . . , xn là hoán vị của các số 2, 3, …, n
Ký hiệu : cmin = min{c[i,j]; i, j = 1,2,…,n, i≠j}
Giả sử có phương án bộ phận (u1,u2, …, uk)
– Chi phí phải trả là : = c[1,u2] + c[u2,u3] + ... + c[uk-1, uk]
– Cận dưới là : g (u1,u2, …, uk) = + (n-k+1)*cmin
- 6 -
1. Phương pháp phân nhánh:
+ Nếu bài toán con có g() > f -(Kỉ lục tạm thời) thì cắt luôn nhánh
của bài toán này
+ Nếu không thì phân nhánh tiếp bài toán con cho đến khi tính được
kỉ lục của bài toán con này. Nếu kỉ lục của bài toán con nhỏ hơn f() thì
cập nhật lại kỉ lục tạm thời f()
2. Phương pháp tính cận: tính cận trên của bài toán con dựa vào công
thức
= c[1,u2] + c[u2,u3] + ... + c[uk-1, uk]
g (u1,u2, …, uk) = + (n-k+1)*cmin
Bài 2: Bài toán cái túi
• Phát biểu bài toán : Một nhà thám hiểm cần đem theo một cái túi có trọng lượng
không quá b. Có n đồ vật có thể đem theo. Đồ vật thứ j có trọng lượng a và giá trị
sử dụng là c . Hỏi rằng nhà thám hiểm cần đem theo các đồ vật nào để cho tổng
giá trị sử dụng của các đồ vật đem theo là lớn nhất.
• Xây dựng công thức :
Phương án x = {x1,x2, …, xn}
Giá trị đồ vật đem theo
Tổng trọng lượng đồ vật
min{f(x) : g(x) ≤ b}
- 7 -
Chương 2 : XÂY DỰNG KHUNG THUẬT TOÁN
NHÁNH CẬN
Thuật toán nhánh cận được xây dựng với mong muốn giải quyết được tập các bài
toán tối ưu tổ hợp. Có nghĩa là tất cả các bài toán đó sẽ được giải quyết dựa trên một
khung chung của thuật toán để khi vào một bài toán cụ thể người viết chương trình chỉ
cần thêm vào khung đó những dữ liệu phù hợp với bài toán của mình. Nó giảm bớt thời
gian xây dựng thuật toán đồng thời nó hữu ích cho những người không biết kỹ thuật
nhánh cận trên môi trường song song vẫn có thể cài đặt song song. Chương này sẽ
trình bày việc xây dựng khung của kĩ thuật nhánh cận và kỹ thuật nhánh cận trên môi
trường tuần tự hoặc song song.
Hệ thống gồm hai nhóm : một nhóm các lớp cung cấp (Provided) bao hàm các thủ
tục chung cho thuật toán nhánh cận (ví dụ như khung của thuật toán nhánh cận tuần tự,
khung của thuật toán nhánh cận song song ...) và nhóm các lớp yêu cầu (Required) bao
hàm các thủ tục riêng để giải quyết một bài toán cụ thể sử dụng kỹ thuật nhánh cận (ví
dụ như các thủ tục tính cận, thủ tục phân nhánh, ...). Để giải quyết một bài toán bằng kỹ
thuật nhánh cận, người sử dụng chỉ cần viết các khai báo và xây dựng các hàm trong
nhóm yêu cầu mà không cần xây dựng lại nhóm cung cấp. Hình 4.1 diễn tả mô hình
UML tổng quan của hệ thống.
- 8 -
* Nhóm các lớp yêu cầu
Mô hình chung của nhóm các lớp yêu cầu
Hình 2 diễn tả các lớp và thủ tục chính trong nhóm yêu cầu.
Hình 1 : Mô hình UML
Hình 2 : Các lớp yêu cầu
- 9 -
Các lớp yêu cầu được sử dụng để lưu trữ dữ liệu cơ bản của thuật toán : bài toán, trạng
thái không gian tìm kiếm. Nó bao gồm các lớp chính sau :
- Bài toán (Problem): Diễn tả các tham số của bài toán cần giải quyết.
- Bài toán con (Subproblem) : Diễn tả vùng không gian chưa được khai thác và
cung cấp các chức năng sau :
o InitSubProblem(pbm) : Sinh ra bài toán con đầu tiên từ bài toán ban đầu
o LowerBound(pbm, sol) : Tính toán cận dưới của hàm mục tiêu cho lời
giải bộ phận sol của bài toán pbm.
o UpperBound(pbm, sol) : Tính giá trị hàm mục tiêu của lời giải toàn cục
sol của bài toán pbm.
o Branch(pbm, sps) : Sinh ra một tập các bài toán con của bài toán đang xét
và lưu vào sps.
Lớp bài toán con diễn tả một bài toán bộ phận. Một bài toán con được xác định bởi
các dữ liệu sau : vector sol chứa các chỉ số đỉnh làm median của bài toán con (hay là lời
giải bộ phận của bài toán cần giải quyết) và được sắp xếp theo thứ tự tăng dần, chỉ số
đỉnh cuối eV của lời giải bộ phận, và cận dưới cost ứng với lời giải bộ phận sol.
Lớp bài toán con phải cung cấp các hàm chính sau :
- InitSubProblem(pbm): sinh ra bài toán con ban đầu với
- Các hàm tính cận dưới (LowerBound), tính cận trên (UpperBound), phân nhánh
(Branch).
- 10 -
* Nhóm các lớp cung cấp
Trước khi mô tả lớp cung cấp chúng ta cần xem xét cấu trúc dữ liệu để lưu các bài
toán con chưa được giải quyết trong quá trình tính toán. Vì số lượng các bài toán con là
rất lớn và không biết trước nên ta sử dụng một danh sách liên kết kép để quản lý chúng.
Lớp Solver : Làm nhiệm vụ đưa ra và duy trì các thông tin có liên quan tới trạng thái
tìm kiếm trong suốt quá trình thực hiện
class Solver {
protected:
const Problem& pbm;// bài toán cần giải quyết
Direction dir;
SubProblem sp; // bài toán con hiện thời cần giải quyết
Solution sol; // giải pháp tốt nhất hiện thời
container<SubProblem> HP;// danh sách các bài toán con cần giải quyết
Bound high;// cận trên của nhánh bài toán con
Bound low;// cận dưới của nhánh bài toán con
Bound bestSol;// kỉ lục hiện thời của bài toán
public:
Solver(const Problem &problem);
- 11 -
..........................
Có hai lớp kế thừa từ lớp Solver
- Lớp Solver_Seq : Chứa thủ tục run() để giải quyết bài toán một cách tuần tự
- Lớp Solver_Lan : Chứa thủ tục run(int argc, char** argv) để giải quyết bài
toán một cách song song trên môi trường mạng LAN. Với tham số truyền vào
của hàm chính là các tên máy tham gia vào quá trình tính toán.
Người sử dụng muốn thực hiện theo phương thức nào (song song hay tuần tự) thì tạo ra
một đối tượng tương ứng sau đó gọi tới thủ tục run . Ví dụ chúng ta muốn tiến hành
thuật toán nhánh cận tuần tự để giải quyết bài toán TSP có đoạn mã của thủ tục main
như sau
Int Main(int argc, char** argv) {
Problem pbm; // Bài toán cần giải quyết
SolVec sol; // Lời giải tối ưu của bài toán
Bound bs; // Giá trị tối ưu của bài toán
Solver_Seq sv(pbm);
Sv.run();
Bs = sv.bestSolution();
Sol = sv.solution();
}
- 12 -
2.1. Xây dựng khung nhánh cận
2.1.1. Cấu trúc dữ liệu
Cấu trúc dữ liệu sử dụng là hàng đợi động để điều khiển bài toán con được sinh
ra bằng phương thức phân nhánh. Các bài toán con được thêm và0 hàng đợi phụ thuộc
vào phương thức tìm kiếm cụ thể trong lớp cài đặt: lifo(last in first out), fifo (first in
first out) hoặc prio-rity. Mỗi một bài toán con được kết nối bởi 2 con trỏ tới thành phần
trứơc và sau của danh sách riêng biệt.
Hình 3: Hàng đợi các bài toán con của kĩ thuật nhánh cận
2.1.2. Thuật toán
Các bài toán sử dụng nhánh cận để giải quyết đều phải sử dụng khung của thuật toán.
Điều này nhấn mạnh rằng người dùng nếu giải bài toán của mình trên môi trường tuần
tự hoặc song song thì chỉ cần thêm một số phương thức, dữ liệu phù hợp mà không cần
suy nghĩ đến việc phải thiết kế các bước như thế nào.
Dưới đây là khung chung của thuật toán:
- 13 -
1. Khởi tạo
a. Tập hoạt động (tập các bài toán con chưa được duyệt) chứa bài toán ban
đầu.
b. Giá trị kỷ lục(best solution=bs) bằng .
2. Lựa chọn
a. Dựa trên một phương pháp nào đó (theo chiều sâu, chiều rộng, hoặc cận tốt
nhất ,...) để lựa chọn một bài toán con khả thi cùng cận của nó từ tập hoạt
động.
b. Xóa bài toán con khỏi tập hoạt động.
3. Phân nhánh
a. Áp dụng luật phân nhánh để sinh ra các bài toán con mới từ bài toán đang
xét. Tính cận của các bài toán con mới này.
b. Tiến hành kiểm tra các bài toán con vừa được sinh ra.
Có hai trường hợp :
(1) bài toán con đã được giải quyết – đi tới bước 5
(2) bài toán con chưa được giải quyết – đi tới bước 4.
4. Kiểm tra tính khả thi : Đưa các bài toán con có cận nhỏ hơn kỷ lục tạm thời vào
tập hoạt động.
5. Dò xét kết thúc
a. Bài toán con được duyệt là một lời giải khả thi khi có cận nhỏ hơn kỷ lục
và khi đó nó sẽ thay thế kỷ lục. Ngược lại sẽ bị xóa.
b. Khi cập nhật kỷ lục mới (5a) thì tất cả các bài toán con trong tập hoạt động
có cận dưới lớn hơn hoặc bằng kỷ lục sẽ bị xóa.
6. Kết thúc thuật toán
- 14 -
a. Lặp lại các bước từ 2-5 nếu tập hoạt động không rỗng. Ngược lại, thì kết
thúc thuật toán và lời giải tối ưu là giá trị kỷ lục.
Ta gọi
L : là tập hoạt động
Q: là tập các bài toán con hiện tại được sinh ra.
bs: giá trị kỉ lục
σ : lời giải
T: lưu trữ lời giải tốt nhất
Пi: các bài toán con được sinh ra
Dưới đây là đoạn mã giả của thuật toán phân nhánh:
- 15 -
Ta có thể sử dụng cấu trúc heap và queue để lưu trữ các bài toán con chưa được giải
quyết. Ở đây chúng tôi sử dụng queue bởi lí do khi số lượng các thành phố là lớn thì
không gian bài toán con tăng lên rất nhiều mà heap không thể lưu trữ được.
Queue gồm 3 lớp sau :
Class bbnode : Định nghĩa các nút trên cây
Class BandbQueue : Lớp trừu tượng này miêu tả một queue
Class BranchQueue : Lớp này sử dụng trong suốt giai đoạn phân nhánh
2.2. Xây dựng khung nhánh cận tuần tự
Ta có thể tóm lược hoạt động của thuật toán nhánh cận tuần tự như sau : Tại thời
điểm khởi tạo, tập hoạt động L chứa bài toán ban đầu, và giá trị kỷ lục tạm thời bs là .
Lặp đi lặp lại các bước sau cho đến khi tập hoạt động bằng : Lựa chọn một bài toán
con từ tập hoạt động, bài toán con có lời giải bộ phận là v1, v2, ...., vi-1. Nếu cận dưới của
bài toán con nhỏ hơn kỷ lục tạm thời ta tiến hành phân nhánh thành các bài toán con
nhỏ hơn với lời giải bộ phận tương ứng là (v1, v2, ...., vi-1+1), ......, (v1, v2, ...., N – K + 1),
tiến hành tính cận cho các bài toán con này. Nếu các bài toán con đã được giải quyết ta
tiến hành duyệt và cập nhật kỷ lục tạm thời bs, ngược lại thì đưa các bài toán con này
vào tập hoạt động L. Sau đây là đoạn mã giả mô phỏng thuật toán nhánh cận tuần tự.
- 16 -
2.3. Xây dựng khung nhánh cận song song
Để song song hóa khung sử dụng kỹ thuật nhánh cận chúng ta sử dụng chiến
lược chủ - thợ. Chiến lược này có thể được định nghĩa như sau: một bộ xử lý chủ giữ tất
cả thông tin về không gian trạng thái, nơi mà chứa đựng số lượng các bài toán con chưa
được phân nhánh trên cây liệt kê và nó cũng lưu giữ lời giải hiện thời. Máy chủ gửi bài
toán con tới máy thợ rỗi và nhận các bài toán con mới được phát sinh từ các máy thợ
đó. Một vài máy thợ định giá những bài toán con và phát sinh thêm những cái mới nếu
cần thiết. Một máy thợ rỗi nhận một bài toán con chỉ khi có những bài tóan con mà có
khả năng dẫn tới một giải pháp tối ưu. Chiến lược này đề xuất những sự kiện có ý nghĩa
Hình 4: Thuật toán nhánh cận tuần tự
- 17 -
như là khả năng điều khiển dễ dàng và thuật toán nhánh cận song song theo phương
pháp dễ hiểu và tự nhiên hơn.
- Bộ xử lí chủ: chỉ có một bộ xử lí chủ trong khung. Nó chứa tất cả thông tin về
không gian trạng thái và tình trạng của mỗi máy thợ ( bận hoặc rỗi.)
- Bộ xử lí thợ: Số lượng bộ xử lí thợ được xác định bởi tham số đầu vào. Nó
thực hiện tất cả những thao tác tính toán để giải quyết hoặc ước lượng một bài toán
con.
Sự song song hiển thị cấu trúc trong Hình 4. Máy chủ có một hàng đợi những bài
toán chưa được giải quyết. Nó loại bỏ mọi bài toán con từ hàng đợi của nó và giao việc
của nó tới máy thợ rỗi trong giai đoạn a. Trong giai đoạn b, một tập bài toán con của
máy thợ đưa đến máy chủ.Trong giai đoạn c, máy chủ nhận những bài toán con và chèn
chúng vào trong hàng đợi của nó. Cuối cùng, máy chủ loại bỏ những bài toán con có
thể thực hiện đc và gửi chúng đến máy thợ rỗi trong giai đoạn d. Tiến trình kết thúc khi
hàng đợi máy chủ là rỗng và lời giải tốt nhất tìm thấy đc.
- 18 -
Hình 5: Các giai đoạn của mô hình Chủ - thợ
Ta nhận thấy rằng mô hình hoạt động ở trên tương đối đơn giản và dễ dàng cài
đặt. Tuy nhiên nó có một nhược điểm lớn là số lượng bài toán con chỉ tập trung tại máy
chủ, điều đó dễ dẫn tới tràn bộ nhớ do số lượng bài toán con này là rất lớn. Thêm vào
nữa máy chủ luôn phải điều động từng bài toán con tới các máy thợ dẫn tới tăng số
lượng công việc tại máy chủ cũng như lưu lượng truyền thông trên mạng là lớn. Để giải
quyết vấn đề này chúng tôi đề xuất một mô hình dữ liệu phân tán, nghĩa là trên mỗi
máy thợ đều có một vùng nhớ để lưu các bài toán con. Và bây giờ các bài toán con
được chuyển một cách trực tiếp từ máy thợ bận (có nhiều bài toán con) tới máy thợ rỗi (
- 19 -
không còn bài toán con để tìm kiếm) dưới sự điều phối của máy chủ. Sau đây là thiết kế
chi tiết đối với cả hai hệ thống này.
2.3.1. Lược đồ song song dữ liệu tập trung
2.3.1.1. Cấu trúc dữ liệu :
Danh sách các bài toán con chưa được giải quyết lưu tại máy chủ, các bài toán con
được rời và gửi tới các máy thợ. Mỗi máy thợ khi nhận bài toán con tiến hành phân
nhánh và lưu các bài toán con vừa mới được sinh ra cùng với cận của nó trong một danh
sách cục bộ. Sau đó nó gửi tới máy chủ, máy chủ lúc này tiến hành nối các bài toán con
nhận được từ danh sách đó nếu cận của nó nhỏ hơn kỷ lục tạm thời. Cấu trúc dữ liệu để
lưu các bài toán con là một danh sách liên kết kép.
2.3.1.2. Thuật toán
a. Thực hiện trên máy chủ
Hình 6 mô tả các công việc được thực hiện trên máy chủ. Máy chủ thực hiện phân phối
các bài toán con giữa các máy thợ. Máy chủ có một danh sách cục bộ L để lưu trữ bài
toán con và cấu trúc dữ liệu I để ghi nhận trạng thái hiện thời của các máy thợ (dòng 1);
Ban đầu tất cả các máy thợ đều rỗi. Khi có các máy thợ rỗi, máy chủ liên tục trích
lọc từng bài toán con khả thi (có cận nhỏ hơn kỷ lục tạm thời), sau đó lựa chọn một máy
thợ rỗi và gửi bài toán con tới nó để tiến hành phân nhánh và ước lượng( dòng 6-7).
Nếu danh sách L rỗng hoặc không có máy thợ nào rỗi, máy chủ tiến hành kiểm tra có
dữ liệu (là các bài toán con mới sinh ra) được gửi về từ máy thợ hay không. Nếu có nó
sẽ nhận dữ liệu từ máy thợ là một tập các bài toán con cùng cận dưới của nó. Kiểm tra
lần lượt từng bài toán con. Nếu bài toán được giải quyết (có số lượng median bằng k),
thì cập nhật kỷ lục và lời giải tạm thời (nếu có cận nhỏ hơn kỷ lục tạm thời) ngược lại
nối các bài toán con khả thi vào danh sách L (Dòng 12-17). Quá trình tìm kiếm kết thúc
khi tất cả các máy thợ đều rỗi và danh sách L rỗng, và khi đó máy chủ gửi một thông
- 20 -
báo kết thúc quá trình tính toán tới các máy thợ (Dòng 20). Sau đây là đoạn mã giả của
thủ tục.
Hình 6: Hoạt động trên máy chủ (Dữ liệu tập trung)
- 21 -
b. Thực hiện trên máy thợ
Máy thợ nhận lệnh từ máy chủ. Có thể là kết thúc quá trình tính toán hoặc nhận một bài
toán con cần phân tích. Nếu lệnh yêu cầu nhận một bài toán con, máy thợ thực hiện
nhận dữ liệu (Dòng 6) , sau đó tiến hành phân nhánh và tính cận cho các bài toán con
vừa được sinh ra (Dòng 7-8). Dữ liệu này được gửi tới máy chủ. Sau đây là đoạn mã giả
của thủ tục.
Hình 7: Hoạt động trên máy thợ (Dữ liệu tập trung)
- 22 -
2.3.2. Lược đồ song song dữ liệu phân tán
2.3.2.1. Cấu trúc dữ liệu
Mỗi máy thợ lưu một danh sách các bài toán con cục bộ. Máy chủ chỉ gửi bài toán con
đầu tiên tới một máy thợ rỗi ban đầu và sau đó không lưu trữ bất kỳ bài toán con nào
mà chỉ thực hiện điều phối các bài toán con giữa các máy thợ.
2.3.2.2. Thuật toán
a. Thực hiện trên máy chủ
Hình 4.6 chỉ ra các công việc trên máy chủ. Máy chủ có một cấu trúc dữ liệu I để ghi
nhận trạng thái hiện thời của các máy thợ (Dòng 1); ban đầu tất cả các máy thợ đều rỗi.
Bài toán con đầu tiên, kỷ lục và lời giải tạm thời được gửi tới một máy thợ rỗi (dòng 3-
4). Máy chủ nhận thông tin gửi về từ máy thợ và quyết định hoạt động tiếp theo phụ
thuộc vào bài toán con được giải quyết (dòng 8) hay là một yêu cầu các máy thợ rỗi từ
máy thợ nào đó (dòng 10) hay là thông báo một máy thợ đang rỗi (dòng 16). Nếu bài
toán con đã được giải quyết, máy chủ nhận và lưu trữ lời giải (nếu cận của nó nhỏ hơn
kỷ lục tạm thời). Khi máy chủ nhận một yêu cầu r máy thợ rỗi từ một máy thợ nào đó,
nó sẽ tiến hành xác định các máy thợ đang rỗi và gửi thông tin về số lượng và tên các
máy thợ đang rỗi tới máy thợ yêu cầu (dòng 13-14), sau đó chờ đợi và nhận lại từ máy
thợ đó các máy thợ không được sử dụng. Quá trình kết thúc khi tất cả các máy thợ đều
rỗi và máy chủ gửi một thông báo kết thúc tới toàn bộ hệ thống( dòng 19). Dưới đây là
đoạn mã giả của thủ tục.
- 23 -
b. Thuật toán trên máy thợ
Máy thợ nhận bài toán con và kỷ lục tạm thời từ một máy thợ nào đó, sau đó tiến hành
phân nhánh và tính cận các bài toán con vừa được sinh ra. Nếu các bài toán con đã được
giải quyết (có số median là k), nó đi tìm bài toán con có cận tốt nhất và gửi tới máy chủ
(Dòng 12 -18). Ngược lại nó gửi một thông báo xin máy chủ cấp cho các máy thợ đang
rỗi để hỗ trợ quá trình tính toán. Nếu số lượng máy thợ nhận được lớn hơn 0 nó tiến
hành gửi các bài toán con tới các máy thợ này ngược lại thì thực hiện các hoạt động của
Hình 8: Hoạt động trên máy chủ (Dữ liệu phân tán)
- 24 -
thuật toán một cách cục bộ ( Dòng 20-24). Nếu trong tập hoạt động không còn bài toán
con nào, máy thợ gửi một thông báo đang rỗi tới máy chủ (Dòng 25).
- 25 -
2.4. Công cụ phát triển hệ thống
Hệ thống sử dụng ngôn ngữ C++ để phát triển và thư viện Nestream để quản lý quá
trình trao đổi dữ liệu giữa các máy trong hệ thống. Netstream hỗ trợ gửi services(basic
và advandced) qua một giao thức mạng và Netstream được phát triển như một lớp trên
chuẩn MPI.
2.5. Lựa chọn mô hình phát triển hệ thống
Phân lớp thuật toán nhánh cận song song
Có ba cách tiếp cận chính trong việc thiết kế thuật toán nhánh cận song song.
- Song song loại 1 : Tiến hành song song hóa các hoạt động trên bài toán con, ví
dụ như tính cận song song trên bài toán con. Cách tiếp cận này không ảnh hưởng
tới cấu trúc chung của thuật toán nhánh cận.
- Song song loại 2 : Xây dựng cây nhánh cận một cách song song bằng việc thực
hiện các hoạt động trên các bài toán con một cách đồng thời. Vì thế nó có thể ảnh
hưởng tới việc thiết kế thuật toán.
- Song song loại 3 : Một vài cây nhánh cận được xây dựng một cách song song.
Các cây được đặc thù bởi các hoạt động khác nhau (phân nhánh, tính cận, kiểm
tra ước lượng hay lựa chọn), và thông tin sinh ra khi xây dựng một cây có thể
được sử dụng cho việc xây dựng cây khác.
Dưới đây ta trình bày cách tiếp cận song song loại 2 để thiết kế thuật toán nhánh cận
song song.
Lựa chọn mô hình phát triển thuật toán
Có hai hệ thống tính toán song song chủ yếu là bộ nhớ dùng chung và bộ nhớ phân tán.
Chúng tôi lựa chọn hệ thống bộ nhớ phân tán để tiến hành thiết kế thuật toán vì một số
lý do sau :
- 26 -
- Lý do đầu tiên xuất phát từ thực tế đó là có thể tiến hành các thuật toán song song
trên mạng nối kết ethernet đơn giản bằng kỹ thuật chuyển thông báo. Đây là một
cách kinh tế để có một hệ thống song song.
- Thứ hai đó là số lượng bộ xử lý trong các hệ thống bộ nhớ dùng chung là giới
hạn.
Các mô hình phân biệt với nhau bởi cách quản lý và điều phối tập các bài toán con
nằm trong cơ sở dữ liệu chính của thuật toán. Mô hình đầu tiên có cơ sở dữ liệu tập
trung. Nghĩa là máy chủ sẽ lưu trữ tập các bài toán con và điều phối chúng tới các máy
thợ rỗi. Mô hình có ưu điểm dễ xây dựng, dễ quản lý nhưng khối lượng công việc cũng
như không gian bộ nhớ trên máy chủ là tương đối lớn đồng thời lưu lượng truyền thông
trên mạng cũng lớn. Mô hình thứ hai có cơ sở dữ liệu phân tán, nghĩa là các bài toán
con lúc này sẽ được lưu một cách cục bộ tại các máy thợ và sẽ được chuyển giao một
cách trực tiếp giữa các máy thợ dưới sự điều phối của máy chủ. Với mô hình này ngoài
chiến lược lựa chọn nút để khai thác không gian lời giải một cách có hiệu quả, hệ thống
còn phải thực hiện các chiến lược để cân bằng công việc giữa các máy thợ sao cho
không xảy ra tình trạng có máy thợ phải thực hiện quá nhiều công việc trong khi các
máy khác rỗi.
- 27 -
Chương 3 : SỬ DỤNG THUẬT TOÁN NHÁNH CẬN ĐỂ GIẢI
QUYẾT BÀI TOÁN TSP Trong chương này chúng tôi đưa ra các kết quả thực nghiệm nhằm đánh giá hiệu suất của
mô hình thuật toán nhánh cận song song đề xuất ở trên. Thuật toán tuần tự được lựa chọn để so
sánh có cùng cách tính cận, phân nhánh và lựa chọn bài toán con như trong mô hình thuật
toán song song.
* Bài toán TSP (Bài toán người du lịch)
3.1. Giới thiệu bài toán
Bài toán người du lịch(TSP) là bài toán tiêu biểu trong việc sử dụng thuật toán
nhánh cận song song. Bài toán được phát biểu như sau:
Một người du lịch có trong tay bản đồ gồm n thành phố và chi phí đi lại giữa
chúng, các con đường này đều là đường 1 chiều(nghĩa là chi phi từ A đến B sẽ khác
khoảng cách từ B đến A). người du lịch muốn làm một hành trình đi qua tất cả các
thành phố với điều kiện mỗi thành phố chỉ đi qua một lần, rồi quay trở về thành phố
xuất phát. Bài toán đặt ra là tìm đường đi cho người du lịch sao cho tổng chi phí là nhỏ
nhất.
3.2. Định nghĩa bài toán
Cho n thành phố và một ma trận chi phí của các đường đi. Hãy tìm đường đi sao cho
tổng chi phí là nhỏ nhất đảm bảo điều kiện của bài toán
• Xây dựng công thức :
Phương án : = (1, 2, … n) là hoán vị của 1, 2, …, n
- 28 -
Hành trình : T 1 T 2 …… T n
Chi phí : f() = c 1, 2 + c 2, 3 + …. + c n, 1
: tập tất cả các hoán vị
=> min {f() : }
Dữ liệu vào cho trong file TSP.DAT, trong đó:
- Dòng đầu: Chứa N là số lượng các thành phố
- Tiếp theo : Ma trận c(n*n) trong đó c(i,j)= chi phí đi lại từ thành phố i đến thành
phố j
Mỗi giá trị chi phí khác nhau được ghi cách nhau một dấu cách trắng
Kết qủa: Ghi trực tiếp lên file TSP.DAT, trong đó:
- Dòng đầu ghi tổng chi phí mà người đó đi hết bằng cách tốt nhất
- Dòng tiếp theo đưa ra phươg án tối ưu nhất qua các thành phố
3.3. Sử dụng thuật toán nhánh cận để giải bài toán TSP
Để đi tìm lời giải chính xác cho bài toán TSP không còn cách nào khác ngoài việc
chúng ta phải duyệt tất cả các lời giải có thể, tuy nhiên số lượng này là quá lớn (= n!),
trong đó rất lãng phí các lời giải không cần thiết. Cách tiếp cận hiệu quả nhất từ trước
tới nay trong chiến lược này đó chính là thuật toán nhánh cận(có thể cắt các nhánh ở các
lời giải không cần thiết)
* Tính cận và phân nhánh
- Tính cận: Cố định thành phố 1
Tìm cực tiểu của hàm :
f(x2, x3, . . , xn) = c[1,x2] + c[x2,x3] + ... + c[xn,1] => min
x2, x3, . . , xn là hoán vị của các số 2, 3, …, n
Ký hiệu : cmin = min{c[i,j]; i, j = 1,2,…,n, i≠j}
- 29 -
Giả sử có phương án bộ phận (u1,u2, …, uk)
– Chi phí phải trả là : = c[1,u2] + c[u2,u3] + ... + c[uk-1, uk]
– Cận dưới là : g (u1,u2, …, uk) = + (n-k+1)*cmin
- Thuật toán phân nhánh dựa vào thuật toán liệt kê các hoán vị của n phần tử{1, 2, ....,
n}. Nghĩa là nếu bài toán con của ta có lời giải bộ phận là c1, c2, ...., ci. Thì các bài toán
con sinh ra có lời giải bộ phận (c1, c2, ...., ci-1+1), .........., (c1, c2, ...., n – k + i).
* Các lớp xây dựng cho bài toán TSP
Như chúng ta đã biết, bài toán yêu cầu tìm giải pháp tốt nhất cho người du lịch sao
cho chi đi qua mỗi thành phố một lần và tổng chi phí quãng đường là nhỏ nhất. Dưới
đây là khai báo lớp Problem cho bài toán TSP:
Lớp Problem lưu giữ số lượng thành phố và ma trận giá trị giữa các thành phố
class Problem {
private:
Number N; // Số lượng thành phố trong bài toán
Matrix c; // Ma trận giá trị giữa các đỉnh
public:
Problem ();
.................
};
Lớp bài toán con diễn tả một bài toán bộ phận. Một bài toán con được xác định bởi
các dữ liệu sau : đỉnh đầu iV, đỉnh cuối eV của lời giải bộ phận, và cận dưới cost ứng
với lời giải bộ phận sol .
class SubProblem {
- 30 -
private:
unsigned iV, /// đỉnh đầu tiên
eV, /// đỉnh kết thúc trong hành trình
cost; /// gía trị thật
Tset visitedSet; /// các thành phố đến thăm
Solution sol; /// giá trị tốt nhất hiện thơi
public:
SubProblem ();
......................
};
Lớp bài toán con phải cung cấp các hàm chính sau :
- InitSubProblem(pbm) : sinh ra bài toán con ban đầu với
iV = 0;
eV = 0;
cost = 0;
- Các hàm tính cận dưới (LowerBound), tính cận trên (UpperBound), phân
nhánh(Branch).
Lớp Solution lưu giữ lời giải hiện tại
Class Solution()
{
…….
}
- 31 -
* Trên môi trường tuần tự
Khi thực thi trên môi trường tuần tự người dùng chỉ cần gọi phương thức run() của
lớp Solver_Seq:
void Solver_Seq::run()
{
if (dir == Minimize) {
minimizing();
}
else {
maximizing();
}
}
* Trên môi trường song song
Tương tự, khi đó phương thức run() của lớp Solver_Lan sẽ được gọi:
void Solver_Lan::run()
{
minimizing();
}
- 32 -
3.4. Chương trình thực thi
Đầu vào của chương trình là tệp tsp.dat lưu số đỉnh, trọng số khoảng cách giữa các
đỉnh.
- 33 -
TÀI LIỆU THAM KHẢO
[1]. Nguyễn Đức Nghĩa, Nguyễn Tô Thành. Toán rời rạc. Nhà xuất bản Giáo dục, 1999.
[2]. Nguyễn Đức Nghĩa. Tối ưu hóa (Quy hoạch tuyến tính và rời rạc). Nhà xuất bản Giáo dục, 1999.
[3]. Nguyễn Đức Nghĩa. Tính toán song song. Bài giảng 2003.
[4]. Nguyễn Thanh Thủy, Lê Đăng Hưng, Tạ Tuấn Anh, Nguyễn Hữu Đức. Lập trình hướng đối tượng với C++. Nhà xuất bản khoa học kỹ thuật, 1999.
[5]. Nguyễn Lê Anh, Phạm Thế Long. Xử lý song song. Bài giảng 2005.
[6]. Alberto CESELLI. Two exact algorithms for the capacitated p-median problem. Quarterly Journal of the Belgian, French and Italian Operations Research Societies. 2003
[7]. Alberto Ceselli. Branch-and-price algorithms for partitioning problems. Ph.D. Thesis, 2005
[8]. Alberto CESELLI, Giovanni RIGHINI. Algoritmi Branch & Bound e Branch & Price per il problema delle p-mediane con capacità. 2001
[9]. Alan Edelman. Applied Parallel Computing. MIT 2004.
[10]. Alan Edelman. Parallel Scientific Computing. MIT 2002.