dynamic programming ii

Dynamic Programming IIMichael Tsai(Instructed by TA)2011/10/07

2

連串矩陣相乘問題

Matrix multiplication is associative.

以上算出來答案都一樣

𝐴1 𝐴2 𝐴3 𝐴4𝐴𝑛

……

題目 : 求矩陣相乘之解 .

.cols=.rows

and are compatible.

3

連串矩陣相乘問題Matrix-Multiply(A,B)if A.columns != B.rowserror “incompatible dimensions”else let C be a new A.rows x B.cols matrixfor i=1 to A.rowsfor j=1 to B.cols=0for k=1 to A.cols

return C 主要花費時間在這邊 !

𝐴 𝐵p

q

q

r

共花費 pqr 次乘法的時間

4

看一個例子

花費之乘法數目 = 花費之乘法數目 = 差十倍 !!

10100 100

5

550

5

連串矩陣相乘問題 - 正式版給一連串的矩陣 , 其中矩陣的大小為 (, 找出一種乘法可以使計算時的乘法數目最少沒有真的要算結果 , 而只是找出能最快算出結果的方法 . 因為算”怎麼算比較快”多花的時間 , 比”用爛方法直接算”多花的時間少很多

6

暴力法有多暴力全部到底有幾種算法呢 ? 用遞迴定義 :

上學期有講過喔 ~ ( 有嗎 ?) P(n) 之解為 Catalan numbers, , or is also

𝑃 (𝑛)={ 1

∑𝑘=1

𝑛− 1

𝑃 (𝑘 ) 𝑃 (𝑛−𝑘)

if

if .

假設先這樣分 :

7

所以不耍暴力了 . 使用 dynamic programming 正規步驟 :1. 找出最佳解的”結構”2. 使用遞迴來定義最佳解的花費3. 計算最佳解的花費4. 使用已經計算的資訊來構築最佳解

8

找出最佳解的”結構”

總花費 = 的花費 + 的花費 + 把和乘起來的花費最佳解的結構 : 假設有的最佳解 , 此一方法為在 k 切一刀 .

則在此最佳解中 , 的相乘方法一定是的最佳相乘方法假設不是最佳解 , 則我們可以在中把換成更好的方法 , 則可以找到一個更好的的相乘方法矛盾 . 子問題的最佳解可以導出大問題的最佳解 ! 最後結論 : 分成兩個子問題 , 並嘗試所有可以切分的地方

(k 值 )

𝐴𝑖 𝐴𝑖+1… 𝐴𝑘 𝐴𝑘+1 𝐴𝑘+2… 𝐴 𝑗

𝑖≤ 𝑗

𝑖≤𝑘< 𝑗

在 k 切一刀

9

使用遞迴來定義最佳解的花費遞迴定義 : 使用子問題最佳解的 cost 來定義大問題最佳解的 cost 定義 : 為所需花的最少乘法數所花乘法數 =

𝐴𝑖 ..𝑘 𝐴𝑘+1. . 𝑗.rows=.cols=

.rows=

.cols=

10

使用遞迴來定義最佳解的花費但是我們不知道最佳解中的 k 的值因此我們必須找所有最後版本 :

𝑚 [ 𝑖 , 𝑗 ]={ 0min𝑖 ≤𝑘< 𝑗

{𝑚 [ 𝑖 ,𝑘 ]+𝑚 [𝑘+1, 𝑗 ]+𝑝𝑖−1𝑝𝑘𝑝 𝑗 }if if .

11

計算最佳解的花費純 recursive 解法 : exponential time 使用前面教的 Bottom-up 填表方法 : 每個不同的 subprogram 僅需解 1 次有幾個不同的問題 ? , 幾個 i 和 j 的組合 ? 答案 :

𝑖≠ 𝑗 𝑖= 𝑗

12

計算最佳解的花費如何決定填表的順序呢 ? ( 這次有 i,j 兩個變數 )𝑚 [ 𝑖 , 𝑗 ]={ 0

min𝑖 ≤𝑘< 𝑗

{𝑚 [ 𝑖 ,𝑘 ]+𝑚 [𝑘+1, 𝑗 ]+𝑝𝑖−1𝑝𝑘𝑝 𝑗 }if if .

個矩陣相乘個矩陣相乘都小於個

我們可以把 j-i+1( 也就是要相乘的 matrix 個數 )當作 problem size 的定義

13計算最佳解的花費n=p.length-1let m[1..n,1..n] and s[1..n-1,2..n] be new tablesfor i=1 to nm[i,i]=0for l=2 to nfor i=1 to n-l+1j=i+l-1m[i,j]=for k=i to j-1q=m[i,k]+m[k+1,j]+if q<m[i,j]m[i,j]=qs[i,j]=kreturn m and s

大 problem 的解只會用到小 problem 的解 . 因此慢慢往上長 .

邊界條件先設好 .

把同樣 problem size 的所有 i,j 組合都依序做過使用遞迴式找出最佳切點 k

Θ(𝑛3)

14計算最佳解的花費用一個例子來 trace code 比較快

MatrixDimension

30 x 35

35 x 15 15 x 5 5 x 10 10 x 20 20 x 25

15

使用已經計算的資訊來構築最佳解前面只印出了花費 , 不是真正的解怎麼乘才是最後的解使用 s 陣列的資訊

16

使用已經計算的資訊來構築最佳解Print-Optimal-Parens(s,i,j)if i==jprint elseprint “(“Print-Optimal-Parens(s,i,s[i,j])Print-Optimal-Parens(s,s[i,j]+1,j)print “)”

17

使用已經計算的資訊來構築最佳解所以該怎麼括 ?

18

看了兩個例子以後… 問 : 一個問題要有什麼要件才能使用

dynamic programming? 答 :1. Optimal substructure2. Overlapping Subproblems

19什麼是 Optimal substructure?

Definition: A problem exhibits optimal substructure if an optimal solution to the problem contains within it optimal solutions to subproblems.

怎麼尋找 optimal substructure 呢 ?

20

怎麼尋找 optimal substructure 呢 ?1. 要得到問題的解答有許多選擇 ( 砍在哪邊 , 切在哪邊 ), 而做這個選擇之後 , 我們有一些

subproblem 要解決 .2. 我們假設對於一個問題 , 我們可以找到那個選擇3. 知道這個選擇以後 , 我們找出哪個

subproblem 可以被拿來應用 , 及剩下的問題( 沒有對應到 subproblem 的 ) 怎麼解決

4. 證明大問題的最佳解中可以直接應用 ( 剪下貼上 ) 子問題的最佳解 .

21

Optimal substructure 越簡單越好=? =?

𝑝𝑖 =?

這一段砍下來就不再砍成更小的了 ( 拿去賣 ) 這一段是 subproblem, 找遞迴朋友去解

versus

22

Optimal substructure越簡單越好

𝐴1𝐴𝑖+1… 𝐴𝑘 𝐴𝑘+1 𝐴𝑘+2… 𝐴 𝑗

1≤ 𝑗

1≤𝑘< 𝑗

在 k 切一刀

假設把問題定義成就好 ( 少一個變數 )

此為一個子問題此不為一個子問題 !

除非 k 一直都是 j-1, 否則…

23

Optimal substructure 的變化1. 原始問題的最佳解用了多少個子問題2. 大問題有多少選擇 ( 選擇用不同的子問題們來獲得最佳解 )大略來說 , 以上兩者決定 dynamic programming algorithm 的執行時間 .( 之前說的 Subproblem graphs 是另外一種算法 )

多少個子問題有多少選擇執行時間鐵條資源回收 n連串矩陣相乘 n-1

24

複習 : Overlapping Subproblems

舉個例子 : 連串矩陣問題的遞迴樹1..3

1..1 2..3 1..2 3..3

2..2 3..3 2..21..1

橘色的是 overlap 的部分 !

25

例子 : 有沒有 optimal substructure

給一個 graph . Edge 沒有 weight. 問題 1: 找出沒有 loop 最短路徑 . 問題 2: 找出沒有 loop 最長路徑 .

問題 1 有沒有 optimal substructure? 假設找到的最短路徑 p, 則我們可以將其分解為 ( 可以是或 ). 則其中一定是的最短路徑 . 不然的話 , 我們可以找到一個比還短路徑 , 那麼和組合起來就變成一條比 p 更短的路徑 ( 矛盾 )

26

例子 : 有沒有 optimal substructure

問題 2 有沒有 optimal substructure?

沒有 ! 來舉一個反例 . 的最長路徑 : 但是的最長路徑為並不是的最長路徑中間的一部分 ! 的最長路徑為也不是的最長路徑中間的一部分 !

q r

s t

27例子 : 有沒有 optimal substructure

為什麼問題 1 和問題 2 相差這麼多 ? 問題 2 缺乏”獨立性” (subproblem 的解互相之間不會影響 ) 出現在的 vertex 就不能出現在 ( 否則就會有 loop 了 )

subproblem 的解互相影響 !

問題 1 有”獨立性” 在最短路徑中 , 出現在的 vertex 本來就不可能出現在假設中除了 w 以外出現了一個一樣的 vertex x. 則可以將最短路徑拆解成 . 因為 x 和 w 不同 , 所以 . 則變成比原本更短的 u 到 v 的路徑 ( 矛盾 )

28

DNA 比對問題 DNA 序列可表示為以 {A,C,G,T} 組合而成的一字串

比較兩者有多相像 ??親屬關係 ?

你是我爸 ?!

29

DNA 比對問題多相像找出兩者中都出現的最長子序列看最長子序列有多長 , 越長越相像子序列 :

順序相同但不一定要連續 .

簡單的例子 : X=ABCBDAB, Y=BDCABA 子序列之一 : BCA 最長共同子序列 : BCBA

最長共同子序列 =? 答案在課本 p.391

30

DNA 比對問題最長共同子序列問題 : 給兩字串 , 找出最長共同子序列 .

最長共同子序列 =Longest Common Subsequence=LCS

問 : 暴力法有多暴力 ?

31

暴力法有多暴力 ? 找出所有 X 之子序列 , 與 Y 比較檢驗看看是不是 Y 的子序列 . X 有幾個子序列 ? 個 Running time:

32Dynamic Programming 出招先來個小定義 , 對 ,

先證明以下三個小定理 . 給定兩字串 , 及為 X 和 Y 的LCS( 之一 )

1. If , then and 是及的 LCS 之一2. If , then 表示是及的 LCS 之一3. If , then 表示是及的 LCS 之一

1. 找出 Optimal Substructure

33

1. If , then (1) and (2) 是及的 LCS 之一

(1) Z 最後一個字元一定是 , 否則可以把加到Z 的最後面成為比 LCS 更長的 CS ( 矛盾 )

(2) 一定是和的 LCS. 假設不是 , 則可以找到一個長度>k-1 的 LCS, 但是加上這一個字元 , 表示可以找到一個和的 LCS 長度>k ( 矛盾 )

𝑋𝑚−1

𝑌 𝑛−1

𝑥𝑚

𝑦 𝑛

𝑍 𝑘− 1𝑍 𝑘

34

2. If , then 表示是及的 LCS 之一

假設 Z 不是和的 LCS, 則有 W 為和的 LCS, 長度>k, 則 W亦為和的 LCS, 長度>k ( 矛盾 )

3. If , then 表示是及的 LCS 之一證明類似上面 2. 的證明 .

𝑋𝑚−1

𝑌 𝑛

𝑥𝑚

𝑍 𝑘− 1𝑍 𝑘

35

Optimal Substructure 給定兩字串 , 及為 X 和 Y 的 LCS( 之一 )1. If , then and

是及的 LCS 之一2. If , then 表示是及的 LCS 之一3. If , then 表示是及的 LCS 之一

大問題的解裡面有小問題的解 !

36

Overlapping subproblem 給定兩字串 , 及為 X 和 Y 的 LCS( 之一 )1. If , then and

是及的 LCS 之一2. If , then 表示是及的 LCS 之一3. If , then 表示是及的 LCS 之一

𝑋𝑚和𝑌 𝑛的𝐿𝐶𝑆

𝑋𝑚−1和𝑌 𝑛的𝐿𝐶𝑆

𝑋𝑚和𝑌 𝑛−1的𝐿𝐶𝑆

𝑋𝑚−1和𝑌 𝑛−1的𝐿𝐶𝑆不同問題需要同樣子問題的解 !

37

Dynamic Programming 出招2. 列出遞迴式子 ( 表示花費 )

if i=0 or j=0if and if and

兩種選擇

條件不同 , 使用的 subproblem 不同

38

Dynamic Programming 出招使用 dynamic programming 填表共有多少個 entry?

3. 計算花費

0 1 2 30123

ij

每一格只用到左、左上、上三格的資訊使用 bottom-up 方法兩層迴圈依序填入即可

39

0 1 2 3 4 5 60 0 0 0 0 0 0 01 0 0 0 0 1 1 12 0 1 1 1 1 2 23 0 1 1 2 2 2 24 0 1 1 2 2 3 35 0 1 2 2 2 3 36 0 1 2 2 3 3 47 0 1 2 2 3 4 4

例題0 1 2 3 4 5 6

01234567

B D C A B A

ABCBDAB

40

LCS_Length(X,Y)m=X.lengthn=Y.lengthlet b[1..m,1..n] and c[0..m,0..n] be new tablesfor i=1 to mc[i,0]=0for j=0 to nc[0,j]=0for i=1 to mfor j=1 to nif c[i,j]=c[i-1,j-1]+1b[i,j]=左上elseif c[i-1,j]c[i,j-1]c[i,j]=c[i-1,j]b[i,j]=上else c[i,j]=c[i,j-1]b[i,j]=左return c and b

邊界起始值填表 : 兩層迴圈

c紀錄 LCS 長度 , b紀錄選擇結果

Θ(𝑚𝑛)

41

Dynamic Programming 出招Print_LCS(b,X,i,j)if i==0 or j==0returnif b[i,j]==左上Print_LCS(b,X,i-1,j-1)print elseif b[i,j]==上Print_LCS(b,X,i-1,j)elsePrint_LCS(b,X,i,j-1)

4. 印出 LCS 結果

O(𝑚+𝑛)

dynamic programming ii

Documents