第 7 章

116
第 7 第 馬馬馬馬馬馬馬馬馬

Upload: rajah-soto

Post on 02-Jan-2016

34 views

Category:

Documents


3 download

DESCRIPTION

第 7 章. 馬可夫鏈與賽局理論. 7.1 馬可夫鏈 例題 1 股票的觀察. 億平對某一家航空公司的股票很有興趣,持續觀察了一段時間,發現其收盤價 (closing price) 的漲跌僅與前一日的收盤價有關。他於各交易日結束時做記錄,若當天的收盤價比前一個交易日的收盤價高、不變或低,則相對登錄為上漲、持平或下跌。億平的這一連串的觀察,可視為馬可夫鏈。. Tan/ 管理數學 第 7 章 第 344 頁. 例題 2 股票的觀察. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 第  7  章

第 7 章第 7 章馬可夫鏈與賽局理論

Page 2: 第  7  章

2

7.1 馬可夫鏈例題 1 股票的觀察

7.1 馬可夫鏈例題 1 股票的觀察

億平對某一家航空公司的股票很有興趣,持續觀察了一段時間,發現其收盤價 (closing price) 的漲跌僅與前一日的收盤價有關。他於各交易日結束時做記錄,若當天的收盤價比前一個交易日的收盤價高、不變或低,則相對登錄為上漲、持平或下跌。億平的這一連串的觀察,可視為馬可夫鏈。

Tan/ 管理數學第 7 章 第 344 頁

Page 3: 第  7  章

3

例題 2 股票的觀察例題 2 股票的觀察 承例題 1 。據億平觀察所得,若該股票當天的收盤價高於前一天,則次日的收盤價會上漲、持平或下跌的機率分別為 0.2, 0.3 與 0.5 ;若該股票當天的收盤價與前一天相同,則次日的收盤價會上漲、持平或下跌的機率分別為 0.5, 0.2 與 0.3 ;若該股票當天的收盤價低於前一天,則次日的收盤價會上漲、持平或下跌的機率分別為 0.4, 0.4 與 0.2 。請利用樹狀圖敘述狀態間遞移的機率。

Tan/ 管理數學第 7 章 第 344 頁

Page 4: 第  7  章

4

例題 2 股票的觀察(續)例題 2 股票的觀察(續)

解:本例的馬可夫鏈由三種狀態組成:上漲、持平或下跌。若現階段是上漲,則由上漲的狀態遞移到其他狀態之機率,標示於樹狀圖的分枝上,見圖 1 的最左圖。至於現階段是持平或下跌狀態,其對應的樹狀圖亦分別繪於圖 1 。

Tan/ 管理數學第 7 章 第 344-345 頁

Page 5: 第  7  章

5

遞移機率遞移機率 敘述馬可夫過程中由某個狀態到達下一個狀態的機率 ( 如例

題 2 中的機率 ) ,稱為遞移機率 (transition probabilities) 。這些遞移機率可用矩陣式來表達。假設有一馬可夫鏈的試驗,各階段的結果有三種狀態,分別命名為狀態 1 、 2 、 3 ,則由狀態 1 到達試驗的下個階段結果--狀態 1 、 2 、 3 的遞移機率,即為給定狀態 1 ,而下一個階段進入狀態1 、 2 、 3 的條件機率,可分別寫成 P ( 狀態 1 | 狀態 1) 、 P ( 狀態 2 | 狀態 1) 及 P ( 狀態 3 | 狀態 1) 。若我們使用矩陣的元素符號,可記成

Tan/ 管理數學第 7 章 第 345 頁

Page 6: 第  7  章

6

遞移機率遞移機率 這裡元素 a 的第一個下標代表試驗的下一階段到達之狀態,我們稱為次態 (next state) ,而第二個下標則代表現在的狀態,稱為現態。若以樹狀圖表示,則有如下關係:

Tan/ 管理數學第 7 章 第 345 頁

Page 7: 第  7  章

7

遞移機率遞移機率 同樣地,由狀態 2 及 3 到達下一階段之狀態的條件機率可寫成

Tan/ 管理數學第 7 章 第 345 頁

Page 8: 第  7  章

8

遞移機率遞移機率

Tan/ 管理數學第 7 章 第 345-346 頁

若以矩陣表示,其形式如下

Page 9: 第  7  章

9

例題 3例題 3

將例題 2 中的遞移機率以矩陣表示。解:例題 2 的馬可夫鏈有三個狀態,我們以狀態 1 、 2 、3 分別代表上漲、持平或下跌的狀態。因此當現態為狀態 1 時,次一階段到達狀態 1 、 2 、 3 的遞移機率分別為

Tan/ 管理數學第 7 章 第 346 頁

Page 10: 第  7  章

10

例題 3 (續)例題 3 (續)

解(續):以此類推,故用矩陣表示則為

Tan/ 管理數學第 7 章 第 346 頁

Page 11: 第  7  章

11Tan/ 管理數學

第 7 章 第 346-347 頁

遞移矩陣具 n 個狀態的馬可夫鏈可用 n × n 的遞移矩陣 (transition matrix) T 來表示,

其元素為 aij (1 i n; 1 j n) :

且遞移矩陣 T 有如下性質:1. 對任意的 i 與 j , aij 0 。2. 矩陣 T 的每一行的總和均等於 1 。

遞移機率遞移機率

Page 12: 第  7  章

12

例題 4 都市與郊區間的人口流動

例題 4 都市與郊區間的人口流動

政府預期每年居住在都市的人口會有 3% 遷移到郊區,且居住在郊區的人口會有 6% 遷移到都市。現在已知人口的分布有 65% 住在都市,其餘 35% 住在郊區。假設總人口數維持不變,試問一年後的人口分布情形如何?

Tan/ 管理數學第 7 章 第 347 頁

Page 13: 第  7  章

13

例題 4 都市與郊區間的人口流動(續)

例題 4 都市與郊區間的人口流動(續)

解:我們可以利用樹狀圖及條件機率求解。本例的樹狀圖繪於圖 2 。由條件機率的性質可知,隨機抽取一人,則他 ( 或她 ) 1 年後會住在都市的機率為

(0.65)(0.97) + (0.35)(0.06) = 0.6515

1 年後會住在郊區的機率為(0.65)(0.03) + (0.35)(0.94) = 0.3485

因此, 1 年後的人口分布為 65.15% 居住於都市,而34.85% 的人口居住於郊區。

Tan/ 管理數學第 7 章 第 347 頁

Page 14: 第  7  章

14

例題 4 都市與郊區間的人口流動(續)

例題 4 都市與郊區間的人口流動(續)

解(續):

Tan/ 管理數學第 7 章 第 347 頁

Page 15: 第  7  章

15

例題 5 都市與郊區間的人口流動

例題 5 都市與郊區間的人口流動

承例題 4 ,試問 2 年後居住於都市的人口比例有多少? 3 年後呢?

解:令 X2 代表 2 年後人口分布的行向量。若將 X1 視為「初始」人口分布,則 X2 只是下一階段的人口分布,因此,可乘上一個 T 矩陣求得分布

Tan/ 管理數學第 7 章 第 348 頁

Page 16: 第  7  章

16

例題 5 都市與郊區間的人口流動(續)

例題 5 都市與郊區間的人口流動(續)

解(續):類似的做法可得 X3 如下

亦即 3 年後居住於都市的人口佔 65.41% ,居住於郊區的人口佔 34.59% 。

Tan/ 管理數學第 7 章 第 348 頁

Page 17: 第  7  章

17

分布向量分布向量

由前面的例子可以看出, X0 , X1 , X2 , X3之間存在如下關係式: X1 = TX0 , X2 = TX1 = T2X0 及 X3 = TX2 = T3X0,由此我們可以進行歸納。

Tan/ 管理數學第 7 章 第 349 頁

Page 18: 第  7  章

18

分布向量分布向量 假設有一具備 n 個狀態的馬可夫鏈,系統一開始處於狀態 1 、

狀態 2 、…、狀態 n 的機率分別寫成 p1, p2, ... , pn,則其機率分配可表成 n 維向量如下:

稱為分布向量 (distribution vector) 。若 T 是該馬可夫鏈的 n × n 遞移矩陣,則系統經過 m 次的觀察後,新的分布向量為

(1)

Tan/ 管理數學第 7 章 第 349 頁

Page 19: 第  7  章

19

例題 6 計程車的移動區域例題 6 計程車的移動區域 吉利計程車行為了方便追蹤所屬計程車的動向,將市鎮劃分成三個區域:區域 1 、區域 2 及區域 3 。吉利計程車行的管理者根據過往的紀錄得知,在區域 1 上車的顧客,有 60% 在同一區域下車, 30% 在區域 2 下車, 10% 在區域 3 下車。在區域 2 上車的顧客,有 40% 在區域 1 下車, 30% 在區域 2 下車, 30% 在區域 3 下車。另外在區域 3 上車的顧客,有 30% 在區域 1 下車, 30% 在區域 2 下車, 40%在區域 3 下車。

Tan/ 管理數學第 7 章 第 349 頁

Page 20: 第  7  章

20

例題 6 計程車的移動區域(續)

例題 6 計程車的移動區域(續)

又知某一天開始營運時,有 80% 的計程車分布於區域 1 , 15% 的計程車分布於區域 2 , 5% 的計程車分布於區域 3 ,又知計程車空車時會固定在原區域內逗留直至招到乘客為止。a. 利用馬可夫鏈敘述計程車的移動區域,寫出其遞 移矩陣。b. 在所有計程車載客一回結束後,找出其新的分布 情形。c. 在所有計程車載客二回後,找出其新的分布情 形。

Tan/ 管理數學第 7 章 第 349 頁

Page 21: 第  7  章

21

例題 6 計程車的移動區域(續)

例題 6 計程車的移動區域(續)

解:今區域 1 、區域 2 及區域 3 分別以馬可夫鏈的狀態1 、狀態 2 及狀態 3 來代表。a. 其遞移矩陣為

Tan/ 管理數學第 7 章 第 349-350 頁

Page 22: 第  7  章

22

例題 6 計程車的移動區域(續)

例題 6 計程車的移動區域(續)

解(續):b. 問題中的初始分布向量為

Tan/ 管理數學第 7 章 第 350 頁

Page 23: 第  7  章

23

例題 6 計程車的移動區域(續)

例題 6 計程車的移動區域(續)

解 b (續):令 X1 代表一次觀察之後 ( 即所有計程車載客一回結束後 ) 的分布向量,則

亦即會有 55.5% 的計程車位於區域 1 , 30% 的計程車位於區域 2 , 14.5% 的計程車位於區域 3 。

Tan/ 管理數學第 7 章 第 350 頁

Page 24: 第  7  章

24

例題 6 計程車的移動區域(續)

例題 6 計程車的移動區域(續)

解(續):c. 令 X2代表二次觀察之後 ( 即所有計程車載客二回後 ) 的分布向量,則

亦即會有 49.65% 的計程車位於區域 1 , 30% 的計程車位於區域 2 , 20.35% 的計程車位於區域 3 。此結果與利用 T2X0 計算出來的一樣。

Tan/ 管理數學第 7 章 第 350 頁

Page 25: 第  7  章

25

7.2 正規馬可夫鏈例題 1 女性的教育狀況

7.2 正規馬可夫鏈例題 1 女性的教育狀況

據調查完成大學教育的母親之中,女兒也完成大學教育的佔 70% ;未完成大學教育的母親之中,女兒完成大學教育的僅佔 20% 。已知現在完成大學教育的女性為 20% ,若照此趨勢發展,最後完成大學教育的女性會有多少比例?

Tan/ 管理數學第 7 章 第 355 頁

Page 26: 第  7  章

26

例題 1 女性的教育狀況(續)

例題 1 女性的教育狀況(續)

解:本問題屬於馬可夫鏈,令完成大學教育為狀態 1 ,未完成大學教育為狀態 2 ,則遞移矩陣為

初始分布向量為

Tan/ 管理數學第 7 章 第 355-356 頁

Page 27: 第  7  章

27

例題 1 女性的教育狀況(續)

例題 1 女性的教育狀況(續)

解(續):利用第 7.1節公式 (1) 可找出經過一代、二代、三代之後的女性教育狀況的分布向量 X1 , X2 及 X3 如下:

Tan/ 管理數學第 7 章 第 356 頁

Page 28: 第  7  章

28Tan/ 管理數學

第 7 章 第 356 頁

例題 1 女性的教育狀況(續)

例題 1 女性的教育狀況(續)

解(續):我們亦可繼續計算往後幾代的分布向量:

Page 29: 第  7  章

29

例題 1 女性的教育狀況(續)

例題 1 女性的教育狀況(續)

解(續):從這裡已經可以看出長期的趨勢為

上述的向量稱做系統的極限 (limiting) 或穩態分布向量 (steady-state distribution vector) 。

Tan/ 管理數學第 7 章 第 356 頁

Page 30: 第  7  章

30

例題 1 女性的教育狀況(續)

例題 1 女性的教育狀況(續)

解(續):由以上的數據可知,本例的初始分布情形,女性當中有 20%完成大學教育, 80%未完成大學教育;經過一代之後,女性當中有 30%完成大學教育, 70%未完成大學教育。若依此趨勢發展,經過許多代以後,女性當中將會有 40%完成大學教育, 60%未完成大學教育。

Tan/ 管理數學第 7 章 第 356-357 頁

Page 31: 第  7  章

31

正規馬可夫鏈正規馬可夫鏈

Tan/ 管理數學第 7 章 第 358 頁

正規馬可夫鏈

若隨機矩陣 T 的次冪T, T2, T3, ...

趨近一個穩態矩陣,且符合以下兩個條件者,稱為正規馬可夫鏈 (regular Markov chain) :

a. 穩態矩陣裡每個元素都是正的。b. 同一列上的元素,其值均相等。

Page 32: 第  7  章

32

例題 2例題 2

判斷下列各矩陣是否為正規隨機矩陣:

解:a. 因矩陣中各元素均為正數,故知其為正規隨機矩 陣。

Tan/ 管理數學第 7 章 第 358-359 頁

Page 33: 第  7  章

33

例題 2 (續)例題 2 (續)

解(續):b. 由於矩陣中有一個元素為 0 ,因此,我們計算它的 次冪:

 在二次冪時,所有元素均已是正數,故知其為正 規隨機矩陣。

Tan/ 管理數學第 7 章 第 359 頁

Page 34: 第  7  章

34

例題 2 (續)例題 2 (續)

解(續):c. 令矩陣為 A並計算它的次冪:

 由於 A3 = A ,因此知道 A4 = A2, A5 = A, ... ,由此判斷,不管 是 A 的任何次冪,不可能得到所有元素均為正的結果,故知 矩陣 A 不是正規的。

Tan/ 管理數學第 7 章 第 359 頁

Page 35: 第  7  章

35

正規馬可夫鏈正規馬可夫鏈

Tan/ 管理數學第 7 章 第 359 頁

求穩態分布向量

令 T 是一個正規隨機矩陣,則其穩態分布向量為下面方程式的解

TX = X並需滿足 X 向量的元素和為 1 的條件。

Page 36: 第  7  章

36

例題 3例題 3

下面的遞移矩陣 T屬於正規馬可夫鏈,試求其穩態分布向量:

Tan/ 管理數學第 7 章 第 360 頁

Page 37: 第  7  章

37

例題 3 (續)例題 3 (續)

解:本例的 T 即為例題 1 之遞移矩陣。令馬可夫鏈的穩態分布向量 X 為

則 TX = X 得

由此列出線性方程組

Tan/ 管理數學第 7 章 第 360 頁

Page 38: 第  7  章

38

例題 3 (續)例題 3 (續)

解(續):但第一式與第二式各自化簡後,會發現它們與下面的方程式是一樣的:

加上 x + y = 1 的條件後,便得到以下線性方程組:

Tan/ 管理數學第 7 章 第 360 頁

Page 39: 第  7  章

39

例題 3 (續)例題 3 (續)

解(續):由第一式可得

代入第二式後,得到

Tan/ 管理數學第 7 章 第 360 頁

Page 40: 第  7  章

40

例題 3 (續)例題 3 (續)

解(續):因此,解得穩態分布向量為

與例題 1 的結果相符。

Tan/ 管理數學第 7 章 第 361 頁

Page 41: 第  7  章

41

例題 4 計程車的移動區域例題 4 計程車的移動區域 在第 7.1節的例題 6 中,我們找出敘述計程車移動區域的遞移矩陣 T ,並知 T 為正規隨機矩陣。試求計程車長時間之後在三個區域的分布情形。

Tan/ 管理數學第 7 章 第 361 頁

Page 42: 第  7  章

42

例題 4 計程車的移動區域(續)

例題 4 計程車的移動區域(續)

解:令穩態分布向量 X 為

則由 TX = X 得

Tan/ 管理數學第 7 章 第 361 頁

Page 43: 第  7  章

43

例題 4 計程車的移動區域(續)

例題 4 計程車的移動區域(續)

解(續):由此寫出線性方程組:

化簡後的線性方程組為

Tan/ 管理數學第 7 章 第 361 頁

Page 44: 第  7  章

44

例題 4 計程車的移動區域(續)

例題 4 計程車的移動區域(續)

解(續):加上 x + y + z = 1 的條件後,得到以下四個方程式的線性方程組:

Tan/ 管理數學第 7 章 第 362 頁

Page 45: 第  7  章

45

例題 4 計程車的移動區域(續)

例題 4 計程車的移動區域(續)

解(續):利用第 2 章的高斯—喬登消去法,解得

即 x 0.47, y = 0.30 與 z 0.23 。因此,最後大約有 47% 的計程車分布在區域 1 , 30% 的計程車分布在區域 2 ,以及23% 的計程車分布在區域 3 。

Tan/ 管理數學第 7 章 第 362 頁

Page 46: 第  7  章

46

7.3 吸收馬可夫鏈吸收馬可夫鏈

7.3 吸收馬可夫鏈吸收馬可夫鏈

若一馬可夫鏈的遞移矩陣是吸收隨機矩陣,則稱之為吸收馬可夫鏈 (absorbing Markov chain) 。

Tan/ 管理數學第 7 章 第 368 頁

吸收隨機矩陣

一個吸收隨機矩陣 (absorbing stochastic matrix)必須符合

下面兩個性質:1. 至少存在一個吸收態。2. 在任一非吸收態的物體,均有機會經由一個或多個階

段來到吸收態。

Page 47: 第  7  章

47

例題 1例題 1

判斷下面的矩陣是否為吸收隨機矩陣:

Tan/ 管理數學第 7 章 第 369 頁

Page 48: 第  7  章

48

例題 1 (續)例題 1 (續)

解:a. 由於矩陣的 a22=1 且第二行的其餘元素均為 0 ,因此知狀

態 2 為吸收態。同理可知,狀態 4 亦為吸收態。接下來要問的是,在非吸收態 ( 狀態 1 與狀態 3) 的物體,是否有機會進入吸收態──狀態 2 或狀態 4 ?檢視矩陣的第一行,可知在狀態 1 的物體有 0.3 的機會可到達狀態 3 。再由矩陣的第三行元素可知,在狀態 3 的物體有 0.5 的機率可以進到狀態 2 ,有 0.2 的機率可以進入狀態 4 。我們注意到,雖然在狀態 1 的物體無法經一個階段即到達吸收態,但因有機會進入狀態 3 ,便可由狀態 3再到吸收態,只是中間需要經歷多個階段。綜合上述,本矩陣為一吸收隨機矩陣。

Tan/ 管理數學第 7 章 第 369 頁

Page 49: 第  7  章

49

例題 1 (續)例題 1 (續)

解(續):b. 狀態 1 與狀態 2 是吸收態,但處在非吸收態

( 狀態 3 與狀態 4) 的物體,都不可能到達狀態 1 或狀態 2 。因此,本矩陣不是吸收隨機矩陣。

Tan/ 管理數學第 7 章 第 369 頁

Page 50: 第  7  章

50

例題 2 賭徒的毀滅例題 2 賭徒的毀滅軍豪決定以本錢 2 元參加賭局。他每次都下 l 元的賭注,每回贏的機率都是 0.4 。軍豪將反覆地賭,直到錢輸光或手上擁有 3 元為止。請寫出此吸收馬可夫鏈的遞移矩陣。

解:本題的馬可夫鏈有 4 個狀態,分別代表軍豪在賭的過程中手上的金額,有 $1 、 $2 及 $3 。由於 $0 的狀態表示錢輸光,不再玩,因此,這兩個狀態都是吸收態。

Tan/ 管理數學第 7 章 第 370 頁

Page 51: 第  7  章

51

例題 2 賭徒的毀滅(續)例題 2 賭徒的毀滅(續)

解(續):把吸收態排在前面, $3 也表示達到目標不再寫出遞移矩陣如下,並說解 $0 玩明於後:

矩陣的第一、第二行因對應吸收態,故 a11 = a22 = l 且 a21 = a31 = a41 = 0 , a12 = a32 = a42 = 0 。

Tan/ 管理數學第 7 章 第 370 頁

Page 52: 第  7  章

52

例題 2 賭徒的毀滅(續)例題 2 賭徒的毀滅(續)

解(續):矩陣的第三行因對應非吸收態, $ l ,因此須考慮玩一把的結果:已知贏的機率是 0.4 ,此時將累積到 $2 ,故有 a43 = 0.4 ;且輸的機率是 0 . 6 ,將剩下 $ 0 ,故有 a13 = 0.6 。矩陣的第四行因對應非吸收態, $2 ,玩下一把的結果,贏的機率是 0.4 , 此時將累積到 $3 ,故有 a24 = 0.4 ;凡輸的機率是 0.6 ,將剩下 $1 ,故有 a34 = 0.6 。

Tan/ 管理數學第 7 章 第 370 頁

Page 53: 第  7  章

53

吸收馬可夫鏈吸收馬可夫鏈

Tan/ 管理數學第 7 章 第 371 頁

求吸收馬可夫鏈的穩態矩陣

假設一吸收隨機矩陣 A 已切割成子矩陣如下

則 A 的穩態矩陣為

此處定義 (I – R)–1內的單位矩陣 I 與 R 的維度相同。

Page 54: 第  7  章

54

例題 3 賭徒的毀滅例題 3 賭徒的毀滅 如同例題 2 的敘述,軍豪將反覆地賭,直到錢輸光了或手上擁有 3 元為止。試問軍豪最後贏錢累積到 $3 的機率為何?

解:例題 2 中,我們已寫出遞移矩陣,予以切割後

Tan/ 管理數學第 7 章 第 371 頁

Page 55: 第  7  章

55

例題 3 賭徒的毀滅(續)例題 3 賭徒的毀滅(續)

解(續):得到子矩陣 R 與 S

因此

Tan/ 管理數學第 7 章 第 371 頁

Page 56: 第  7  章

56

例題 3 賭徒的毀滅(續)例題 3 賭徒的毀滅(續)

解(續):求其反矩陣(可利用第 2.6節的公式)得

與 S 相乘後

Tan/ 管理數學第 7 章 第 371-372 頁

Page 57: 第  7  章

57

例題 3 賭徒的毀滅(續)例題 3 賭徒的毀滅(續)

解(續):得到 A 的穩態矩陣為

我們因此知道,軍豪從 $2 開始賭,最後累積到 $3 結束賭局的機率為 0.53 ,亦即贏 $ l 的機率是 53 % 。Tan/ 管理數學

第 7 章 第 372 頁

Page 58: 第  7  章

58

例題 4 遺傳學例題 4 遺傳學 有一特殊的玫瑰品種,若具 AA 基因會開出紅色的花,具 Aa 基因會開出粉紅色的花,具 aa 基因會開出白色的花。這裡的 A 為顯性基因, a 為隱性基囚。此外,兩裸母株交配之後,它們的基因會遺傳到子株身上。今假設所有的後代都只與紅色植株交配,試說明經過無數代之後,最終只會剩下紅色的玫塊花。

Tan/ 管理數學第 7 章 第 372 頁

Page 59: 第  7  章

59

例題 4 遺傳學(續)例題 4 遺傳學(續)

解:本例題的馬可夫鏈共有三種狀態,分別表示三類基因 AA 、 Aa 及 aa 。我們寫出遞移矩陣如下,並說明於後:

Tan/ 管理數學第 7 章 第 372 頁

Page 60: 第  7  章

60

例題 4 遺傳學(續)例題 4 遺傳學(續)

解(續):因為具 AA 基因的母株與紅色植株(亦為 AA 基因)交配後的 子株,只可能遺傳到 AA 基因(由二母株各取得一個 A 的基因),因此,矩陣的第一行為 a11 = 1 , a21 = a31 = 0 。若是具 Aa 基因的母株與紅色植株

交配其子株有 的機會得到 A 或 a 的基因,加上來自紅色植株的 A 基因,因此子株為 AA 或 Aa 基因的機率各半,故矩陣的第二行為 。

Tan/ 管理數學第 7 章 第 372-373 頁

Page 61: 第  7  章

61

例題 4 遺傳學(續)例題 4 遺傳學(續)

解(續):若是具 aa 基因的母株與紅色植株交配,其子株必然得到 a 的基因,加上來自紅色植株的 A 基因,因此子株基因肯定為 Aa ,故矩陣的第三行的 a23 = 1 ,其餘為 0 。

Tan/ 管理數學第 7 章 第 373 頁

Page 62: 第  7  章

62

例題 4 遺傳學(續)例題 4 遺傳學(續)

解(續):由遞移矩陣的對角線元素可知狀態 AA 是一個吸收態,且另兩個非吸到達狀態 AA ,因此,本例是一個吸收馬可夫鏈陣求得。其長期的效果,可由 T 的穩態矩陣求得。首先將 T 做個切割。

Tan/ 管理數學第 7 章 第 373 頁

Page 63: 第  7  章

63

例題 4 遺傳學(續)例題 4 遺傳學(續)

解(續):得到子矩陣 R 與 S

因此

Tan/ 管理數學第 7 章 第 373 頁

Page 64: 第  7  章

64

例題 4 遺傳學(續)例題 4 遺傳學(續)

解(續):求其反矩陣(可利用第 2.6節的公式)得

與 S 相乘後

Tan/ 管理數學第 7 章 第 373 頁

Page 65: 第  7  章

65

例題 4 遺傳學(續)例題 4 遺傳學(續)

解(續):得到 T 的穩態矩陣為

由於穩態矩陣第一列的元素均為 l ,因此表示交配到最後,花色將全部變紅。

Tan/ 管理數學第 7 章 第 373 頁

Page 66: 第  7  章

66

7.4 賽局理論與嚴格判定賽局7.4 賽局理論與嚴格判定賽局 賽局理論( game theory )的發展得歸功於約翰 · 馮 · 紐曼( John von Neu-mann , 1903-1957) ,他是 20 世紀位一位偉大的數學家。之後於 1994 年,約翰 · 哈森義( John Harsanyi )、約翰 · 納許( John Nash )與仁哈德 · 塞頓( Reinhard Selten )三人更因在賽局理論上的重大貢獻,而獲得諾貝爾獎。賽局理論結合矩陣方法與機率論,探討在二位或更多對手競爭的情境下,各方可以採取的最佳策略( optimal strategy ) ,原則上以尋求自身的最人穫利( gain ) 或最小損失( loss)為目的。例如,撲克牌的玩家、競爭行號問急欲擴充市場佔有率的管理者、不同黨派的競選總部、或敵我作戰部隊的將領之間),便而臨這類問題的考驗。為簡化起見,我們只討論兩個參賽者( player )的賽局( game) ,並稱為二人賽局( two-person game)

Tan/ 管理數學第 7 章 第 379 頁

Page 67: 第  7  章

67

例題 1 錢幣配對例題 1 錢幣配對唐先生和聶小姐,一塊兒玩錢幣配對遊戲。在事先不知對方的選擇下,各自選定十元錢幣的一側(正面或反面),爾後同時打開手掌。若兩人都是正面,則唐先生必須付聶小姐 3 元;若聶小姐是正面,唐先生選反面,則聶小姐需付唐先生 6 元;若頗小姐是反面,唐先生選正面,則唐先生需付頗小姐 2 元;若兩人都是反面,則唐先生必須付聶小姐 1 元。在這個遊戲裡,雙方都想找到一個最佳策略,使自己可以贏最多的錢(或者,使自己可以輸得最少)。

Tan/ 管理數學第 7 章 第 379 頁

Page 68: 第  7  章

68

二人賽局二人賽局 例題 l 的錢幣配對遊戲是典型的零和賽局( zero-

sum game),即一方的收益代表另一方的損失,因此,雙方的付款總和必然為零。例如,當唐先生與聶小姐都出示正面時,若從唐先生(支付)的角度看,因唐先生必須支付 3 元,故記做 +3 而聶小姐因收入 3 元,故她的支付款記做 3 ,二者的和即為 0 。

Tan/ 管理數學第 7 章 第 379 頁

Page 69: 第  7  章

69

二人賽局二人賽局 以下將錢幣配對遊戲的支付額情形寫成矩陣形式:

Tan/ 管理數學第 7 章 第 379 頁

Page 70: 第  7  章

70

二人賽局二人賽局 矩陣各行代表唐先生所採取的行動,各列代表聶小姐所採取的行動。炬陣中的元素代表雙方採取的行動之後果,為免混淆,固定以唐先生的支付額登錄。亦即唐先生需付款給聶小姐時(唐先生輸錢的時候),其值為正,而聶小姐需付給唐先生時(唐先生贏錢的時候),其值為負。例如, a22 = 1 表示兩人都出示反面時,唐先生需支付 1 元給聶小姐,而 a12 = 6 則表示聶小姐出示正面,唐先生出示反面時,唐先生將從聶小姐處贏得 6 元。

Tan/ 管理數學第 7 章 第 379-380 頁

Page 71: 第  7  章

71

二人賽局二人賽局 今假設有 R 與 C兩名參賽者的一個二人賽局,參賽者 R 可採

取的行動為 R1, R2, …, Rm 共 m 個,而參賽者 C 可採取的行動為 C1, C2, …, Cn 共 n 個。我們可利用一個 m × n 大小的矩陣來表示雙方採取的行動組合後果,形式如下

Tan/ 管理數學第 7 章 第 380 頁

Page 72: 第  7  章

72

二人賽局二人賽局

其中,第 i列第 j 行的元素 aij表示 R 採取 Ri的行動且 C 採取 Cj 的行動時,參賽者 C 的支付額( payoff )為 aij ,指 C 應付給 R 的款項。注意當 R 需支付給 C 時,則 aij的值為負。上面的矩陣,我們稱為支付額矩陣( payoff matrix )。

Tan/ 管理數學第 7 章 第 380 頁

Page 73: 第  7  章

73

例題 2例題 2

一賽局的支付額矩陣如下:

請解釋矩陣內容。

Tan/ 管理數學第 7 章 第 380 頁

Page 74: 第  7  章

74

例題 2 (續)例題 2 (續)

解:此二人賽局的參賽者 R 有兩種行動,而參賽者 C 有三種行動。假設支付的單位是元。由支付額矩陣可知,若 R 選擇 R1

的行動,則當 C 採取 C1時, R 贏 1 元。當 C 採取 C2時, R 輸 2 元。當 C 採取 C3 時, R 贏 3 元。若 R 選擇 R2的行動,則當 C 採取 C1時, R 贏 4 元。當 C 採取 C2時, R 輸 5 元。當 C 採取 C3 時, R 輸 1 元。Tan/ 管理數學

第 7 章 第 380-381 頁

Page 75: 第  7  章

75

二人賽局二人賽局

Tan/ 管理數學第 7 章 第 381 頁

極小值最大化策略 1. 從支付額矩陣的每一列找出最小元素,稱列極小值。2. 從所有的列極小值中選出最大的,其所在列即參賽者

R 的最佳行動。

Page 76: 第  7  章

76

二人賽局二人賽局 前述的支付額矩陣運用極小值最大化策略的結果,圈選元素 1 如下:

因此,聶小姐的最佳行動是採用 R2,而圈選的元素1 表示她至少會贏 1 元。

Tan/ 管理數學第 7 章 第 381 頁

Page 77: 第  7  章

77

二人賽局二人賽局

Tan/ 管理數學第 7 章 第 382 頁

極大值最小化策略

1. 從支付額矩陣的每一行找出最大元素,稱行極大值。2. 從所有的行極大值中選出最小的,其所在行即參賽者

C 的最住行動。

Page 78: 第  7  章

78

二人賽局二人賽局 承例提 1 ,唐先生運用極大值最小化策略的結果,圈選元素 1 如下:

因此,唐先生的最佳行動是採用 C2,而圈選的元素1 代表他最多只會輸掉 1 元。

Tan/ 管理數學第 7 章 第 382 頁

Page 79: 第  7  章

79

例題 3例題 3

針對下面的支付額矩陣,找出它的極小值最大化策略與極大值最小化策略:

解:先寫出每一列的極小值與每一行的極大值,再從列極小值中圈選最大者(此處為 1 ,位於第三列),得到極小值最大化策略,表示列參賽者應採取第三列的行動。

Tan/ 管理數學第 7 章 第 382 頁

Page 80: 第  7  章

80

例題 3 (續)例題 3 (續)

解(續):

若從行極大值中圈選最小者(此處為 0 ,位於第 2 行),得到極大值最小化策略,表示行參賽者應採取第二行的行動。

Tan/ 管理數學第 7 章 第 382-383 頁

Page 81: 第  7  章

81

例題 4例題 4

針對下面的支付額矩陣,找出它的極小值最大化策略與極大值最小化策略:

解:先寫出每一列的極小值與每一行的極大值,再從列極小值中圈選最大者(此處為 3 ,位於第 2列),得到極小值最大化策略,表示列參賽者應採取第二列的行動。

Tan/ 管理數學第 7 章 第 383 頁

Page 82: 第  7  章

82

例題 4 (續)例題 4 (續)

解(續):

若從行極大值中圈選最小者(此處為 3 ,位於第 3 行),得到極大值最小化策略,表示行參賽者應採取第三行的行動。

Tan/ 管理數學第 7 章 第 383 頁

Page 83: 第  7  章

83Tan/ 管理數學

第 7 章 第 384 頁

二人賽局二人賽局

最佳策略

賽局裡所指的最佳策略( optimal strategy ) ,係對某一名

參賽者最為有利的策略。

Page 84: 第  7  章

84

二人賽局二人賽局

嚴格判定賽局

一個嚴格判定賽局( strictly determined game )具備下

面的性質: 1. 在支付額矩陣中,存在一元素,既是所處列的最小值,也是所處行的最大值。該元素稱為此賽局的鞍點( saddle point )。

2. 對列參賽者而言,他的最佳策略是極小值最大化策略,選取的即是鞍點的所在列。對行參賽者而言,他的最佳策略是極大值最小化策略,選取的即是鞍點的所在行。

Tan/ 管理數學第 7 章 第 384 頁

Page 85: 第  7  章

85

例題 5例題 5

一個二人零和賽局的支付額矩陣如下:

a. 證明此賽局是一個嚴格判定賽局,並找出它的鞍 點。b. 分別找出兩位參賽者的最佳策略。c. 賽局值為何?試問此賽局對誰較有利?

Tan/ 管理數學第 7 章 第 384-385 頁

Page 86: 第  7  章

86

例題 5 (續)例題 5 (續)

解:a. 先寫出每一列的極小值與每一行的極大值:

 再圈選出元素 2 ,它同時為所在列的最小值與所在行的最  大值,故此元素 a23 = 2 為鞍點。此鞍點的存在,證明這是  一個嚴格判定賽局。Tan/ 管理數學

第 7 章 第 385 頁

Page 87: 第  7  章

87

例題 5 (續)例題 5 (續)

解(續):b. 因鞍點位於第二列第三行,對列參賽者而言,他  的最佳策略是第二列,對行參賽者而言,他的最 佳策略是第三行。c. 我們得到賽局值為 2 ,表示兩位參賽者都採行最  佳策略時,行參賽者將贏得 2 個單位,亦即此賽局  對行參賽者較為有利。

Tan/ 管理數學第 7 章 第 385 頁

Page 88: 第  7  章

88

例題 6例題 6

一個二人零和賽局的支付額矩陣如下:

a. 證明此賽局是一個嚴格判定賽局,並找出它的鞍 點。b. 分別找出兩位參賽者的最佳策略。c. 試問此賽局是否對誰較為有利?

Tan/ 管理數學第 7 章 第 385 頁

Page 89: 第  7  章

89

例題 6 (續)例題 6 (續)解:

a. 先寫出每一列的極小值與每一行的極大值:

再圈選出元素 4 ,共有兩個,它們都同時為所在列的最小值與所在行的最大值,故本賽局有兩個鞍點, a11 = 4 及 a31 = 4 。這些鞍點的存在,證明這是一個嚴格判定賽局。另外要注意的是,雖然鞍點可能有多個,但其值應相等。

Tan/ 管理數學第 7 章 第 385-386 頁

Page 90: 第  7  章

90Tan/ 管理數學

第 7 章 第 386 頁

例題 6 (續)例題 6 (續)

解(續):b. 由於鞍點有兩個,都落在第一行,分別位於第一 及第三列。因此,對列參賽者而言,他的最佳策  略是第一及第三列,對行參賽者而言,他的最佳  策略只有第一行。

c. 我們得到賽局值為 4 ,表示此賽局對列參賽者較為  有利。

Page 91: 第  7  章

91

7.5 混合策略的賽局混合策略

7.5 混合策略的賽局混合策略

Tan/ 管理數學第 7 章 第 391 頁

Page 92: 第  7  章

92

賽局的期望值賽局的期望值

Tan/ 管理數學第 7 章 第 393 頁

賽局的期望值

1

21 2 m

n

q

qP p p p Q

q

Page 93: 第  7  章

93

賽局的期望值賽局的期望值

分別代表列參賽者與行參賽者的混合策略,且知其賽局的支付額矩陣 A ( 維度 m × n) 為

Tan/ 管理數學第 7 章 第 393 頁

11 12 1

21 22 2

1 2

n

n

m m mn

a a a

a a aA

a a a

Page 94: 第  7  章

94

賽局的期望值賽局的期望值

Tan/ 管理數學第 7 章 第 393 頁

則此賽局的期望值計算如下:

11 12 1 1

21 22 2 21 2

1 2

n

nm

m m mn n

a a a q

a a a qE PAQ p p p

a a a q

Page 95: 第  7  章

95

例題 1例題 1

唐先生和聶小姐一起玩錢幣配對遊戲,其支付額矩陣如下(唐先生視為行參賽者,聶小姐視為列參賽者 ) :

以下若聶小姐採用 P 的混合策略,而唐先生採用 Q 的混合策略,試求賽局的期望支付額:

Tan/ 管理數學第 7 章 第 394 頁

Page 96: 第  7  章

96

例題 1 (續)例題 1 (續)

解:a. 由公式計算得

 因此,在重複的賽局下,從長期看,雙方並沒有 輸贏。

Tan/ 管理數學第 7 章 第 394 頁

Page 97: 第  7  章

97

例題 1 (續)例題 1 (續)

解(續):b. 由公式計算得

 因此,在重複的賽局下,從長期看,對列參賽者  (聶小姐 ) 而言,每一回比賽平均將輸掉 1.06 元。

Tan/ 管理數學第 7 章 第 394 頁

Page 98: 第  7  章

98

例題 2例題 2

一賽局的支付額矩陣如下:

a. 如果列參賽者採用極小值最大化策略,且行參賽者採用極大值最小化策略,試問對列參賽者而言,期望支付額為多少?

b. 如果列參賽者採用極小值最大化策略的機會為 50% ,選擇其餘兩列的機會各為 25% ,且行參賽者選擇各行的機會分別為 50% ,試問對列參賽者而言,期望支付額為多少?

Tan/ 管理數學第 7 章 第 395 頁

Page 99: 第  7  章

99

例題 2 (續)例題 2 (續)

解:a. 我們利用第 7.4節的方法,尋找極小值最大化策略與極大值最小化策略如下:

 

Tan/ 管理數學第 7 章 第 395 頁

Page 100: 第  7  章

100

例題 2 (續)例題 2 (續)

解 a (續):列參賽者的最佳單一策略是選擇第二列,而行參賽者的最佳單一策略是選擇第二行。如果兩位參賽者都採用上述的最佳單一策略,則從支付額矩陣的第二列第二行元素可知,賽局的期望支付額為支付給列參賽者 2 元。

Tan/ 管理數學第 7 章 第 395 頁

Page 101: 第  7  章

101

例題 2 (續)例題 2 (續)

解(續):b. 根據題意,可寫出列參賽者的混合策略為

 行參賽者的混合策略為

Tan/ 管理數學第 7 章 第 395 頁

Page 102: 第  7  章

102

例題 2 (續)例題 2 (續)

解 b (續):由公式計算,支付給列參賽者的期望支付額為

Tan/ 管理數學第 7 章 第 395-396 頁

Page 103: 第  7  章

103Tan/ 管理數學

第 7 章 第 396-397 頁

賽局的期望值賽局的期望值

2 × 2 非嚴格判定賽局的最佳混合策略令

為一非嚴格判定賽局的支付額矩陣。則對列參賽者而言,其最佳混合策略是

(2a)其中

a b

c d

1 2 P p p

1

2 11

d cp

a d b cp p

Page 104: 第  7  章

104Tan/ 管理數學

第 7 章 第 397 頁

賽局的期望值賽局的期望值

對行參賽者而言,其最佳混合策略是

(2b)

其中

1

2

qQ

q

1

2 11

d bq

a d b cq q

Page 105: 第  7  章

105

賽局的期望值賽局的期望值

Tan/ 管理數學第 7 章 第 397 頁

此外,當 P 與 Q 分別是列與行參賽者的最佳混合策略時,賽局值定義成此賽局的期望值 E = PAQ ,即

(2c)

E PAQ

ad bc

a d c c

Page 106: 第  7  章

106

例題 3 錢幣配對遊戲例題 3 錢幣配對遊戲依照例題 1 的支付額矩陣:

a. 找出唐先生與聶小姐二人的最佳混合策略。b. 計算賽局值,並判斷此賽局是否對誰較為有利?

Tan/ 管理數學第 7 章 第 397 頁

Page 107: 第  7  章

107

例題 3 錢幣配對遊戲(續)例題 3 錢幣配對遊戲(續)

解:a. 由於此支付額矩陣沒有鞍點,因此這是一個非嚴格判定賽局。將 a = 3, b = 2, c = 2 與 d = 1 代入公式 (2a) :

Tan/ 管理數學第 7 章 第 397 頁

Page 108: 第  7  章

108

例題 3 錢幣配對遊戲(續)例題 3 錢幣配對遊戲(續)

解 a (續):

故知聶小姐的最佳混合策略為

Tan/ 管理數學第 7 章 第 398 頁

Page 109: 第  7  章

109

例題 3 錢幣配對遊戲(續)例題 3 錢幣配對遊戲(續)

解 a (續):利用公式 (2b) :

Tan/ 管理數學第 7 章 第 398 頁

Page 110: 第  7  章

110

例題 3 錢幣配對遊戲(續)例題 3 錢幣配對遊戲(續)

解 a (續):得知唐先生的最佳混合策略是

Tan/ 管理數學第 7 章 第 398 頁

Page 111: 第  7  章

111

例題 3 錢幣配對遊戲(續)例題 3 錢幣配對遊戲(續)

Tan/ 管理數學第 7 章 第 398 頁

解(續):b. 利用公式 (2c) 可計算出賽局值:

 由於賽局值為負,所以,此賽局對唐先生較為有利。當唐  先生與聶小姐都採取最佳混合策略,在重複的賽局下,從  長期看,平均一回唐先生將贏 1/8 元。

Page 112: 第  7  章

112

例題 4 投資策略例題 4 投資策略 連家共有 4萬元在股票及貨幣市場進行短期投資,其投資的績效視優惠利率的情況而定。如優惠利率上升,將有利於貨幣市場的投資;如優惠利率下降,則利於股票市場的投資。今將連家視為列參賽者,把不同情形下估算的投資報酬率 (%) 當作支付額,整理出支付額矩陣如下:

Tan/ 管理數學第 7 章 第 399 頁

Page 113: 第  7  章

113

例題 4 投資策略(續)例題 4 投資策略(續)

a. 對於連家這筆 4 萬元的短期投資,其最佳投資策 略為何?

b. 連家的這項短期投資,利潤如何?

Tan/ 管理數學第 7 章 第 399 頁

Page 114: 第  7  章

114

例題 4 投資策略(續)例題 4 投資策略(續)

解:a. 由支付額矩陣可知,此為非嚴格判定賽局。令 P = [p1 p2] 代表連家的最佳混合策略,利用公式 (2a) ,解得

Tan/ 管理數學第 7 章 第 399 頁

Page 115: 第  7  章

115

例題 4 投資策略(續)例題 4 投資策略(續)

解 a (續):

故連家宜投資 (6/7)(40,000) ,即大約 34,300 元於貨幣市場,以及 (1/7)(40,000) ,約 5700 元於股票市場。

Tan/ 管理數學第 7 章 第 399 頁

Page 116: 第  7  章

116

例題 4 投資策略(續)例題 4 投資策略(續)

解(續):b. 我們求出賽局值

 故知連家這項 4 萬元的短期投資,預期會有 12.14% 的投資 報酬率,即獲得 (0.1214)(40,000) = 4,856 元的利潤。

Tan/ 管理數學第 7 章 第 399-400 頁