云南农业大学经济管理学院 主讲:佘迎红

95
Page 1 云云云云云云云云云云云云 云云 云云云

Upload: lee-rocha

Post on 02-Jan-2016

161 views

Category:

Documents


6 download

DESCRIPTION

云南农业大学经济管理学院 主讲:佘迎红. 第 12 章 博 弈 论 game theory. 12.1 引 言 12.2 纳什均衡 Nash Equilibrium 12.3 反应函数法 Method of reaction function 12.4 有限二人零和博弈 Two person finite zero-sum game 12.5 有限二人非零和博弈 Two person finite non-zero-sum game. 12.1 引 言. 12.1.1 博弈论概述. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1

云南农业大学经济管理学院主讲:佘迎红

12.1 引 言 12.2 纳什均衡 Nash Equilibrium 12.3 反应函数法 Method of reaction function 12.4 有限二人零和博弈 Two person finite zero-sum game 12.5 有限二人非零和博弈 Two person finite non-zero-sum game

第第 1212 章 博 弈 论章 博 弈 论game theory

Page 3

博弈论( game theory )亦称对策论,是研究具有对抗或竞争性质现象的数学理论和方法,它既是数学、也是运筹学的一个重要分支。 博弈行为是博弈论中一个重要的概念。博弈行为是指具有竞争或对抗性质的行为,在这类行为中,参加斗争或竞争的各方各自具有不同的利益和目标,各方需考虑对手的各种可能的行动方案,如何采取行动以及与对手互动对自己最为有利 。

12.1.1 博弈论概述

12.1 引 言

Page 4

【例 12-3 】齐威王田忌赛马

齐王:上 中 下 田忌:下 上 中

12.1.1 博弈论概述

Page 5

【补充例 1 】囚徒的困境

( -1 , -1 )( -10 , -1/4 )抵赖

( -1/4 , -10 )( -5 , -5 )坦白

抵赖坦白 囚徒 2囚徒 1

12.1.1 博弈论概述

Page 6

博弈: 是一些个人、团队或其它组织,面对一定的环境条件,在一定的规则下,同时或先后从各自允许的行为或策略中进行选择并加以实施,各自取得相应结果的过程。博弈行为具有的共同特征:

( 1 )有一定的规则( 2 )有一个明确的结果( 3 )有可供选择的策略( 4 )策略与利益相互依存

12.1.1 博弈论概述

Page 7

在现实社会、经济生活中很多活动都具有博弈的特征,例如:市场竞争、经营决策、投资分析、价格制定、费用分摊、财政转移支付、投标与拍卖、对抗与追踪、资源利用、谈判、竞选、战争等。 又如,三国时代的曹不兴溅墨画蝇、曹操兵败华容道、北宋时期的丁渭挖河修皇宫等都是博弈论成功应用的例子。

12.1.1 博弈论概述

Page 8

博弈论研究的问题 : 参与博弈的各方是否存在最合理的策略以及如何找到合理的策略。 博弈论是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。即它是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。它将成为当代经济管理学科的前沿领城。 著名法国经济学家泰勒尔( Jean Tirole )说:“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远地改变了经济学家的思维方式”。

12.1.1 博弈论概述

Page 9

1944 年美国普林斯特大学教授冯 ·诺伊曼、摩根斯坦的著作《博弈论和经济行为》的出版,是博弈论诞生的标志。 普林斯特大学对博弈论作出重大贡献的还有塔克、库恩、纳什等。

12.1.1 博弈论概述

要想在现代社会做 一个有文化的人,你必须对博弈论有一个大致的了解。

——萨缪尔森

Page 10

12.1.1 博弈论概述

约翰 ·纳什 (John F. Nash )1928年生于美国 ,1994年获得诺贝尔经济学奖。在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响。

Nash 对博弈论的主要贡献有:( 1 )合作博弈中的讨价还价模型,称为 Nash讨价还价解;( 2 )非合作博弈的均衡分析。

Page 11

博弈论发展史上的五次诺贝尔经济学奖 1994年,纳什、海萨尼、塞尔顿,非合作博弈理论

12.1.1 博弈论概述

Page 12

博弈论发展史上的五次诺贝尔经济学奖 1996年,莫里斯和维克瑞,不对称信息条件下激励机制问题

12.1.1 博弈论概述

Page 13

博弈论发展史上的五次诺贝尔经济学奖 2005年,罗伯特 .奥曼,托马斯 .谢林,合作博弈理论

12.1.1 博弈论概述

Page 14

博弈论发展史上的五次诺贝尔经济学奖 2007年,三名美国经济学家莱昂尼德 .赫维奇,埃里克 .马斯金,罗杰 . “ ”迈尔森, 机制设计理论

12.1.1 博弈论概述

Page 15

博弈论发展史上的五次诺贝尔经济学奖 2012年,美国经济学家阿尔文 .罗思( Alvin E. Roth )和劳埃德 .沙普利( Lloyd S. Shapley ),“稳定匹配理论和市场设计实践”。

12.1.1 博弈论概述

Page 16

博弈模型的 3 个基本要素: ( 1 )局中人 (players) :博弈的参加者,可以是一个人、一个团队、一个企业、交战的一方等。假设每一个局中人都是“理智”的。 ( 2 )策略集 (strategies) :策略是可供局中人选择的实际可行的完整的行动方案。每个局中人的策略集( S )至少应包括两个策略。 ( 3 )得益(赢得)函数 (payoffs) :当每个局中人的策略确定后,他们就会得到相应的收益或损失称为局中人的得益,不同的策略会导致不同的得益,因此,得益是策略的函数。

12.1.2 博弈三要素

Page 17

),,,( 21 nssss n 人博弈全体局势的集合 S 可用各局中人的策略集的迪卡尔集表示

nSSSS 21

12.1.2 博弈三要素

局势:每一个局中人各选择一个策略形成的对局 ( 策略组合 ) 。 两人博弈

二人博弈的矩阵型表示 :

ji ,

坦白 抵赖坦白 -5 , -5 -1/4 , -1

0

抵赖 -10 , -1/4

-1 , -1

囚徒 2

囚徒1

18

分类依据 类 型

局中人数量 两人博弈,多人博弈,单人博弈策略数量 有限博弈,无限博弈

信息结构 完全信息博弈,不对称信息博弈

局中人间是否允许合作 非合作博弈,合作博弈

博弈过程 静态博弈,动态博弈,重复博弈

得益情况 零和博弈,常和博弈,变和博弈

12.1.3 博弈的结构和分类

Page 19

完全理性非合作博弈

按博弈方式 有限理性

合作博弈

二人零和博弈二人博弈

博弈分类 按博弈人数 二人非零和博弈

多人博弈

完全信息静态博弈静态博弈

不完全信息静态博弈按博弈状态

完全信息动态博弈动态博弈

不完全信息动态博弈

12.1.3 博弈的结构和分类

Page 20

【例 12-2】 1943年 2月,日本统帅山本五十六大将计划由南太平洋新不列颠群岛的拉包尔出发, 3天穿过俾斯麦海,开往新几内亚的莱城,支援困守的日军。有两条路线:北线和南线。 盟军统帅麦克阿瑟命令他麾下的太平洋战区空军司令肯尼将军组织空中打击。侦察机重点搜索有两个方案:北线和南线。 当时未来 3天中:北线阴雨,能见度差;南线晴天,能见度佳。日美双方各自应采用哪种方案。

12.1.3 博弈的结构和分类

北线

南线

Page 22

【解】局中人:盟军、日军 双方策略:北线、南线

盟军的赢得矩阵如下: 212211 ,=,= SS

日军盟军

北线( )

南线 ( )

北线( ) 2 2

南线( ) 1 3

1 21

2

最优局势是: 即都选择北线。日军舰队受到重创,但未全歼。

),( *1

*1

双方选择策略的思路: 在最不利中选择最有利的策略。

12.1.3 博弈的结构和分类

两人有限零和博弈

Page 23

【补充例 2】双寡头削价竞争(两个厂商)

类似地,广告投资、采用新技术等方面,厂商之间常常耗资巨大,但不一定有利可图的争夺战;对公共资源的掠夺式使用等问题。 我们的目的是如何利用这种困境达到有利于社会,合理利用和开发公共资源,保护环境。

12.1.3 博弈的结构和分类

中南

亚贸高价 低价

高价 ( 100 , 100 )

( 30 , 150 )

低价 ( 150 , 30 )

( 70 , 70 )

两人有限非零和博弈

Page 24

多寡头削价竞争( 3 个厂商:亚贸,中南,中北)

中北采用高价

中北采用低价

12.1.3 博弈的结构和分类

中南亚贸 高价 低价

高价 (100,100,100) (20,150,20)

低价 (150,20,20) (130,130,20)

中南亚贸 高价 低价

高价 (20,20,150) (20,130,130)

低价 (130,20,130) (70,70,70)

Page 25

【补充例 3 】动态博弈:甲向乙借一万元钱经营,甲许诺经营成功后分给乙总利润( 4 万)的一半,乙是否借给甲?

甲借 不借

分 不分

(2 , 2)

(1 , 0)

不打

(0 , 4)

(1 , 0) (- 1,0)有法律保障 法律保障不足

12.1.3 博弈的结构和分类完全信息动态博弈

Page 28

12.2 纳 什 均 衡

纳什均衡( Nash Equilibrium ) :

假定有 n 个博弈方参加博弈,在给定其他博弈方策略的条件下,每个人选择自己的最优策略(个人最优策略可能依赖也可能不依赖他人策略),从而使自己利益最大化,所有局中人的策略一起构成一个策略组合。而 Nash 均衡是这样一种策略组合,由所有参与人的最优策略组成,给定别人策略的条件下,没有任何单个参与人有积极性选择其他策略,从而没有任何人有积极性打破这种均衡, Nash 均衡是一种“ 僵局”:给定别人不动的情况下,没有人有兴趣动。

12.2.1 纳什均衡定义

Page 29

另一种解释: 假定所有博弈方事先达成一项协议,规定每个人的行为规则,在没有外在的强制力约束时,当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡:假定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换句话说,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背此协议,不满足 Nash 均衡要求的协议是没有意义的。

12.2 纳 什 均 衡

Page 31

12.2 纳 什 均 衡

你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你 3元,如果我们都是反面,我给你1元,剩下的情况你给我 2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?

Page 32

用 G表示一个博弈,若一个博弈中有 n 个局中人,则每个局中人可选策略的集合称为策略集,分别用 S1 , S2 ,…, Sn

表示 sij表示局中人 i 的第 j 个策略,其中 j 可取有限个值(有限策略博弈),也可取无限个值(无限策略博弈);博弈方 i 的得益则用 hi 表示; hi 是各博弈方策略的多元函数, n 个局中人的博弈 G常写成:

G={S1 ,…, Sn; h1 ,…hn}

12.2 纳 什 均 衡

Page 33

纯策略纳什均衡【定义 12.1 】 在博弈 G={S1,S2…,Sn; h1,h2…hn} 中,如果由

各个博弈方各选取一个策略组成的某个策略组合( s1*,s2

*…,sn

* )中,任一博弈方 i 的策略 si* ,都是对其余局中人策略的

组合( s1*,…,s*

i-1,s*

i+1…,sn* )的最佳选择,即

对任意 sij S∈ i 都成立,则称( s1*,…,sn

* )为 G 的一个纯策略“纳什均衡”( Nash Equilibrium )。

12.2 纳 什 均 衡

各选取一个策略组成的某个策略组合构成一个局势,其最优局势称为纯策略意义下的最优局势(纳什均衡)。

),,,,,,(),,,,,,( **1

*1

*1

**1

**1

*1 niijiiniiii ssssshsssssh

Page 34

【例 12-1 】 假设有三个厂商在同一市场上生产销售完全相同的产品,它们各自的产量分别用 m1 、 m2 和 m3表示,再假设m1 、 m2 和 m3只能取 1 、 2 、 3…… 等正整数值。市场出清价格一定是市场总产量 Q=m1+m2+m3 的函数,假设该函数为: 1 2 320 ( ), 20

( ) 200, 20

m m m QP P Q Q

Q

不妨先假设三个厂商开始时分别生产 3单位, 9单位和 6单位产量,这时三厂商是否满意各自的产量,要从利润进行分析,由于产量不能超过 20 ,则第 i 个厂商的利润函数为

12.2 纳 什 均 衡

1 2 3[20 ( )]i i ipm m m m m

Page 35

可算出在产量组合为( 3 , 9 , 6 )时,市场价格为 2 ,三厂商的利润分别为 6 , 18 和 12 ,再作其它产量组合时亦会有不同的结果。

表 12-2 三厂商离散产量组合对应价格和利润 m1 m2 m3 p π1 π2 π3

3 9 6 2 6 18 12

3 8 6 3 9 24 18

5 5 6 4 20 20 24

5 5 5 5 25 25 25

5 5 4 6 30 30 24

3 3 3 11 33 33 33

6 3 3 8 48 24 24

12.2 纳 什 均 衡

最稳定的产量组合,是一个纳什均衡

Page 36

【定义 12.2 】 在博弈 G={S1 ,…, Sn; h1 ,…, hn}

中,局中人 i 的策略集为 Si={si1 ,…, sik} ,则他以概率分布 pi= ( pi1 ,…, pik )随机在其 k 个可选策略中选择的“策略”称为一个混合策略,其中 0≤pij≤1 对 j=1 ,…, k 都成立,且 pi1+…+pik=1 。 纯策略是混合策略的特殊情形,只是选择相应纯策略的概率服从( 0-1 )分布。 一个混合策略可理解为:如果进行多局博弈 G 的话,局中人 i 分别选取纯策略的频率;若只进行一次博弈,则反映了局中人 i 对各纯策略的偏爱程度。

混合策略纳什均衡

12.2 纳 什 均 衡

Page 37

【定义 12.3 】 如果一个博弈 G={S1 ,…, Sn , h1 ,…,

hn} 中,参予者 i 的策略集为 Si={si1 ,…, sik} ,如果由各

个博弈方的策略组成策略集合 G*={s1* , s2

* ,…, sn*} ,

其中

都是对其余博弈方策略组合的最佳策略,即 hi(s1

*,s2*,…,si-1

*,si*, si+1

*…sn*)≥hi(s1

*,s2*,…,si-1

*,sij,si+1*,…sn

*)

对任意 sij S∈ i 都成立,则称 (s1*,… , sn

*) 为 G 的一个混合策略纳什均衡.

1,,,2,1,0|1

*i

i

m

iiii

mii xmixExs

12.2 纳 什 均 衡

Page 39

当得益是博弈的多元连续函数时,求出每个博弈方的反应函数,而各个反应函数的交点就是纳什均衡。

12.3 反应函数法

Page 40

【例 12-4 】设 A , B两厂家生产同样产品,厂商 A产量为 q1 , B产量为 q2 ,市场总产量为 Q=q1+q2 ,市场出清价格是市场总产量的函数 P= 6- Q 。设产品产量的边际成本相等, C1=C2=2 。求解两厂商的纳什均衡(假设产量连续可分)。分析:这是一个连续产量的古诺模型,不难看出,该博弈中两厂商各自的利润分别为各自的销售收益减去各自成本,即:

12.3 反应函数法

2121112111111 42)](6[)( qqqqqqqqqCQpq

2221222122222 42)](6[)( qqqqqqqqqCQpq

)4max(max 212111 qqqq

q1 q1

Page 41

)4(2

1)( 221 qqR

)4(2

1)( 112 qqR

作反应函数

纳什均衡: (4/3,4/3)

12.3 反应函数法

)4(2

12

*1 qq )4(

2

11

*2 qq

(0,4)

( 0,2)

(2,0) (4,0)

(4/3,4/3)R1

R2

Page 44

【例 12-6 】设有 3 个农户一起放牧羊群,现有一可供大家自由放牧的草地,由于草地面积有限,只能供有限只羊群吃饱,否则就会影响到羊群的产出,假设每只羊的产出函数为

成本 C=8 ,且每个农户在决定自己放牧羊群数的时候并不知道其它农户的决策,试求出该决策问题的纳什均衡。

)(8080 221 qqqQV

【解】各农户的得益函数分别为 132111 8)](80[ qqqqqh

2 2 1 2 3 2[80 ( )] 8h q q q q q

3 3 1 2 3 3[80 ( )] 8h q q q q q

12.3 反应函数法

Page 45

12.3 反应函数法

反应函数

323211 2

1

2

136),( qqqqRq

313112 2

1

2

136),( qqqqRq

212113 2

1

2

136),( qqqqRq

因此该博弈的纳什均衡为( 18, 18 , 18 )

Page 46

用反应函数法求纳什均衡的步骤:1. 建立得益函数;2. 求反应函数:即对得益函数求偏导数;3. 解反应函数方程组。反应函数方程组的解即为纳什均衡。

12.3 反应函数法

Page 48

12.4 二人有限零和博弈

两人有限零和博弈也称矩阵博弈,在众多博弈模型中占有重要地位,也是最简单、理论和算法都比较完善的一类。 齐威王田忌赛马,例 12-2 均为矩阵博弈。

Page 49

12.4.1 数学模型 模型: S1={α1,α2,… , αm}——局中人Ⅰ的纯策略集 S2={β1,β2,… , βn}——局中人Ⅱ的纯策略集 ai j——局中人Ⅰ在局势( αi ,βj )下的赢得值

—— 局中人Ⅰ的得益矩阵 ( 局中人Ⅱ的得益矩阵为 -A)

mnmm

n

n

aaa

aaa

aaa

A

21

22221

11211

G={S1, S2; A}

Ⅰ:

Ⅱ:

12.4 二人有限零和博弈

Page 50

建立齐王田忌赛马的数学模型S1={( 上中下) , (上下中) , (中上下) , (中下上) , (下上中) , (下中上 )}

S2={( 上中下) , (上下中) , (中上下) , (中下上) , (下上中) , (下中上 )}

12.4.1 数学模型

田忌齐王 上中下 上下中 中上下 中下上 下上中 下中上上中下 3 ,-

31 ,-1

1 ,-1

1 ,-1

- 1 ,1

1 ,-1

上下中 1 ,-1

3 ,-3

1 ,-1

1 ,-1

1 ,-1

- 1 ,1

中上下 1 ,-1

- 1 ,1

3 ,-3

1 ,-1

1 ,-1

1 ,-1

中下上 - 1 ,1

1 ,-1

1 ,-1

3 ,-3

1 ,-1

1 ,-1

下上中 1 ,-1

1 ,-1

1 ,-1

- 1 ,1

3 ,-3

1 ,-1

下中上 1 ,-1

1 ,-1

- 1 ,1

1 ,-1

1 ,-1

3 ,-3

Page 51

12.4.1 数学模型

311111

131111

113111

111311

111131

111113

--

=A

齐王的赢得矩阵

Page 52

【例 12-7 】求解矩阵博弈,其中 ASSG ;,= 21

22max min min max 3ij ijj ji ia a a

博弈 G 的解(纳什均衡)为:

【解】

602

1117

435

915

=A

12.4.2 纯策略矩阵博弈

),( 22

3 GV的赢得为局中人

局中人Ⅰ的最优策略是 α2 , 局中人Ⅱ的最优策略是β2

S1={α1 , α2 , α3 , α4 }

S2={β1 , β2 , β3 }

Page 53

【定义 12.4 】 设 G={S1 , S2; A} 为矩阵博弈,其中 S1={α1 , α2 ,…, αm} , S2={β1 , β2 ,…, βn} ,

若等式

nmijaA )(=

**maxminminmax jiijij

ijji

aaa

成立, ,则称 VG 为博弈 G 的值,对应的策略组合 称为该博弈的纯策略纳什均衡。

** jiG aV

* *( , )i j

12.4.2 纯策略矩阵博弈

Page 54

【定理 12.1 】矩阵博弈 G={S1 , S2; A} 在纯策略意义下有纳什均衡的充要条件是:存在策略组合 使得对一切 i=1 ,…, m, j =1 ,…, n, 均有:

意义: 当局中人Ⅰ选定纯策略 αi* 后,局中人Ⅱ为了使其所失最少,只能选择纯策略 βj* ,否则就可能损失得更多;反之,当局中人Ⅱ选定纯策略 βj* 后,局中人Ⅰ为了得到最大的赢得也只能选择纯策略 αi* ,否则就会赢得更少,双方的竞争在局势( αi*,, βj* )下达到了一个平衡状态。即纳什均衡。

),( ** jia

jijiij aaa ****

12.4.2 纯策略矩阵博弈

Page 55

【定义 12.5 】设 f(x , y) 为一个定义在 x∈A 及 y B∈上的实函数,如果存在 x* A∈ 及 y* B,∈ 使得对一切 x

∈A 及 y B∈ 有 yxfyxfyxf ,,, ****

),( ** yx则称 为函数 f 的一个鞍点。

矩阵博弈在纯策略意义下有解且 的充要条件是:

** jiG aV

12.4.2 纯策略矩阵博弈

是 A 的鞍点。( αi* ,βj* )

Page 56

8 5 8 5

2 3 2 1

9 5 6 5

0 2 3 3

A

【例 12-9 】 设有矩阵博弈 G={ S1 , S2; A },赢得矩阵为

求纳什均衡

12.4.2 纯策略矩阵博弈

S1={α1 , α2 , α3 , α4 }

S2={β1 , β2 , β3 , β4 }

Page 57

3320

5659

1232

5858

纳什均衡为: (α1 ,β2 ) , (α1 ,β4 ) , (α3 ,β2 ) , (α3 ,β4 )

博弈值 VG=5

局中人Ⅰ的最优纯策略为 α1 , α3

局中人Ⅱ的最优纯策略为 β2 , β4

12.4.2 纯策略矩阵博弈

A=

α1

α2

α3

α4

β1 β2 β3 β4

【解】

Page 58

【性质 12.1 】 无差别性。若 和 为 G 的两个解,则:

【性质 12.2 】 可交换性。若 和 为 G 的两个解,则 和 也是博弈的解.

),11 ji ( ),

22 ji (

2211 jiji aa

),11 ji ( ),

22 ji (

),21 ji ( ),

12 ji (

12.4.2 纯策略矩阵博弈

Page 59

应用举例: 某单位采购员在秋天时要决定冬季取暖用煤的采购量。已知在正常气温条件下需要煤 15吨,在较暖和较冷气温条件下分别需要煤 10吨和 20吨。假定冬季的煤价随天气寒冷程度而变化,在较暖、正常、较冷气温条件下每吨煤的价格分别为 100元、 150元和 200元。又设秋季时每吨煤的价格为 100元,在没有关于当年冬季气温情况准确预报的条件下,秋季时应采购多少吨煤能使总支出最少?试建立该问题的矩阵对策模型,并求解。

12.4.2 纯策略矩阵博弈

Page 60

【解】局中人 I (采购员): S1={10吨, 15吨, 20吨 }

局中人 II (大自然): S2={较暖,正常,较冷 }

纳什均衡为( α3 , β3 ),博弈值 VG=-2000

既采购员在秋天购煤 20吨较好。

200020002000

250015001500

300017501000

A

12.4.2 纯策略矩阵博弈

Page 61

12.4.3 混合策略矩阵博弈

矩阵博弈满足纯策略纳什均衡是指: 满足局中人Ⅰ有把握的至少赢得是局中人Ⅱ有把握的至多损失,即

21 maxminminmax VaaV jiijji

ji

当 V1≠V2 时,这时不存在纯策略意义下的纳什均衡 。

Page 62

利用最小最大和最大最小原则,发现不存在使得

成立的点,即不存在纯策略纳什均衡。ji

ijjiji

aa maxminminmax

12.4.3 混合策略矩阵博弈齐王田忌赛马

311111

131111

113111

111311

111131

111113

--

=A

Page 63

【定义 12.6 】设矩阵博弈 ,其中

ASSG ;,= 21

nm SS ,,,=,,,,= 212211

nmijaA

1,,,2,1,0|),,,(1

211

m

iiim xmixxxxxS =

1,,,2,1,0|),,,(1

212

n

jjjn ynjyyyyyS =

12.4.3 混合策略矩阵博弈

则分别称 为局中人Ⅰ、Ⅱ的混合策略集; 、 分别称为局中人Ⅰ、Ⅱ的混合策略, 为一个混合局势。

21 SS 和 *

1Sx *2Sy

),( yx

称为 G 的混合扩充。 E 是局中人Ⅰ的赢得期望值

ESSG ,, *2

*1

*

m

i

n

jjiij

T yxaxAyyxEE1 1

),(

Page 64

纯策略与混合策略的关系 纯策略是混合策略的特殊情形。一个混合策略 X=

(x1, x2, … , xm) 可理解为:如果进行多局博弈的话,局中人 I 分别选取纯策略 α1,α2,… , αm 的频率;若只进行一次博弈,则反映了局中人 I 对各纯策略的偏爱程度。

12.4.3 混合策略矩阵博弈

Page 65

【定理 12.2 】矩阵博弈 G={S1 , S2; A} 在混合策略意义下有解的充要条件是:存在 x* S∈ 1

* , y* S∈ 2* ,使( x* , y

* )为函数 E(x, y) 的一个鞍点,即对一切 x S∈ 1* , y S∈ 2

* 有 E ( x , y* )≤ E ( x* , y* )≤ E ( x* ,

y )

12.4.3 混合策略矩阵博弈

称为局中人Ⅰ的赢得函数, VG 称为 G* 的值。

【定义 12.6′ 】设 G*={S1*,S2

*,E} 是矩阵博弈 G={S1,S2,A} 的混 合扩充,当

时,称 为局中人Ⅰ、Ⅱ在混合策略中的纳什均衡。

GSxSySySx

VyxEyxE

),(maxmin),(minmax*1

*2

*2

*1

),( ** yx

yxAyxE T),(

Page 66

【例 12-11 】 考虑矩阵博弈 G={ S1 , S2; A } ,其中

试求纳什均衡【解】 纯策略纳什均衡不存在。设 x= ( x1 , x2 )为局中人Ⅰ的混合策略, y=(y1 , y2) 为局中人Ⅱ的混合策略,则:局中人Ⅰ的赢得期望值:

1 1 1 2 2 1 2 2

1 1 1 1 1 1 1 1

1 1

, 2 6 5 3

2 6 (1 ) 5(1 ) 3(1 )(1 )

1 16 4

3 2

E x y x y x y x y x y

x y x y x y x y

x y

12.4.3 混合策略矩阵博弈

35

62A

x1

x2

y1 y2

Page 67

),(,),( **** yxEyxEyxE 满足

该博弈的纳什均衡为: (x*, y*)

其中

局中人Ⅰ和Ⅱ的最优策略分别为: x*, y*

博弈值

* *1 2 1 1( , ), ( , )3 3 2 2

x y

* * * *, , , 4E x y E x y E x y

12.4.3 混合策略矩阵博弈

GV =4

取 , ,则 * *, 4E x y * *1 2 1 1( , ), ( , )3 3 2 2

x y

Page 68

12.4.4 纳什均衡存在定理

【定理 12.3 】 设 x* S∈ 1* , y* S∈ 2

*, 则( x* , y* )为博弈 G

的纳什均衡的条件是:对任意 i=1,… , m , j=1,… , n ,有 E(i , y*)≤E(x*, y*)≤E(x*, j)【定理 12.4 】 设 x* S∈ 1

* , y* S∈ 2* ,则( x* , y* )是博弈

G 的纳什均衡的充要条件是:存在数 V ,使得 x* , y* 分别满足:

mix

x

njVxa

i

ii

iiij

,,2,1,0

1

,,2,1,

njy

y

miVya

j

jj

jjij

,,2,1,0

1

,,2,1,

且 V=VG

Page 69

【定理 12.5 】 对任一矩阵博弈 G={S1 , S2; A} ,一定存在混合策略意义下的纳什均衡。

12.4.4 纳什均衡存在定理

定理 12.4-12.6 说明了矩阵博弈总是有解的,并给出了解所应满足的条件。

【定理 12.6 】 设( x* , y* )为矩阵博弈 G 的一个纳什均衡, V=VG ,则

( 1 )若 xi*> 0 ,则

( 2 )若 yj

* > 0 ,则 ( 3 )若 ,则 ( 4 )若 ,则

ij jj

a y V

Vyaj

jij

Vxa iiji

0* ix

0* jyVxa iiji

Page 70

35

62

2

1

21

x

xA

yy

42

1,

2

1,

3

2,

3

1 **

GVyx

例 12-11

12.4.4 纳什均衡存在定理

vxxvyy

vxxvyy

2121

2121

3635

5262

Page 71

12.4.4 纳什均衡存在定理

【定理 12.7 】 设有两个矩阵博弈 G1={S1 , S2; A}, G2={S1 , S2; kA}

其中 k> 0 为一常数。 则 G1 与 G2 有相同的解,且: 12 GG kVV

【补充定理】 G1={S1 , S2 ; A1=(aij)m×n}

G2={S1 , S2 ; A2=(aij+d)m×n}

d 为常数,则 G1 与 G2 有相同的解,且: dVV GG 12

18001200

12003600【补充例】求解矩阵博弈

Page 72

1. 线性方程组法

mixx

njvxa

ii

i

iiij

,,2,1,01

,,1

njyy

mivya

jj

j

jjij

,2,1,0,1

,,1

若最优策略中 和 均不为零时,根据定理 12.6 ,有 ix

jy

12.4.5 矩阵博弈求解方法

注意:( 1 )应用此方法的条件是所有策略的概率大于零。 ( 2 )对于 2×2 的矩阵博弈当不存在纯策略

鞍点时, 容易证明,各局中人的最优策略中 xi , yj

均大于零, 可采用此法求解。

Page 73

1 2 1

5 4 1

2 2 1

A

ASSG ;, 21【例 12-14 】求解矩阵博弈

【解】设 x=(x1, x2, x3), y=(y1, y2, y3), xi>0, yj>0, i,j =1,2,3建立方程组

1 2 3

1 2 3

1 2 3

1 2 3

5 2

2 4 2

1

x x x V

x x x V

x x x V

x x x

1 2 3

1 2 3

1 2 3

1 2 3

2

5 4

2 2

1

y y y V

y y y V

y y y V

y y y

x*=(0.525 , 0.275 , 0.2) y*=(0.2 , 0.05 , 0.75)

该矩阵博弈的纳什均衡为 ( x*, y* ) , 搏弈值 VG=- 0.45

12.4.5 矩阵博弈求解方法

Page 74

2. 优超原则法(严格下策反复消去法) 优超原则: P311【定义 12.7】 , 【定理 12.

8】【例 12-12】 设赢得矩阵 A 为 :

求纳什均衡

12.4.5 矩阵博弈求解方法

2 1 0 2 0

3 0 1 4 8

6 4 9 5 9

3 6 8 7 5

5 0 7 9 3

A

Page 75

【解】

12.4.5 矩阵博弈求解方法

1

6 4 9 5 9

3 6 8 7 5

5 0 7 9 3

A

2 1 0 2 0

3 0 1 4 8

6 4 9 5 9

3 6 8 7 5

5 0 7 9 3

A

305

563

946

2A

563

9463A

63

464A

Page 76

该矩阵博弈的纳什均衡为: (x*, y*)

3 2(0,0, , ,0)

5 5x

2 3( , ,0,0,0)5 5

y VG=4.8

3 4

3 4

3 4

6 3

4 6

1

x x v

x x v

x x

1 2

1 2

1 2

6 4

3 6

1

y y v

y y v

y y

3 4

3 2,

5 5x x

1 2

2 3,

5 5y y

12.4.5 矩阵博弈求解方法

63

464A

Page 77

3. 图解法 【补充例 1 】用图解法求解

【解】设 x=(x1,1-x1) , y=(y1,1-y1)

对于局中人Ⅰ:如果局中Ⅱ人选取 β1 ,则有 V=20-15x1

如果局中Ⅱ人选取 β2 ,则有 V=25x1+10

1020

355A

4

3,

4

1*x4

116V

12.4.5 矩阵博弈求解方法

点 B(1/4, 65/4) 为局中人Ⅰ的极值点

l1

l2

C

B

A

o x1

v

1

Page 78

同理 V=35-30y1

V=10+10y1

解得

8

3,

8

5*y

12.4.5 矩阵博弈求解方法

该矩阵博弈的纳什均衡为: (x*, y*)

VG=16.25

4

3,

4

1*x

8

3,

8

5*y

Page 79

【补充例 2 】某公司有甲、乙两个工厂,每年的税额是 400万元和 1200万元。对于每个工厂,公司可如实申报税款,或者篡改账目,声称税额为零,而税务局由于人力所限,每年只能检查一个工厂的账目,如果税务局发现工厂偷税,则不但要工厂如数缴纳税款,而且还要缴纳相当于一半税款的罚金。( 1 )试将该问题表示为一个矩阵博弈模型;( 2 )求出税务局和公司的最优策略及税务局从公司征收税款(含罚金)。

12.4.5 矩阵博弈求解方法

【解】税务局: S1={查甲工厂,查乙工厂 }

公司:S2={甲乙都实报,甲乙都报零,甲实报乙报零,甲报零乙实报 }

1200220018001600

18004006001600A

利用定理 12.7 及补充定理化简

设 x =(x1, 1-x1)

y=(y1, y2, y3, y4)

V=6 (1)

V=-6x1+7 (2)

V=-9x1+9 (3)

V=3x1+4 (4)点 B(1/3, 5) 为局中人Ⅰ的极值点

3

2,

3

1*x

4976

70161A

x1

l1

l2

l4

l3

C

BA

o

v

1D

4

9

7

6

1

7

=5VVG 1

点 B(1/3, 5) 不满足方程( 1 )、( 3 ),由定理 12.6

y1=y3=0

解 (5) (6) 组成的方程组

同理可得 V=6y1+y2+7y4 (5)

V=6y1+7y2+9y3+4y4 (6)

3

2

3

142 yy

该矩阵博弈的纳什均衡为: (x*, y*)

3

2,0,

3

1,0,

3

2,

3

1 ** yx 1400200)25(* GV

税务局最优策略是以 1/3 的概率检查甲公司, 2/3的概率检查乙公司,这样至少能征收到 1400万元的税款

Page 84

3. 线性规划方法 任意矩阵博弈 的求解均等价于一对互为对偶的线性规划问题,而定理 12.4表明,博弈 G 的解等价于下面两个不等式组的解.

ASSG ,, 21=

mix

x

njvxa

i

ii

iiij

,10

1

,,1

njy

y

mivya

j

jj

jjij

,10

1

,,1

),(maxmin),(minmax*1

*2

*2

*1

yxEyxEvSxSySySx

12.4.5 矩阵博弈求解方法

Page 85

mix

x

njvxa

vZ

i

ii

iiij

,,2,1,0

1

,,2,1,

max

njy

y

mivya

vZ

j

jj

jjij

,,2,1,0

1

,,2,1,

min

则局中人Ⅰ、Ⅱ的最优策略等价于线性规划问题:

12.4.5 矩阵博弈求解方法

【定理 12.9 】 设矩阵博弈的值为 v ,则:

* ** *2 21 1

max min ( , ) min max ( , )y S y Sx S x S

v E x j E i y

Page 86

令 miv

xx i

i ,,1 , 当 V>0 时,有

1max

1, 1,2, ,

1( )

0, 1,2, ,

ii

ij ii

ii

i

vx

a x j n

p xv

x i m

mix

njxap

xZ

i

iiij

ii

,,2,1,0

,,2,1,1)(

min

局中人Ⅰ:

12.4.5 矩阵博弈求解方法

Page 87

njy

miyaD

yw

j

jjij

jj

,,2,1,0

,,2,1,1)(

max

同理 , 令 njv

yy j

j ,,1 有

局中人Ⅱ:

12.4.5 矩阵博弈求解方法

1min

1, 1,2, ,

1( )

0, 1,2, ,

jj

ij jj

jj

j

vy

a y i m

D yv

y j n

Page 88

12.4.5 矩阵博弈求解方法

注意:( 1 )用线性规划法求解的必要条件是 V>0 。如何判断 V>0 ,可以证明,当 aij≥0 时, V >0 。

( 2 )若某个 aij≤0 ,可对 A 的各元素加上适当的数 d>0 ,使

所有的 aij≥0

Page 89

【例 12-12 】 利用线性规划方法求解赢得矩阵为

1075

274

836

=A

的矩阵博弈的纳什均衡. 【解】 此问题可化为两个互为对偶的线性规划问题:

0

11028

1773

1546

min

3,2,1

321

321

321

321

xxx

xxx

xxx

xxx

xxxz

0,

11075

1274

1836

max

3,21

321

321

321

321

yyy

yyy

yyy

yyy

yyyw

12.4.5 矩阵博弈求解方法

Page 90

最优解: x= (0.1065 , 0.1448 , 0.0437),

y= (0.1093 , 0.1038 , 0.0819); w= 0.29508.

wvy

wyx

wx

1,

1,

1 ** 利用变换

得到x*=(0.36 , 0.49 , 0.15) , y*=(0.37 , 0.35 , 0.28);v=3.39

12.4.5 矩阵博弈求解方法

Page 91

有无纯策略解

无 优超原则和定理 12.7化简

1.A2×n或 Am×2 ,图解法。

2.A2×2 ,图解法,方程组法,代数法。

3.LP 法( aij≥0)

12.4.5 矩阵博弈求解方法

解矩阵博弈的一般步骤

Page 92

下一节:有限二人非零和博弈

Page 93

12.5.1 数学定义假设:彼此了解对方的纯策略集和赢得函数,但不合作,并 且局中人在选择自己策略时不知道对方的选择。数学模型: Γ={S1,S2;(A1,A2)}, 其中

S1={α1,α2 ,…, αm} , S2={β1,β2,… , βn}

A1=(aij)m×n , A2=(a′ij)m×n , A1+A2≠0

两人有限非零和博弈也称为双矩阵博弈。

记局中人Ⅰ的混合策略为 x=(x1,x2,…,xm) ,局中人Ⅱ的混合

策略为 y=(y1,y2, …,ym) ,相应的策略集分别记为

12.5 二人有限非零和博弈

*2

*1 , SS

Page 94

12.5.1 数学定义

【补充例 1 】囚徒的困境

( -1, -1)( -10, -1/4)抵赖

( -1/4, -10)( -5, -5)坦白

抵赖坦白 囚徒 2 囚徒 1

14/1

105

110

4/1521 AA

)1,1()4/1,10(

)10,4/1()5,5(A

Page 95

12.5.1 数学定义

【例 11.16 】市场上有两企业生产同样商品,甲企业与乙企业的赢得矩阵分别为

1 2

11

2

2 1

0 3A

1 2

12

2

3 1

2 3A

矩阵 A1 和 A2 合并为双矩阵

(2,3) (1,1)

(0,2) (3,3)A

【例 11.16 】市场上有两企业生产同样商品,甲企业与乙企业的赢得矩阵分别为

1 2

11

2

2 1

0 3A

1 2

12

2

3 1

2 3A

【例 11.16 】市场上有两企业生产同样商品,甲企业与乙企业的赢得矩阵分别为

1 2

11

2

2 1

0 3A

矩阵 A1 和 A2 合并为双矩阵

1 2

12

2

3 1

2 3A

【例 11.16 】市场上有两企业生产同样商品,甲企业与乙企业的赢得矩阵分别为

1 2

11

2

2 1

0 3A

(2,3) (1,1)

(0,2) (3,3)A

矩阵 A1 和 A2 合并为双矩阵

1 2

12

2

3 1

2 3A

1 2

11

2

2 1

0 3A

Page 96

【定义 12.8 】 对于某个二人有限非零和博弈,其局中人Ⅰ的赢得(混合策略下)为

局中人Ⅱ的赢得为

1 2( ) , ( )ij m n ij m nA a A a

12.5.1 数学定义

Tm

i

n

jjiij yxAyxayxe 1

1 11 ),(

Tm

i

n

jjiij yxAyxayxe 2

1 12 ),(

Page 97

12.5.2 二人有限非零和博弈纳什均衡

【定理 12.10 】(纳什定理)任何矩阵博弈及有限二人非零和博弈至少有一个纳什均衡。

【定义 12.9 】在有限二人非零和博弈中 ,设分别是局中人Ⅰ和Ⅱ的赢得, 为任意策略,如果有一博弈 满足

*)*,( yx则称 为该博弈的纳什均衡,称

为博弈的赢得值。

),(),( 21 yxeyxe 和*2

*1 , SySx

*2

**1

* , SySx

),(),(),(),( *2

**2

*1

**1 yxeyxeyxeyxe 及

),(),,(),( **2

**1

** yxeyxevu

Page 102

纳什均衡 ( 纯策略 )为:局中人Ⅰ、Ⅱ的最优策略分别是 α2, β3

博弈值:

方法:局中人Ⅰ对 A1 进行行比较,删去数据小的行; 局中人Ⅱ对 A2 进行列比较,删去数据小的列。

(2,4) (8,3) (4,3)

(5,6) (4,5) (5,7)A

3. 优超原则法【例 12.18 】用优超原则求解下列双矩阵博弈

1

(2,4) (4,3)

(5,6) (5,7)A

( *, *) (5,7)u v

12.5.3 2×2 二人有限非零和博弈的求解

)1,0,0(10),( **32 yx ),,(,即

)7,5()6,5(2 A

Page 103

4. 划线法( 1 )局中人Ⅰ从 A1 的每列选取最大值划线。

( 2 )局中人Ⅱ从 A2 的每行选取最大值划线。( 3 )如果某一策略组合值下都划了横线,则此策略组合就是纳什均衡解,该组数字分别为两人的赢得值。否则,不存在纯策略意义下的纳什均衡。

12.5.3 2×2 二人有限非零和博弈的求解

Page 104

【例 12-19 】用划线法求解双矩阵博弈

(2,4) (8,3) (4,3)

(5,6) (4,5) (5,7)A

23 23( , )a a 下都已划线,则纳什均衡为 (α2 , β3 )

12.5.3 2×2 二人有限非零和博弈的求解

即:局中人Ⅰ、Ⅱ的最优策略分别是 α2, β3博弈值: ( *, *) (5,7)u v

【补充例】用划线法求解囚徒的困境

Page 105

女方 男方 足球 音乐会

足球 ( 3, 1 ) ( -1 , -1 )

音乐会 ( -1 , -1 ) ( 1 , 3)

【补充例】一对恋人商量周末的活动安排,是看足球赛还是听音乐会。已知不同策略组合下的收益值如表所示。

求解该博弈问题。(足球,足球),(音乐会,音乐会)是该问题的两个纳什均衡。

12.5.3 2×2 二人有限非零和博弈的求解

Page 106

具有一个以上的纳什均衡时,根据博弈的背景、局中人的一些信息或理性,判断或预测出的最终结局,称为聚点。

当存在多重纳什均衡时,一般很难判断最终结局,但在联系博弈背景及局中人习性后,一定条件下可以推断聚点的出现。

12.5.3 2×2 二人有限非零和博弈的求解

Page 110

论 文论 文

企业如何走出囚徒的困境

Page 111

The End of Chapter 12

作业:教材 P292 T2 、 7

12.5 有限二人非零和博弈