2009 年随机图与复杂网络学术会议

2009年随机图与复杂网络学术会议

李泉林博士

随机演化博弈的算法研究及其在复杂网络中的应用

汇报提纲2

进化博弈的基本内容我们的研究工作随机进化博弈所面临的理论困难在计算机网络中的应用在复杂网络中的应用我们的未来研究工作

演化博弈论的产生背景

1990-Present

1980-1990

1950-1951

1944

1944, J. von. Neumann和 Oskar. Morgenstern 奠定了经典博弈理论的基础。

1950-1951, J. Nash 提出了非合作博弈的纳什均衡的概念。

二十世纪八十年代，博弈论成为经济学领域当中的通用理论工具，例如：分析不同厂商的合作、联盟、竞争与冲突；工业组织的形成；经济契约的签订；拍卖机制的设计；不对称信息的市场分析等等。

标准式博弈标准式博弈由三种元素组成：参与人、纯策略、收益函数纯策略；混合策略是在纯策略上的概率分布。

纳什均衡：如果博弈中的任意一个参与人选择的纯策略，都是对其他人选择的纯策略的最优反应，那么这样的纯策略组合为一个标准式博弈的纯策略纳什均衡：

* * * *, ( , ) ( , ).i i i i i i i is s u s s u s s

严格占优策略：任意给定其他博弈参与人的纯策略选择组合，如果某一个特定的纯策略满足如下条件，则称这个纯策略为严格占优策略：

' * * ', , ( , ) ( , )i i i i i i i i is s s u s s u s s


经典博弈论经典博弈论

实证缺陷实证缺陷

方法缺陷方法缺陷

假设缺陷假设缺陷

二十世纪八十年代之后，研究工作围绕着修正经典博弈论中的完全理性假设展开研究，并试图为纳什均衡的概念寻找动态结构下的解释。研究表明：经典博弈论在应用中遇到困难，主要是存在三种缺陷：假设缺陷、方法缺陷、实证缺陷。

为了解决经典博弈论的以上三种缺陷，从二十世纪九十年代发展了演化博弈论的研究工作。


假设缺陷：完全理性假设，即假定参与人完全了解其对手的策略集合以及使用每个策略的概率，同时也了解博弈规则与收益结构。参与人也具有通过精确计算推理得到最优策略的能力。但现实中的参与人只具有有限理性(Bounded Rationality) 。

方法缺陷：经典博弈论关注的重点是如何求解博弈的平衡结构，但不能解释博弈的各参与方是如何通过参与博弈而趋向于这些均衡状态的 (H.P. Young) 。

实证缺陷：多数解析型博弈论的预测都是基于理想的假设和精确的数学推导，需要实证的经验规律来充实经典博弈论 (Colin Camerer) 。

演化博弈论的研究意义

演化博弈研究具有普遍意义的有限理性的参与人：惰性、近视、遗传、突变、变异。 Kandori, Mailath和 Rob (1993)

演化博弈不仅关注博弈的稳定结构，还通过引入不同的动态机制研究博弈系统的稳定结构和演化过程之间的关系；

演化博弈模型可以和个人学习机制相结合，可以探讨微观层面上参与人的互动和宏观层面上群体的均衡现象之间的关系；

演化博弈的假设条件与建模方法更加有利于进行模拟实验来获得实证数据。

演化博弈论的文献综述溯源 1798，Malthus 的“人口论”； 1887， Darwin 的“物种起源”；

当代演化博弈论在生物学上的起源 Lewontin (1961) 物种与生存环境 Smith与 Price(1973) 生物之间的有限战争 Smith(1982) 专著 ; Taylor和 Jonker(1978)

个体相互作用内涵的转变

策略内涵的转变均衡内涵的转变

演化稳定策略（ ESS）

用 J（ p, q）来表示一个物种的策略 p 遇到策略 q 时的收益函数。

策略 p* 被称为是一个 ESS ，如果

J（ p*, p* ）〉 J（ p, p* ）

或者当 J（ p*, p* ） = J（ p, p* ）时，

J（ p*, p ）〉 J（ p, p ）。

ESS可以是纯策略，也可以是混合策略。

微分方程的稳定性

马氏链的稳定性

相关研究的文献综述

确定性的演化博弈模型（微分方程）： Friedman(1991,1998); Hofbauer和Sigmund(1988, 1998); Weibull(1995).

随机性的演化博弈模型：扰动的生灭过程： Fudenberg和 Imhof(2006);

Fudenberg 等人 (2006) 。扰动的拟生灭过程： Tadja和 Touzene(2003);

Q.L. Li(2008) 。扰动图的马氏链： Young(1993)

相关研究的文献综述

探讨演化稳定策略的定义和求解方法，以及演化稳定策略与纳什均衡策略之间关系：Friedman(1991,1998); Hofbauer和 Sigmund(1988, 1998); Samuelson(1997); Weibull(1995).

演化博弈和学习机制的交叉研究： Fudenberg和Levine(1997); Foster和 Young(2003); Milgrom和Robert(1991); Young(1998, 2000,2 002).

Nash均衡 ESS

Quan-Lin Li

Constructive Computation in Stochastic Models with Applications ：

The RG-Factorizations

Springer Chapter 11 Sensitivity Analysis and Evolutionary Games

我们的研究工作针对策略状态空间是离散的、群体的人口规模是有限的、决策具有随机

性的演化博弈模型。

对两个群体的演化博弈问题，研究了两类模型：两个群体间接相关，博弈只在每个群体内部进行，但是两个群体通过策

略相关性因子互相影响；两个群体直接相关，博弈的双方每次分别从两个不同的群体中随机抽取。

针对任意多个群体的演化博弈问题，研究了三类模型：间接相关、直接相关、混合相关。

多个群体演化博弈问题的建模及其求解演化稳定策略，为演化博弈论在经济学、运筹学领域的广泛应用提供了一定的理论基础；同时，通过一系列数值算例，定性与定量相结合地研究不同建模参数对演化稳定策略分布的影响，为设计实验、提供实验数据的实证支持打下了基础。

演化博弈的基本要素

1 2 3 有限人口 - 无限人口：

离散的策略 - 连续的策略：

参与人的匹配方式：单对模型、总体统计模型、随机匹配模型

同质群体的对称二人博弈；

不同质群体的非对称二人博弈。

自然选择机制（复制子动态）；

模仿机制；强化学习机制；最优反应机制；几种机制的混合：虚拟行动。

对称的（）演化博弈假设前提：假设 1 ：参与人采用近似最优反应机制规定的决策模式，即参与人对市场的认知程度是有局限性的；

假设 2 ：参与人的决策是“近视”的，其决策基于参与人对当前市场结构的认识；

假设 3 ：参与人的决策具有不确定性，统称为“变异”。

模型描述：两个互相独立的群体 P1、 P2，人口规模分别为M, N. 设每一个参与人只具有两个纯策略，则两个群体的策略集分别为：

1 11 12{ , }S s s 2 21 22{ , }S s s和：群体 P1、 P2 内部的博弈方式是“随机匹配”，阶段博弈矩阵为：

1 2,a b a c

A Ac d b d

2 2

对称的（）演化博弈给出参与人的期望收益函数：

2 2

11

( ) ( ( ))( ( )) ,s

az t b M z tf z t

M

12

( ) ( ( ))( ( )) .s

cz t d M z tf z t

M

定义参与人选择其第一类策略的转移率为：

11 12( ) max{ ( ) ( ),0}, {0,1,... 1}.s si f i f i i M

12 11( ) max{ ( ) ( ),0}, {1,2,... }.s si f i f i i M

* 0

1 * 1

*

Q

N

*

0

0 , 1 , 2 , , ;

lim .

N

k k

2 2

两个独立群体的演化博弈假设前提：假设 1 ：参与人采用近似最优反应机制规定的决策模式，即参与人对市场的认知程度是有局限性的；

假设 2 ：参与人的决策是“近视”的，其决策基于参与人对当前市场结构的认识；

假设 3 ：参与人的决策具有不确定性，统称为“变异”。

模型描述：两个互相独立的群体 P1、 P2，人口规模分别为M, N. 设每一个参与人只具有两个纯策略，则两个群体的策略集分别为：


1 1 2 21 2

1 1 2 2

,a b a b

A Ac d c d

两个独立群体的演化博弈给出参与人的期望收益函数：

11

1 1 1 1 1( ) ( ( ))( ( )) ,s

a z t b M z tf z t

M

12

1 1 1 1 1( ) ( ( ))( ( )) .s

c z t d M z tf z t

M

21

2 2 2 2 2( ) ( ( ))( ( )) ;s

a z t b N z tf z t

N

22

2 2 2 2 2( ) ( ( ))( ( )) .s

c z t d N z tf z t

N

定义参与人选择其第一类策略的转移率为：11 12

1 1 11( ) max{ ( ) ( ),0}, {0,1,... 1}.s si f i f i i M

12 11

1 1 11( ) max{ ( ) ( ),0}, {1,2,... }.s si f i f i i M

21 22

2 2 22( ) max{ ( ) ( ),0}, {0,1,... 1}.s sj f j f j j N

22 21

2 2 22( ) max{ ( ) ( ),0}, {1,2,... }.s sj f j f j j N

定义拟生灭过程的状态空间为：{(0,0), (0,1),...(0, ); (1,0), (1,1),...(1, );...; ( ,0), ( ,1),...( , )}N N M M M N

两个独立群体的演化博弈拟生灭过程的无穷小生成元为：

0 01 01 1 12 1 0

2 2 22 1 0

2 2 22 1 0

1 1 12 1 0

2 1

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

.

( ) ( ) ( )

( ) ( ) ( )

( ) ( )

M M M

M M M

M M

A A

A A A

A A A

Q

A A A

A A A

A A

其中：1

1

0

1

( )

( )( ) ,

( )

m

m

mA

m

1

1

2

1

( )

( )( ) .

( )

n

n

nA

n

两个独立群体的演化博弈

21

2 212 2

11

2 21

21

( ,0) (0)

(1) ( ,1) (1)

(2) ( , 2) (2)( ) ,

( 1) ( , 1) ( 1)

( ) ( , )

k

a k

a k

a kA

N a k N N

N a k N

1 1 2 21( , ) ( ) ( ) ( ) ( ),0 ,0 .a k l k k l l k M l N

两个独立群体的演化博弈

1 ( ),M MU A 1 1 11 0 2( ) ( )[ ] ( );k k k k kU A A U A 1 1

0 ( )[ ] .k k kR A U

0 1 1( ) ( ( ), ( ),..., ( ), ( )),M M

0 1 1( ) ( ( ), ( ),..., ( ), ( )).N Nk k k k k

0 0 1 1( ) ( ) ( ) ( ) ( )... ( ),0 .k kv R R R k M

0 ( )v 0U

00

0

( ) 0

( ) 1

v U

v e

令

如果将这个拟生灭过程的极限平稳分布记作：

其中

那么

为马氏链的平稳概率向量，并满足

.

演化稳定策略的计算

*

0lim ,0k k k N

策略相关两个互动群体的演化博弈模型描述：两个相对独立的群体 P1、 P2 ，人口规模分别为 M, N. 设每一个参

与人只具有两个纯策略，则两个群体的策略集分别为：


1 1 2 21 2

1 1 2 2

,a b a b

A Ac d c d

策略相关性因子为：1 1 2 2( , ) {( ( , ), ( , )), ( ( , ), ( , ))},0 ,0D i j D i j D i j D i j D i j i M j N

引入策略相关性因子后，参与人策略的转移率定义为：1' 1 1( , ) ( ) ( , ),0 ,0 ;i j i D i j i M j N 1' 1 1( , ) ( ) ( , ),0 ,0i j i D i j i M j N

2' 2 2( , ) ( ) ( , ),0 ,0 ;i j j D i j i M j N 2' 2 2( , ) ( ) ( , ),0 ,0i j j D i j i M j N

策略相关性两个互动群体的演化博弈

无穷小生成元为：0 01 01 1 12 1 0

2 2 22 1 0

2 2 22 1 0

1 1 12 1 0

2 1

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( )

M M M

M M M

M M

A A

A A A

A A A

Q

A A A

A A A

A A

1'

1'

0

1'

( ,0)

( ,1)( ) ;

( , )

m

m

mA

m n

1'

1'

2

1'

( ,0)

( ,1)( ) .

( , )

n

n

nA

n n

其中

策略相关性两个互动群体的演化博弈

' 2 '1

2' ' 2 '1

2' ' 2 '1

1

2' ' 2'1

2' '1

( ,0) ( ,0)

( ,1) ( ,1) ( ,1)

( , 2) ( , 2) ( , 2)( )

( , 1) ( , 1) ( , 1)

( , ) ( , )

k

a k k

k a k k

k a k kA

k N a k N k N

k N a k N

其中

' 1' 1' 2' 2'1( , ) ( , ) ( , ) ( , ) ( , )a k l k l k l k l k l

1 1 1 1 2 2 2 2( ) ( , ) ( ) ( , ) ( ) ( , ) ( ) ( , )k D k l k D k l l D k l l D k l

新技术的市场进入研究

问题描述：假设构成群体 P1 的是某工业领域的技术提供方，他们提供相似性很强可以互相替代的成熟技术。构成群体 P2 的是技术的使用方。当有某种新技术出现时，我们假设群体 P1和群体 P2 均同时获悉将有新的技术进入。群体 P2 中的参与人有两种战略选择：采用市场上成熟的通用技术，或者采用新技术。面对这种新形势，群体 P1 中的参与人将试图通过市场营销手段继续维持现有技术的优势地位，而尽量排斥新技术的进入，他们的目标是群体 P1 中的参与人继续采用流行的成熟技术。则两个群体的策略集合为：

1 11 12{ , }.S s s 其中： 11s =“ ”进行市场营销， 12s =“ ”不进行市场营销；

2 21 22{ , }.S s s 其中： 21s =“ ”采用成熟技术， 22s =“ 采用新发明 ”技术。

两个群体内部博弈的收益矩阵定义

1

1.0 2.5;

0.5 0A

2

5.0 2.0

8.0 6.0A


定义策略相关性因子为：1 ( , ) (1 ) (1 ) ;i j

ii jiD i j d d 1 ( , ) (1 ) (1 ) .i jii jiD i j d d

2 ( , ) (1 ) (1 ) ;i jij jjD i j d d

2 ( , ) (1 ) (1 ) .i jij jjD i j d d

考查以下三组数值算例：

对照组 1 2 3

iid 0 0.2 0.2 0.2

jjd 0 0.5 0.1 0.1

ijd 0 0.1 0.4 0.1

jid 0 0.4 0.4 0.4

1 ( , ) (1 ) (1 ) ;i jii jiD i j d d 1 ( , ) (1 ) (1 ) .i j

ii jiD i j d d

2 ( , ) (1 ) (1 ) ;i jij jjD i j d d

1 ( , ) (1 ) (1 ) ;i jii jiD i j d d 1 ( , ) (1 ) (1 ) .i j

ii jiD i j d d

2 ( , ) (1 ) (1 ) .i jij jjD i j d d 2 ( , ) (1 ) (1 ) ;i j

ij jjD i j d d

1 ( , ) (1 ) (1 ) ;i jii jiD i j d d 1 ( , ) (1 ) (1 ) .i j

ii jiD i j d d

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1


0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1


我们使用策略相关因子分析新技术进入成熟市场问题有如下结论：

1 、如果技术使用者对于已有技术没有明显偏好、没有从众心理，同时也不受技术提供方的营销手段影响，则他们有可能根据新技术的先进性和占优条件来选择新技术。

2 、如果技术使用者有较强的从众心理，则新技术一般比较难进入市场。

两个直接相关群体的演化博弈模型描述：两个互相博弈的群体 P1、 P2 ，人口规模分别为 M, N. 设每一个参

与人只具有两个纯策略，则两个群体的策略集分别为：

1 11 12{ , }S s s 2 21 22{ , }S s s和：群体 P1、 P2 之间的博弈方式是“随机匹配”，互相博弈的收益矩阵

为：

1 1 2 21 2

1 1 2 2

, .a b a b

A Ac d c d

则收益函数为：

1 1 2 1 2

11

( ) ( ( ))( ( )) ;s

a z t b N z tf z t

N

1 1 2 1 2

12

( ) ( ( ))( ( )) .s

c z t d N z tf z t

N

2 2 1 2 1

21

( ) ( ( ))( ( )) ;s

a z t b M z tf z t

M

2 2 1 2 1

22

( ) ( ( ))( ( )) .s

c z t d M z tf z t

M

两个直接相关群体的演化博弈转移率定义

11 12

1 1 11( ) max{ ( ) ( ),0}, {0,1,... }, 2;s sj f j f j j N j P

12 11

1 1 11( ) max{ ( ) ( ),0}, {0,1,2,... }, 2.s sj f j f j j N j P

21 22

2 2 22( ) max{ ( ) ( ),0}, {0,1,... }, 1;s si f i f i i M i P

22 21

2 2 22( ) max{ ( ) ( ),0}, {1,2,... }, 1.s si f i f i i N i P

拟生灭过程的转移率矩阵如下0 01 01 1 12 1 0

2 2 22 1 0

2 2 22 1 0

1 1 12 1 0

2 1

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( )

M M M

M M M

M M

A A

A A A

A A A

Q

A A A

A A A

A A

两个直接相关群体的演化博弈

其中2

12 2

12 2

11

2 21

21

( ,0) ( )

( ) ( ,1) ( )

( ) ( , 2) ( )( ) .

( ) ( , 1) ( )

( ) ( , )

k

a k k

k a k k

k a k kA

k a k N k

k a k N

1

1

0

1

(0)

(1)( ) ;

( )

mA

N

1

1

2

1

(0)

(1)( ) .

( )

nA

N

两个直接相关群体的演化博弈

如果两个群体中有一个群体具有严格占优的策略，则这个群体的演化稳定策略分布将以概率 1 收敛于这个严格占优的策略；而另外一个群体的所有参与人将以概率 1 选择针对其对方群体策略的最优反应策略；

如果两个群体的阶段博弈具有两个纯策略的纳什均衡以及一个混合策略的纳什均衡，则两个群体将共同协调收敛于严格风险占优策略构成的纳什均衡；

如果两个群体的阶段博弈只具有一个混合策略的纳什均衡，则演化博弈不存在演化稳定策略。

多个群体的独立演化博弈

考虑有 K个互相独立的群体：1,2,3,..., . ( 2)K K 。其中第 k个群体的人口数为

kM 。设每个群体中的参与人都只具有两个纯策略，则：第 k个群体的策略集用

1, 2{ }k k kS s s 表示。每个参与人只与同一群体内部的其他参与人进行博弈

假设各个群体内部的博弈收益矩阵为 1 2, ,..., KA A A ，定义如下：

1 1 2 21 2

1 1 2 2

, ,..., .K KK

K K

a b a b a bA A A

c d c d c d

各个群体的参与人收益函数如下所示：

1

( ) ( ( ))( ( )) ;k k k k k k

kks

a z t b M z tf z t

M

2

( ) ( ( ))( ( )) .k k k k k k

kks

c z t d M z tf z t

M

拟生灭过程的转移率定义如下：

1 2( ) max{ ( ) ( ),0}, {0,1,... 1}. 1,2,3 ;

k k

k k kk s s ki f i f i i M k

2 1( ) max{ ( ) ( ),0}, {1,2,... }. 1,2,3.

k k

k k kk s s ki f i f i i M k

多个群体的独立演化博弈拟生灭过程的无穷小生成元为：

1

1

1

( 1) 00 0

1 ( 1) 12 1 0

2 ( 1) 22 2 0

( )

2 ( 1) 22 2 0

1 ( 1) 12 1 0

( 1)2

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) .( ) ( ) ( )

( ) ( ) ( )

( ) ( )

K

K

K

K

M K MM

M K MM

M KM

Q A

A Q A

A Q A

QA Q A

A Q A

A Q

其中 ( ) ( )KQ 是一个 1 2( 1)( 1) ( 1)KM M M “维方阵，上标表示这是 K个

具有双策略的 ”群体参加各自独立的演化博弈的无穷小生成元矩阵。

0 1( ),0 1mA m M 是一个 2( 1) ( 1)KM M 维方阵，表示在矩阵 ( ) ( )KQ 右上

次对角线上的子矩阵，m “ ”代表该子矩阵所在的水平，记： 1

1

0

1

( )

( )( ) .

( )

m

m

mA

m

1

1

2

1

( )

( )( ) .

( )

n

n

nA

n

多个群体的独立演化博弈

最后， ( 1)1( ), 0,1,...,K

kQ k M 表示在矩阵 ( ) ( )KQ 主对角线上的子矩阵， k称

“ ”为其水平。

值得注意的是： ( 1)1( ), 0,1,...,K

kQ k M “与 ( 1)K 个具有双策略的群体参加

的各自独立的演化博弈模型” 中的无穷小生成元矩阵 ( 1) ( )KQ 具有相同的形式：

为三对角的分块矩阵。并且除了其主对角线上的元素， ( 1) ( )KkQ 与 ( 1) ( )KQ 其它

元素是相等的。

如果设 ( 1) ( )KQ 是群体 P2、P3直到群体 PK参加的独立演化博弈的无穷小生成

元矩阵，容易得出：

当 0k 时： ( 1) ( 1) 0

0( ) ( ) ( )K KkQ Q A ；

当 11 1k M 时： ( 1) ( 1)

0 2( ) ( ) ( )K K k kkQ Q A A ；

当 1k M 时： ( 1) ( 1)

2( ) ( ) ( )K K kkQ Q A .

多个群体策略相关性的演化博弈

考虑有 K个互相独立的群体：1,2,3,..., . 2K K 。其中第 k个群体的人口数

为 kM 。设每个群体中的参与人都只具有两个纯策略，则：第 k个群体的策略集

用 1, 2{ }k k kS s s 表示。

假设各个群体内部的博弈收益矩阵为 1 2, ,..., KA A A ，定义如下：

1 1 2 21 2

1 1 2 2

, ,..., K KK

K K

a b a b a bA A A

c d c d c d

设策略相关性因子为：

1 2 1 2( ( , ,..., ), ( , ,..., )), 1, 2,3,...,m mi iK KD D i i i D i i i m K

把带有策略相关性因子的模型对应的最小生成元矩阵记为：

1

1

1

( 1) 00, 0,

1 ( 1) 12, 1, 0,

2 ( 1) 22, 2, 0,

( )

2 ( 1) 22, 2, 0,

1 ( 1) 12, 1, 0,

( 1)2, ,

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( )( ) ( ) ( )

( ) ( ) ( )

( ) ( )

KD D

KD D D

KD D D

KD

M K MD M D D

M K MD M D D

M KD M D

Q A

A Q A

A Q A

QA Q A

A Q A

A Q

多个群体策略相关性的演化博弈

根据矩阵

修正 ( ) ( )KDQ 的右上次对角矩阵 0, 0 0 1( ) ( ),1k k k

DA A k M ；

( ) ( )KQ 推导带有策略相关性的矩阵 ( ) ( )KDQ 算法

修正 ( ) ( )KDQ 的左下次对角矩阵 2, 2 2 1( ) ( ),1k k k

DA A k M ；

修正 ( ) ( )KDQ 主对角线上的子矩阵 (2) (2)

, 1( ) ( )kk D kQ Q ；

修正矩阵 ( ) ( )KDQ 主对角线上的元素，需满足：

1( 1) ( 1) (3), 11

( ( )) 0, {0,1,2,...( 1) ( 1)}KM M

D i j KjQ i M M

多群体直接博弈的演化博弈

考虑这样一个不对称的 K人博弈：假设有 K个群体：P1，P2，…，PK。其中第

k个群体的人口数为 , 1, 2,3,...kM k K 。并且假设每个群体中的参与人都只具有

两个纯策略，其中第 k个群体的策略集用 1, 2{ }k k kS s s 表示。

可以定义任意一个从第 ,1k k K 个群体中抽取的参与人的收益结构为：

1 1 2 1

2 1 2 2

( , ,..., ,..., ).

( , ,..., ,..., )

kk K

k kk K

x s s s sA

x s s s s

用 ( ), 1, 2,...,kz t k K 表示在时刻 t第 k个群体中选择第一类策略 1ks 的参与人数，

系统的状态表示为： 1 2( ) ( ( ), ( ),..., ( ))Kz t z t z t z t 。

可以定义任意一个从第 ,1k k K 个群体中抽取的参与人选取不同策略的期望

收益函数为： 1 1 111

( ( )) ( ,..., , , ,..., );k kk k Kksf z t f i i i i

1 1 122( ( )) ( ,..., , , ,..., ).k k

k k Kksf z t f i i i i


第 k个群体中的某一个参与人从选择第二类策略 2ks 转而选择第一类策略 1ks 的转

移率为： 1 2

( , ) max{ ( , ) ( , ),0};k k kk k k k k k kk ks si i f i i f i i

从选择第一类策略 1ks 转而选择第二类策略 2ks 的转移率为：

2 1( , ) max{ ( , ) ( , ),0}.k k k

k k k k k k kk ks si i f i i f i i

拟生灭过程 1 2{ ( ), 0}, ( ) ( ( ), ( ),..., ( ))Kz t t z t z t z t z t 的无穷小生成元矩阵可以写为：

1

1

1

( 1) 00 0

1 ( 1) 12 1 0

2 ( 1) 22 2 0

( )

2 ( 1) 22 2 0

1 ( 1) 12 1 0

( 1)2

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( )( ) ( ) ( )

( ) ( ) ( )

( ) ( )

K

K

K

K

M K MM

M K MM

M KM

Q A

A Q A

A Q A

QA Q A

A Q A

A Q

多群体直接博弈的演化博弈模型

0 1( ),0 1mA m M 是一个 2( 1) ( 1)KM M 维方阵，表示在矩阵 (3) ( )Q 右上次

对角线上的子对角矩阵，m “ ”代表该子矩阵所在的水平，记：

11,2

11,2

0

12 1,2

( ,0, )

( ,1, )( ) ;

( , , )

m

i

iA

M i

其中： 1

1,2,31

1,2,311,2

13 1,2,3

( ,0,0, )

( ,0,1, )( ,0, ) .

( ,0, , )

i

ii

M i

其中 11,2,3( ,0,0, )i ， 1

1,2,3,4( ,0,0,0, )i 依次类推。


2 1( ),1 1nA n M 也是一个 2( 1) ( 1)KM M 维的方阵，表示在矩阵 (3) ( )Q 左

下次对角线上的子对角矩阵， n “ ”代表该子矩阵所在的水平，记：

11,2

11,2

2

11,2

( ,0, )

( ,0, )( ) ;

( ,0, )

n

i

iA

i

其中：

11,2,3

11,2,31

1,2

13 1,2,3

( ,0,0, )

( ,0,1, )( ,0, ) .

( ,0, , )

i

ii

M i


最后， ( 1)1( ), 0,1,...,K

kQ k M 表示在矩阵 ( ) ( )KQ 主对角线上的子矩阵，k称为其

“ ”水平。设 ( 1) ( )KQ “代表群体 P2、P3、、PK这 1K 个群体共同直接

”博弈模型的最小生成元矩阵。

需要指出的是， ( 1) ( )KQ 中群体 P2用指标 1（第一个群体）表示，群体 P3用指

标 2（第二个群体）表示，依次类推，群体 PK用指标 1K （第 1K 个群体）

表示。现在需要考虑加入群体 P1之后这 K个群体共同参加的博弈，群体 P1用

指标 1表示，群体 P2用指标 2表示，依次类推，群体 PK用指标 K表示。因此，

维度增加之后，需要用新的转移率代替矩阵 ( 1) ( )KQ 相应位置的转移率，且遵循

如下规则：

多群体直接博弈的演化博弈( 1) 1 ( 1) 2

1 1,2

( 1) 1 ( 1) 21 1,2

( 1) 2 ( 1) 31,2 1,2,3

( 1) 2 ( 1) 21,2 1,2

( ) : ( , ) ( ) : ( , , ),

( ) : ( , ) ( ) : ( , , ),

( ) : ( , , ) ( ) : ( , , , ),

( ) : ( , , ) ( ) : ( , , ,

K Kk

K Kk

K Kk

K Kk

Q i Q k i

Q i Q k i

Q x i Q k x i

Q x i Q k x i

,3),

( 1) 1 ( 1)1 2 1 2

( 1) 1 ( 1)1 2 1 2

( ) : ( , , , ) ( ) : ( , , , , ),

( ) : ( , , , ) ( ) : ( , , , , ).

K K K Kk

K K K Kk

Q x x Q k x x

Q x x Q k x x

最后，需要对矩阵 ( 1) ( )KkQ 的对角元素进行修正，需满足：矩阵 ( ) ( )KQ 的

每一行的所有元素之和为零。

这样，最终我们通过迭代构造法，根据 ( 1) ( )KQ “推导出了双策略的 K个群体

”不对称博弈模型的拟生灭过程的最小生成元矩阵 ( ) ( )KQ 。

我们研究工作的总结

将一个多群体进化博弈模型可以归结为一个多维的QBD 过程，面临两个实质性的理论困难 :

（ 1 ）怎样写出多维的 QBD 过程；（ 2 ）怎样计算扰动的平稳概率向量，以及对于扰

动求极限。哈佛大学 D. Fudenberg教授等人解决了对称多

策略进化博弈模型。 Takayuki Osogami（） Carnegie Mellon

University 研究了一些特殊的多维QBD 过程。

进化博弈在计算机网络中的应用

无线网络的能量管理

无线网络的拥挤控制协议设计

无线网络中用户的偏好行为

无线网络的自适应路径策略

复制子动态微分方程

进化博弈在计算机网络中的应用

基于非合作博弈的无线网络路由机制研究

计算机学报 , 2009年 1 期

进化博弈在复杂网络中的应用

鹰鸽模型囚徒困境模型循环博弈模型

性别战模型斗鸡模型

智能猪模型进化博弈模型

进化空间博弈模型复杂网络基本性质

进化博弈在我国汽车工业中的应用

谢谢大家！

2009 年随机图与复杂网络学术会议

Documents