2009 年随机图与复杂网络学术会议

50
2009 年年年年年年年年年年年年年 年年年 年年 年年年年年年年年年年年 年年年年年年年年年年年

Upload: edythe

Post on 06-Jan-2016

92 views

Category:

Documents


4 download

DESCRIPTION

随机演化博弈的算法研究 及其在复杂网络中的应用. 2009 年随机图与复杂网络学术会议. 李泉林 博士. 汇报提纲. 进化博弈的 基本内容 我们的 研究工作 随机进化博弈所面临的 理论困难 在 计算机网络 中的应用 在 复杂网络 中的应用 我们的 未来研究工作. 1944. 1950-1951. 1980-1990. 1990-Present. 演化博弈论的产生背景. 1944, J. von. Neumann 和 Oskar. Morgenstern 奠定了 经典博弈理论的基础 。. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 2009 年随机图与复杂网络学术会议

2009年随机图与复杂网络学术会议

李泉林 博士

随机演化博弈的算法研究及其在复杂网络中的应用

Page 2: 2009 年随机图与复杂网络学术会议

汇报提纲2

进化博弈的基本内容我们的研究工作随机进化博弈所面临的理论困难在计算机网络中的应用在复杂网络中的应用我们的未来研究工作

Page 3: 2009 年随机图与复杂网络学术会议

演化博弈论的产生背景

1990-Present

1980-1990

1950-1951

1944

1944, J. von. Neumann和 Oskar. Morgenstern 奠定了经典博弈理论的基础。

1950-1951, J. Nash 提出了非合作博弈的纳什均衡的概念。

二十世纪八十年代,博弈论成为经济学领域当中的通用理论工具,例如:分析不同厂商的合作、联盟、竞争与冲突;工业组织的形成;经济契约的签订;拍卖机制的设计;不对称信息的市场分析等等。

Page 4: 2009 年随机图与复杂网络学术会议

标准式博弈 标准式博弈由三种元素组成:参与人、纯策略、收益函数 纯策略; 混合策略是在纯策略上的概率分布。

纳什均衡:如果博弈中的任意一个参与人选择的纯策略,都是对其他人选择的纯策略的最优反应,那么这样的纯策略组合为一个标准式博弈的纯策略纳什均衡:

* * * *, ( , ) ( , ).i i i i i i i is s u s s u s s

严格占优策略:任意给定其他博弈参与人的纯策略选择组合,如果某一个特定的纯策略满足如下条件,则称这个纯策略为严格占优策略:

' * * ', , ( , ) ( , )i i i i i i i i is s s u s s u s s

Page 5: 2009 年随机图与复杂网络学术会议

演化博弈论的产生背景

经典博弈论经典博弈论

实证缺陷实证缺陷

方法缺陷方法缺陷

假设缺陷假设缺陷

二十世纪八十年代之后,研究工作围绕着修正经典博弈论中的完全理性假设展开研究,并试图为纳什均衡的概念寻找动态结构下的解释。研究表明:经典博弈论在应用中遇到困难,主要是存在三种缺陷:假设缺陷、方法缺陷、实证缺陷。

为了解决经典博弈论的以上三种缺陷,从二十世纪九十年代发展了演化博弈论的研究工作。

Page 6: 2009 年随机图与复杂网络学术会议

演化博弈论的产生背景

假设缺陷:完全理性假设,即假定参与人完全了解其对手的策略集合以及使用每个策略的概率,同时也了解博弈规则与收益结构。参与人也具有通过精确计算推理得到最优策略的能力。但现实中的参与人只具有有限理性(Bounded Rationality) 。

方法缺陷:经典博弈论关注的重点是如何求解博弈的平衡结构,但不能解释博弈的各参与方是如何通过参与博弈而趋向于这些均衡状态的 (H.P. Young) 。

实证缺陷:多数解析型博弈论的预测都是基于理想的假设和精确的数学推导,需要实证的经验规律来充实经典博弈论 (Colin Camerer) 。

Page 7: 2009 年随机图与复杂网络学术会议

演化博弈论的研究意义

演化博弈研究具有普遍意义的有限理性的参与人:惰性、近视、遗传、突变、变异。 Kandori, Mailath和 Rob (1993)

演化博弈不仅关注博弈的稳定结构,还通过引入不同的动态机制研究博弈系统的稳定结构和演化过程之间的关系;

演化博弈模型可以和个人学习机制相结合,可以探讨微观层面上参与人的互动和宏观层面上群体的均衡现象之间的关系;

演化博弈的假设条件与建模方法更加有利于进行模拟实验来获得实证数据。

Page 8: 2009 年随机图与复杂网络学术会议

演化博弈论的文献综述 溯源 1798,Malthus 的“人口论”; 1887, Darwin 的“物种起源”;

当代演化博弈论在生物学上的起源 Lewontin (1961) 物种与生存环境 Smith与 Price(1973) 生物之间的有限战争 Smith(1982) 专著 ; Taylor和 Jonker(1978)

个体相互作用内涵的转变

策略内涵的转变 均衡内涵的转变

Page 9: 2009 年随机图与复杂网络学术会议

演化稳定策略( ESS)

用 J( p, q)来表示一个物种的策略 p 遇到策略 q 时的收益函数。

策略 p* 被称为是一个 ESS ,如果

J( p*, p* ) 〉 J( p, p* )

或者当 J( p*, p* ) = J( p, p* )时,

J( p*, p ) 〉 J( p, p )。

ESS可以是纯策略,也可以是混合策略。

微分方程的稳定性

马氏链的稳定性

Page 10: 2009 年随机图与复杂网络学术会议

相关研究的文献综述

确定性的演化博弈模型(微分方程): Friedman(1991,1998); Hofbauer和Sigmund(1988, 1998); Weibull(1995).

随机性的演化博弈模型: 扰动的生灭过程: Fudenberg和 Imhof(2006);

Fudenberg 等人 (2006) 。 扰动的拟生灭过程: Tadja和 Touzene(2003);

Q.L. Li(2008) 。 扰动图的马氏链: Young(1993)

Page 11: 2009 年随机图与复杂网络学术会议

相关研究的文献综述

探讨演化稳定策略的定义和求解方法,以及演化稳定策略与纳什均衡策略之间关系:Friedman(1991,1998); Hofbauer和 Sigmund(1988, 1998); Samuelson(1997); Weibull(1995).

演化博弈和学习机制的交叉研究: Fudenberg和Levine(1997); Foster和 Young(2003); Milgrom和Robert(1991); Young(1998, 2000,2 002).

Nash均衡 ESS

Page 12: 2009 年随机图与复杂网络学术会议

Quan-Lin Li

Constructive Computation in Stochastic Models with Applications :

The RG-Factorizations

Springer Chapter 11 Sensitivity Analysis and Evolutionary Games

Page 13: 2009 年随机图与复杂网络学术会议

我们的研究工作 针对策略状态空间是离散的、群体的人口规模是有限的、决策具有随机

性的演化博弈模型。

对两个群体的演化博弈问题,研究了两类模型: 两个群体间接相关,博弈只在每个群体内部进行,但是两个群体通过策

略相关性因子互相影响; 两个群体直接相关,博弈的双方每次分别从两个不同的群体中随机抽取。

针对任意多个群体的演化博弈问题,研究了三类模型:间接相关、直接相关、混合相关。

多个群体演化博弈问题的建模及其求解演化稳定策略,为演化博弈论在经济学、运筹学领域的广泛应用提供了一定的理论基础;同时,通过一系列数值算例,定性与定量相结合地研究不同建模参数对演化稳定策略分布的影响,为设计实验、提供实验数据的实证支持打下了基础。

Page 14: 2009 年随机图与复杂网络学术会议

演化博弈的基本要素

1 2 3 有限人口 - 无限人口:

离散的策略 - 连续的策略:

参与人的匹配方式:单对模型、总体统计模型、随机匹配模型

同质群体的对称二人博弈;

不同质群体的非对称二人博弈。

自然选择机制(复制子动态);

模仿机制; 强化学习机制; 最优反应机制; 几种机制的混合:虚拟行动。

Page 15: 2009 年随机图与复杂网络学术会议

对称的( )演化博弈 假设前提: 假设 1 :参与人采用近似最优反应机制规定的决策模式,即参与人对市场的认知程度是有局限性的;

假设 2 :参与人的决策是“近视”的,其决策基于参与人对当前市场结构的认识;

假设 3 :参与人的决策具有不确定性,统称为“变异”。

模型描述: 两个互相独立的群体 P1、 P2,人口规模分别为M, N. 设每一个参与人只具有两个纯策略,则两个群体的策略集分别为:

1 11 12{ , }S s s 2 21 22{ , }S s s和: 群体 P1、 P2 内部的博弈方式是“随机匹配”,阶段博弈矩阵为:

1 2,a b a c

A Ac d b d

2 2

Page 16: 2009 年随机图与复杂网络学术会议

对称的( )演化博弈 给出参与人的期望收益函数:

2 2

11

( ) ( ( ))( ( )) ,s

az t b M z tf z t

M

12

( ) ( ( ))( ( )) .s

cz t d M z tf z t

M

定义参与人选择其第一类策略的转移率为:

11 12( ) max{ ( ) ( ),0}, {0,1,... 1}.s si f i f i i M

12 11( ) max{ ( ) ( ),0}, {1,2,... }.s si f i f i i M

* 0

1 * 1

*

Q

N

*

0

0 , 1 , 2 , , ;

lim .

N

k k

2 2

Page 17: 2009 年随机图与复杂网络学术会议

两个独立群体的演化博弈 假设前提: 假设 1 :参与人采用近似最优反应机制规定的决策模式,即参与人对市场的认知程度是有局限性的;

假设 2 :参与人的决策是“近视”的,其决策基于参与人对当前市场结构的认识;

假设 3 :参与人的决策具有不确定性,统称为“变异”。

模型描述: 两个互相独立的群体 P1、 P2,人口规模分别为M, N. 设每一个参与人只具有两个纯策略,则两个群体的策略集分别为:

1 11 12{ , }S s s 2 21 22{ , }S s s和: 群体 P1、 P2 内部的博弈方式是“随机匹配”,阶段博弈矩阵为:

1 1 2 21 2

1 1 2 2

,a b a b

A Ac d c d

Page 18: 2009 年随机图与复杂网络学术会议

两个独立群体的演化博弈 给出参与人的期望收益函数:

11

1 1 1 1 1( ) ( ( ))( ( )) ,s

a z t b M z tf z t

M

12

1 1 1 1 1( ) ( ( ))( ( )) .s

c z t d M z tf z t

M

21

2 2 2 2 2( ) ( ( ))( ( )) ;s

a z t b N z tf z t

N

22

2 2 2 2 2( ) ( ( ))( ( )) .s

c z t d N z tf z t

N

定义参与人选择其第一类策略的转移率为:11 12

1 1 11( ) max{ ( ) ( ),0}, {0,1,... 1}.s si f i f i i M

12 11

1 1 11( ) max{ ( ) ( ),0}, {1,2,... }.s si f i f i i M

21 22

2 2 22( ) max{ ( ) ( ),0}, {0,1,... 1}.s sj f j f j j N

22 21

2 2 22( ) max{ ( ) ( ),0}, {1,2,... }.s sj f j f j j N

定义拟生灭过程的状态空间为:{(0,0), (0,1),...(0, ); (1,0), (1,1),...(1, );...; ( ,0), ( ,1),...( , )}N N M M M N

Page 19: 2009 年随机图与复杂网络学术会议

两个独立群体的演化博弈 拟生灭过程的无穷小生成元为:

0 01 01 1 12 1 0

2 2 22 1 0

2 2 22 1 0

1 1 12 1 0

2 1

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

.

( ) ( ) ( )

( ) ( ) ( )

( ) ( )

M M M

M M M

M M

A A

A A A

A A A

Q

A A A

A A A

A A

其中:1

1

0

1

( )

( )( ) ,

( )

m

m

mA

m

1

1

2

1

( )

( )( ) .

( )

n

n

nA

n

Page 20: 2009 年随机图与复杂网络学术会议

两个独立群体的演化博弈

21

2 212 2

11

2 21

21

( ,0) (0)

(1) ( ,1) (1)

(2) ( , 2) (2)( ) ,

( 1) ( , 1) ( 1)

( ) ( , )

k

a k

a k

a kA

N a k N N

N a k N

1 1 2 21( , ) ( ) ( ) ( ) ( ),0 ,0 .a k l k k l l k M l N

Page 21: 2009 年随机图与复杂网络学术会议

两个独立群体的演化博弈

1 ( ),M MU A 1 1 11 0 2( ) ( )[ ] ( );k k k k kU A A U A 1 1

0 ( )[ ] .k k kR A U

0 1 1( ) ( ( ), ( ),..., ( ), ( )),M M

0 1 1( ) ( ( ), ( ),..., ( ), ( )).N Nk k k k k

0 0 1 1( ) ( ) ( ) ( ) ( )... ( ),0 .k kv R R R k M

0 ( )v 0U

00

0

( ) 0

( ) 1

v U

v e

如果将这个拟生灭过程的极限平稳分布记作:

其中

那么

为马氏链 的平稳概率向量,并满足

.

Page 22: 2009 年随机图与复杂网络学术会议

演化稳定策略的计算

*

0lim ,0k k k N

Page 23: 2009 年随机图与复杂网络学术会议

策略相关两个互动群体的演化博弈 模型描述: 两个相对独立的群体 P1、 P2 ,人口规模分别为 M, N. 设每一个参

与人只具有两个纯策略,则两个群体的策略集分别为:

1 11 12{ , }S s s 2 21 22{ , }S s s和: 群体 P1、 P2 内部的博弈方式是“随机匹配”,阶段博弈矩阵为:

1 1 2 21 2

1 1 2 2

,a b a b

A Ac d c d

策略相关性因子为:1 1 2 2( , ) {( ( , ), ( , )), ( ( , ), ( , ))},0 ,0D i j D i j D i j D i j D i j i M j N

引入策略相关性因子后,参与人策略的转移率定义为:1' 1 1( , ) ( ) ( , ),0 ,0 ;i j i D i j i M j N 1' 1 1( , ) ( ) ( , ),0 ,0i j i D i j i M j N

2' 2 2( , ) ( ) ( , ),0 ,0 ;i j j D i j i M j N 2' 2 2( , ) ( ) ( , ),0 ,0i j j D i j i M j N

Page 24: 2009 年随机图与复杂网络学术会议

策略相关性两个互动群体的演化博弈

无穷小生成元为:0 01 01 1 12 1 0

2 2 22 1 0

2 2 22 1 0

1 1 12 1 0

2 1

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( )

M M M

M M M

M M

A A

A A A

A A A

Q

A A A

A A A

A A

1'

1'

0

1'

( ,0)

( ,1)( ) ;

( , )

m

m

mA

m n

1'

1'

2

1'

( ,0)

( ,1)( ) .

( , )

n

n

nA

n n

其中

Page 25: 2009 年随机图与复杂网络学术会议

策略相关性两个互动群体的演化博弈

' 2 '1

2' ' 2 '1

2' ' 2 '1

1

2' ' 2'1

2' '1

( ,0) ( ,0)

( ,1) ( ,1) ( ,1)

( , 2) ( , 2) ( , 2)( )

( , 1) ( , 1) ( , 1)

( , ) ( , )

k

a k k

k a k k

k a k kA

k N a k N k N

k N a k N

其中

' 1' 1' 2' 2'1( , ) ( , ) ( , ) ( , ) ( , )a k l k l k l k l k l

1 1 1 1 2 2 2 2( ) ( , ) ( ) ( , ) ( ) ( , ) ( ) ( , )k D k l k D k l l D k l l D k l

Page 26: 2009 年随机图与复杂网络学术会议

新技术的市场进入研究

问题描述:假设构成群体 P1 的是某工业领域的技术提供方,他们提供相似性很强可以互相替代的成熟技术。构成群体 P2 的是技术的使用方。当有某种新技术出现时,我们假设群体 P1和群体 P2 均同时获悉将有新的技术进入。群体 P2 中的参与人有两种战略选择:采用市场上成熟的通用技术,或者采用新技术。面对这种新形势,群体 P1 中的参与人将试图通过市场营销手段继续维持现有技术的优势地位,而尽量排斥新技术的进入,他们的目标是群体 P1 中的参与人继续采用流行的成熟技术。则两个群体的策略集合为:

1 11 12{ , }.S s s 其中: 11s =“ ”进行市场营销 , 12s =“ ”不进行市场营销 ;

2 21 22{ , }.S s s 其中: 21s =“ ”采用成熟技术 , 22s =“ 采用新发明 ”技术 。

两个群体内部博弈的收益矩阵定义

1

1.0 2.5;

0.5 0A

2

5.0 2.0

8.0 6.0A

Page 27: 2009 年随机图与复杂网络学术会议

新技术的市场进入研究

定义策略相关性因子为:1 ( , ) (1 ) (1 ) ;i j

ii jiD i j d d 1 ( , ) (1 ) (1 ) .i jii jiD i j d d

2 ( , ) (1 ) (1 ) ;i jij jjD i j d d

2 ( , ) (1 ) (1 ) .i jij jjD i j d d

考查以下三组数值算例:

对照组 1 2 3

iid 0 0.2 0.2 0.2

jjd 0 0.5 0.1 0.1

ijd 0 0.1 0.4 0.1

jid 0 0.4 0.4 0.4

1 ( , ) (1 ) (1 ) ;i jii jiD i j d d 1 ( , ) (1 ) (1 ) .i j

ii jiD i j d d

2 ( , ) (1 ) (1 ) ;i jij jjD i j d d

1 ( , ) (1 ) (1 ) ;i jii jiD i j d d 1 ( , ) (1 ) (1 ) .i j

ii jiD i j d d

2 ( , ) (1 ) (1 ) .i jij jjD i j d d 2 ( , ) (1 ) (1 ) ;i j

ij jjD i j d d

1 ( , ) (1 ) (1 ) ;i jii jiD i j d d 1 ( , ) (1 ) (1 ) .i j

ii jiD i j d d

Page 28: 2009 年随机图与复杂网络学术会议

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

新技术的市场进入研究

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 80

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 2 4 6 8 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Page 29: 2009 年随机图与复杂网络学术会议

新技术的市场进入研究

我们使用策略相关因子分析新技术进入成熟市场问题有如下结论:

1 、如果技术使用者对于已有技术没有明显偏好、 没有从众心理,同时也不受技术提供方的营销 手段影响,则他们有可能根据新技术的先进性 和占优条件来选择新技术。

2 、如果技术使用者有较强的从众心理,则新技术 一般比较难进入市场。

Page 30: 2009 年随机图与复杂网络学术会议

两个直接相关群体的演化博弈 模型描述: 两个互相博弈的群体 P1、 P2 ,人口规模分别为 M, N. 设每一个参

与人只具有两个纯策略,则两个群体的策略集分别为:

1 11 12{ , }S s s 2 21 22{ , }S s s和: 群体 P1、 P2 之间的博弈方式是“随机匹配”,互相博弈的收益矩阵

为:

1 1 2 21 2

1 1 2 2

, .a b a b

A Ac d c d

则收益函数为:

1 1 2 1 2

11

( ) ( ( ))( ( )) ;s

a z t b N z tf z t

N

1 1 2 1 2

12

( ) ( ( ))( ( )) .s

c z t d N z tf z t

N

2 2 1 2 1

21

( ) ( ( ))( ( )) ;s

a z t b M z tf z t

M

2 2 1 2 1

22

( ) ( ( ))( ( )) .s

c z t d M z tf z t

M

Page 31: 2009 年随机图与复杂网络学术会议

两个直接相关群体的演化博弈 转移率定义

11 12

1 1 11( ) max{ ( ) ( ),0}, {0,1,... }, 2;s sj f j f j j N j P

12 11

1 1 11( ) max{ ( ) ( ),0}, {0,1,2,... }, 2.s sj f j f j j N j P

21 22

2 2 22( ) max{ ( ) ( ),0}, {0,1,... }, 1;s si f i f i i M i P

22 21

2 2 22( ) max{ ( ) ( ),0}, {1,2,... }, 1.s si f i f i i N i P

拟生灭过程的转移率矩阵如下0 01 01 1 12 1 0

2 2 22 1 0

2 2 22 1 0

1 1 12 1 0

2 1

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) ( )

M M M

M M M

M M

A A

A A A

A A A

Q

A A A

A A A

A A

Page 32: 2009 年随机图与复杂网络学术会议

两个直接相关群体的演化博弈

其中2

12 2

12 2

11

2 21

21

( ,0) ( )

( ) ( ,1) ( )

( ) ( , 2) ( )( ) .

( ) ( , 1) ( )

( ) ( , )

k

a k k

k a k k

k a k kA

k a k N k

k a k N

1

1

0

1

(0)

(1)( ) ;

( )

mA

N

1

1

2

1

(0)

(1)( ) .

( )

nA

N

Page 33: 2009 年随机图与复杂网络学术会议

两个直接相关群体的演化博弈

如果两个群体中有一个群体具有严格占优的策略,则这个群体的演化稳定策略分布将以概率 1 收敛于这个严格占优的策略;而另外一个群体的所有参与人将以概率 1 选择针对其对方群体策略的最优反应策略;

如果两个群体的阶段博弈具有两个纯策略的纳什均衡以及一个混合策略的纳什均衡,则两个群体将共同协调收敛于严格风险占优策略构成的纳什均衡;

如果两个群体的阶段博弈只具有一个混合策略的纳什均衡,则演化博弈不存在演化稳定策略。

Page 34: 2009 年随机图与复杂网络学术会议

多个群体的独立演化博弈

考虑有 K个互相独立的群体:1,2,3,..., . ( 2)K K 。其中第 k个群体的人口数为

kM 。设每个群体中的参与人都只具有两个纯策略,则:第 k个群体的策略集用

1, 2{ }k k kS s s 表示。每个参与人只与同一群体内部的其他参与人进行博弈

假设各个群体内部的博弈收益矩阵为 1 2, ,..., KA A A ,定义如下:

1 1 2 21 2

1 1 2 2

, ,..., .K KK

K K

a b a b a bA A A

c d c d c d

各个群体的参与人收益函数如下所示:

1

( ) ( ( ))( ( )) ;k k k k k k

kks

a z t b M z tf z t

M

2

( ) ( ( ))( ( )) .k k k k k k

kks

c z t d M z tf z t

M

拟生灭过程的转移率定义如下:

1 2( ) max{ ( ) ( ),0}, {0,1,... 1}. 1,2,3 ;

k k

k k kk s s ki f i f i i M k

2 1( ) max{ ( ) ( ),0}, {1,2,... }. 1,2,3.

k k

k k kk s s ki f i f i i M k

Page 35: 2009 年随机图与复杂网络学术会议

多个群体的独立演化博弈 拟生灭过程的无穷小生成元为:

1

1

1

( 1) 00 0

1 ( 1) 12 1 0

2 ( 1) 22 2 0

( )

2 ( 1) 22 2 0

1 ( 1) 12 1 0

( 1)2

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( ) .( ) ( ) ( )

( ) ( ) ( )

( ) ( )

K

K

K

K

M K MM

M K MM

M KM

Q A

A Q A

A Q A

QA Q A

A Q A

A Q

其中 ( ) ( )KQ 是一个 1 2( 1)( 1) ( 1)KM M M “维方阵,上标表示这是 K个

具有双策略的 ”群体 参加各自独立的演化博弈的无穷小生成元矩阵。

0 1( ),0 1mA m M 是一个 2( 1) ( 1)KM M 维方阵,表示在矩阵 ( ) ( )KQ 右上

次对角线上的子矩阵,m “ ”代表该子矩阵所在的 水平 ,记: 1

1

0

1

( )

( )( ) .

( )

m

m

mA

m

1

1

2

1

( )

( )( ) .

( )

n

n

nA

n

Page 36: 2009 年随机图与复杂网络学术会议

多个群体的独立演化博弈

最后, ( 1)1( ), 0,1,...,K

kQ k M 表示在矩阵 ( ) ( )KQ 主对角线上的子矩阵, k称

“ ”为其 水平 。

值得注意的是: ( 1)1( ), 0,1,...,K

kQ k M “与 ( 1)K 个具有双策略的群体参加

的各自独立的演化博弈模型” 中的无穷小生成元矩阵 ( 1) ( )KQ 具有相同的形式:

为三对角的分块矩阵。并且除了其主对角线上的元素, ( 1) ( )KkQ 与 ( 1) ( )KQ 其它

元素是相等的。

如果设 ( 1) ( )KQ 是群体 P2、P3直到群体 PK参加的独立演化博弈的无穷小生成

元矩阵,容易得出:

当 0k 时: ( 1) ( 1) 0

0( ) ( ) ( )K KkQ Q A ;

当 11 1k M 时: ( 1) ( 1)

0 2( ) ( ) ( )K K k kkQ Q A A ;

当 1k M 时: ( 1) ( 1)

2( ) ( ) ( )K K kkQ Q A .

Page 37: 2009 年随机图与复杂网络学术会议

多个群体策略相关性的演化博弈

考虑有 K个互相独立的群体:1,2,3,..., . 2K K 。其中第 k个群体的人口数

为 kM 。设每个群体中的参与人都只具有两个纯策略,则:第 k个群体的策略集

用 1, 2{ }k k kS s s 表示。

假设各个群体内部的博弈收益矩阵为 1 2, ,..., KA A A ,定义如下:

1 1 2 21 2

1 1 2 2

, ,..., K KK

K K

a b a b a bA A A

c d c d c d

设策略相关性因子为:

1 2 1 2( ( , ,..., ), ( , ,..., )), 1, 2,3,...,m mi iK KD D i i i D i i i m K

把带有策略相关性因子的模型对应的最小生成元矩阵记为:

1

1

1

( 1) 00, 0,

1 ( 1) 12, 1, 0,

2 ( 1) 22, 2, 0,

( )

2 ( 1) 22, 2, 0,

1 ( 1) 12, 1, 0,

( 1)2, ,

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( )( ) ( ) ( )

( ) ( ) ( )

( ) ( )

KD D

KD D D

KD D D

KD

M K MD M D D

M K MD M D D

M KD M D

Q A

A Q A

A Q A

QA Q A

A Q A

A Q

Page 38: 2009 年随机图与复杂网络学术会议

多个群体策略相关性的演化博弈

根据矩阵

修正 ( ) ( )KDQ 的右上次对角矩阵 0, 0 0 1( ) ( ),1k k k

DA A k M ;

( ) ( )KQ 推导带有策略相关性的矩阵 ( ) ( )KDQ 算法

修正 ( ) ( )KDQ 的左下次对角矩阵 2, 2 2 1( ) ( ),1k k k

DA A k M ;

修正 ( ) ( )KDQ 主对角线上的子矩阵 (2) (2)

, 1( ) ( )kk D kQ Q ;

修正矩阵 ( ) ( )KDQ 主对角线上的元素,需满足:

1( 1) ( 1) (3), 11

( ( )) 0, {0,1,2,...( 1) ( 1)}KM M

D i j KjQ i M M

Page 39: 2009 年随机图与复杂网络学术会议

多群体直接博弈的演化博弈

考虑这样一个不对称的 K人博弈:假设有 K个群体:P1,P2,…,PK。其中第

k个群体的人口数为 , 1, 2,3,...kM k K 。并且假设每个群体中的参与人都只具有

两个纯策略,其中第 k个群体的策略集用 1, 2{ }k k kS s s 表示。

可以定义任意一个从第 ,1k k K 个群体中抽取的参与人的收益结构为:

1 1 2 1

2 1 2 2

( , ,..., ,..., ).

( , ,..., ,..., )

kk K

k kk K

x s s s sA

x s s s s

用 ( ), 1, 2,...,kz t k K 表示在时刻 t第 k个群体中选择第一类策略 1ks 的参与人数,

系统的状态表示为: 1 2( ) ( ( ), ( ),..., ( ))Kz t z t z t z t 。

可以定义任意一个从第 ,1k k K 个群体中抽取的参与人选取不同策略的期望

收益函数为: 1 1 111

( ( )) ( ,..., , , ,..., );k kk k Kksf z t f i i i i

1 1 122( ( )) ( ,..., , , ,..., ).k k

k k Kksf z t f i i i i

Page 40: 2009 年随机图与复杂网络学术会议

多群体直接博弈的演化博弈

第 k个群体中的某一个参与人从选择第二类策略 2ks 转而选择第一类策略 1ks 的转

移率为: 1 2

( , ) max{ ( , ) ( , ),0};k k kk k k k k k kk ks si i f i i f i i

从选择第一类策略 1ks 转而选择第二类策略 2ks 的转移率为:

2 1( , ) max{ ( , ) ( , ),0}.k k k

k k k k k k kk ks si i f i i f i i

拟生灭过程 1 2{ ( ), 0}, ( ) ( ( ), ( ),..., ( ))Kz t t z t z t z t z t 的无穷小生成元矩阵可以写为:

1

1

1

( 1) 00 0

1 ( 1) 12 1 0

2 ( 1) 22 2 0

( )

2 ( 1) 22 2 0

1 ( 1) 12 1 0

( 1)2

( ) ( )

( ) ( ) ( )

( ) ( ) ( )

( )( ) ( ) ( )

( ) ( ) ( )

( ) ( )

K

K

K

K

M K MM

M K MM

M KM

Q A

A Q A

A Q A

QA Q A

A Q A

A Q

Page 41: 2009 年随机图与复杂网络学术会议

多群体直接博弈的演化博弈模型

0 1( ),0 1mA m M 是一个 2( 1) ( 1)KM M 维方阵,表示在矩阵 (3) ( )Q 右上次

对角线上的子对角矩阵,m “ ”代表该子矩阵所在的 水平 ,记:

11,2

11,2

0

12 1,2

( ,0, )

( ,1, )( ) ;

( , , )

m

i

iA

M i

其中: 1

1,2,31

1,2,311,2

13 1,2,3

( ,0,0, )

( ,0,1, )( ,0, ) .

( ,0, , )

i

ii

M i

其中 11,2,3( ,0,0, )i , 1

1,2,3,4( ,0,0,0, )i 依次类推。

Page 42: 2009 年随机图与复杂网络学术会议

多群体直接博弈的演化博弈

2 1( ),1 1nA n M 也是一个 2( 1) ( 1)KM M 维的方阵,表示在矩阵 (3) ( )Q 左

下次对角线上的子对角矩阵, n “ ”代表该子矩阵所在的 水平 ,记:

11,2

11,2

2

11,2

( ,0, )

( ,0, )( ) ;

( ,0, )

n

i

iA

i

其中:

11,2,3

11,2,31

1,2

13 1,2,3

( ,0,0, )

( ,0,1, )( ,0, ) .

( ,0, , )

i

ii

M i

Page 43: 2009 年随机图与复杂网络学术会议

多群体直接博弈的演化博弈

最后, ( 1)1( ), 0,1,...,K

kQ k M 表示在矩阵 ( ) ( )KQ 主对角线上的子矩阵,k称为其

“ ”水平 。设 ( 1) ( )KQ “代表 群体 P2、P3、、PK这 1K 个群体共同直接

”博弈模型 的最小生成元矩阵。

需要指出的是, ( 1) ( )KQ 中群体 P2用指标 1(第一个群体)表示,群体 P3用指

标 2(第二个群体)表示,依次类推,群体 PK用指标 1K (第 1K 个群体)

表示。现在需要考虑加入群体 P1之后这 K个群体共同参加的博弈,群体 P1用

指标 1表示,群体 P2用指标 2表示,依次类推,群体 PK用指标 K表示。因此,

维度增加之后,需要用新的转移率代替矩阵 ( 1) ( )KQ 相应位置的转移率,且遵循

如下规则:

Page 44: 2009 年随机图与复杂网络学术会议

多群体直接博弈的演化博弈( 1) 1 ( 1) 2

1 1,2

( 1) 1 ( 1) 21 1,2

( 1) 2 ( 1) 31,2 1,2,3

( 1) 2 ( 1) 21,2 1,2

( ) : ( , ) ( ) : ( , , ),

( ) : ( , ) ( ) : ( , , ),

( ) : ( , , ) ( ) : ( , , , ),

( ) : ( , , ) ( ) : ( , , ,

K Kk

K Kk

K Kk

K Kk

Q i Q k i

Q i Q k i

Q x i Q k x i

Q x i Q k x i

,3),

( 1) 1 ( 1)1 2 1 2

( 1) 1 ( 1)1 2 1 2

( ) : ( , , , ) ( ) : ( , , , , ),

( ) : ( , , , ) ( ) : ( , , , , ).

K K K Kk

K K K Kk

Q x x Q k x x

Q x x Q k x x

最后,需要对矩阵 ( 1) ( )KkQ 的对角元素进行修正,需满足:矩阵 ( ) ( )KQ 的

每一行的所有元素之和为零。

这样,最终我们通过迭代构造法,根据 ( 1) ( )KQ “推导出了 双策略的 K个群体

”不对称博弈模型 的拟生灭过程的最小生成元矩阵 ( ) ( )KQ 。

Page 45: 2009 年随机图与复杂网络学术会议

我们研究工作的总结

将一个多群体进化博弈模型可以归结为一个多维的QBD 过程,面临两个实质性的理论困难 :

( 1 )怎样写出多维的 QBD 过程; ( 2 )怎样计算扰动的平稳概率向量,以及对于扰

动求极限。 哈佛大学 D. Fudenberg教授等人解决了对称多

策略进化博弈模型。 Takayuki Osogami() Carnegie Mellon

University 研究了一些特殊的多维QBD 过程。

Page 46: 2009 年随机图与复杂网络学术会议

进化博弈在计算机网络中的应用

无线网络的能量管理

无线网络的拥挤控制协议设计

无线网络中用户的偏好行为

无线网络的自适应路径策略

复制子动态 微分方程

Page 47: 2009 年随机图与复杂网络学术会议

进化博弈在计算机网络中的应用

基于非合作博弈的无线网络路由机制研究

计算机学报 , 2009年 1 期

Page 48: 2009 年随机图与复杂网络学术会议

进化博弈在复杂网络中的应用

鹰鸽模型 囚徒困境模型 循环博弈模型

性别战模型 斗鸡模型

智能猪模型进化博弈模型

进化空间博弈模型复杂网络基本性质

Page 49: 2009 年随机图与复杂网络学术会议

进化博弈在我国汽车工业中的应用

Page 50: 2009 年随机图与复杂网络学术会议

谢谢大家!