hamada m

14

Click here to load reader

Upload: harmonylab

Post on 20-Jun-2015

129 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: hamada m

ゲーム環境におけるタグ情報の利用と

戦略進化に関する研究

システム情報工学専攻

複雑系工学講座

調和系工学分野

濱田 貴広

Page 2: hamada m

はじめに

タグ

チープトーク

タグ

シグナリング

コスト 送信内容

ゲーム理論における,事前コミュニケーション

シグナリング

プレイヤがある行動を選択することによって自分のタイプを

顕示しようとする行為 → コストをかけることで戦略的効果の発揮

チープトーク

コストのかからないシグナリング

意図的

意図的

非意図的

・誰からも可視な外見上の特徴

・プレイヤの行動と明示的な相関はない

・意図的な変更不可

・コストゼロ

Page 3: hamada m

関連研究

[Riole 97] [Alkemade et. al. 00]

[Axtell et. al. 00]

IPDゲームで,類似したタグを持つプレイヤを相手として

選択することによる協調関係の形成

相手選択に使用

行動選択に使用

タグで特徴付けられるプレイヤ集団の行動に対する期待を形成し,

それをもとに行動選択する.

要求ゲームにおける規範の形成,平等規範の安定性

チキンゲームにおける,タグの複雑化,集団サイズの利得への影響

[Hoffmann 01]

Page 4: hamada m

目的

ゲーム環境において,タグ情報を利用するプレイヤとそうでないプレイヤが混在する集団では,タグ情報がどのくらい意味のあるものになるのかを考察する

プレイヤはタグを識別して行動することを前提

タグで特徴づけられるプレイヤ集団をひとまとめに考えて,次回以降の相手の行動を予測する.

ステレオタイプ化

Page 5: hamada m

モデルとゲーム )}{,}{,( NiiNii fSNG

},{ DCSi

プレイヤ集合

行動選択

利得関数

}2,1{N

ゲーム

タグ

C D

C 4,4 1,3

D 3,1 2,2

C D

C 3,3 2,4

D 4,2 1,1

C D

C 3,3 1,4

D 4,1 2,2

チキンゲーム

囚人のジレンマゲーム

鹿狩りゲーム

鹿狩りゲーム

チキンゲーム

囚人のジレンマゲーム

支配戦略が存在しない

ナッシュ均衡の対称性

リスク支配な戦略がない

支配戦略が存在しない

ナッシュ均衡の非対称性

支配戦略が存在するが

パレート最適ではない

2人非協力ゲーム・1 shot - game

2

21: RSSfi

}1,...,1,0{ tTti

・・・ プレイヤに唯一で意図的な変更不可

Page 6: hamada m

プレイヤのタイプと戦略 入力

行動履歴

出力 行動提示

タグ

<出力>

D

C 1

1

2 行動 m(記憶長)

C D

C C

0

1

D D t-1

各タグをもつプレイヤに対する履歴

m=2 … タグで特徴付けられた

集団全体に対する履歴

ステレオタイプ化した戦略表現

<入力>

tm 2

戦略遺伝子列長 :

それぞれのタグを持つプレイヤに対する戦略

0

D C D C D D D D ・・・

D C D C

1 t-1

i. Type D : Tag Distinguish

ii. Type N : Noise Input

タグが特定の集団に対応付いている

タグが特定の集団に対応付いていない

x ランダムに決定

t )( Tt

)( Tx

Page 7: hamada m

戦略進化のプロセス

GAでプレイヤの戦略を適応的に更新する

適応度 ⇒ 平均利得

ルーレット選択

二点交叉 ( 同タイプ,同タグの相手とのみ ) 突然変異 ( 戦略遺伝子列,タイプ,タグ )

P(player数) M(ゲーム回数)

T(タグの種類の数) m(記憶長) GAの世代数

交叉率

タグ変異率

戦略タイプ変異率

突然変異率

試行回数

100

平均 40

設定による

2

10000

0.5

0.01

0.01

0.001 ( per bit )

20

Page 8: hamada m

入力情報の影響の定量化

XxxpxpXHH )(log)()( 2

YyXxyxpyxpYXH

, 2 )|(log),()|(

)|()(),( YXHXHYXIItag

},{ DCXx

},...,1{ tYy

行動の不確実性

タグ入力の情報量

行動

タグ

)(xp 各行動の選択割合

プレイヤの行動に対して,タグ情報がどのくらい影響を与えているのかを定量化

Page 9: hamada m

実験

Type D のプレイヤのみの集団

Type D と Type N のプレイヤの混合集団

tagI と平均利得の関係

tagI と平均利得の関係 Type Dのプレイヤ集団の

Type Dと Type N のプレイヤ集団の平均利得の比較

Page 10: hamada m

T = 1

Type Dのみの集団

22.22.42.62.8

33.23.43.63.8

4

0 0.02 0.04 0.06 0.08 0.1 0.12

tagI

平均利得

T = 1, 2, 3, 4, 5, 6, 7.

初期状態 : 各タグを持つプレイヤ数はほぼ同数

鹿狩りゲーム

チキンゲーム

囚人のジレンマゲーム

鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある

それぞれの設定における全世代,全試行の平均をプロット

Page 11: hamada m

Type D + Type N の混合集団

22.22.42.62.8

33.23.43.63.8

4

0 0.02 0.04 0.06 0.08 0.1 0.12

tagI

タイプDのプレイヤーの平均利得

T = 2, 3, 4, 5.

初期状態 : type D とtype N のプレイヤは同数

各タグを持つプレイヤ数もほぼ同数

鹿狩りゲーム

チキンゲーム

囚人のジレンマゲーム

それぞれの設定における全世代,全試行の平均をプロット

鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある

Page 12: hamada m

Type D + Type N の混合集団

0

1

2

3

4

2 3 4 5

0

1

2

3

4

2 3 4 5

0

1

2

3

4

2 3 4 5

鹿狩りゲームにおいてのみType Dの平均利得が高い

T = 2, 3, 4, 5.

初期状態 : type D とtype N のプレイヤは同数

各タグを持つプレイヤ数はほぼ同数

それぞれの設定における全世代,全試行の平均

各タイプのプレイヤー

の平均利得

T T

T

鹿狩りゲーム チキンゲーム

囚人のジレンマゲーム

各タイプのプレイヤー

の平均利得

各タイプのプレイヤー

の平均利得

type Nのプレイヤの平均利得

type Dのプレイヤの平均利得

Page 13: hamada m

考察

Type Dのプレイヤのみの集団では,タグの情報量と平均利得に正の相関があるので,特に鹿狩りゲームではタグ情報は意味 がある

Type DとType Nのプレイヤの混合集団では,

鹿狩りゲームで,Type Dのプレイヤにおいてタグの情報量と

平均利得に正の相関があり,かつ平均利得に関して, Type D

がType Nを上回ったので,タグ情報は意味がある

・・・タグ情報に意味を持つのはゲームの性質による

Page 14: hamada m

まとめ

タグ情報を利用するプレイヤ間のゲームを扱った

タグ情報を利用しないプレイヤが混在する状況では,ゲームによっては,進化の過程でタグ情報に対する行動の期待が実現されにくくなり,ジレンマ型のゲームにおいては,タグ情報は意味を持たなくなる

タグ情報を特定の集団に対応付けて行動選択するプレイヤ集団では,タグ情報は意味がある