hamada m
TRANSCRIPT
ゲーム環境におけるタグ情報の利用と
戦略進化に関する研究
システム情報工学専攻
複雑系工学講座
調和系工学分野
濱田 貴広
はじめに
タグ
チープトーク
タグ
シグナリング
コスト 送信内容
ゲーム理論における,事前コミュニケーション
シグナリング
プレイヤがある行動を選択することによって自分のタイプを
顕示しようとする行為 → コストをかけることで戦略的効果の発揮
チープトーク
コストのかからないシグナリング
有
無
無
意図的
意図的
非意図的
・誰からも可視な外見上の特徴
・プレイヤの行動と明示的な相関はない
・意図的な変更不可
・コストゼロ
関連研究
[Riole 97] [Alkemade et. al. 00]
[Axtell et. al. 00]
IPDゲームで,類似したタグを持つプレイヤを相手として
選択することによる協調関係の形成
相手選択に使用
行動選択に使用
タグで特徴付けられるプレイヤ集団の行動に対する期待を形成し,
それをもとに行動選択する.
要求ゲームにおける規範の形成,平等規範の安定性
チキンゲームにおける,タグの複雑化,集団サイズの利得への影響
[Hoffmann 01]
目的
ゲーム環境において,タグ情報を利用するプレイヤとそうでないプレイヤが混在する集団では,タグ情報がどのくらい意味のあるものになるのかを考察する
プレイヤはタグを識別して行動することを前提
タグで特徴づけられるプレイヤ集団をひとまとめに考えて,次回以降の相手の行動を予測する.
ステレオタイプ化
モデルとゲーム )}{,}{,( NiiNii fSNG
},{ DCSi
プレイヤ集合
行動選択
利得関数
}2,1{N
ゲーム
タグ
C D
C 4,4 1,3
D 3,1 2,2
C D
C 3,3 2,4
D 4,2 1,1
C D
C 3,3 1,4
D 4,1 2,2
チキンゲーム
囚人のジレンマゲーム
鹿狩りゲーム
鹿狩りゲーム
チキンゲーム
囚人のジレンマゲーム
支配戦略が存在しない
ナッシュ均衡の対称性
リスク支配な戦略がない
支配戦略が存在しない
ナッシュ均衡の非対称性
支配戦略が存在するが
パレート最適ではない
2人非協力ゲーム・1 shot - game
2
21: RSSfi
}1,...,1,0{ tTti
・・・ プレイヤに唯一で意図的な変更不可
プレイヤのタイプと戦略 入力
行動履歴
出力 行動提示
タグ
<出力>
D
C 1
1
2 行動 m(記憶長)
C D
C C
0
1
D D t-1
…
各タグをもつプレイヤに対する履歴
m=2 … タグで特徴付けられた
集団全体に対する履歴
ステレオタイプ化した戦略表現
<入力>
tm 2
戦略遺伝子列長 :
それぞれのタグを持つプレイヤに対する戦略
0
D C D C D D D D ・・・
D C D C
1 t-1
i. Type D : Tag Distinguish
ii. Type N : Noise Input
タグが特定の集団に対応付いている
タグが特定の集団に対応付いていない
x ランダムに決定
t )( Tt
)( Tx
戦略進化のプロセス
GAでプレイヤの戦略を適応的に更新する
適応度 ⇒ 平均利得
ルーレット選択
二点交叉 ( 同タイプ,同タグの相手とのみ ) 突然変異 ( 戦略遺伝子列,タイプ,タグ )
P(player数) M(ゲーム回数)
T(タグの種類の数) m(記憶長) GAの世代数
交叉率
タグ変異率
戦略タイプ変異率
突然変異率
試行回数
100
平均 40
設定による
2
10000
0.5
0.01
0.01
0.001 ( per bit )
20
入力情報の影響の定量化
XxxpxpXHH )(log)()( 2
YyXxyxpyxpYXH
, 2 )|(log),()|(
)|()(),( YXHXHYXIItag
},{ DCXx
},...,1{ tYy
行動の不確実性
タグ入力の情報量
行動
タグ
)(xp 各行動の選択割合
プレイヤの行動に対して,タグ情報がどのくらい影響を与えているのかを定量化
実験
Type D のプレイヤのみの集団
Type D と Type N のプレイヤの混合集団
tagI と平均利得の関係
tagI と平均利得の関係 Type Dのプレイヤ集団の
Type Dと Type N のプレイヤ集団の平均利得の比較
T = 1
Type Dのみの集団
22.22.42.62.8
33.23.43.63.8
4
0 0.02 0.04 0.06 0.08 0.1 0.12
tagI
平均利得
T = 1, 2, 3, 4, 5, 6, 7.
初期状態 : 各タグを持つプレイヤ数はほぼ同数
鹿狩りゲーム
チキンゲーム
囚人のジレンマゲーム
鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある
それぞれの設定における全世代,全試行の平均をプロット
Type D + Type N の混合集団
22.22.42.62.8
33.23.43.63.8
4
0 0.02 0.04 0.06 0.08 0.1 0.12
tagI
タイプDのプレイヤーの平均利得
T = 2, 3, 4, 5.
初期状態 : type D とtype N のプレイヤは同数
各タグを持つプレイヤ数もほぼ同数
鹿狩りゲーム
チキンゲーム
囚人のジレンマゲーム
それぞれの設定における全世代,全試行の平均をプロット
鹿狩りゲームにおいてタグの情報量と平均利得に正の相関がある
Type D + Type N の混合集団
0
1
2
3
4
2 3 4 5
0
1
2
3
4
2 3 4 5
0
1
2
3
4
2 3 4 5
鹿狩りゲームにおいてのみType Dの平均利得が高い
T = 2, 3, 4, 5.
初期状態 : type D とtype N のプレイヤは同数
各タグを持つプレイヤ数はほぼ同数
それぞれの設定における全世代,全試行の平均
各タイプのプレイヤー
の平均利得
T T
T
鹿狩りゲーム チキンゲーム
囚人のジレンマゲーム
各タイプのプレイヤー
の平均利得
各タイプのプレイヤー
の平均利得
type Nのプレイヤの平均利得
type Dのプレイヤの平均利得
考察
Type Dのプレイヤのみの集団では,タグの情報量と平均利得に正の相関があるので,特に鹿狩りゲームではタグ情報は意味 がある
Type DとType Nのプレイヤの混合集団では,
鹿狩りゲームで,Type Dのプレイヤにおいてタグの情報量と
平均利得に正の相関があり,かつ平均利得に関して, Type D
がType Nを上回ったので,タグ情報は意味がある
・・・タグ情報に意味を持つのはゲームの性質による
まとめ
タグ情報を利用するプレイヤ間のゲームを扱った
タグ情報を利用しないプレイヤが混在する状況では,ゲームによっては,進化の過程でタグ情報に対する行動の期待が実現されにくくなり,ジレンマ型のゲームにおいては,タグ情報は意味を持たなくなる
タグ情報を特定の集団に対応付けて行動選択するプレイヤ集団では,タグ情報は意味がある