ゲーム理論 - econ.hokudai.ac.jpmachino/game2019stratgic.pdf · (裏切り, 協力)...

ゲーム理論戦略形ゲーム

（１）北海道大学

経済学研究院/公共政策大学院

町野和夫

2019年4月8日

（14, 15頁修正, 5, 21頁微修正）

I. ゲーム理論の基礎ⅰ) ゲーム理論とは何か ii)（注）非協力ゲームの基礎（戦略ゲーム，ナッシュ均衡，ダイナミックなゲームなど） iii) 繰り返しゲーム

II. ゲーム理論の応用ⅰ）情報不完備ゲームと情報の経済学（逆選択，モラル・ハザードなど） ii）交渉ゲーム iii）協力ゲーム*

III. 新しい分野進化ゲーム，ゲーム実験など

注：前回 ii)として挙げていた「不確実性の扱い方」の内容はいくつかに分けて、それぞれ必要な場所で説明する。

2019/4/8 2

I. ゲーム理論の基礎ii)非協力ゲームの基礎

1. 戦略形ゲーム(1) 戦略形ゲームとは(2) ナッシュ均衡（純粋戦略）

(3) 支配戦略均衡(4) 有名な戦略形ゲームの例

2019/4/8 33

1. 戦略形ゲーム

(1) 戦略形ゲームとは

構成要素• プレーヤ• 戦略（全ての取り得る選択肢）• 利得（or期待利得）

表現形式利得行列（プレーヤが二人で戦略集合が少ない場合は利得表）あるいは，利得関数の形式で表現できる。

2019/4/8 4

囚人 2囚人 1

協力

（黙秘）

裏切り

（自白）

協力

（黙秘）-1, -1 -3, 0

裏切り

（自白）0, -3 -2, -2

2019/4/8 5

プレーヤの集合：N = {1, 2,…, n} 各プレーヤの戦略集合: Si, i =1, 2, …, n

Si = {si1, si2, …, sim}ただしmはプレーヤiの戦略の数でプレーヤによって異なる。

プレーヤiの戦略： si ∈ Si , i =1, …, n（ siは{si1, si2, …, sim}のうちのどれか、ということ）

2019/4/8 6

各プレーヤの戦略と利得の関係（利得関数）:

πi(s), s = (s1, …, sn) で定義される。戦略の組み合わせ（各プレーヤが一つずつ選んだ戦略の組）s = (s1, …, sn)を

戦略プロファイルと呼ぶ。

2019/4/8 7

プレーヤの集合：N = {囚人１，囚人２}各プレーヤの戦略集合: S囚人1 = {協力, 裏切}S囚人2 = {協力, 裏切}

各プレーヤの利得関数:（s =(協力,協力), (協力, 裏切), (裏切,協力), あるいは (裏切, 裏切)）π囚人1(協力,協力) = -1, π囚人1(協力,裏切) = -3, π囚人1(裏切,協力) = 0, π囚人1(裏切, 裏切) = -2 π囚人2(協力,協力) = -1, π囚人2(協力,裏切) = 0, π囚人2(裏切,協力) = -3, π囚人2(裏切, 裏切) = -2

2019/4/8 8

（直感的な定義）

最適応答：相手（他のプレーヤ）の戦略に対して，自分の利得を最大にする戦略をとること。

ナッシュ均衡

それぞれのプレーヤが相手の戦略に対して最適応答をとっているとき，この戦略の組をナッシュ均衡点という。

2019/4/8 9

均衡とはゲーム全体を第3者的に見て，各プレーヤの戦略の組合せ（戦略プロファイル）が，誰も他の戦略に変更するインセンティブがないような状況。

別の言い方をすると，ゲームの後に，どのプレーヤも（他のプレーヤの選んだ戦略を前提にすると）もっといい戦略は無かったと言える状況。

*純粋戦略以外も含んだ解釈については次回以降

2019/4/8 10

お互いに，相手が戦略を変えない限り，自分も戦略を変えるインセンティブが無いような戦略プロファイル s*= (si

*, s-i*) ．すなわち，以下の条

件を満たすs*.πi(si

*, s-i*) ≥ πi(si, s-i

*) ∀ si ∀iただし，s-i = (s1, …, si-1, si+1,… ,sn )*支配戦略均衡（後述）はナッシュ均衡の特殊ケース

2019/4/8 11

定義のイメージ：囚人のジレンマの例

π1(裏切り, 裏切り) ≥ π1(協力, 裏切り)π2(裏切り, 裏切り) ≥ π1(裏切り, 協力)他のプレーヤの戦略を均衡（候補）

の戦略に固定して、自分の戦略を変化させて最も利得が高い、ということが、全てのプレーヤで言えるとき、この戦略プロファイルをナッシュ均衡と言う。この例は他のプレーヤが一人、戦略も２つだけなので比較は容易。

2019/4/8 12

定義：二つの戦略si, si’があり，他のプレーヤがどんな戦略をとろうともプレーヤiにとってはsiのときの利得が常にsi’のときの利得より大きいとき，si’はsiに（厳密に）支配されると言う。

戦略siが，プレーヤiの他の戦略全てを支配するときsiをプレーヤiの支配戦略という。プレーヤ全員が支配戦略を取っているとき，支配戦略均衡と呼ぶ。

2019/4/8 13

支配される戦略がある場合、支配される戦略を順次削除していくことで唯一のナッシュ均衡求められることもある。

囚人のジレンマの例では、まず囚人Aの協力という戦略は裏切という戦略に支配されるので、削除する。残った戦略の組合せでは、囚人Bの協力という戦略が裏切りという戦略に支配されるので削除する。最後に残る戦略の組合せ（戦略プロファイル）は、（裏切，裏切）で、これはナッシュ均衡であり支配戦略均衡である。

2019/4/8 14

プレーヤ１の戦略「下」は「上」に支配される。

プレーヤ２の戦略「左」は「中」に支配される。

プレーヤ１の戦略「中」は「上」に支配される。

プレーヤ２の戦略「右」は「中」に支配される。

最後に残った戦略の組合せ（上，中）がナッシュ均衡。

2019/4/8 15

プレーヤ2 プレーヤ1 左中右

上 2, 3 1, 5 4, 2中 3, 1 0, 3 1, 4下 1, 4 0, 2 3, 3

定義：二つの戦略si, si’があり，他のプレーヤがどんな戦略をとろうともプレーヤiにとってはsiのときの利得が常にsi’のときの利得と同じか、より大きいとき，si’はsiにに弱支配されると言う。

戦略siが，プレーヤiの他の戦略全てを弱支配するときsiをプレーヤiの弱支配戦略という。

2019/4/8 16

プレーヤ2 プレーヤ1 左中右

上 1, 1 2, 1 2, 2中 2, 2 2, 2 4, 2下 2, 2 3, 2 3, 3

2019/4/8

i.支配される戦略，支配戦略があれば求めなさい。ii.弱支配される戦略，弱支配戦略があれば求めなさ

い。iii.支配される戦略の逐次削除で残る戦略があれば求

めなさい。iv.弱支配される戦略の逐次削除で残る戦略があれば

求めなさい。v.（純粋戦略）ナッシュ均衡を求めなさい。 17

練習問題については、次の回の講義中に解説し中間試験の前の週に再度まとめて解説する。

2019/4/8 18

a. 囚人のジレンマ

b. 協調ゲーム

c. 男女の争い

d. チキン・ゲーム（タカ-ハト・ゲーム）

e. ゼロサム・ゲーム

f. 電話ゲーム

2019/4/8 19

ドライバーB ドライバーA

左側通行右側通行

左側通行 1, 1 -1, -1右側通行 -1, -1 1, 1

2019/4/8

ナッシュ均衡は（左側通行，左側通行）と（右側通行，右側通行）。

どっちの均衡？協調が望ましい。均衡選択の問題（後述）

20

花子太郎

映画野球

映画 3, 2 1, 1野球 0, 0 2, 3

2019/4/8

”Battle of Sex”というゲーム。男女がデートの時に一緒に行く方（協調）が，それぞれの好みの場所に別々に行くよりうれしいが，一緒の場合は自分の好みの場所に行く方がうれしい。均衡選択の問題

21

ドライバーBドライバーA

避ける避けない

避ける 2, 2 1, 4避けない 4, 1 0, 0

2019/4/8

若者同士が車を向き合って走らせ，どちらが勇敢かを競うゲーム。先に避けた方が臆病（英語の俗語でチキン）と呼ばれる。（James Deanの『理由なき反抗』）均衡選択の問題

22

BA

鳩タイプ鷹タイプ

鳩タイプ 2, 2 1, 3鷹タイプ 3, 1 0, 0

2019/4/8

鷹同士がであうと激しく戦うが。鳩同士は譲り合う。鷹と鳩が出会うと鳩は逃げる。構造はチキンゲームと同じ。

23

習トランプ

掛ける待つ

掛ける 0, 0 2, 3待つ 3, 2 1, 1

2019/4/8

電話で話そうとするとき，相手に掛けてもらった方が電話代が浮くので望ましい。しかし，両方が掛けて通じなかったり，両方が待つよりは，自分が掛けて話ができた方がよい。構造はチキンゲームと同じ。

24

E. ゼロ・サムゲーム例：顧客獲得競争

（この例はコンスタント・サム（定和））

単位：%B店

A店価格維持値下げ

価格維持 50, 50 30, 70値下げ 70, 30 50, 50

2019/4/8 25

プレーヤ2 プレーヤ1

石紙はさみ

石 0, 0 -1, 1 1, -1紙 1, -1 0, 0 -1, 1

はさみ -1, 1 1, -1 0, 0

2019/4/8

プレーヤの利得を足すと常にゼロになる。二人の場合は両者の利害が必ず正反対になる。足して定数になる場合もゲームの性質は同じ。

26

21～26頁の（純粋戦略）ナッシュ均衡を求めなさい。

2019/4/8 27

複数の均衡がある場合• 別の情報を追加（例：フォーカ

ル・ポイント（目立つもの））

• 進化的プロセス（どれか一つの均衡に収斂していく）（後日）

など

（純粋戦略の）均衡がない場合• 混合戦略（次回）

2019/4/8 28

戦略が連続的な例：クールノー=ナッシュ均衡

企業i ∈ {A, B}，生産量xi，

逆需要関数 p(x) = - a(xA + xB) + b ，費用関数 C(xi) = cxi (c < b), とすると，問題は以下の最大化問題を解くこと。

max Π i = p(x)xi - C(xi)= {- a(xA + xB) + b}xi - cxi , i = A, B

最大値の必要条件:上の関数の傾きが0- 2axA - axB + b = c，- 2axB – axA + b = c

2019/4/8 29

2019/4/8

xA

xB

NE

Aの反応曲線

Bの反応曲線

この条件を満たすxiはxj (j ≠ i)の関数（反応関数）xA = - (xB/2) + (b -c)/2a, xB = - (xA/2) + (b - c)/2aクールノー=ナッシュ均衡生産量⇒ (xA*, xB*) = ((b -c)/3a, (b - c)/3a) xA

*

xB*

30

2019/4/8

xBxA

0 … (b - c)/3a … (b - c)/2a

0 0, 0 … 0, 2(b - c)2/9a

… 0,(b - c)2/4a

⁞ ⁞ ⁞ ⁞(b -

c)/3a2(b - c)2/9a,

0… (b - c)2/9a,

(b - c)2/9a… (b - c)2/18a,

(b - c)2/12a

⁞ ⁞ ⁞ ⁞(b-

c)/2a(b - c)2/4a,

0… (b- c)2/12a,

(b - c)2/18a… 0, 0

31

今回の例は，既に挙げた参考書以外に次の本も参考にした。

Harrington, Joseph H. (2015) Games, Strategies, and Decision Making 2nd ed., Worth Publishers.

2019/4/8 32

ゲーム理論 - econ.hokudai.ac.jpmachino/game2019stratgic.pdf · (裏切り, 協力)...

Documents