ec311-15 game theory...

10
ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร วิชาทฤษฎีเศรษฐศาสตรจุลภาค (EC311) Sec030003 ภาค 1/2556 . ลอยลม ประเสริฐศรี เคาโครงการบรรยาย หัวขอที15 ทฤษฎีเกมและพฤติกรรมเชิงกลยุทธ บทนำ หมวดหมูและประเภทของเกม การหาดุลยภาพของเกมแบบเลนพรอมกัน Prisoners’ Dilemma เกมแบบผลัดกันเลน วันพุธ ที4 กันยายน .. 2556 STUDENT Version Make-up class ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร .ลอยลม ประเสริฐศรี 2 15.1 บทนำ นิยาม เกม (Game) คือ สถานการณที่มีการแขงขันเพื่อเอาชนะกัน โดยที่ผูเลนแตละฝายตระหนักถึง ผลกระทบที่อาจเกิดขึ้นซึ่งกันและกัน (Mutually Interdependent) ตามกลยุทธที่แตละฝายเลือกใช ทั้งนีเพื่อใหไดผลประโยชนของตนสูงสุด

Upload: others

Post on 14-Feb-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร

วิชาทฤษฎีเศรษฐศาสตรจุลภาค (EC311) Sec030003 ภาค 1/2556 อ.ลอยลม ประเสริฐศรี

เคาโครงการบรรยาย

หัวขอที่ 15ทฤษฎีเกมและพฤติกรรมเชิงกลยุทธ

บทนำ

หมวดหมูและประเภทของเกม

การหาดุลยภาพของเกมแบบเลนพรอมกัน

Prisoners’ Dilemma

เกมแบบผลัดกันเลน

วันพุธ ที่ 4 กันยายน พ.ศ. 2556

STUDENT Version

Make-up class

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี2

15.1 บทนำ นิยาม

เกม (Game) คือ สถานการณที่มีการแขงขันเพื่อเอาชนะกัน โดยที่ผูเลนแตละฝายตระหนักถึงผลกระทบที่อาจเกิดขึ้นซึ่งกันและกัน (Mutually Interdependent) ตามกลยุทธที่แตละฝายเลือกใช ทั้งนี้ เพื่อใหไดผลประโยชนของตนสูงสุด

Page 2: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี3

องคประกอบของเกม

Strategy 2Strategy 1

Strategy 1

Strategy 2

(Payoff A , Payoff B) (Payoff A , Payoff B)

(Payoff A , Payoff B) (Payoff A , Payoff B) Play

er A

Player B

1

2

3

ผูเลน(Players): ผูที่เขารวมเลนหรือแขงขันในเกม

ผลรางวัล (Payoff): ผลประโยชนหรือผลลัพธ ที่แตละฝายอาจจะไดรับจากการเลนเกม

กลยุทธ (Strategies): กฎเกณฑ (Rules) หรือกติกาที่เกมอนุญาตใหเลน

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี4

ขอสมมติเกี่ยวกับเกม

มีขอมูลที่สมบูรณ (Perfect information) ผูเลนทุกคนรูกฎเกณฑ และผลรางวัล และรูเขารูเรา

มีเหตุมีผล (Rational) ผูเลนใชขอมูลที่มีอยูทั้งหมด ในการตัดสินใจเลือกกลยุทธที่ดีที่สุด

การศึกษาทฤษฎีเกม มีขอสมมติ ดังนี้

The limbic system: "The limbic system is located beneath the cerebral cortex. This system is the center for emotional thinking. The limbic system is where most of your emotions, like happiness, sadness and anger. Memory is also stored here."

The cerebral cortex: "The cerebral cortex is divided into lobes that each have a specific function. For example, there are specific areas involved in vision, hearing, touch, movement, and smell. Other areas are critical for thinking and reasoning."

Brain System:-

ตัวอยางที่ 1: เกมทดลอง

ผูเลน (Players): นักศึกษาทุกคนเปนผูเลนในเกม

กติกา (Rule of the Game): ใหเขียนตัวเลข 1-100 ลงในกระดาษ (พรอมชื่อ-นามสกุล) จากนั้นจะนำเอาขอมูลทุกคนมาหาคาเฉลี่ย ใครเขียนตัวเลขไดใกลเคียงกับคาเฉลี่ยที่สุด รับรางวัล

ผลลัพธ (Payoffs): ..................................................

Page 3: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี5

รูปแบบการนำเสนอเกม

รูปแบบปกติ (Normal or Payoff matrix form)

รูปแบบขยาย (Extensive form or game tree)

จุดที่ทำการตัดสินใจ (Node)

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี6

15.2 หมวดหมูและประเภทของเกม

เกมแบบเกื้อกูลกัน (Cooperative Game) ผูเลนสามารถเจรจาตกลงทำสัญญาที่ใชบังคับ (binding contracts) ที่ทำใหไดประโยชนรวมกัน เชน การทำ Cartel

เกมแบบขับเคี่ยวกัน (Noncooperative Game) ผูเลนไมสามารถเจรจาตกลงทำสัญญาที่ใชบังคับ (No binding contracts) เชน การประมูล

พิจารณาจากลักษณะของความรวมมือ1

เลนพรอมกัน (Simultaneous games)นั่นคือ ผูเลนทุกคนเลนเกมพรอมกัน ตัวอยาง: เปา-หยิง-ฉุบ Cournot competition

ผลัดกันเลน (Sequential games) ผูเลนคนแรกเลนกอนแลวผูเลนอื่นเลนตาม

ตัวอยาง: Poker, Stackelberg, Price leadership

พิจารณาจากจังหวะเวลาในการเลน2

Page 4: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี7

หมวดหมูและประเภทของเกม

แขงขันครั้งเดียว (One-shot games): เชน FA Cup

แขงซ้ำหลายครั้ง (Repeated games): ธุรกิจการคา

พิจารณาจากจำนวนครั้งที่เลน3

ผลรางวัลรวมคงที่ (Constant sum games) ผลรวมรางวัลของคูแขงทั้งหมดคงที:่ การพนัน

ผลรางวัลรวมไมคงที่ (Non-constant sum games) ผลรวมรางวัลของคูแขงทั้งหมดไมคงที่: oligopoly, การเจรจาเปดเสรีการคา

พิจารณาจากผลรางวัล4

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี8

15.3 การหาดุลยภาพของเกมแบบเลนพรอมกันDominant Strategies

Definition: Dominant Strategy Equilibrium เกิดขึ้นเมื่อผูเลนแตละฝายเลือกกลยุทธที่โดดเดนสำหรับตนเอง

ไมโฆษณาโฆษณา

โฆษณา

ไมโฆษณา

16 , 16 20 , 15

18 , 18 15 , 20

Hond

a

Toyota

ตัวอยางที่ 2: เกมการโฆษณาของ Honda VS Toyota การตัดสินใจใชกลยุทธการโฆษณาหรือไมใชการโฆษณา สงผลตอยอดขายรถยนต (หนวย:พันลานบาท) ดังแสดงในตาราง

“ฉันจะทำสิ่งที่ดีที่สุดสำหรับตัวฉันเอง ฉันไมสนใจหรอกวาเธอจะทำอะไร”

Equilibrium: Payoff:

Toyota:

Honda:

Page 5: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี9

Dominant Strategies

ไมลงทุนลงทุน

ลงทุน

ไมลงทุน

10 , 5 10 , 10

20 , 2 6 , 8

โออิชิ

อิชิตัน

ตัวอยางที่ 3: เกมการลงทุนของ Honda VS Toyota

การตัดสินใจลงทุนสรางโรงงานเพิ่มหรือไมลงทุน สงผลตอยอดขายชาเขียว (หนวย: รอยลานบาท) ดังแสดงในตาราง

อิชิตัน:

โออิชิ:

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี10

Nash Equilibrium

Definition: Nash Equilibrium เกิดขึ้นเมื่อผูเลนแตละฝายเลือกกลยุทธที่ดีที่สุด ภายใตกลยุทธที่คูแขงเลือกใชอยู “ฉันจะทำสิ่งที่ดีที่สุด ภายใตสิ่งที่เธอทำ”

“เธอทำในสิ่งที่ดีที่สุด ภายใตสิ่งที่ฉันทำ”

ไมถอนเงินถอนเงิน

ถอนเงิน

ไมถอนเงิน

25 , 25 50 , 0

110 , 1100 , 50ลูกคาธนาคารคนที่ 1 ลูกคาธนาคารคนที่ 2

ตัวอยางที ่4: เกม Bank Runs

การที่ลูกคาธนาคาร ตัดสินใจวาจะถอนเงินหรือไมถอนเงิน สงผลกระทบตอเงินฝากของตนเอง ดังแสดงในตาราง

Equilibrium:Payoff:

ลูกคาธนาคารคนที่ 2:

ลูกคาธนาคารคนที่ 1:

Page 6: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี11

Nash Equilibriumตัวอยางที ่5: Simple 2-firms Cournot Modelสมมติวา ในแบบจำลองการแขงขันเชิงปริมาณในธุรกิจหนังสือพิมพภาคภาษาอังกฤษในประเทศไทย ซึ่งมีบริษัทอยู 2 ราย ไดแก หนังสือพิมพ Bangkok Post และหนังสือพิมพ The Nation

กำหนดให

ตนทุนสวนเพิ่มในการพิมพคงที่ (เทากัน):

อุปสงคของตลาดที่คูแขงขันเผชิญ: P = 100 −Qi

โดยที่ คือ ราคาคาหนังสือพิมพตอฉบับP

คือ จำนวนยอดพิมพ (หนวย: ลานฉบับตอเดือน)Qi

โดย Qi = qB + qNแทนยอดพิมพ BANGKOK POSTqBแทนยอดพิมพ THE NATIONqN

MCB = MCN = 10

qB1 = 30

qB2 = 45

450 , 675

0 , 0675 , 450

900 , 900

qN1 = 30 qN

2 = 45

π B* = P* − ACB( )qB* = 40 −10( ) 30( ) = 900

π N* = P* − ACN( )qN* = 40 −10( ) 30( ) = 900

สมมติ (หาราคา): qB2 = 45, qN

1 = 30P = 100 −Qi = 100 − (45 + 30) = 25

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี12

Maximin Strategies

Definition: Maximin Strategies เปนวิธีการหาดุลยภาพที่ผูเลนเลือกกลยุทธที่ใหคา Payoffs สูงที่สุด ในบรรดา Payoffs ที่เลวรายที่สุด

ออกจากตลาดเขาสูตลาด

เขาสูตลาด

ออกจากตลาด

-200 , -200 300 , 0

0 , 00 , 300

MRT

BTS

ตัวอยางที่ 6: Entry Game in Natural Monopolyสมมติวา กระทรวงคมนาคม คิดที่จะสรางเสนทางรถไฟฟาสายเหลือง-แดง จากทาพระจันทร-รังสิต โดยแตละทางเลือกมีขอมูลดังตาราง

Equilibrium:

Payoff:

Page 7: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี13

15.4 Prisoners’ Dilemma

8 ป 8 ป

1 ป 1 ป

10 ป

10 ป 0 ป

0 ป

สารภาพผิด

สารภาพผิด

ปฏิเสธขอหา

ปฏิเสธขอหา

Prisoners’ Dilemma เปนเกมการตัดสินใจ ที่อธิบายวาเหตุใดผูเลนจึงไมสามารถรวมมือ

กันได เปรียบเสมือนกลบางอยางที่ทำใหตองตัดสินใจแบบหนีเสือปะจรเข

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี14

Prisoners’ Dilemma

ปฏิเสธขอหาสารภาพผิด

สารภาพผิด

ปฏิเสธขอหา

-8 , -8 0 , -10

-1 , -1-10 , 0

ตัวอยางที ่7: Prisoners’ Dilemmaสมมติวา นกสองตัวถูกหมูขโมยไข จึงตองหาวิธีแกแคน โดยเขาไปทำลายบานหมูดวยการระดมยิงหนังสะติ๊กระเปดใสบานหมู สุดทายถูกเจาหนาที่จับไดจึงทำการสอบสวน เพื่อลงโทษตามกฎหมาย

Note: Pareto Efficient Solution คือ ดุลยภาพที่อยางนอยหนึ่งคนมีโอกาสดีขึ้น โดยที่อีกฝายไมแยลง

Dominant Strategies Nash Equilibrium Maximin Strategies

ทั้งคูสารภาพผิด

ติดคุกรายละ 8 ป

ทั้งคูสารภาพผิด

ติดคุกรายละ 8 ป

ทั้งคูสารภาพผิด

ติดคุกรายละ 8 ป

Page 8: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี15

Prisoners’ Dilemma

ตามโควตามากกวาโควตา

มากกวาโควตา

ตามโควตา

5 , 5 50 , -25

25 , 25-25 , 50

ประเทศที่ 1

ประเทศที่ 2

ตัวอยางที ่8: Prisoners’ Dilemma กับการอธิบาย Cartel

สมมติวา ประเทศผูสงออกขาวรายใหญของโลกสองประเทศ ประชุมเพื่อจะกำหนดโควตาการสงออกรวมกัน และจัดตั้งเปนกลุมผูสงออกขาวของโลก หรือ “OREC” ตัวอยางนี้จะอธิบายวาเหตุใดจึงมักมีการโกงในการทำ Cartel

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี16

15.5 เกมแบบผลัดกันเลน

Definition: เกมแบบผลัดกันเลน (Sequential Game) เปนเกมที่มีผูเลนฝายใดฝายหนึ่งไดโอกาสเริ่มตนเลนเกมกอนโดยเสนอกลยุทธของตนเอง จากนั้นอีกฝายจะเลือกกลยุทธในภายหลังวาจะตัดสินใจเชนไรภายใตขอเสนอที่ไดรับ

Player 1

ชวงเวลาที่ 1

Player 2

ชวงเวลาที่ 2

Player 1

ชวงเวลาที่ 3timing

...

ผูที่เริ่มตนเลนเกมกอนไดเปรียบ เชน บริษัทที่ออกผลิตภัณฑกอนมักไดเปรียบ หรือ เกมแบบ Stackelberg ที่บริษัทซึ่งผลิตกอนไดเปรียบ และผลิตเปนจำนวนมาก

เกมแบบผลัดกันเลน มีขอสังเกต ดังนี้

การหาดุลยภาพของเกม ใชวิธี Backward Induction

Page 9: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี17

การหาดุลยภาพของเกมแบบผลัดกันเลน

ตัวอยางที ่9: การปองกันการเขาสูตลาด (Entry Deterrence)ในการแขงขันเชิงธุรกิจ ผูที่เปนเจาเดิม (incumbent firm) อาจปองกันการเขาตลาด โดยทำใหเจาใหมเชื่อวา การเขามานั้นไมมีกำไร

ไมเขา

เขา

เจาใหม

ราคาสูง

ราคาต่ำ

2 , 5

-2 , 4

ราคาสูง

ราคาต่ำ

0 , 10

0 , 5

เจาเกา

Payoff to: เจาใหม , เจาเกา

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี18

การหาดุลยภาพของเกมแบบผลัดกันเลน

ตัวอยางที ่10: การปองกันการเขาสูตลาด (Entry Deterrence)

ในกรณีนี้ ตางจากตัวอยางที่ 9 คือ ไมใชขูดวยวาจาเพียงอยางเดียว แตยังลงทุนเพิ่มดวย ทำให Payoffs เปลี่ยนแปลงไป

0 , 7

0 , 4

2 , 2

-2 , 3

หลังการลงทุนกอนการลงทุน

ไมเขา

เขา

เจาใหม

ราคาสูง

ราคาต่ำ

2 , 5

-2 , 4

ราคาสูง

ราคาต่ำ

0 , 10

0 , 5

เจาเกา

Payoff to: เจาใหม , เจาเกา

Page 10: EC311-15 Game Theory STecon.tu.ac.th/class/archan/Loylom/EC311-1-2556...การศึกษาทฤษฎีเกม มีข อสมมติ ดังนี้ The limbic

ลิขสิทธิ์ของ คณะเศรษฐศาสตร มหาวิทยาลัยธรรมศาสตร อ.ลอยลม ประเสริฐศรี19

Game Theory: Movie Recommendations