ทฤษฎีเกม (game theory)

16

Upload: umaraporn

Post on 23-Jul-2015

219 views

Category:

Education


3 download

TRANSCRIPT

Page 1: ทฤษฎีเกม (Game theory)
Page 2: ทฤษฎีเกม (Game theory)

ทฤษฎเกม (องกฤษ: Game theory) เปนสาขาของคณตศาสตรประยกตท

ศกษาเกยวกบสถานการณขดแยงทมผเลนหลายฝาย ทแตละฝายพยายามแสวงหา

ผลตอบแทนใหไดมากทสด แมวาทฤษฎเกมมรากฐานการศกษาเกยวของกบการละเลนหลาย

ชนด เชนหมากรก ทก-แทก-โท และ โปเกอร อนเปนทมาของชอ แตแบบจ าลองนยง

เกยวของกบสถานการณขดแยงในหลายสาขา เชน สงคมวทยา เศรษฐศาสตร รฐศาสตร

การทหาร รวมถงชววทยา

ผเรมศกษาทฤษฎเกมในระยะแรกคอ จอหน ฟอน นอยมนส และ ออสการ

มอรเกนสเตรน โดยไดตพมพต ารา Theory of Games and Economic Behavior ใน

พ.ศ. 2487 ตอมา จอหน แนช ไดพฒนาการศกษาในดานนและไดรบรางวลโนเบลสาขา

เศรษฐศาสตรจากการน าทฤษฎเกมไปประยกตใชในดานเศรษฐศาสตร

Page 3: ทฤษฎีเกม (Game theory)

ประวต

ใน พ.ศ. 2256 เจมส เวลดเกรฟ ไดท าการวเคราะหหา

กลยทธทดทสดในการเลนเกมไพชนดหนงทมผเลนสองคน เรยกวา

le Her โดยใชหลกการคลายกบทฤษฎเกม และ แอนโทน ออกส

ตน คอรนอต ไดตพมพผลงานเรอง Researches into the Mathematical Principles of the Theory of Wealth ใน

พ.ศ. 2381ซงเปนกรณทวไปของการศกษาของเจมส แตทฤษฎ

เกมไดมการศกษาเปนสาขาเฉพาะครงแรกโดย จอหน ฟอน นอย

มนส โดยไดเรมตพมพผลงานดานนมาตงแต พ.ศ. 2473 และได

ตพมพต ารา Theory of Games and Economic Behavior ท

เขยนรวมกบ ออสการ มอรเกนสเตรน ใน พ.ศ. 2487 ทม

จอหน แนช หนงใน

ผพฒนาการศกษาทฤษฎเกม

เนอหาเกยวกบวธการหา "กลยทธเดน" ซงเปนทางเลอกทดทสดส าหรบเกมผลรวมศนยทมผ

เลนสองคน ต ารานนบวาเปนการวางรากฐานของทฤษฎเกมทงทางดานคณตศาสตรและ เศรษฐศาสตรอยางมนคง จงถอไดวา จอหน ฟอน นอยมนน เปนผใหก าเนดทฤษฎเกม

Page 4: ทฤษฎีเกม (Game theory)

ใน พ.ศ. 2493 จอหน แนชได พฒนาการศกษาในดานทฤษฎเกมในดานตาง

ๆ จ านวนมาก เชน การศกษาถงต าแหนงทดทสดของเกมททกคนพอใจในต าแหนงน

เรยกวา "จดสมดลของแนช" นกเศรษฐศาสตรไดน าแนวคดนไปชวยในการวเคราะหใน

หลาย ๆ เรอง เชน การประมล การแขงขนของผผลตสนคา ท าใหจอหน แนช ไดรบ

รางวลโนเบลสาขาเศรษฐศาสตร รวมกบ ฮารซานย และ ไรนฮารด เซนเทล ในป พ.ศ.

2537 ในฐานะทเปนผน าหลกทฤษฎเกมไปประยกตใชในดานเศรษฐศาสตร และไดมการ

สรางภาพยนตร เกยวกบชวประวตของเขาเรอง A Beautiful Mind โดย ซลเวย นา

ซาร ใน พ.ศ. 2544

หลงจากนน ไดมการศกษาทฤษฎเกมในวงกวางมากขน และไดมการน าทฤษฎ

เกมไปประยกตใชในดานสงคมวทยา รฐศาสตร และชววทยา

ปจจบน ทฤษฎเกมไดมการพฒนาขนเรอย ๆ อยางตอเนอง ในป พ.ศ. 2548

โทมส เชลลง และ โรเบรต ออมนน ไดรบรางวลโนเบลสาขาเศรษฐศาสตรจากผลงานดาน

ทฤษฎเกม โดยการสรางแบบจ าลองไดนามกทเกยวของกบทฤษฎเกมประยกต และได

พฒนาแนวคดตาง ๆ ใหครอบคลมมากขน

Page 5: ทฤษฎีเกม (Game theory)

รปแบบของเกม

เกมททฤษฎเกมศกษาประกอบดวยผเลนจ านวนหนง และทางเลอกส าหรบผ

เลนแตละคน ซงแตละทางเลอกมผลตอบแทนทแตกตางกน

เกมรปแบบครอบคลม เกมรปแบบครอบคลม เปนเกมทผเลนแตละคนตดสนใจเลอก

ทางเลอกตาง ๆ ตามล าดบ โดยผเลนจะทราบถงการตดสนใจของผ

เลนอกฝายในตากอนหนา สามารถเขยนเกมประเภทนไดในรป

แผนภาพตนไม โดยตงตนทจดเรมแรก และจบทจดสนสดของเกม

ซงสามารถมไดหลายจด มการใชจดยอดแทนสถานะทมทางเลอกใน

การตดสนใจของผเลน และใชเสนแทนทางเลอกของผเลนในตา

ถดไปส าหรบเกมในภาพ มผเลนสองคน ผเลน 1 ตดสนใจเลอกกอนระหวาง ทางเลอก

F และทางเลอก U จากนนผเลน 2 ซงทราบถงการตดสนใจของผเลน 1 ตดสนใจเลอก

ระหวาง ทางเลอก A และทางเลอก R โดยมผลตอบแทนทไดแสดงไวดานลาง เชน ถาผเลน 1 เลอก U และผเลน 2 เลอก A ผลตอบแทนทไดคอ ผเลน 1 ได 8 และผเลน 2

ได 2 เกมหลายชนด เชน หมากรก ทก-แทก-โท กถอวาเปนเกมรปแบบครอบคลม จงสามารถหาวธทดทสดในการเลนเกมเหลานได โดยการใชแผนภาพตนไม

Page 6: ทฤษฎีเกม (Game theory)

ผเลน 2

เลอก ซายผเลน 2

เลอก ขวา

ผเลน 1

เลอก บน4, 3 –1, –1

ผเลน 1

เลอก ลาง0, 0 3, 4

ตารางแสดงเกมทมผเลน 2 คน และม 2 ทางเลอก

เกมรปแบบปกต

เกมรปแบบปกต เปนเกมทผเลนไมทราบ

ถงการตดสนใจของผเลนคนอน นยมเขยนแสดงเกม

ในรปแบบตาราง ซงมกจะใชในกรณทมผเลน 2

คน โดยผเลนคนหนงจะแทนการตดสนใจดวยแถว

ตาง ๆ และผเลนอกคนหนงแทนการตดสนใจดวย

คอลมนตาง ๆ

ส าหรบเกมในภาพ ผเลน 1 มทางเลอก 2

ทาง คอ บน และ ลาง สวนผเลน 2 มทางเลอก 2

ทาง คอ ซาย และ ขวา จดตดของแถวและคอลมน

จะแสดงถงผลตอบแทนทผเลนทงสองไดรบ เชน ถา

ผเลน 1 เลอก บน และผเลน 2 เลอก ซาย ผลตอบแทนทไดคอ ผเลน 1 ได 4 และผเลน 2 ได

3

Page 7: ทฤษฎีเกม (Game theory)

ชนดของเกม

เกมรวมมอ และเกมไมรวมมอ

เกมรวมมอเปนเกมทผเลนแตละฝายสามารถตกลงกนไดเพอใหไดรบผลตอบ

แทนรวมทดทสด โดยจะถอวาผเลนทรวมมอกนจะเปนผเลนฝายเดยวกนและจะปฏบตตาม

ขอตกลงทไดตกลงกนไว ซงแตกตางจากเกมไมรวมมอทผเลนแตละฝายไมสามารถตกลง

ผลตอบแทนกน ไดเลย จะตองตดสนใจโดยใชผลตอบแทนของตนเปนหลกเทานน

E F

E 1, 2 0, 0

F 0, 0 1, 2

เกมสมมาตรเปนเกมทผลตอบแทนทไดรบขนกบการ

ตดสนใจของตนเองและคน อนเทานน โดยไมขนกบวาใครจะเปนผ

เลนเกมน จงมกลยทธในการเลนทเหมอนกนส าหรบผเลนทกคน

เกมทมผเลน 2 คนและทางเลอก 2 ทางทมชอเสยงจ านวนมาก

จดอยในประเภทน เชน เกมความล าบากใจของนกโทษ เกมไกตน

และเกมความรวมใจ

เกมไมสมมาตรจะมกลยทธในการเลนทแตกตางกนออกไป

ส าหรบผเลนแตละคน เชนเกมในภาพถอวาเปนเกมไมสมมาตร ถงแม

กลยทธในการเลนทดทสดจะเปนกลยทธเดยวกนกตาม

เกมสมมาตร และเกมไมสมมาตร

เกมไมสมมาตร

Page 8: ทฤษฎีเกม (Game theory)

เกมผลรวมศนย และเกมผลรวมไมเปนศนย

เกมผลรวมศนยเปนกรณเฉพาะของเกมผลรวมคงท ซง

เปนเกมในลกษณะทผลรวมของผลตอบแทนทไดของผเลนจะเปน

คาคงท เชน การแบงปนผลก าไร หรอเกมทมผชนะและผแพ เชน

หมากรก หมากลอม กถอวาเปนเกมผลรวมศนยเชนกน ในการเขยน

เกมในรปแบบตารางทมผเลนสองคนจงสามารถละไวโดยเขยนเพยง

ผล ตอบแทนของผเลนเพยงคนเดยวได และกลยทธในการตดสนใจ

ใหไดผลตอบแทนมากทสดจะเปนวธเดยวกบทท าให ฝายตรงขามได

ผลตอบแทนนอยทสด

เกมสวนมากทนกทฤษฎเกมศกษามกจะเปนเกมผลรวมไม

เปนศนย เนองจากในความเปนจรง ผลลพธทไดไมจ าเปนตองคงท

เสมอไป ขนอยกบแนวทางการตดสนใจของแตละฝาย ดงนน การ

ไดรบผลตอบแทนมากทสดจงไมจ าเปนตองท าใหฝายตรงขามได

ผลตอบแทน นอยทสด

A B

A –1, 1 3, –3

B 0, 0 –2, 2

เกมผลรวมศนย

Page 9: ทฤษฎีเกม (Game theory)

ตวอยางเกมทมชอเสยง

เกมความล าบากใจของนกโทษ

เกมความล าบากใจของนกโทษ (Prisoner's dilemma) เปนเกมทมผเลน 2

คนและทางเลอก 2 ทาง แนวคดของเกมนไดสรางขนโดย เมอรรล ฟลด และ เมลวน

เดรชเชอร ใน พ.ศ. 2493 โดยมลกษณะเปนเกมทผเลนทงสองฝายพยายามเลอก

ทางเลอกทไดผลตอบแทน มากทสด แตกลบท าใหผลตอบแทนรวมทไดต าลง ม

สถานการณดงน

คนรายสองคนคอ A และ B ถกต ารวจจบและถกแยกไปสอบปากค าทละคน

ต ารวจไมสามารถด าเนนคดกบคนรายทงสองไดทนทเพราะไมมพยาน คนรายแตละคนม

ทางเลอกสองทางคอ รบสารภาพ และไมรบสารภาพ ถาคนรายคนหนงรบสารภาพแตอก

คนไมรบ ต ารวจจะกนคนทรบสารภาพไวเปนพยานและปลอยตวไป และจะสงฟองคนท

ไมรบสารภาพซงมโทษจ าคก 20 ป ถาทงสองคนรบสารภาพ จะไดรบการลดโทษเหลอ

จ าคกคนละ 10 ป แตถาทงสองคนไมรบสารภาพ ต ารวจจะสามารถสงฟองไดเพยงขอหา

เลกนอยเทานนซงมโทษจ าคก 1 ป

Page 10: ทฤษฎีเกม (Game theory)

เกมนสามารถเขยนแสดงในรปแบบตารางไดดงน

รบสารภาพ ไมรบสารภาพ

รบสารภาพ -10, -10 0, -20

ไมรบสารภาพ -20, 0 -1, -1

จะเหนวากลยทธเดนของผเลนทงสองฝายคอการรบสารภาพ เพราะไมวาผเลน

อกฝายจะตดสนใจอยางไร กจะไดผลตอบแทนทดกวาเสมอ แตเมอทงสองฝายเลอก

ทางเลอกน กลบไมใหผลตอบแทนทดทสด ถงแมผเลนจะทราบวาผลตอบแทนทดทสดจะ

เกดขนเมอทงสองฝายไม รบสารภาพ แตทงคอาจไมกลาท าเพราะไมไวใจอกฝายวาจะรบ

สารภาพหรอไม จงท าใหทงสองฝายตองไดรบผลตอบแทนทต าลง และจด (-10, -10) ก

เปนจดสมดลของแนชในเกมน เพราะผเลนทงสองฝายไมสามารถเปลยนไปเลอกทางเลอก

อนทไดผลตอบแทน ดกวาน

Page 11: ทฤษฎีเกม (Game theory)

เกมไกตน

เกมไกตน (Chicken) เปนเกมทมผเลน 2 คนและทางเลอก 2 ทาง ม

สถานการณดงน

ผเลนสองคนขบรถดวยความเรวสงเขาหากน ฝายทหกหลบรถกอนจะเปนผแพ

แตถาผเลนทงสองฝายไมหกหลบรถ รถจะชนกนและจะท าใหผเลนทงสองฝายเกดความ

เสยหายอยางมาก

เกมนสามารถเขยนแสดงในรปแบบตารางไดดงน

หลบ ไมหลบ

หลบ 0, 0 -1, +1

ไมหลบ +1, -1 -10, -10

จะเหนวาเกมในรปแบบนไมมกลยทธเดน และมจดสมดลของแนชสองจดคอ (-

1, +1) และ (+1, -1) แตวธทางจตวทยาส าหรบผเลนเกมนคอ พยายามสงสญญาณให

ผเลนฝายตรงขามเหนวา ตนจะไมหกหลบอยางแนนอน ซงจะท าใหผเลนฝายตรงขามตอง

ยอมหกหลบไปเอง มฉะนนจะเสยผลตอบแทนอยางมาก

Page 12: ทฤษฎีเกม (Game theory)

เกมแหงความรวมมอ

เกมแหงความรวมมอ (Stag hunt) เปนเกมทมผเลน 2 คนและทางเลอก

2 ทาง ซงเปนทางเลอกระหวางทางทปลอดภยกบการใหความรวมมอกบอกฝาย ม

สถานการณดงน

ผเลนสองคนตองการเลอกลาสตวชนดหนงระหวางกวางกบกระตาย ซงกวางมราคา

ดกวากระตายมาก แตกลายากกวาเชนกน จ าเปนตองใชสองคนรวมมอกนจงจะลาได ในขณะ

ทกระตายมราคาต าแตลาไดงาย สามารถลาไดโดยใชเพยงคนเดยว

เกมนสามารถเขยนแสดงในรปแบบตารางไดดงน

ลากวาง ลากระตาย

ลากวาง +10, +10 0, +3

ลากระตาย +3, 0 +3, +3

จะเหนวาเกมในรปแบบนไมมกลยทธเดน และมจดสมดลของแนชสองจดคอ

(+10, +10) และ (+3, +3) ซงการทผเลนทงสองจะไดผลตอบแทนสงสดนน

จะตองอาศยความรวมมอรวมใจกน คอเลอกลากวางทงค ซงผเลนจะตองมความไววางใจผ

เลนอกฝายดวย

Page 13: ทฤษฎีเกม (Game theory)

การประยกตใช

รฐศาสตร

มการน าทฤษฎเกมมาประยกตใชในดานรฐศาสตร เชน การหาเสยงเลอกตง ในป

พ.ศ. 2500 แอนโทน ดาวนส ไดตพมพผลงานเรอง An Economic Theory of Democracy ซงมเนอหาเกยวกบการเลอกต าแหนงในการหาเสยงเลอกตงใหไดผลดทสด

เศรษฐศาสตร

ในทางเศรษศาสตร ไดมการน าทฤษฎเกมมาชวยในการตดสนใจในหลาย ๆ ดาน

มาเปนเวลานานแลว เชน การตอรองผลประโยชน การประมล การแขงขนของผผลต การ

รวมกลมทางเศรษฐกจ โดยมแนวคดส าคญทใชคอเรองจดสมดลของแนช อยางไรกตาม ใน

เกมการแขงขนทางธรกจ อาจมการปรบเปลยนกลยทธไดตลอดเวลาเพอใหไดรบ

ผลตอบแทนทสงขน และผลลพธทไดกจะเขาสจดสมดลของแนช ซงเปนจดททกฝายไมสาม

รถเปลยนกลยทธเพอใหไดผลตอบแทนสงกวาน อกแลว

Page 14: ทฤษฎีเกม (Game theory)

ชววทยา

มการใชทฤษฎเกมเพออธบายถงปรากฏการณตาง ๆ ทางชววทยา เชน ในป

พ.ศ. 2473 โรนลด ฟชเชอร ไดใชทฤษฎเกมในการอธบายถงอตราสวนของสตวเพศผตอ

เพศเมยทเปน 1:1 เนองจากเปนอตราสวนทสามารถสบพนธไดจ านวนมากทสด

นอกจากน นกชววทยายงใชทฤษฎเกมเพอชวยในการศกษาพฤตกรรมตาง ๆ ของสตว เชน

การใชเกมไกตนในการอธบายถงการตอสของสตว

วทยาการคอมพวเตอร

มการพฒนาในดานวทยาการคอมพวเตอร และการเขยนโปรแกรม เพอหา

อลกอรทมทดทสดในการเลนเกมในสถานการณหนงเปนระยะเวลานาน

Page 15: ทฤษฎีเกม (Game theory)

สงคมวทยา

ไดมการน าทฤษฎเกมมาประยกตใชในดานสงคมวทยา เชน

วลลารด แวน ออรมาน ควนท และ เดวส ลอส ไดพฒนาการศกษาดาน

ประเพณนยม และมการวเคราะหเกยวกบเกมตาง ๆ ทตองเลอกระหวาง

ศลธรรมกบผลประโยชนของตนเอง เชน เกมความล าบากใจของนกโทษ

***จบ***

Page 16: ทฤษฎีเกม (Game theory)