game theory
TRANSCRIPT
Game Theory จดท าโดย
นางสาว พรรณประภา ปองกน ชน ม.4/1 เลขท13
เสนอคณคร ณฐพล บวอไร
ทฤษฎเกม (องกฤษ: Game theory) เปนสาขาของคณตศาสตรประยกตทศกษาเกยวกบสถานการณขดแยงทมผเลนหลายฝาย ทแตละฝายพยายามแสวงหาผลตอบแทนใหไดมากทสด แมวาทฤษฎเกมมรากฐานการศกษาเกยวของกบการละเลนหลายชนด เชนหมากรก ทก-แทก-โท และโปเกอร อนเปนทมาของชอ[ตองการอางอง] แตแบบจ าลองนยงเกยวของกบสถานการณขดแยงในหลายสาขาเชนสงคมวทยา เศรษฐศาสตร รฐศาสตร การทหาร รวมถงชววทยาผเรมศกษาทฤษฎเกมในระยะแรกคอ จอหน ฟอน นอยมนน และออสการ มอรเกนสเตรน โดยไดตพมพต ารา Theory of Games and Economic Behavior ใน พ.ศ. 2487 ตอมา จอหน แนชไดพฒนาการศกษาในดานนและไดรบรางวลโนเบลสาขาเศรษฐศาสตรจากการน าทฤษฎเกมไปประยกตใชในดานเศรษฐศาสตร
Game Theory
ประวต
ใน พ.ศ. 2256 เจมส เวลดเกรฟ ไดท าการวเคราะหหากลยทธทดทสดในการเลนเกมไพชนดหนงทมผเลนสองคน เรยกวา le Her โดยใชหลกการคลายกบทฤษฎเกม และ แอนโทน ออกสตน คอรนอต ไดตพมพผลงานเรอง Researches into the Mathematical Principles of the Theory of Wealth ใน พ.ศ. 2381 ซงเปนกรณทวไปของการศกษาของเจมส แตทฤษฎเกมไดมการศกษาเปนสาขาเฉพาะครงแรกโดย จอหน ฟอน นอยมนน โดยไดเรมตพมพผลงานดานนมาตงแต พ.ศ. 2473 และไดตพมพต ารา Theory of Games and Economic Behavior ทเขยนรวมกบ ออสการ มอรเกนสเตรน ใน พ.ศ. 2487 ทมเนอหาเกยวกบวธการหา "กลยทธเดน" ซงเปนทางเลอกทดทสดส าหรบเกมผลรวมศนยทมผเลนสองคน ต ารานนบวาเปนการวางรากฐานของทฤษฎเกมทงทางดานคณตศาสตรและเศรษฐศาสตรอยางมนคง จงถอไดวา จอหน ฟอน นอยมนน เปนผใหก าเนดทฤษฎเกม
ใน พ.ศ. 2493 จอหน แนชไดพฒนาการศกษาในดานทฤษฎเกมในดานตาง ๆ จ านวนมาก เชน การศกษา ถงต าแหนงทดทสดของเกมททกคนพอใจในต าแหนงน เรยกวา "จดสมดลของแนช" นกเศรษฐศาสตรไดน า แนวคดนไปชวยในการวเคราะหในหลาย ๆ เรอง เชน การประมล การแขงขนของผผลตสนคา ท าใหจอหน แนช ไดรบรางวลโนเบลสาขาเศรษฐศาสตร รวมกบจอหน ฮารซานย และ ไรนฮารด เซลเทน ในป พ.ศ. 2537 ในฐานะทเปนผน าหลกทฤษฎเกมไปประยกตใชในดานเศรษฐศาสตร และไดมการสรางภาพยนตร เกยวกบชวประวตของเขาเรอง
A Beautiful Mind โดย ซลเวย นาซาร ใน พ.ศ. 2544หลงจากนน ไดมการศกษาทฤษฎเกมในวงกวางมากขน และไดมการน าทฤษฎเกมไปประยกตใชใน
ดานสงคมวทยา รฐศาสตร และชววทยาปจจบน ทฤษฎเกมไดมการพฒนาขนเรอย ๆ อยางตอเนอง ในป พ.ศ. 2548 โทมส เชลลง และ โร
เบรต ออมนน ไดรบรางวลโนเบลสาขาเศรษฐศาสตรจากผลงานดานทฤษฎเกม โดยการสรางแบบจ าลองไดนามกทเกยวของกบทฤษฎเกมประยกต และไดพฒนาแนวคดตาง ๆ ใหครอบคลมมากขน
(ภาพพนหลงเปนภาพของจอหน แนช หนงในผพฒนาการศกษาทฤษฎเกม)
รปแบบของเกม
แผนภาพตนไมแสดงทางเลอกในการตดสนใจ
เกมรปแบบครอบคลม เปนเกมทผเลนแตละคนตดสนใจเลอกทางเลอกตาง ๆ ตามล าดบ โดยผเลนจะทราบถงการตดสนใจของผเลนอกฝายในตากอนหนา สามารถเขยนเกมประเภทนไดในรปแผนภาพตนไม โดยตงตนทจดเรมแรก และจบทจดสนสดของเกม ซงสามารถมไดหลายจด มการใชจดยอดแทนสถานะทมทางเลอกในการตดสนใจของผเลน และใชเสนแทนทางเลอกของผเลนในตาถดไปส าหรบเกมในภาพ มผเลนสองคน ผเลน 1 ตดสนใจเลอกกอนระหวาง ทางเลอก F และทางเลอก U จากนนผเลน 2 ซงทราบถงการตดสนใจของผเลน 1 ตดสนใจเลอกระหวาง ทางเลอก A และทางเลอก R โดยมผลตอบแทนทไดแสดงไวดานลาง เชน ถาผเลน 1 เลอก U และผเลน 2 เลอก A ผลตอบแทนทไดคอ ผเลน 1 ได 8 และผเลน 2 ได 2เกมหลายชนด เชน หมากรก ทก-แทก-โท กถอวาเปนเกมรปแบบครอบคลม จงสามารถหาวธทดทสดในการเลนเกมเหลานได โดยการใชแผนภาพตนไม
เกมรปแบบปกตเกมรปแบบปกต เปนเกมทผเลนไมทราบถงการตดสนใจของผเลนคนอน นยมเขยนแสดงเกมในรปแบบตาราง
ซงมกจะใชในกรณทมผเลน 2 คน โดยผเลนคนหนงจะแทนการตดสนใจดวยแถวตาง ๆ และผเลนอกคนหนงแทนการตดสนใจดวยคอลมนตาง ๆ
ส าหรบเกมในภาพ ผเลน 1 มทางเลอก 2 ทาง คอ บน และ ลาง สวนผเลน 2 มทางเลอก 2 ทาง คอ ซาย และ ขวา จดตดของแถวและคอลมนจะแสดงถงผลตอบแทนทผเลนทงสองไดรบ เชน ถาผเลน 1 เลอก บน และผเลน 2 เลอก ซาย ผลตอบแทนทไดคอ ผเลน 1 ได 4 และผเลน 2 ได 3
ผเลน 2 เลอก ซาย_____________ผเลน 2 เลอก ขวา
ผเลน1เลอกบน
ผเลน1เลอกลาง
4.3 -1.-1
0.0 3.4
ตารางแสดงเกมทมผเลน 2 คน และม 2 ทางเลอก
ชนดของเกมเกมรวมมอ และเกมไมรวมมอ
เกมรวมมอเปนเกมทผเลนแตละฝายสามารถตกลงกนไดเพอใหไดรบผลตอบแทนรวมทดทสด โดยจะถอวาผเลนทรวมมอกนจะเปนผเลนฝายเดยวกนและจะปฏบตตามขอตกลงทไดตกลงกนไว ซงแตกตางจากเกมไมรวมมอทผเลนแตละฝายไมสามารถตกลงผลตอบแทนกนไดเลย จะตองตดสนใจโดยใชผลตอบแทนของตนเปนหลกเทานน
เกมสมมาตร และเกมไมสมมาตรเกมสมมาตรเปนเกมทผลตอบแทนทไดรบขนกบการตดสนใจของตนเองและคนอนเทานน โดยไมขนกบวาใครจะเปนผเลนเกมน จงมกลยทธในการเลนทเหมอนกนส าหรบผเลนทกคน เกมทมผเลน 2 คนและทางเลอก 2 ทางทมชอเสยงจ านวนมากจดอยในประเภทน เชน เกมความล าบากใจของนกโทษ เกมไกตน และเกมความรวมใจเกมไมสมมาตรจะมกลยทธในการเลนทแตกตางกนออกไปส าหรบผเลนแตละคน เชนเกมในภาพถอวาเปนเกมไมสมมาตร ถงแมกลยทธในการเลนทดทสดจะเปนกลยทธเดยวกนกตาม
1,2 0,0
0,0 1,2
E
E
F
F
เกมไมสมมาตร
-1, 1 3,-3
0,0 -2,2
A
A
B
B
เกมผลรวมศนย
เกมผลรวมศนย และเกมผลรวมไมเปนศนยเกมผลรวมศนย เกมผลรวมศนยเปนกรณเฉพาะของเกมผลรวมคงท ซงเปนเกมในลกษณะทผลรวมของผลตอบแทนทไดของผเลนจะเปนคาคงท เชน การแบงปนผลก าไร หรอเกมทมผชนะและผแพ เชน หมากรก หมากลอม กถอวาเปนเกมผลรวมศนยเชนกน ในการเขยนเกมในรปแบบตารางทมผเลนสองคนจงสามารถละไวโดยเขยนเพยงผลตอบแทนของผเลนเพยงคนเดยวได และกลยทธในการตดสนใจใหไดผลตอบแทนมากทสดจะเปนวธเดยวกบทท าใหฝายตรงขามไดผลตอบแทนนอยทสดเกมสวนมากทนกทฤษฎเกมศกษามกจะเปนเกมผลรวมไมเปนศนย เนองจากในความเปนจรง ผลลพธทไดไมจ าเปนตองคงทเสมอไป ขนอยกบแนวทางการตดสนใจของแตละฝาย ดงนน การไดรบผลตอบแทนมากทสดจงไมจ าเปนตองท าใหฝายตรงขามไดผลตอบแทนนอยทสด
ตวอยางเกมทมชอเสยงเกมความล าบากใจของนกโทษเกมความล าบากใจของนกโทษ (Prisoner's dilemma) เปนเกมทมผเลน 2 คนและทางเลอก 2 ทาง แนวคดของเกมนไดสรางขนโดย เมอรรล ฟลด และ เมลวน เดรชเชอร ใน พ.ศ. 2493 โดยมลกษณะเปนเกมทผเลนทงสองฝายพยายามเลอกทางเลอกทไดผลตอบแทนมากทสด แตกลบท าใหผลตอบแทนรวมทไดต าลง มสถานการณดงนคนรายสองคนคอ A และ B ถกต ารวจจบและถกแยกไปสอบปากค าทละคน ต ารวจไมสามารถด าเนนคดกบคนรายทงสองไดทนทเพราะไมมพยาน คนรายแตละคนมทางเลอกสองทางคอ รบสารภาพ และไมรบสารภาพ ถาคนรายคนหนงรบสารภาพแตอกคนไมรบ ต ารวจจะกนคนทรบสารภาพไวเปนพยานและปลอยตวไป และจะสงฟองคนทไมรบสารภาพซงมโทษจ าคก 20 ป ถาทงสองคนรบสารภาพ จะไดรบการลดโทษเหลอจ าคกคนละ 10 ป แตถาทงสองคนไมรบสารภาพ ต ารวจจะสามารถสงฟองไดเพยงขอหาเลกนอยเทานนซงมโทษจ าคก 1 ป เกมนสามารถเขยนแสดงในรปแบบตารางไดดงน
รบสารภาพ ไมรบสารภาพ
รบสารภาพ -10, -10 0, -20
ไมรบสารภาพ -20, 0 -1, -1
จะเหนวากลยทธเดนของผเลนทงสองฝายคอการรบสารภาพ เพราะไมวาผเลนอกฝายจะตดสนใจอยางไร กจะไดผลตอบแทนทดกวาเสมอ แตเมอทงสองฝายเลอกทางเลอกน กลบไมใหผลตอบแทนทดทสด ถงแมผเลนจะทราบวาผลตอบแทนทดทสดจะเกดขนเมอทงสองฝายไมรบสารภาพ แตทงคอาจไมกลาท าเพราะไมไวใจอกฝายวาจะรบสารภาพหรอไม จงท าใหทงสองฝายตองไดรบผลตอบแทนทต าลง และจด (-10, -10) กเปนจดสมดลของแนชในเกมน เพราะผเลนทงสองฝายไมสามารถเปลยนไปเลอกทางเลอกอนทไดผลตอบแทนดกวาน
• เกมไกตน• เกมไกตน (Chicken) เปนเกมทมผเลน 2 คนและทางเลอก 2 ทาง มสถานการณดงน• ผเลนสองคนขบรถดวยความเรวสงเขาหากน ฝายทหกหลบรถกอนจะเปนผแพ แตถาผเลนทงสองฝายไมหก
หลบรถ รถจะชนกนและจะท าใหผเลนทงสองฝายเกดความเสยหายอยางมาก เกมนสามารถเขยนแสดงในรปแบบตารางไดดงน
หลบ ไมหลบ
หลบ 0, 0 -1, +1
ไมหลบ +1, -1 -10, -10
จะเหนวาเกมในรปแบบนไมมกลยทธเดน และมจดสมดลของแนชสองจดคอ (-1, +1) และ (+1, -1) แตวธทางจตวทยาส าหรบผเลนเกมนคอ พยายามสงสญญาณใหผเลนฝายตรงขามเหนวา ตนจะไมหกหลบอยางแนนอน ซงจะท าใหผเลนฝายตรงขามตองยอมหกหลบไปเอง มฉะนนจะเสยผลตอบแทนอยางมาก
ลากวาง ลากระตาย
ลากวาง +10, +10 0, +3
ลากระตาย +3, 0 +3, +3
จะเหนวาเกมในรปแบบนไมมกลยทธเดน และมจดสมดลของแนชสองจดคอ (+10, +10) และ (+3, +3) ซงการทผเลนทงสองจะไดผลตอบแทนสงสดนน จะตองอาศยความรวมมอรวมใจกน คอเลอกลากวางทงค ซงผเลนจะตองมความไววางใจผเลนอกฝายดวย
เกมแหงความรวมมอเกมแหงความรวมมอ (Stag hunt) เปนเกมทมผเลน 2 คนและทางเลอก 2 ทาง ซงเปนทางเลอกระหวางทางทปลอดภยกบการใหความรวมมอกบอกฝาย มสถานการณดงน
ผเลนสองคนตองการเลอกลาสตวชนดหนงระหวางกวางกบกระตาย ซงกวางมราคาดกวากระตายมาก แตกลายากกวาเชนกน จ าเปนตองใชสองคนรวมมอกนจงจะลาได ในขณะทกระตายมราคาต าแตลาไดงาย สามารถลาไดโดยใชเพยงคนเดยว
เกมนสามารถเขยนแสดงในรปแบบตารางไดดงน
การประยกตใชรฐศาสตรมการน าทฤษฎเกมมาประยกตใชในดานรฐศาสตร เชน การหาเสยงเลอกตง ในป พ.ศ. 2500 แอนโทน ดาวนส ไดตพมพผลงานเรอง An Economic Theory of Democracy ซงมเนอหาเกยวกบการเลอกต าแหนงในการหาเสยงเลอกตงใหไดผลดทสดเศรษฐศาสตรในทางเศรษฐศาสตร ไดมการน าทฤษฎเกมมาชวยในการตดสนใจในหลาย ๆ ดานมาเปนเวลานานแลว เชน การตอรองผลประโยชน การประมล การแขงขนของผผลต การรวมกลมทางเศรษฐกจ โดยมแนวคดส าคญทใชคอเรองจดสมดลของแนช อยางไรกตาม ในเกมการแขงขนทางธรกจ อาจมการปรบเปลยนกลยทธไดตลอดเวลาเพอใหไดรบผลตอบแทนทสงขน และผลลพธทไดกจะเขาสจดสมดลของแนช ซงเปนจดททกฝายไมสามรถเปลยนกลยทธเพอใหไดผลตอบแทนสงกวานอกแลวชววทยามการใชทฤษฎเกมเพออธบายถงปรากฏการณตาง ๆ ทางชววทยา เชน ในป พ.ศ. 2473 โรนลด ฟชเชอร ไดใชทฤษฎเกมในการอธบายถงอตราสวนของสตวเพศผตอเพศเมยทเปน 1:1 เนองจากเปนอตราสวนทสามารถสบพนธไดจ านวนมากทสด นอกจากน นกชววทยายงใชทฤษฎเกมเพอชวยในการศกษาพฤตกรรมตาง ๆ ของสตว เชน การใชเกมไกตนในการอธบายถงการตอสของสตววทยาการคอมพวเตอรมการพฒนาในดานวทยาการคอมพวเตอรและการเขยนโปรแกรมเพอหาอลกอรทมทดทสดในการเลนเกมในสถานการณหนงเปนระยะเวลานานสงคมวทยาไดมการน าทฤษฎเกมมาประยกตใชในดานสงคมวทยา เชน วลลารด แวน ออรมาน ควนท และ เดวด ลอส ไดพฒนาการศกษาดานประเพณนยม และมการวเคราะหเกยวกบเกมตาง ๆ ทตองเลอกระหวางศลธรรมกบผลประโยชนของตนเอง เชน เกมความล าบากใจของนกโทษ
เอกสารอางองhttp://th.wikipedia.org/wiki/%E0%B8%97%E0%B8%A4%E0%B8%A9%E0%B8%8E%E0%B8%B5%E0%B9%80%E0%B8%81%E0%B8%A1#.E0.B8.8A.E0.B8.99.E0.B8.B4.E0.B8.94.E0.B8.82.E0.B8.AD.E0.B8.87.E0.B9.80.E0.B8.81.E0.B8.A1