wstęp do teorii gier

28
Wstęp do teorii gier

Upload: britanni-howell

Post on 02-Jan-2016

62 views

Category:

Documents


2 download

DESCRIPTION

Wstęp do teorii gier. Indywidualna vs interaktywna teoria decyzji. Gry o sumie zerowej. W grach o sumie zerowej wypłaty sumują się do zera w każdym stanie Diagram przesunięć. Gry o sumie zerowej. Minimax = maximin = wartość gry Gra może mieć wiele punktów siodłowych. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Wstęp do teorii gier

Wstęp do teorii gier

Page 2: Wstęp do teorii gier

Indywidualna vs interaktywna teoria decyzji

Page 3: Wstęp do teorii gier

Gry o sumie zerowej• W grach o sumie zerowej wypłaty sumują się do zera w każdym stanie

• Diagram przesunięć

Page 4: Wstęp do teorii gier

Gry o sumie zerowej• Minimax = maximin = wartość gry

• Gra może mieć wiele punktów siodłowych

Page 5: Wstęp do teorii gier

Gry o sumie zerowej

• Albo nie mieć ich wcale

• Jaka jest wartość gry w takim przypadku? – Jeśli gra nie ma punktu siodłowego, trzeba

wprowadzić strategie mieszane

Page 6: Wstęp do teorii gier

Gry o sumie zerowej

• Jeśli jest więcej niż dwie strategie dla jednego gracza i gra nie ma punktu siodłowego, nie wiadomo, które strategie będą częścią optymalnej strategii mieszanej

• Niech mieszana strategia Kolumny będzie (x,1-x)• Wypłata Wiersza dla każdej jego strategii

Page 7: Wstęp do teorii gier

• Column will try to choose x to minimize the upper envelope

Gry o sumie zerowej

Page 8: Wstęp do teorii gier

• Przekształcamy w problem programowania liniowego

Gry o sumie zerowej

Page 9: Wstęp do teorii gier

Studium przypadku: Teoria gier vs indywidualna teoria decyzji w warunkach ryzyka oraz niepewności

• W latach pięćdziesiątych, Davenport studiował zachowanie rybaków w małej wiosce na Jamajce.

Page 10: Wstęp do teorii gier

• Twenty-six fishing crews in sailing, dugout canoes fish this area [fishing grounds extend outward from shore about 22 miles] by setting fish pots, which are drawn and reset, weather and sea permitting, on three regular fishing days each week … The fishing grounds are divided into inside and outside banks. The inside banks lie from 5-15 miles offshore, while the outside banks all lie beyond … Because of special underwater contours and the location of one prominent headland, very strong currents set across the outside banks at frequent intervals … These currents are not related in any apparent way to weather and sea conditions of the local region. The inside banks are almost fully protected from the currents. [Davenport 1960]

Page 11: Wstęp do teorii gier

Jamajka

Page 12: Wstęp do teorii gier

Strategie

• 26 drewnianych kanoe. Kapitanowie tych kanoe mają do dyspozycji 3 strategie połowu:– IN – ustawić wszystkie kosze w zatokach – OUT – ustawić wszystkie kosze na wodach

odsłoniętych– IN-OUT – część koszy w zatokach część na

zewnątrz

Page 13: Wstęp do teorii gier

Zalety i wady połowu na otwartym morzuWADY

• Dopłynięcie do łowiska zabiera więcej czasu, więc można postawić mniej koszy

• Jak prąd jest aktywny, powoduje duże zagrożenie dla koszy ustawionych na otwartym morzu– Znosi znaczniki– Uszkadza kosze podczas

przesuwania– Zmiany temperatury wody mogą

zabijać ryby wewnątrz koszy

ZALETY

• Ryby na łowiskach zewnętrznych są dużo lepszej jakości– Jeśli jest ich dosyć, mogą wyprzeć ryby z

łowisk wewnętrznych zupełnie z rynku

• Rybołóstwo na łowiskach zewnętrznych wymaga dużo lepszych kanoe– Zazwyczaj ci, którzy łowią na łowiskach

wewnętrznych kupują używane kanoe od tych, którzy łowią na łowiskach zewnętrznych

– Posiadanie lepszych kanoe daje dużo prestiżu, ponieważ ich kapitanowie dominują w corocznych wyścigach kanoe

Page 14: Wstęp do teorii gier

Dane• Davenport zebrał dane dotyczące średnich

dziennych zysków w zależności od strategii połowu oraz obecności/nieobecności prądu

Rybacy\Prąd Płynie Nie płynie

IN 17,3 11,5

OUT -4,4 20,6

IN-OUT 5,2 17,0

Page 15: Wstęp do teorii gier

Strategia OUT

Page 16: Wstęp do teorii gier

1 Gra o sumie zerowej??• Nie ma punktu siodłowego• Strategia mieszana:

– Załóżmy, że „złośliwy” prąd „stosuje” strategię „Płynę” z prawdopodobieństwem p1, „Nie płynę” z prawdopodobieństwem p2

– Strategia rybaków: IN z prawd. q1, OUT z prawd. q2, IN-OUT z prawd. q3

– Dla każdego p rybacy wybierają strategię (q) z maksymalną wypłatą

– A „złośliwy” prąd wybiera p tak, aby rybacy zarobili jak najmniej

Page 17: Wstęp do teorii gier

Rozwiązanie graficzne problemu prądu

Optymalna strategia mieszana prądu

Solution: p=0.31

5

7

9

11

13

15

17

19

21

IN

OUT

IN-OUT

Page 18: Wstęp do teorii gier

• Podobnie w przypadku odwrotnym:– Dla każdej strategii rybaków q, prąd „wybiera”

taką, dla której rybacy zarobią najmniej:

– Rybacy natomiast będą się starali tak wybrać q, aby zmaksymalizować swoją wypłatę

Page 19: Wstęp do teorii gier

Maximin i minimax w Excel Solverobjective function

Fishers' mixed strategy

q1 q2 q3Maximize 13,31 0,67 0,00 0,33

Expected payoff of the current whenFLOW 13,31 >= 13,31NO FLOW 13,31 >= 13,31probabilities 1,00 = 1,00

objective function

Mixed strategy of the current

p1 p2minimize 13,31 0,31 0,69

Expected payoff from strategy:IN 13,31 <= 13,31OUT 12,79 <= 13,31IN_OUT 13,31 <= 13,31probabilities 1,00 = 1,00

Optymalna strategia rybaków

Optymalna strategia prądu

Wartość gry

Page 20: Wstęp do teorii gier

Prognoza i obserwacja

Gra o sumie zerowej• Nikt nie ryzykuje

zastawiania koszy na zewnętrznych łowiskach

• Optymalna strategia rybaków: 67% IN, 33% IN-OUT [Oczekiwana wypłata: 13.31]

• Optymalna strategia prądu: 31% PŁYNIE, 69% NIE PŁYNIE

Obserwacja• Nikt nie ryzykuje

zastawiania koszy na zewnętrznych łowiskach

• Strategia rybaków: 69% IN, 31% IN-OUT [Oczekiwana wypłata: 13.38]

• Prąd: 25% PŁYNIE, 75% NIE PŁYNIE

Konkluzja Davenporta: rybacy są dobrze przystosowaniOdkrycie Davenporta przez parę lat nie zostało zakwestionowane aż do momentu …

Page 21: Wstęp do teorii gier

Prąd nie jest złośliwy• Kozelka 1969 oraz Read, Read 1970 zauważyli, że

– Prąd nie dostosowuje swojej „strategii” do działań rybaków– Dlatego rybacy powinni zastosować zasadę oczekiwanych zysków

• Oczekiwane zyski rybaków– IN: 0.25 x 17.3 + 0.75 x 11.5 = 12.95– OUT: 0.25 x (-4.4) + 0.75 x 20.6 = 14.35– IN-OUT: 0.25 x 5.2 + 0.75 x 17.0 = 14.05

• Czyli wszyscy rybacy powinni łowić na zewnętrznych łowiskach• Może jednak nie są zbyt dobrze przystosowani

Rybacy\Prąd Płynie (25%) Nie płynie (75%)

IN 17,3 11,5

OUT -4,4 20,6

IN-OUT 5,2 17,0

Page 22: Wstęp do teorii gier

Prąd może być jednak złośliwy• Prąd nie rozumuje, ale łowienie na otwartym morzu jest bardzo

ryzykowne.• Nawet jeśli prąd płynie ŚREDNIO 25% czasu, to jednak może płynąć

częściej w danym roku.• Załóżmy, że w jednym roku prąd płynie 35% czasu. Oczekiwana wypłata:

– IN: 0.35 x 17.3 + 0.65 x 11.5 = 13.53– OUT: 0.35 x (-4.4) + 0.65 x 11.5 = 11.85– IN-OUT: 0.35 x 5.2 + 0.65 x 17.0 = 12.87.

• Poprzez potraktowanie prądu jak złośliwego gracza rybacy GWARANTUJĄ sobie wypłatę przynajmniej 13.31, niezależnie od tego, jak często płynie prąd

• Rybacy płacą $1.05 składki ubezpieczeniowejRzeczywisty (25%) Złośliwy (31%) 35%Gra o sumie

0 13.3125 13.3125 13.3125

Rzcezywista 13.291 13.31164 13.3254OUT 14.35 12.85 11.85

Page 23: Wstęp do teorii gier

Teoria decyzji w warunkach niepewności

Rybacy\Prąd Płynie Nie płynie

IN 0 9,1

OUT 21,7 0

IN-OUT 12,1 3,6

0,67 IN+0,33 IN-OUT 3,9875 7,2875

Rybacy\Prąd Płynie Nie płynie MAXIMIN MAXIMAX MINIMAX REGRET

IN 17,3 11,5 11,5 17,3 9,1

OUT -4,4 20,6 -4,4 20,6 21,7IN-OUT 5,2 17 5,2 17 12,10,67 IN+0,33 IN-OUT 13,3125 13,3125 13,3125 13,3125 7,2875

Page 24: Wstęp do teorii gier

Teoria decyzji w warunkach niepewności

Rybacy\Prąd Płynie Nie płynie

IN 0 9,1

OUT 21,7 0

IN-OUT 12,1 3,6

0,67 IN+0,33 IN-OUT 3,9875 7,2875

Rybacy\Prąd Płynie Nie płynie MAXIMIN MAXIMAX MINIMAX REGRET

IN 17,3 11,5 11,5 17,3 9,1

OUT -4,4 20,6 -4,4 20,6 21,7IN-OUT 5,2 17 5,2 17 12,10,67 IN+0,33 IN-OUT 13,3125 13,3125 13,3125 13,3125 7,2875

Page 25: Wstęp do teorii gier

Teoria decyzji w warunkach niepewności

Rybacy\Prąd Płynie Nie płynie

IN 0 9,1

OUT 21,7 0

IN-OUT 12,1 3,6

0,67 IN+0,33 IN-OUT 3,9875 7,2875

Rybacy\Prąd Płynie Nie płynie MAXIMIN MAXIMAX MINIMAX REGRET

IN 17,3 11,5 11,5 17,3 9,1

OUT -4,4 20,6 -4,4 20,6 21,7IN-OUT 5,2 17 5,2 17 12,10,67 IN+0,33 IN-OUT 13,3125 13,3125 13,3125 13,3125 7,2875

Page 26: Wstęp do teorii gier

Teoria decyzji w warunkach niepewności

Rybacy\Prąd Płynie Nie płynie

IN 0 9,1

OUT 21,7 0

IN-OUT 12,1 3,6

0,67 IN+0,33 IN-OUT 3,9875 7,2875

Rybacy\Prąd Płynie Nie płynie MAXIMIN MAXIMAX MINIMAX REGRET

IN 17,3 11,5 11,5 17,3 9,1

OUT -4,4 20,6 -4,4 20,6 21,7IN-OUT 5,2 17 5,2 17 12,10,67 IN+0,33 IN-OUT 13,3125 13,3125 13,3125 13,3125 7,2875

Page 27: Wstęp do teorii gier

Teoria decyzji w warunkach niepewności

Rybacy\Prąd Płynie Nie płynie MAXIMIN MAXIMAX Indeks Hurwicza

IN 17,3 11,5 11,5 17,3 11,5α+17,3(1-α)

OUT -4,4 20,6 -4,4 20,6 -4,4α+20,6(1-α)IN-OUT 5,2 17 5,2 17 5,2α+17(1-α)0,67 IN+0,33 IN-OUT 13,3125 13,3125 13,3125 13,3125 13,3125

Page 28: Wstęp do teorii gier

5

7

9

11

13

15

17

19

21

IN

OUT

IN-OUT