gry o sumie niezerowej - strona główna · •aby rozwiązanie gry w strategiach mieszanych miało...
Post on 28-Feb-2019
215 Views
Preview:
TRANSCRIPT
2011-12-06 Zdzisław Dzedzej 1
Gry o sumie niezerowej
Równowagi Nasha
2011-12-06 Zdzisław Dzedzej 2
Pytanie
Czy profile równowagi Nasha są dobrym rozwiązaniem gry o dowolnej sumie ?
Zaleta: zawsze istnieją (w grach dwumacierzowych, a także dla dużej klasy innych gier niekooperacyjnych)
W grach antagonistycznych ich znajomość jest wskazówką dla graczy: wystarczy wybierać strategie prowadzące do równowagi.
Na razie zakładamy zakaz komunikowania się
2011-12-06 Zdzisław Dzedzej 3
Przykład 1
A
B
A
(2, 3)
(3, 2)
B
(1, 0)
(0,1)
2011-12-06 Zdzisław Dzedzej 4
• W grze Wiersza A dominuje B
• Wiedząc o tym, Kolumna zagra A
• Profil (A,A) jest równowagą czystą Nasha
• Można używać diagramu przesunięć oraz
kryterium dominacji (indywidualna
racjonalność graczy)
2011-12-06 Zdzisław Dzedzej 5
Przykład 2
A
B
A
(2, 4)
(1, 0)
B
(3, 1)
(0,4)
2011-12-06 Zdzisław Dzedzej 6
Nie ma czystej równowagi Nasha
• Szukamy strategii wyrównującej Wiersza w grze
Kolumny
• W: pA+(1-p)B ?
• K A: 4p+1(1-p) = 0p+4(1-p) : B
• Stąd W : 3/7A+4/7B
• Podobnie K : 1/2A+1/2B po analizie gry Wiersza
• To daje równowagę Nasha z wynikiem (3/2, 16/7)
• Zauważmy , że (A,A) dałoby wynik lepszy dla obu graczy
2011-12-06 Zdzisław Dzedzej 7
Przykład 3
A
B
A
(1, 1)
(2, 5)
B
(5, 2)
(-1,-1)
2011-12-06 Zdzisław Dzedzej 8
Są dwie czyste równowagi Nasha
Profile (B, A) oraz (A, B) sa równowagami, ale dają różne
wypłaty:
BA jest lepsza dla Wiersza, AB dla Kolumny
Jeśli obaj wybiorą strategie prowadzące do preferowanych
przez siebie równowag, to wyjdzie BB – najgorszy możliwy
wynik na dodatek nie będący równowagą.
Wniosek: równowagi nie są wymienne ani równoważne, a
ich zbiór nie jest prostokątny .
2011-12-06 Zdzisław Dzedzej 9
Przykład 4
A
B
A
(3, 3)
(-1, 5)
B
(5,-1)
(0, 0)
2011-12-06 Zdzisław Dzedzej 10
Komentarz
• W przykładzie 4 jest jedyna równowaga Nasha:
• Czysta BB – powstaje ze ścisłych dominacji dla
obu graczy
• Lepszy wynik byłby, gdyby obaj gracze wybrali A
• Wniosek: nie można przenieść pojęcia
rozwiązania gry z gier macierzowych na
dwumacierzowe bez zmian.
2011-12-06 Zdzisław Dzedzej 11
Profil Pareto -optymalny
• DEF: Profil jest
nieoptymalny w
sensie Pareto, jeśli
istnieje inny profil
dający wszystkim co
najmniej te same
wypłaty, a
przynajmniej jednemu
wyższą.
2011-12-06 Zdzisław Dzedzej 12
Kryterium Pareto
• Racjonalność grupowa:
• Tylko profil optymalny w sensie Pareto
może być akceptowalny jako kandydat na
rozwiązanie gry.
• Uwaga: kryterium dominacji interpretuje
się jako racjonalność indywidualną.
2011-12-06 Zdzisław Dzedzej 13
Przykład 1
A
B
A
(2, 3)
(3, 2)
B
(1, 0)
(0,1)
2011-12-06 Zdzisław Dzedzej 14
W
Kol
BA 1
AA
AB
1
3
3
Przykład 1
Równowaga Nasha
2011-12-06 Zdzisław Dzedzej 15
Przykład 2
A
B
A
(2, 4)
(1, 0)
B
(3, 1)
(0,4)
2011-12-06 Zdzisław Dzedzej 16
W
Kol
AB 1
AA
1
3
3
Przykład 2
Równowaga Nasha
2011-12-06 Zdzisław Dzedzej 17
Przykład 3
A
B
A
(1, 1)
(2, 5)
B
(5, 2)
(-1,-1)
2011-12-06 Zdzisław Dzedzej 18
W
Kol
2
AB
BA
2
5
5
Przykład 3
AA
2011-12-06 Zdzisław Dzedzej 19
Przykład 4
A
B
A
(3, 3)
(-1, 5)
B
(5,-1)
(0, 0)
2011-12-06 Zdzisław Dzedzej 20
W
Kol
AB 1
AA
1
3
3
Przykład 4
Równowaga Nasha
2011-12-06 Zdzisław Dzedzej 21
Gry rozwiązywalne
• DEF: Gra dwuosobowa jest rozwiązywalna
w ścisłym sensie , jeśli
• Posiada przynajmniej jedną równowagę
Nasha optymalną w sensie Pareto,
• Jeśli takich równowag jest więcej, to są
one ekwiwalentne i wymienne.
2011-12-06 Zdzisław Dzedzej 22
• Drugi warunek oznacza, że dają równe wypłaty, a
także: gdy obaj gracze zagrają dowolne swoje
strategie będące składowymi punktu równowagi,
to otrzymamy punkt równowagi.
• Z naszych przykładów tylko 1 jest rozwiązywalna
w ścisłym sensie
• 2 ma równowagę nieoptymalną, w 3 równowagi
optymalne nie są wymienne ani ekwiwalentne, w
4 równowaga też nie jest optymalna
(ekstremalnie!)
2011-12-06 Zdzisław Dzedzej 23
Strategie bezpieczeństwa
• DEF: Strategia optymalna Wiersza
(Kolumny) w grze Wiersza (Kolumny)
nazywa się strategią bezpieczeństwa
Wiersza (Kolumny).
• Odpowiednia wartość wypłaty gracza
nazywa się jego poziomem
bezpieczeństwa
2011-12-06 Zdzisław Dzedzej 24
Jeszcze raz Przykład 2
• W grze Wiersza jest
punkt siodłowy AB
• Zatem strategia A
gwarantuje poziom co
najmniej 1
• To jest poziom
bezpieczeństwa Wiersza
A
B
A
2
1
B
3
0
2011-12-06 Zdzisław Dzedzej 25
Jeszcze raz Przykład 2
• W grze Kolumny jej
strategia bezpieczeństwa
to 4/7A +3/7B, która daje
poziom co najmniej 16/7
• To jest poziom
bezpieczeństwa Kolumny
A
B
A
4
0
B
1
4
2011-12-06 Zdzisław Dzedzej 26
Analiza
• Jeśli obaj gracze zagrają swoje strategie
bezpieczeństwa , otrzymamy profil 4/7AA+3/7AB
• To daje wypłaty (11/7, 16/7)
• Nie jest to wynik paretooptymalny ani nie jest to
równowaga
• Równowaga : [3/7A+4/7B, 1/2A+1/2B] daje wypłaty
(3/2, 16/7)
• Jeśli Kolumna przewiduje, że Wiersz gra strategię
bezpieczeństwa, to powinna zagrać najlepszą
odpowiedź ( strategia kontrbezpieczna) A i wygrać 4.
• Podobnie Wiersz ma strategię kontrbezpieczną B
2011-12-06 Zdzisław Dzedzej 27
Strategia
Wiersza
Strategia
Kolumny
Wypłata
Wiersza
Wypłata
Kolumny
Bezp A Bezp.
4/7A+3/7B 1,57 2,29
Bezp A
Kontrb. A 2,00 4,00
Kontrb. B Bezp.
4/7A+3/7B 1,71 2,29
Kontrb. B Kontrb. A
3,00 1,00
2011-12-06 Zdzisław Dzedzej 28
Uwagi
• Strategie bezpieczeństwa są nazywane
także maksyminowymi ( od sposobu
obliczania poziomów bezpieczeństwa).
• Średnia wypłata gracza w punkcie
równowagi jest co najmniej taka , jak
poziom bezpieczeństwa.
2011-12-06 Zdzisław Dzedzej 29
Przykład 5
• Równowagi :
• BB nieoptymalna
• AC Pareto-optymalna
• To nie są ich strategie
bezpieczeństwa
• Ćwiczenie: wykonaj
odp. Diagramy i rys.
A
B
C
A
(0, -1)
(0, 2)
(2, 3)
B
(0, 0)
(2, 1)
(1,-1)
C
(2, 2)
(1, 4)
(1, -1)
2011-12-06 Zdzisław Dzedzej 30
Przykład 6
• !
2011-12-06 Zdzisław Dzedzej 31
Teoria użyteczności
• Kiedy próbujemy zastosować teorię gier
do rzeczywistych przykładów, konieczna
jest analiza procesu przypisywania
wartości liczbowych wypłat.
• Podstawy teorii użyteczności stworzyli
von Neumann i Morgenstern.
• Jakie właściwości wypłat są konieczne dla
sensowności wniosków z modelu.
2011-12-06 Zdzisław Dzedzej 32
Przypadek 1- jest punkt siodłowy
• To znaczy ,że Wiersz przedkłada go nad inne w jego
kolumnie, zaś każdy w jego wierszu uważa za lepszy.
• Zatem wymagamy jedynie, aby liczby reprezentowały
uporządkowanie wyników od najbardziej do najmniej
preferowanego przez Wiersza (odwrotnie dla kolumny).
• Życzymy sobie by porządek wynikający z preferencji
Wiersza był liniowy.
• Aby grę można było uznać za grę o sumie zerowej,
porządek preferencji Kolumny powinien być odwrotny do
preferencji Wiersza.
2011-12-06 Zdzisław Dzedzej 33
Przykład
• Punkt siodłowy BB
• Jeżeli przekształcimy wartości
wypłat przez funkcję rosnącą ,
punkt siodłowy zostanie w tym
samym miejscu
• Zachowają się też wszystkie
dominacje
A B
A 6 1
B 5 4
C 2 3
2011-12-06 Zdzisław Dzedzej 34
Skala porządkowa
• DEF: Skalę , na której większa wartość
reprezentuje bardziej preferowany wynik
(znaczenie ma tylko uporządkowanie
wartości) nazywamy skalą porządkową.
• Użyteczności wyznaczone zgodnie z taką
zasadą nazywamy użytecznościami
porządkowymi.
2011-12-06 Zdzisław Dzedzej 35
Przypadek 2 – nie ma punktu siodłowego
• Tutaj trzeba posługiwać się
strategiami mieszanymi
• Skala, na której można
interpretować proporcje
między różnicami różnych
wartości nazywamy skalą
interwałową.
• Liczby oddające preferencje
mierzone na skali interwałowej
nazywamy użytecznościami
interwałowymi.
A B
A a b
B c d
Gdy a>b i d>c, to optymalną
strategią Wiersza jest strategia
Mieszana, ale wtedy proporcja
Różnic d-c i a-b musi być
interpretowalna
2011-12-06 Zdzisław Dzedzej 36
Loterie
• Aby rozwiązanie gry w strategiach mieszanych
miało sens, liczby wpisane w macierz gry
powinny być użytecznościami interwałowymi.
• Niech możliwymi wynikami będą u, x, w, v
kolejności wg preferencji Wiersza.
• Chcemy tak przypisać liczby wynikom, by
proporcje między różnicami użyteczności
wynikały z preferencji Wiersza:
• Zadajemy Wierszowi pytania o stosunek do
loterii :
2011-12-06 Zdzisław Dzedzej 37
u>v niech u=100 , v=0
• Pytamy Wiersza : czy woli x na pewno, czy
loterię gdzie u z prawdopodobieństwem ½ i v
też.
• Jeśli woli x to umieszczamy je w przedziale
(50,100).
• Czy woli x czy loterię 1/2v,3/4u
• Jeśli woli loterię, to x jest w (50,75), itd.
• Aż do odpowiedzi, że są równie korzystne.
• Zgodność oznacza, że położenie wyników
ilustruje preferencje Wiersza w stosunku do
loterii ,np. x=60 ~ 4/10v,6/10u
2011-12-06 Zdzisław Dzedzej 38
Kolumna
• Aby gra miała sumę zerową, preferencje
Kolumny powinny być dokładnie odwrotne do
Wiersza.
• Jednak zmieniając punkty końcowe i zachowując
proporcje (tzn . Ustawiając wartości wg wartości
funkcji liniowej rosnącej) dostajemy równoważną
skalę interwałową.
• Wniosek: Niektóre gry o sumie niezerowej są
równoważne grom o sumie zerowej
2011-12-06 Zdzisław Dzedzej 39
Przykład 7
• Górna gra nie ma
sumy zerowej ani
stałej, ale stosując do
użyteczności wiersza
funkcję
• G(x)=½(x-17)
• otrzymamy dolną grę.
A B
A (27,-5) (17, 0)
B (19,-1) (23,-3)
A B
A (5,-5) (0,0)
B (1,-1) (3,-3)
2011-12-06 Zdzisław Dzedzej 40
-5
5
u
ż
y
t
e
c
z
n
o
ś
c
i
Użyteczności Kolumny
Użyteczności Wiersza 5 15 2
0
20 A
B
AB
BA
BB
AA
2011-12-06 Zdzisław Dzedzej 41
Źródła
• J. von Neumann, O. Morgenstern, Theory of Games and
Economic Behavior 1944
• I.N. Herstein, J. Milnor, An axiomatic approach to
measurable utility, Econometrica 21(1953), 291-297
• Ph. Straffin, Teoria Gier, W-wa 2004
2011-12-06 Zdzisław Dzedzej 42
Typowe błędy
• 1. Odwrócenie przyczynowości :
• Jeśli ktoś przedkłada jakąś propozycję nad inną, to oznacza, że ta propozycja ma wyższą użyteczność.
• 2. Racjonalność :
• Jeśli mając do wyboru jedną z dwóch propozycji osoba wybiera tę o niższej użyteczności, to znaczy, że postępuje nieracjonalnie.
2011-12-06 Zdzisław Dzedzej 43
• 3. Dodawanie użyteczności :
• Możemy określić, jaka propozycja jest społecznie najbardziej pożądana, sumując użyteczności różnych osób (Bentham i utylitaryści XIX w.).
• 4. Międzyosobowe porównywanie użyteczności :
• Jeśli dany wynik ma dla jednego z graczy wyższą użyteczność niż dla drugiego, to jest on przez pierwszego gracza bardziej pożądany niż przez drugiego.
2011-12-06 Zdzisław Dzedzej 44
John Milnor
2011-12-06 Zdzisław Dzedzej 45
John von Neumann
2011-12-06 Zdzisław Dzedzej 46
Oskar
Morgenstern
2011-12-06 Zdzisław Dzedzej 47
John F.
Nash
80 lat
2011-12-06 Zdzisław Dzedzej 48
POBUDKA !!!
Idziemy do domu.
2011-12-06 Zdzisław Dzedzej 49
top related