teoria dei giochi - università di pavia · se la somma dei due numeri è pari, vince ii. ... É...
TRANSCRIPT
Teoria dei Giochi
Anna Torre
Almo Collegio Borromeo 9 marzo 2010
email: [email protected]
sito web del corso:www-dimat.unipv.it/atorre/borromeo2010.html
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
TEOREMI DI ESISTENZA
Teorema di Von Neumann. Se (X, Y, f , −f ) è l’estensione mista di
un gioco a somma zero finito, allora esiste almeno una coppia distrategie che realizzano il maxmin=minmax.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
TEOREMI DI ESISTENZA
Teorema di Von Neumann. Se (X, Y, f , −f ) è l’estensione mista di
un gioco a somma zero finito, allora esiste almeno una coppia distrategie che realizzano il maxmin=minmax.
Teorema di Nash. Se (X, Y, f , g) è l’estensione mista di un giocofinito, allora esiste almeno una coppia di strategie che realizzano un
equilibrio di Nash.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
TEOREMI DI ESISTENZA
Teorema di Von Neumann. Se (X, Y, f , −f ) è l’estensione mista di
un gioco a somma zero finito, allora esiste almeno una coppia distrategie che realizzano il maxmin=minmax.
Teorema di Nash. Se (X, Y, f , g) è l’estensione mista di un giocofinito, allora esiste almeno una coppia di strategie che realizzano un
equilibrio di Nash.Gli equilibri di Nash di un gioco a somma zero sono le coppie di
strategie che realizzano il maxmin=minmax
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
ESEMPIO
Vediamo questo gioco:
I/II L R
T -2,2 3,-3
B 3,-3 -4,4
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
ESEMPIO
Vediamo questo gioco:
I/II L R
T -2,2 3,-3
B 3,-3 -4,4
Facendo i conti si vede che l’equilibrio si ottiene per p = 712 e q = 7
12
con un guadagno atteso per I uguale a 112 .
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
ESEMPIO
Vediamo questo gioco:
I/II L R
T -2,2 3,-3
B 3,-3 -4,4
Facendo i conti si vede che l’equilibrio si ottiene per p = 712 e q = 7
12
con un guadagno atteso per I uguale a 112 .
Quindi, questo gioco che a una analisi poco attenta sembra pari, in
realtà se entrambi i giocatori giocano al meglio delle loro possibilitàdà al primo giocatore un guadagno atteso positivo.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Analogamente il gioco delle cinque dita:
I/II 1 2 3 4 5
1 -1 1 -1 1 -1
2 1 -1 1 -1 1
3 -1 1 -1 1 -1
4 1 -1 1 -1 1
5 -1 1 -1 1 -1
I giocatori (I e II) devono scegliere contemporaneamente eindipendentemente un numero tra 1 e 5. Se la somma dei due numeri
è pari, vince II. Altrimenti vince I. Questo gioco apparentementeavvantaggia il giocatore 2 ma l’equilibrio è ( 1
2 ,12 , 0, 0, 0)per il primo
giocatore e ( 12 ,
12 , 0, 0, 0) per il secondo con valore atteso 0. Questa è
la la differenza tra il trovarsi di fronte al caso o di fronte a un essere
intelligente che va a caso “con intelligenza”.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
É RILEVANTE SCEGLIERE PER PRIMI?I/II L R
T 5,5 0,6
B 6,0 1,1
É RILEVANTE SCEGLIERE PER PRIMI?I/II L R
T 2,1 0,0
B 0,0 1,2
É RILEVANTE SCEGLIERE PER PRIMI?I/II L R
T -1,1 1,-1
B 1,-1 -1,1
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Aumentare i Payoff migliora la situazione?I/II L R
T 12,12 102,11
B 11,102 101,101
I/II L R
T 9,9 99,10
B 10,99 100,100
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
È facile vedere se un gioco è pari?I/II L R
T -2,2 3,-3
B 3,-3 -4,4
I/II L R S
T -1 1 -1
B 1 -1 1
Q -1 1 -1
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Riprendiamo il gioco del poker semplificato. Il gioco in formastrategica era:
I\\II P S
PAPK (−1, 1) (−1, 1)
PARK (0, 0) (−3/2, 3/2)
RAPK (0, 0) (1/2,−1/2)
RARK (1,−1) (0, 0)
I payoff sono i valori attesi dei payoff con la distribuzione di probabilità
assegnata.
NB: la strategia RARK prevede (per via di RK) che il giocatore I bluffi.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
q 1 − q
I\\II P S
p RAPK (0, 0) (1/2,−1/2)
1 − p RARK (1,−1) (0, 0)
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
f (p, q) = − 32 pq + 1
2 p + q = (− 32 q + 1
2 )p + q
che ha massimo per p = 1 quando q ≤ 13
per p = 0 se q ≥ 13 e per ogni valore di p se q = 1
3
Analogamente g(p, q) = ( 32 p − 1)q − 1
2 p
che ha massimo per q = 1 quando p ≥ 23
per q = 0 se p ≤ 23 e per ogni valore di q se p = 2
3
NB: la strategia RARK prevede (per via di RK) che il giocatore I bluffi.Si noti che la strategia ottimale per I prevede con probabilità positiva
(1/3) che I adotti la strategia RARK e quindi che, quando lui ha lacarta “bassa” (cioè K) bluffi mediamente 1/3 delle volte. Si noti che è
ottimale per I bluffare con questa “frequenza”, nè più spesso nèmeno spesso!
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
INDUZIONE A RITROSOSe un gioco è dato in forma estesa ed è finito e a informazione
perfetta, un modo per trovare equilibri di Nash in strategie pure è datodal cosidetto metodo dell’induzione a ritroso.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
INDUZIONE A RITROSOSe un gioco è dato in forma estesa ed è finito e a informazione
perfetta, un modo per trovare equilibri di Nash in strategie pure è datodal cosidetto metodo dell’induzione a ritroso.
Si osservano gli ultimi nodi nei quali un giocatore è chiamato a
giocare e si suppone (coerentemente con le ipotesi di razionalità eintelligenza) che in questi nodi il giocatore scelga la strategia che gli
offre il payoff maggiore.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
INDUZIONE A RITROSOSe un gioco è dato in forma estesa ed è finito e a informazione
perfetta, un modo per trovare equilibri di Nash in strategie pure è datodal cosidetto metodo dell’induzione a ritroso.
Si osservano gli ultimi nodi nei quali un giocatore è chiamato a
giocare e si suppone (coerentemente con le ipotesi di razionalità eintelligenza) che in questi nodi il giocatore scelga la strategia che gli
offre il payoff maggiore.Nei nodi precedenti, il giocatore che è chiamato a giocare sa cosa
farà l’ultimo giocatore in quanto egli conosce il gioco e sa che l’ultimogiocatore è intelligente e razionale. Così il giocatore si comporta
come se in realtà fosse l’ultimo a giocare, in quanto il payoff cheottiene giocando ciascuna strategia gli è noto perché sa quali
saranno le conseguenze della sua scelta.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
INDUZIONE A RITROSOSe un gioco è dato in forma estesa ed è finito e a informazione
perfetta, un modo per trovare equilibri di Nash in strategie pure è datodal cosidetto metodo dell’induzione a ritroso.
Si osservano gli ultimi nodi nei quali un giocatore è chiamato a
giocare e si suppone (coerentemente con le ipotesi di razionalità eintelligenza) che in questi nodi il giocatore scelga la strategia che gli
offre il payoff maggiore.Nei nodi precedenti, il giocatore che è chiamato a giocare sa cosa
farà l’ultimo giocatore in quanto egli conosce il gioco e sa che l’ultimogiocatore è intelligente e razionale. Così il giocatore si comporta
come se in realtà fosse l’ultimo a giocare, in quanto il payoff cheottiene giocando ciascuna strategia gli è noto perché sa quali
saranno le conseguenze della sua scelta.
In questo modo si proceede passo dopo passo ...in conclusione nelprimo nodo il giocatore che è chiamato a scegliere in base alle ipotesi
di conoscenza comune della razionalità e intelligenza di tutti igiocatori, in realtà sa già cosa succederà in corrispondenza ad ogniA. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
INDUZIONE A RITROSOSe un gioco è dato in forma estesa ed è finito e a informazione
perfetta, un modo per trovare equilibri di Nash in strategie pure è datodal cosidetto metodo dell’induzione a ritroso.
Si osservano gli ultimi nodi nei quali un giocatore è chiamato a
giocare e si suppone (coerentemente con le ipotesi di razionalità eintelligenza) che in questi nodi il giocatore scelga la strategia che gli
offre il payoff maggiore.Nei nodi precedenti, il giocatore che è chiamato a giocare sa cosa
farà l’ultimo giocatore in quanto egli conosce il gioco e sa che l’ultimogiocatore è intelligente e razionale. Così il giocatore si comporta
come se in realtà fosse l’ultimo a giocare, in quanto il payoff cheottiene giocando ciascuna strategia gli è noto perché sa quali
saranno le conseguenze della sua scelta.
In questo modo si proceede passo dopo passo ...in conclusione nelprimo nodo il giocatore che è chiamato a scegliere in base alle ipotesi
di conoscenza comune della razionalità e intelligenza di tutti igiocatori, in realtà sa già cosa succederà in corrispondenza ad ogniA. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Si potrebbe (non è particolarmennte difficile) dimostrare che lesoluzioni ottenute in questo modo sono equilibri di Nash, ma non tutti
gli equilibri di Nash di un gioco a informazione perfetta si possono
ottenere in questo modo.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Si potrebbe (non è particolarmennte difficile) dimostrare che lesoluzioni ottenute in questo modo sono equilibri di Nash, ma non tutti
gli equilibri di Nash di un gioco a informazione perfetta si possono
ottenere in questo modo.Un sottogioco G′ di un gioco G in forma estesa a informazione
perfetta è il gioco formato da un nodo di G e da tutti i suoi successoriin G.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Si potrebbe (non è particolarmennte difficile) dimostrare che lesoluzioni ottenute in questo modo sono equilibri di Nash, ma non tutti
gli equilibri di Nash di un gioco a informazione perfetta si possono
ottenere in questo modo.Un sottogioco G′ di un gioco G in forma estesa a informazione
perfetta è il gioco formato da un nodo di G e da tutti i suoi successoriin G.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
RAFFINAMENTI DELL’EQUILIBRIO DI NASHTutto ciò ci porta alla definizione di “equilibrio perfetto nei sottogiochi”
(SPE: subgame perfect equilibrium), che è dovuto a Selten (1965).
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
RAFFINAMENTI DELL’EQUILIBRIO DI NASHTutto ciò ci porta alla definizione di “equilibrio perfetto nei sottogiochi”
(SPE: subgame perfect equilibrium), che è dovuto a Selten (1965).Se ci limitiamo, per semplicità, ai giochi ad informazione perfetta, la
condizione che imponiamo è che non solo si abbia un equilibrio, mache tale resti anche quando “restringiamo” le strategie ai sottogiochi
del gioco dato.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
RAFFINAMENTI DELL’EQUILIBRIO DI NASHTutto ciò ci porta alla definizione di “equilibrio perfetto nei sottogiochi”
(SPE: subgame perfect equilibrium), che è dovuto a Selten (1965).Se ci limitiamo, per semplicità, ai giochi ad informazione perfetta, la
condizione che imponiamo è che non solo si abbia un equilibrio, mache tale resti anche quando “restringiamo” le strategie ai sottogiochi
del gioco dato.Per gioco ad informazione perfetta la definizione di sottogioco è
semplicissima: si tratta di considerare un generico nodo e prenderlo
come “radice” del gioco.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
RAFFINAMENTI DELL’EQUILIBRIO DI NASHTutto ciò ci porta alla definizione di “equilibrio perfetto nei sottogiochi”
(SPE: subgame perfect equilibrium), che è dovuto a Selten (1965).Se ci limitiamo, per semplicità, ai giochi ad informazione perfetta, la
condizione che imponiamo è che non solo si abbia un equilibrio, mache tale resti anche quando “restringiamo” le strategie ai sottogiochi
del gioco dato.Per gioco ad informazione perfetta la definizione di sottogioco è
semplicissima: si tratta di considerare un generico nodo e prenderlo
come “radice” del gioco.Il metodo della induzione a ritroso per trovare un equilibrio di Nash in
un gioco ad informazione perfetta fornisce, in realtà, un equilibrioperfetto nei sottogiochi. Si consideri il seguente gioco (in forma
estesa)
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
@@@@@@
��
��
��AAAA
���
�0
0
2
1
RL
BT
gioca 1
12
gioca 2
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
I\II L R
T 2, 1 0, 0
B 1, 2 1, 2
Si vede immediatamente che questo gioco ha due equilibri (in
strategie pure): (T, L) e (B,R): il primo è perfetto nei sottogiochi, ilsecondo no. Quale è il senso del nuovo equlibrio che abbiamo
trovato, ovvero (B,R)?non tutti gli equilibri di Nash sono “uguali”.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
@@@@@@
��
��
��AAAA
���
�
��
��
AAAA
1
1
1
1
0
0
2
1100
DCBA
FE
gioca I
gioca IIgioca II
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
HHHHHHHHHHHH
III
BBBBBBB
�������
������������
��
��
��BBBBB
�����
@@@@@@�����
BBBBB
BBBBB
�����
BBBBB
�����
BBBBB
�����
BBBBB
�����
989721 3 99
S D S D DSS D S DS D
1 20 0 3 0 97 0 98 0 99 0
99 0 98 0 97 0 3 0 2 0 1 0
I
IIIIII IIII II
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
@@@@@@
��
��
��AAAA
���
�0
0
2
2
AC
OUTIN
gioca I
1
5
gioca S
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Il centipede
s s s s s s s
s s s s s s
D D DDDD
C CCCC
0
0
−1
2
1
1
0
3
2
2
1
4
3
3I II I II I II
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Il risultato è inefficiente. Ed un po’ di “capacità di vedere lontano”
dovrebbe portare i giocatori a non “defezionare” subito dal gioco.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Il risultato è inefficiente. Ed un po’ di “capacità di vedere lontano”
dovrebbe portare i giocatori a non “defezionare” subito dal gioco.Cheragionamento fa II quando “defeziona” la terza volta in cui tocca a lui
giocare?.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Il risultato è inefficiente. Ed un po’ di “capacità di vedere lontano”
dovrebbe portare i giocatori a non “defezionare” subito dal gioco.Cheragionamento fa II quando “defeziona” la terza volta in cui tocca a lui
giocare?.
Perchè “defezionare”? Perchè ritiene (da induzione a ritroso) chenella mossa successiva I defezionerebbe.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Il risultato è inefficiente. Ed un po’ di “capacità di vedere lontano”
dovrebbe portare i giocatori a non “defezionare” subito dal gioco.Cheragionamento fa II quando “defeziona” la terza volta in cui tocca a lui
giocare?.
Perchè “defezionare”? Perchè ritiene (da induzione a ritroso) chenella mossa successiva I defezionerebbe.
Ma se II si trova davvero a dover giocare la sua terza mossa, ciò èsolo perché I ha deciso per ben tre volte di comportarsi in modo
diverso da come prescrive lo SPE (ed anche II stesso, si noti!).
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
Il risultato è inefficiente. Ed un po’ di “capacità di vedere lontano”
dovrebbe portare i giocatori a non “defezionare” subito dal gioco.Cheragionamento fa II quando “defeziona” la terza volta in cui tocca a lui
giocare?.
Perchè “defezionare”? Perchè ritiene (da induzione a ritroso) chenella mossa successiva I defezionerebbe.
Ma se II si trova davvero a dover giocare la sua terza mossa, ciò èsolo perché I ha deciso per ben tre volte di comportarsi in modo
diverso da come prescrive lo SPE (ed anche II stesso, si noti!).Allora II “defeziona” ipotizzando un comportamento futuro di
“razionalità” da parte di I, che se fosse stato adottato in passato nonavrebbe certamente portato II a dover giocare!
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
I SPE sono un cosiddetto “raffinamento” degli equilibri di Nash che
sfrutta la forma estesa. Sono però stati proposti altri raffinamenti cheutilizzano solo la forma strategi Mi limito a citare gli equilibri perfetti
(introdotti da Selten nel 1975). Vediamo solo un esempio.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
I SPE sono un cosiddetto “raffinamento” degli equilibri di Nash che
sfrutta la forma estesa. Sono però stati proposti altri raffinamenti cheutilizzano solo la forma strategi Mi limito a citare gli equilibri perfetti
(introdotti da Selten nel 1975). Vediamo solo un esempio.Qui abbiamo due equilibri di Nash (in strategie pure): (T, L) e (B,R).
Ma solo (T, L) è “perfetto”.
I\II L R
T 1, 1 0, 0
B 0, 0 0, 0
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo
I SPE sono un cosiddetto “raffinamento” degli equilibri di Nash che
sfrutta la forma estesa. Sono però stati proposti altri raffinamenti cheutilizzano solo la forma strategi Mi limito a citare gli equilibri perfetti
(introdotti da Selten nel 1975). Vediamo solo un esempio.Qui abbiamo due equilibri di Nash (in strategie pure): (T, L) e (B,R).
Ma solo (T, L) è “perfetto”.
I\II L R
T 1, 1 0, 0
B 0, 0 0, 0
L’idea di equilibrio perfetto è basata sul fatto che il giocatore non è ingrado di evitare errori. E quindi un equilibrio dovrebbe essere, per
così dire, “limite” di equilibri che si ottengono “obbligando” i giocatori
ad effettuare errori.
A. Torre Teoria dei giochi 2010-Almo Collegio Borromeo