Download - Teoria Dos Jogos
Uma maneira formal de se analisar
interações entre agentes racionais que
agem estrategicamente.
Um conjunto de técnicas para prever o resultado da interação de agentes na qual a ação de um participante diretamente afeta a recompensa dos outros participantes.
O QUE É TEORIA DOS JOGOS?
Jogos de soma zero
O interesse de cada jogador está em conflito
com o outro. Ou seja, qualquer jogo que exista
um vencedor e um perdedor como, por
exemplo, futebol e xadrez.
Jogos de soma não zero
O interesse dos jogadores não está sempre
em conflito havendo possibilidade dos dois
jogadores ganharem.
TIPOS DE JOGOS
Há dois ou mais jogadores
Há uma escolha estratégica de ações
Há um ou mais resultados
Há interação estratégica, ou seja, o resultados
depende da estratégia escolhida pelos jogadores.
Deste modo nós não estudaremos jogos de sorte
como loteria nos quais a estratégia não faz a
menor diferença, nem jogos de apenas um jogador
no qual o jogador não interagem estrategicamente
com outros jogadores.
CARACTERÍSTICAS DOS JOGOS
Jogador: qualquer indivíduo, grupo ou
organização envolvidos no processo de interação
estratégica e que tenha autonomia para tomar
decisões.
Ação ou Movimento: é uma escolha que o
jogador pode fazer em um dado momento do
jogo.
Conjunto de Ações: conjunto que descreve todas
as possíveis ações de um jogador.
DEFINIÇÕES
Por exemplo, em um jogo que dois bancos estão
decidindo se renovam ou não o empréstimo de uma
firma devedora que está tendo problema para pagar o
empréstimo o conjunto de ações de cada banco é
composto por duas ações: renova o empréstimo e não
renova o empréstimo. Assim o conjunto de ação do
banco A pode ser escrito como:
𝐴𝐴={Renova o empréstimo, Não renova o empréstimo}
Deste modo, qual seria o conjunto de ações do banco
B?
Qual o conjunto de ações do jogador 1 em um jogo
zero ou um?
CONJUNTO DE AÇÕES - CONTINUAÇÃO
Em um jogo em que cada jogador é identificado por
um subíndice i, no qual i=1,2,..,n, o conjunto de ações
do i-ésimo jogador lista todas as ações disponíveis
para aquele jogador. Esse conjunto de ações é
representado por:
𝑨𝒊{𝒂𝒊}
Conhecer o conjunto de ações de cada jogador é um
passo fundamental na análise de um processo de
interação estratégica.
Ao avaliar a melhor ação, cada jogador considera não
apenas toas as ações relevantes que dispões, mas
também todas as ações relevantes disponíveis para os
demais jogadores.
CONJUNTO DE AÇÕES - GENERALIZANDO
Estratégia : um plano de ações que especifica, para um
determinado jogador, que ação tomar em todos os momentos em
que ele terá de decidir o que fazer.
Conjunto de Estratégias ou Espaço de Estratégias :
conjunto de estratégias que cada jogador dispõe.
Por exemplo, em um jogo que a empresa inovadora está
decidindo antes se lança um produto novo ou não e a empresa
l íder decidindo depois se mantém ou reduz o preço do seu
produto antigo, o conjunto de estratégias da empresa inovadora
é:
𝑆 𝑖𝑛𝑜𝑣𝑎𝑑𝑜𝑟𝑎 = {𝑙𝑎𝑛ç𝑎 𝑜 𝑝𝑟𝑜𝑑𝑢𝑡𝑜 𝑛𝑜𝑣𝑜, 𝑛ã𝑜 𝑙𝑎𝑛ç𝑎 𝑜 𝑝𝑟𝑜𝑑𝑢𝑡𝑜 𝑛𝑜𝑣𝑜}
No caso do jogo dos bancos que decidem renovar ou não o
empréstimo da firma devedora o conjunto de estratégias dos
dois bancos coincide com o conjunto de ações dos dois bancos.
CONJUNTO DE ESTRATÉGIAS
Como a empresa líder decidindo depois da empresa inovadora
se mantém ou reduz o preço do seu produto antigo, o conjunto
de estratégias da empresa líder é um pouco mais complexo:
𝑆 𝑙í𝑑𝑒𝑟 = {mantém o preço se inovadora lança produto novo, mantém o preço se inovadora não lança o produto novo; reduz o preço se inovadora lança produto novo, mantém o preço se inovadora não lança o produto novo; mantém o preço se inovadora lança produto novo, reduz o preço se inovadora não lança o produto novo; reduz o preço se inovadora lança produto novo, reduz o preço se inovadora não lança o produto novo}
O conjunto de estratégia da empresa líder é mais complexo
porque o conjunto a empresa líder possui mais informação
quando ela toma sua decisão.
CONJUNTO DE ESTRATÉGIAS -
CONTINUAÇÃO
Se chamarmos de 𝑠𝑗𝑖 a j-ésima estratégia do
jogador i, o conjunto de estratégias ou espaço
de estratégias do jogador i é dado por:
𝑆 𝑖 = 𝑠𝑗𝑖
Combinação de Estratégias é representada por
um conjunto ordenado, no qual cada elemento é
uma estratégia para cada um dos n jogadores.
𝑆 = 𝑠1 , 𝑠2 … , 𝑠𝑛
CONJUNTO DE ESTRATÉGIAS -
GENERALIZAÇÃO
Recompensa (Payoff): aquilo que o jogador obtém depois de
encerrado o jogo, de acordo com suas próprias escolhas e a dos
demais jogadores.
Função de Recompensa: especifica um valor numérico que nos
ajuda a perceber como o jogador avalia um determinado
resultado do jogo. Deste modo, a função de recompensa
possibilita a ordenação dos possíveis resultados do jogo. Então
a função de recompensa é tal que:
∀ 𝒙 𝒆 𝒚, 𝝅 𝒙 ≥ 𝝅 𝒚 𝒔𝒆 𝒙 ≿ 𝒚
A função de recompensa ordena as preferências de um mesmo
jogador.
A função de preferência não pode ser usada para ordenar as
preferências de jogadores diferentes.
Cada combinação estratégica produz recompensas diferentes
para os jogadores.
DEFINIÇÕES - CONTINUAÇÃO
1. Recompensas são fixas e conhecidas.
2. Os jogadores se comportam de forma
racional
Entendem o jogo e cada jogador busca
maximizar sua a recompensa.
3. As regras do jogo, incluindo recompensas,
são de conhecimento comum
4. Jogadores são neutros ao risco
Maximizam o retorno esperado.
JOGOS SIMULTÂNEOS COM INFORMAÇÃO
COMPLETA - HIPÓTESES
Toda informação (quem são os jogadores, quais são as
estratégias, quais são as recompensas para cada possível
combinação de estratégias) é conhecida por todos os
jogadores e todos os jogadores sabem que os outros
jogadores sabem que os outros jogadores conhecem toda
informação do jogo.
Os jogadores racionais adotarão as estratégias que
maximizam suas recompensas, por isso, afirmar que as
recompensas são de conhecimento comum significa dizer
que nenhum dos jogadores possui dúvidas sobre o resultado
que os demais jogadores buscam obter. Assim, cada
jogador sabe exatamente com quem está jogando, pois
sabe quais os objetivos dos outros jogadores.
CONHECIMENTO COMUM
Os jogos simultâneos com informação completa são, geralmente, representados pela forma normal.
Definição:
A representação na formal normal de um jogo especifica os jogadores i=1,2,..,n, os espaços de estratégias 𝑆1 , 𝑆2,… , 𝑆𝑛 dos jogadores e suas funções de recompensas
𝜋1 , 𝜋2 ,...,𝜋𝑛
Desta forma o jogo pode ser denotado por
𝐺 = 1,2,...,n; 𝑆1 , 𝑆2,… , 𝑆𝑛 ; 𝜋1 , 𝜋2 ,...,𝜋𝑛 .
Observação: Os valores das recompensas não precisam representa exatamente o valor obtido por cada jogador, mas sim a ordenação de suas preferências.
FORMA NORMAL
Jogadores: Luísa (linha) e Carlos (coluna);
Luísa quer ir ao cinema;
Carlos quer ir ao Futebol;
Os dois gostam de ficarem juntos.
EXEMPLO: BATALHA DOS SEXOS
Futebol Cinema
Futebol 1,2 0,0
Cinema 0,0 2,1
Carlos
Luís
a
Confessa Não Confessa
Confessa -2,-2 0,-4
Não Confessa -4,0 -1,-1
BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO
ESTRATÉGIAS ESTRITAMENTE DOMINADAS
Dilema dos Prisioneiros:
Para o jogador 1, a estratégia confessar estritamente domina a estratégia
não confessar. Ou seja, a estratégia não confessar é estritamente dominada
pela estratégia confessar.
Definição:
Uma estratégia 𝑠𝑖∗∗ é estritamente dominada
para o jogador i por uma estratégia 𝑠𝑖∗ se:
𝜋 𝑠𝑖∗ , 𝑠−𝑖 > 𝜋 𝑠𝑖
∗∗ , 𝑠−𝑖 , para todo 𝑠−𝑖
ESTRATÉGIA ESTRITAMENTE DOMINADA
Definição:
Uma estratégia 𝑠𝑖∗ é estritamente dominante
para o jogador i em relação a uma estratégia
𝑠𝑖∗∗ se:
𝜋 𝑠𝑖∗ , 𝑠−𝑖 > 𝜋 𝑠𝑖
∗∗ , 𝑠−𝑖 , para todo 𝑠−𝑖
ESTRATÉGIA ESTRITAMENTE DOMINANTE
AGORA É A SUA VEZ: IDENTIFIQUE E ELIMINE A
ESTRATÉGIA ESTRITAMENTE DOMINADA DO
JOGADOR 2
Dilema dos Prisioneiros:
Para o jogador 2, a estratégia confessar é estritamente dominante em
relação à estratégia não confessar.
Ou seja, a estratégia não confessar é estritamente dominada pela estratégia
confessar.
BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO
ESTRATÉGIAS ESTRITAMENTE DOMINADAS
Dilema dos Prisioneiros:
Confessar é a estratégia estritamente dominante para os dois jogadores,
então a solução desse jogos é os prisioneiros confessam e cada um será
sentenciado com dois anos de cadeia.
Este jogo é solucionável por dominância, ou seja, podemos encontrar a
solução (o equilíbrio) através da eliminação iterativa das estratégias
dominantes.
Lançar Nova
Versão
Reduzir Preço
Lançar Modelo
Próprio
1,4 1,3
Importar da
Matriz
2,2 2,3
BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO
ESTRATÉGIAS ESTRITAMENTE DOMINADAS
O resultado dado pela combinação das estratégias (Importar da Matriz,
Reduzir o Preço) é um equilíbrio em estratégias estritamente dominantes.
Este jogo é solucionável por dominância.
Para solucionar o jogo por intermédio da
eliminação iterativa de estratégias estritamente
dominadas assumiu-se o conhecimento comum
da racionalidade (CCR).
O jogador 1 sabe que os jogadores 1 e 2 são racionais. O
jogador 2 sabe que jogador 1 sabe que os jogadores 1 e 2
são racionais. O jogador 1 sabe que o jogador 2 sabe que
jogador 1 sabe que os jogadores 1 e 2 são racionais,...
CONSIDERAÇÕES
As estratégias que resultam da eliminação iterativa
de estratégias estritamente dominadas são
chamadas de racionalizáveis.
Uma dada estratégia 𝑠𝑖∗ do um jogador 𝑖 é
considerada a melhor resposta desse jogador 𝑖 a
uma dada estratégia 𝑠−𝑖 dos demais jogadores se:
𝜋 𝑠𝑖∗ , 𝑠−𝑖 ≥ 𝜋 𝑠𝑖
, , 𝑠−𝑖 , para algum 𝑠−𝑖 e todo 𝑠𝑖, ≠ 𝑠𝑖
∗
Ou seja, a melhor resposta é a estratégia que dá a
melhor recompensa ao jogador 𝑖 para uma dada
estratégia dos outros jogadores.
ESTRATÉGIAS RACIONALIZÁVEIS E
MELHOR RESPOSTA
Lançar nova
versão
Manter
preço
Reduzir
Preço
Lançar
modelo
próprio
1,4 4,1 1,3
Importar da
matriz 2,2 2,1 2,3
Não competir 0,1 0,6 0,0
BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO
ESTRATÉGIAS ESTRITAMENTE DOMINADAS
A estratégia Não Competir não é a melhor resposta para
nenhuma estratégia que a empresa Carro Novo possa adotar,
então a estratégia Não Competir não é uma estratégia
racionalizável para a empresa Novo Auto.
Empresa Carro Novo
Em
pre
sa
No
vo A
uto
BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO
ESTRATÉGIAS ESTRITAMENTE DOMINADAS
Este jogo não é solucionável por dominância.
Eliminar estratégias fortemente dominadas pode não
ser aplicável, mas sempre que é dá certo.
Não
Exporta
Exporta
em
Pequena
Escala
Exporta
em
Grande
Escala
Investe 2,1 1,0 0,-1
Não Investe 1,0 2,1 -1,2
JOGO DA PREVENÇÃO DA ENTRADA NO
MERCADO NACIONAL
Entrante Potencial
Em
pre
sa
Do
min
an
te
Nem sempre as estratégias que não podem ser eliminadas em um
processo de eliminação iterativa de estratégias estritamente
dominadas são, necessariamente, racionalizáveis.
Exportar em pequena escala não é uma estratégia racionalizável para a
empresa entrante.
Diz-se que uma combinação de estratégias constitui um equilíbrio de Nash quando cada estratégia é a melhor resposta possível às estratégias dos demais jogadores, e isso é verdade para todos os jogadores.
Definição: as estratégias 𝑠1 , 𝑠2 , … , 𝑠𝑛 constituem um equilíbrio de Nash para o jogo G se:
𝜋𝑖 𝑠𝑖,∗𝑠−𝑖,
∗ ≥ 𝜋𝑖 𝑠𝑖 ,𝑠−𝑖,∗ para todo 𝑠𝑖 , e todo 𝑖 .
Ou seja, no Equilíbrio de Nash nenhum jogador conseguirá aumentar a sua recompensa mudando unilateralmente a sua estratégia.
EQUILÍBRIO DE NASH
Lançar Nova
Versão
Reduzir Preço
Lançar Modelo
Próprio
1,4 1,3
Importar da
Matriz
2,2 2,3
BUSCANDO A SOLUÇÃO DO JOGO:
IDENTIFICADOS AS ESTRATÉGIAS QUE SÃO
MELHOR RESPOSTAS
Conforme discutido anteriormente, o resultado dado pela combinação das
estratégias (Importar da Matriz, Reduzir o Preço) é um equilíbrio em
estratégias estritamente dominantes. Ou seja, este jogo é solucionável por
dominância.
Este mesmo resultado é, também um equilíbrio de Nash.
ENCONTRANDO O EQUILÍBRIO DE NASH
Este jogo não é solucionável por dominância.
Porém, este jogo possui uma solução que corresponde
ao conceito de equilíbrio de Nash.
Não
Exporta
Exporta
em
Pequena
Escala
Exporta
em
Grande
Escala
Investe 2,1 1,0 0,-1
Não Investe 1,0 2,1 -1,2
JOGO DA PREVENÇÃO DA ENTRADA NO
MERCADO NACIONAL
Entrante Potencial
Em
pre
sa
Do
min
an
te
O resultado dado pela combinação das estratégias
(Investe, Não Exporta) é o Equilíbrio de Nash neste jogo.
BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO
ESTRATÉGIAS ESTRITAMENTE DOMINADAS
Dilema dos Prisioneiros:
O resultado dado pela combinação das estratégias
(Confessa, Confessa) é o Equilíbrio de Nash neste jogo.
EXEMPLO: BATALHA DOS SEXOS
Futebol Cinema
Futebol 1,2 0,0
Cinema 0,0 2,1
Carlos
Luís
a
Os resultados (Futebol, Cinema) e (Cinema, Futebol)
são soluções para este jogo.
Há mais que um Equilíbrio de Nash neste jogo.
JOGO DURÃO E MEDROSO
Os resultados (M, D) e (D, M) são soluções para este
jogo.
Há mais que um Equilíbrio de Nash neste jogo.
Definição:
As estratégias 𝑠1 , 𝑠2 , … , 𝑠𝑛 constituem um equilíbrio
de Nash Estrito para o jogo G se:
𝜋𝑖 𝑠𝑖,∗𝑠−𝑖,
∗ > 𝜋𝑖 𝑠𝑖 ,𝑠−𝑖,∗ para todo 𝑠𝑖 , e todo 𝑖 .
Dado a estratégia escolhida do oponente, não há
nenhuma estratégia que seja pelo menos tão boa
quanto a estratégia que os outros jogadores estão
jogando no equilíbrio de Nash.
EQUILÍBRIO DE NASH ESTRITO
IDENTIFICANDO EQUILÍBRIO DE NASH
ESTRITO
Dilema dos Prisioneiros:
O resultado dado pela combinação das estratégias
(Confessa, Confessa) é um Equilíbrio de Nash Estrito.
Um equilíbrio em estratégia estritamente
dominantes é sempre um equilíbrio de Nash,
mas um equilíbrio de Nash nem sempre é um
equilíbrio em estratégia dominante.
Se existir um equilíbrio em estratégia
estritamente dominantes este equilíbrio
também é um equilíbrio de Nash Estrito.
RELAÇÃO ENTRE EQUILÍBRIO DE NASH E
EQUILÍBRIO EM ESTRATÉGIAS ESTRITAMENTE
DOMINANTES
Ótimo de Pareto: um dada situação em que não é
possível melhorar a situação de um agente sem
piorar a de outro.
Equilíbrio de Nash: Cada jogador individualmente
adota a melhor resposta às estratégias dos demais
jogadores, mas isso não significa que a situação
resultante das decisões conjuntas será a melhor
possível.
EQUILÍBRIO DE NASH E ÓTIMO DE PARETO
DILEMA DOS PRISIONEIROS
O resultado dado pela combinação das estratégias (Confessa,
Confessa) é um Equilíbrio de Nash, mas não é uma Alocação
Ótima de Pareto. Se os dois jogadores conseguissem cooperar
eles poderiam melhorar as recompensas obtidas desse jogo.
Definições:
Um jogo é dito Não-Cooperativo quando os jogadores
não podem estabelecer compromissos garantidos.
Se os jogadores podem estabelecer compromissos, e
esses compromissos possuem garantias efetivas, diz-
se que o jogo é Cooperativo.
JOGOS COOPERATIVOS E NÃO-
COOPERATIVOS
Tarifa Alta Tarifa Baixa
Tarifa Alta 800 , 800 2.300 , (700)
Tarifa Baixa (700) , 2300 1.700 , 1.700
O JOGO DO COMÉRCIO INTERNACIONAL
Vimos no Jogo da Batalha dos Sexos que é possível que haja mais que um equilíbrio de Nash para um dado jogo.
Esse jogo é um exemplo de coordenação com várias opções.
Na realidade, há uma série de situações com várias possibilidades de equilíbrio, ou seja, situações em que os agentes não teriam estímulos para mudar suas decisões.
Porém em qual desses equilíbrios os agentes irão acomodar-se?
EQUILÍBRIO DE NASH: CONSIDERAÇÕES
Adota Campanha
Agressiva
Não Adota
Campanha
Agressiva
Adota Campanha
Agressiva -20,-20 10,-10
Não Adota
Campanha
Agressiva
-10,10 0,0
O JOGO DA CAMPANHA PUBLICITÁRIA
Definição:
Um ponto focal é um elemento que destaca de um
contexto, e que permite aos jogadores coordenarem suas
decisões em um dentre vários equilíbrios de Nash
possíveis.
O conceito do ponto focal baseará a coordenação dos
agentes para a obtenção da solução cooperativa.
Para tanto, precisaremos que existam:
1. Conhecimento comum;
2. Compartilhamento de experiência;
3. Pequenos grupos de jogadores.
O CONCEITO DO PONTO FOCAL
Atualizar Não Atualizar
Desenvolver 2,1 -1,-2
Não Desenvolver 0,-1 1,2
JOGO DE COORDENAÇÃO DO PADRÃO
TECNOLÓGICO
Empresa de Antivírus
Em
pre
sa
de
Sis
tem
a
Op
era
cio
na
l
Ponto Focal: Colunista especializado em uma revista
internacional de novidades em tecnologia de
informação.
Cara Coroa
Cara 1,-1 -1,1
Coroa -1,1 1,-1
AUSÊNCIA DE EQUILÍBRIO DE NASH
Não existe equilíbrio de Nash com estratégias puras.
Esse jogo, matching pennies, é um jogo estritamente
competitivo ou de soma zero.
Nesta aula nós discutimos alguns jogos que são
importantes na literatura da teoria dos jogos, como:
1. A batalha dos Sexos
Coordenação com várias opções.
2. O Dilema do Prisioneiro
Cooperação versus interesse próprio.
3. O Jogo da Galinha
Competição destrutiva
JOGOS IMPORTANTES
Cervo Lebre
Cervo 3,3 0,1
Lebre 1,0 1,1
O JOGO DA CAÇA AO CORVO: O DILEMA DO
CONTRATO SOCIAL
O jogo da caça ao cervo representa situações de interação
estratégicas em que:
O melhor resultado depende da cooperação de todos.
Se alguém buscar um resultado individual mais imediato,
aqueles que se mantiverem fiéis ao compromisso inicial serão
prejudicados.
Também conhecidos como Jogos de Soma Zero.
Jogadores estão preocupados em infligir o maior dano
possível uns aos outros, uma vez que a perda para um
dos jogadores representa o ganho para o outro.
Definição: Seja um par qualquer de estratégias do
jogador 𝑎 , representado por 𝒔𝒊𝒂 , 𝒔𝒋
𝒂 , e seja um par
qualquer de estratégias do jogador 𝒃, representado por
𝒔𝒊𝒃 , 𝒔𝒋
𝒃 . Para que o jogo seja estritamente competitivo,
é necessário que:
𝝅𝒂 𝒔𝒊𝒂 , 𝒔𝒋
𝒃 ≥ 𝝅𝒂 𝒔𝒋𝒂 , 𝒔𝒊
𝒃 𝒔𝒆, 𝒆 𝒔𝒐𝒎𝒆𝒏𝒕𝒆 𝒔𝒆, 𝝅𝒃 𝒔𝒋𝒂 , 𝒔𝒊
𝒃
≥ 𝝅𝒃 𝒔𝒊𝒂 , 𝒔𝒋
𝒃
JOGOS ESTRITAMENTE COMPETITIVOS
Uma combinação de estratégias fornece uma
recompensa maior ou igual à outra combinação de
estratégias para um dos jogadores, se o inverso
acontecer para o outro jogador.
Portanto, é permitido escrever os jogos estritamente
competitivos indicando apenas as recompensas de um
dos jogadores, pois o resultado que um dos jogadores
prefere é exatamente o resultado que o outro jogador
despreza.
JOGOS ESTRITAMENTE COMPETITIVOS
Então, podemos escrever a recompensa de um dos
jogadores como sendo a recompensa do outro jogador, com
o sinal trocado:
𝝅𝒂 𝒔𝒊𝒂 , 𝒔𝒋
𝒃 = −𝝅𝒃 𝒔𝒊𝒂 , 𝒔𝒋
𝒃
Logo, a soma das recompensas dos dois jogadores será
zero:
𝝅𝒂 𝒔𝒊𝒂 , 𝒔𝒋
𝒃 +𝝅𝒃 𝒔𝒊𝒂 , 𝒔𝒋
𝒃 =0
Esta é a razão desses jogos serem conhecidos como jogos
de soma zero.
Assim, em um jogo estritamente competitivo, não existe
combinação de estratégias preferível a qualquer outra para
os dois jogadores simultaneamente.
JOGOS ESTRITAMENTE COMPETITIVOS
A BATALHA DE BISMARK:
ESTE JOGO É UM JOGO ESTRITAMENTE
COMPETITIVO?
Rota Sul Rota Norte
Busca Rota Sul no primeiro dia 3,-3 1,-1
Busca Rota Norte primeiro dia 2,-2 2,-2
Comboio Japonês
Forç
as A
liad
as
Cara Coroa
Cara 1,-1 -1,1
Coroa -1,1 1,-1
MATCHING PENNIES
Esse jogo é um jogo estritamente competitivo ou de soma
zero.
Jogadores: Luísa (linha) e Carlos (coluna);
Número iguais Luísa ganha;
Números diferentes Carlos ganha;
ZERO OU UM
0 1
0 1,-1 -1,1
1 -1,1 1,-1
Luís
a
Carlos
Jogadores: Luísa (linha) e Carlos (coluna);
TESOURA , PAPEL OU PEDRA
T PP PR
T 0,0 1,-1 -1,1
PP -1,1 0,0 1,-1
PR 1,-1 -1,1 0,0
Luís
a
Carlos
Alternativamente podemos representar os jogos
estritamente competitivos (ou jogos de soma zero)
representando apenas a recompensa do jogador que
está na linha, uma vez que a recompensa do jogador
que está na coluna é o seu oposto.
REPRESENTAÇÃO ALTERNATIVA
0 1
0 1,-1 -1,1
1 -1,1 1,-1
Luís
a
Carlos
0 1
0 1 -1
1 -1 1
Carlos
Luís
a
A BATALHA DE BISMARK
Rota Sul Rota Norte
Busca Rota Sul no primeiro dia 3,-3 1,-1
Busca Rota Norte primeiro dia 2,-2 2,-2
Comboio Japonês
Forç
as A
liad
as
Rota Sul Rota Norte
Busca Rota Sul no primeiro dia 3 1
Busca Rota Norte primeiro dia 2 2Forç
as A
liad
as
Comboio Japonês
Cada jogador está tomando suas decisões
procurando causar o maior dano possível ao outro
jogador.
Uma estratégia prudente é tentar minimizar o dano
que o oponente pode lhe causar.
QUAL A MELHOR ESTRATÉGIA EM UM JOGO
ESTRITAMENTE COMPETITIVO?
Representando as recompensas apenas do jogador
que está na linha, podemos representar o pior
resultado que o jogador que está na coluna pode obter
caso ele escolha a estratégia representada pela
coluna 𝑡 ′ por:
max𝑠
𝜋 𝑠, 𝑡 ′
Onde s é a estratégia do jogador que está na linha. E a
função de recompensa acima apresentada é a função
de recompensa do jogador que está na linha.
RESOLVENDO PELO MÉTODO DO MAXMIN OU
MINIMAX
O pior resultado que o jogador que está na linha pode
obter caso ele escolha a estratégia representada pela
linha 𝑠 ′ é representado por:
min𝑡
𝜋 𝑠 ′ , 𝑡
Onde t é a estratégia do jogador que está na coluna. E
a função de recompensa acima apresentada é a
função de recompensa do jogador que está na linha.
RESOLVENDO PELO MÉTODO DO MAXMIN OU
MINIMAX
A BATALHA DE BISMARK
Rota Sul Rota Norte
Busca Rota Sul no primeiro dia 3 1
Busca Rota Norte primeiro dia 2 2Forç
as A
liad
as
Comboio Japonês
Então, o valor maxmin do jogo, ou seja, o maior dano que os aliados podem garantir, dadas as suas opções e as opções da marinha japonesa, é dado por:
max𝑠
min𝑡
𝜋 𝑠, 𝑡 = 𝜋 𝑠2 , 𝑡2
Quando a combinação de estratégias para os quais o
máximo entre os mínimos que o jogador na linha
pode obter for a mesma para o qual o jogador nas
colunas obtém o mínimo entre os máximos, temos:
𝑚𝑖𝑛𝑖𝑚𝑎𝑥 𝑛𝑎𝑠 𝑐𝑜𝑙𝑢𝑛𝑎𝑠 = 𝑚𝑎𝑥𝑚𝑖𝑛 𝑛𝑎𝑠 𝑙𝑖𝑛ℎ𝑎𝑠
Ou seja,
Que no caso anterior é 𝜋 𝑠2 , 𝑡2 = 2.
PONTO DE SELA
min𝑡
max𝑠
𝜋 𝑠, 𝑡 =max𝑠
min𝑡
𝜋 𝑠, 𝑡
O equilíbrio maxmin-minimax é um equilíbrio, pois nenhum
dos jogadores tem incentivo a desviar da escolha
estratégica que compõe a combinação de estratégias que
tenta impor o maior dano possível ao seu oponente.
A combinação de estratégias cuja recompensa tenta impor
o maior dano possível ao seu oponente, tem como melhor
resposta minimizar as suas próprias perdas.
Assim, como cada jogador está buscando escolher a
estratégia que é a melhor resposta a estratégia do seu
oponente, o equilíbrio maxmin-minimax é um Equilíbrio de
Nash.
EQUILÍBRIO MINIMAX
Os jogadores jogam estratégias puras quando
adotam uma estratégia com certeza.
Quando um jogador varia a escolha de suas
estratégias de forma a tentar surpreender o outro
jogador, diz-se que ele adota estratégia mista.
Faz-se uso de estratégias mistas para buscar
surpreender e evitar ser surpreendido, neutralizando
os efeitos da estratégia escolhida pelo outro
jogador.
ESTRATÉGIA MISTAS
Definição:
Quando, em vez de escolher entre suas estratégias
uma dada estratégia para jogá-la com certeza, um
jogador decide alternar entre suas estratégias
aleatoriamente, atribuindo uma probabilidade a
cada estratégia a ser escolhida, diz-se que o jogador
utiliza estratégias mistas. Caso contrário, diz-se que
emprega estratégias puras .
ESTRATÉGIA MISTAS
Definição :
A recompensa esperada de um jogador pela adoção
de uma dada estratégia é a recompensa que ele
pode vir a obter, em média, dadas as probabilidades
com que os outros jogadores escolhem suas
estratégias.
RECOMPENSA ESPERADA
ZERO OU UM: RESOLVENDO POR
ESTRATÉGIAS MISTAS.
𝜋𝐶𝑎𝑟𝑙𝑜𝑠𝑒 0 = 𝑝 × −1 + 1 − 𝑝 × 1
𝜋𝐶𝑎𝑟𝑙𝑜𝑠𝑒 1 = 𝑝 × 1 + 1 − 𝑝 × −1
𝜋𝐿𝑢í𝑠𝑎𝑒 0 = 𝑞 × 1 + 1 − 𝑞 × −1
𝜋𝐿𝑢í𝑠𝑎𝑒 1 = 𝑞 × −1 + 1 − 𝑞 × 1
0 (q) 1 (1-q) RE Luísa
0 (p) 1,-1 -1,1 q*1+(1-q)*(-1)
1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1)
RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1)
Luís
a
Carlos
ZERO OU UM: RESOLVENDO POR
ESTRATÉGIAS MISTAS.
O Jogo zero ou um não tem equilíbrio em estratégias
estritamente dominantes, não tem equilíbrio de Nash
em estratégias puras, mas tem equilíbrio em
estratégias mistas.
0 (q) 1 (1-q) RE Luísa
0 (p) 1,-1 -1,1 q*1+(1-q)*(-1)
1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1)
RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1)
Luís
a
Carlos
ZERO OU UM: RESOLVENDO POR
ESTRATÉGIAS MISTAS.
O Jogo zero ou um não tem equilíbrio em estratégias
estritamente dominantes, não tem equilíbrio de Nash em
estratégias puras, mas tem equilíbrio em estratégias mistas.
O equilíbrio de Nash em estratégias mista para esse jogo
acontece quando a Luísa e o Carlos escolhem suas estratégias
com a mesma probabilidade, 𝑝 = 𝑞 = 12 , de tal forma que
nenhum deles consegue antecipar se o seu oponente escolherá
zero ou um.
Ou seja, cada um dos jogadores neutralizou a vantagem que seu
oponente teria variando aleatoriamente sua escolha.
O Equilíbrio de Nash em estratégias mistas é:
𝑝, 1 − 𝑝 , 𝑞, 1 − 𝑞 =1
2,1
2,1
2,1
2
ZERO OU UM: A FUNÇÃO DE RECOMPENSA
ESPERADA QUANDO TODOS OS JOGADORES
JOGAM ESTRATÉGIAS MISTAS.
𝜋𝐿𝑢í𝑠𝑎𝑒 = 𝑝𝑞 1 + 1 − 𝑝 1 − 𝑞 −1
+ 1 − 𝑝 𝑞 −1 + 1 − 𝑝 1 − 𝑞 1 = 0
𝜋𝐶𝑎𝑟𝑙𝑜𝑠𝑒 = 𝑝𝑞 −1 + 1 − 𝑝 𝑞(1)+ 𝑝 1 − 𝑞 (1) +1 − 𝑝 1 − 𝑞 −1 =0
0 (q) 1 (1-q) RE Luísa
0 (p) 1,-1 -1,1 q*1+(1-q)*(-1)
1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1)
RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1)
Luís
a
Carlos
O JOGO DA GUERRA FRIA:
RESOLVENDO POR ESTRATÉGIAS MISTAS
Ameaça Não Ameaça
Ameaça -100,-100 10,-10
Não Ameaça -10,10 0,0
URSS
EUA
O JOGO DA GUERRA FRIA:
RESOLVENDO POR ESTRATÉGIAS MISTAS
Ameaça (q) Não Ameaça (1-q) RE EUA
Ameaça (p) -100,-100 10,-10 q*(-100)+(1-q)*10
Não Ameaça (1-p) -10,10 0,0 q*(-10)+(1-q)*0
RE URSS p*(-100)+(1-p)*10 p*(-10)+(1-p)*0
EUA
URSS
Os EUA escolherão a probabilidade de ameaçar que fará a URSS
ser indiferente entre ameaçar e não ameaçar. Ou seja:
𝜋𝑈𝑅𝑆𝑆𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝜋𝑈𝑅𝑆𝑆
𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎
Sendo,
𝜋𝑈𝑅𝑆𝑆𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝑝 × −100 + 1 − 𝑝 × 10
𝜋𝑈𝑅𝑆𝑆𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎 = 𝑝 × (−10) + 1 − 𝑝 × 0
O JOGO DA GUERRA FRIA:
RESOLVENDO POR ESTRATÉGIAS MISTAS
Ameaça (q) Não Ameaça (1-q) RE EUA
Ameaça (p) -100,-100 10,-10 q*(-100)+(1-q)*10
Não Ameaça (1-p) -10,10 0,0 q*(-10)+(1-q)*0
RE URSS p*(-100)+(1-p)*10 p*(-10)+(1-p)*0
EUA
URSS
A URSS, também, escolherá a probabilidade de ameaçar que
fará os EUA ser indiferente entre ameaçar e não ameaçar. Ou
seja:
𝜋𝐸𝑈𝐴𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝜋𝐸𝑈𝐴
𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎
Sendo,
𝜋𝑈𝑅𝑆𝑆𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝑞 × −100 + 1 − 𝑞 × 10
𝜋𝑈𝑅𝑆𝑆𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎 = 𝑞 × (−10) + 1 − 𝑞 ×0
Assim, a combinação de estratégias mistas que faz os
jogadores indiferentes entre ameaçar e não ameaçar é
Este jogo possui dois equilíbrios de Nash em estratégias
pura e um equilíbrio em estratégia mistas.
É melhor escolher o equilíbrio em estratégia mista que dá
uma recompensa de -1 a cada um do jogadores, que é
uma recompensa melhor do que ter a chance de uma
ameaça mútua.
O JOGO DA GUERRA FRIA:
RESOLVENDO POR ESTRATÉGIAS MISTAS
𝑝, 1 − 𝑝 , 𝑞, 1 − 𝑞 =1
10,9
10,
1
10,9
10
Em todo o jogo que há um número
finito de jogadores, com um número
finito de estratégias, sempre há um
equilíbrio de Nash, provavelmente em
estratégias mistas.
ESTRATÉGIAS MISTAS
Que acontece em sequencia, ou seja, os
jogadores se movem (um após o outro) em
resposta a ações e reações do oponente.
Mais comumente representado pela forma
extensiva
Representação de possíveis movimentos de um
jogo no formato de uma árvore de decisões.
JOGOS SEQUENCIAIS
A BATALHA DOS SEXOS JOGADA
SEQUENCIALMENTE
Luísa escolhe primeiro, Carlos observa escolha e joga em
seguida.
No jogo simultâneo, haviam dois equilíbrios de Nash: (Futebol,
Futebol) e (Cinema, Cinema).
Agora a Luísa tem a vantagem de ser a primeira a escolher.
Matriz esconde a característica sequencial do jogo, (Futebol,
Futebol) não será um equilíbrio razoável neste jogo sequencial.
FORMA EXTENSIVA DO JOGO -
INFORMAÇÃO PERFEITA
Luísa
Carlos
Futebol
Cinema
Futebol
Cinema
Futebol
Cinema
1,2
0,0
0, 0
2, 1
Jogo com informação Perfeita.
Resolução do jogo por indução reversa
(Luísa, Carlos)
Carlos
Árvore de
Escolha
Equilíbrio por
indução reversa
ou equilíbrio de
Nash
sequencialmente
racional.
FORMA EXTENSIVA DO JOGO –
INFORMAÇÃO IMPERFEITA
Luísa
Carlos
Futebol
Cinema
Futebol
Cinema
Futebol
Cinema
1,2
0,0
0, 0
2, 1
Jogo com informação Imperfeita.
Resolução do jogo por subjogo perfeito
Carlos
O conceito de
subjogo
perfeito foi
desenvolvido
por Selten e é
um
refinamento
do conceito de
equilíbrio de
Nash.
JOGO COM BARREIRAS À
ENTRADA
Entrante
Escolhe
Estabelecido
escolhe
Fica de
fora
Entra
Luta
Não
luta
Luta
Não
luta
1, 9
1, 9
0, 0
2, 1 Estabelecido
escolhe
Lutar é uma ameaça crível? Entrante espera que Estabelecido aja
racionalmente.
Uma vez que a entrada ocorreu, o melhor a fazer é não lutar: ameaça
é vazia.
JOGO COM BARREIRAS À
ENTRADA
Entrante
Escolhe
Estabelecido
escolhe
Fica de
fora
Entra
Luta
Não
luta
Luta
Não
luta
1, 9
1, 9
0, 2
2, 1 Estabelecido
escolhe
Se estabelecido tiver
capacidade extra que
permita lutar no caso de
entrada e ganhar 2.
Lutar torna-se uma
ameaça crível.
Equilíbrio de Nash: (Fica
de fora, não luta)
Firma estabelecida
continua monopolista e
nunca usa capacidade
extra.
“Excesso” de
capacidade para manter
credibilidade da ameaça a
possíveis entrantes.
Jogos nos quais as ações são tomadas e
as decorrentes recompensas são
recebidos várias vezes, de modo
consecutivo.
JOGOS REPETIDOS
DILEMA DOS PRISIONEIROS
O resultado do jogo não repetido é dado pela combinação das
estratégias (Confessa, Confessa) que é um Equilíbrio de Nash
Estrito.
Se o jogo for repetido dez vezes os jogadores serão capazes de
cooperar e atingir um resultado que é Pareto eficiente, (Não
Confessa, Não Confessa)?
Qualquer jogo repetido em n finitas vezes, em que o jogo-base apresente apenas um equilíbrio de Nash, possui um único equilíbrio de Nash em subjogo perfeito, que consiste em jogar o equilíbrio de Nash do jogo-base em todas as n etapas.
Se um jogo-base possui mais de um equilíbrio de Nash, combinações de estratégias que não envolvam em alguma etapa do jogo um equilíbrio de Nash no subjogo podem constituir um equilíbrio de Nash em subjogo perfeito.
JOGOS COM UM NÚMERO FINITO DE
REPETIÇÕES
É a presença de estratégias que envolvam
retaliações em função do comportamento dos
demais jogadores ao longo da história do jogo
que possibilitam um equilíbrio de Nash em
subjogo perfeito composto por combinações
de estratégias que não necessariamente são
equilíbrio de Nash no jogo-base em todos os
subjogos.
AMEAÇAS E RETALIAÇÕES
A empresa automobilística informa a fornecedora que
pedirá peça em liga especial com entrega urgência no
primeiro ano e se a fornecedora entregar ela pedirá
peça em liga especial com entrega rápida, senão ela
pedirá peça em aço comum com entrega normal.
A fornecedora cumpre o acordo, pois a soma das suas
recompensas é maior que se ela não cumprir o acordo.
O JOGO DA COORDENAÇÃO DA CADEIA
PRODUTIVA
Empresa Automobilística Entrega Urgente Entrega Normal Entrega Rápida
Peça em Liga Especial 4,3 0,0 2,5
Peça em Aço Comum 0,1 2,2 0,1
Fornecedor
DILEMA DOS PRISIONEIROS JOGADO
INFINITAMENTE
Se o jogo for repetido um número infinito de vezes os jogadores
serão capazes de cooperar e atingir um resultado que é Pareto
eficiente, (Não Confessa, Não Confessa)?
Neste caso, estratégias severas permitem que a cooperação seja
atingida no jogo finito.
Estratégia de Gatilho:
Cooperar enquanto o outro jogador cooperar e
não cooperar nunca mais quando o outro jogador
não cooperar uma vez.
Tit-for-tat:
Começa cooperando e depois adota a estratégia
que o oponente adotou na última jogada.
ESTRATÉGIAS SEVERAS
Se um jogo-base possui uma combinação de
estratégias com uma recompensa maior que a
recompensa do equilíbrio de Nash do jogo-
base, então, se os jogadores foram pacientes
(taxa de paciência próxima de um) e os
jogadores adotem estratégias severas, existe
um equilíbrio de Nash em subjogo perfeito em
que a recompensa média esperada do jogo
infinito será o valor da maior recompensa do
jogo-base.
TEOREMA POPULAR: VERSÃO DO
FRIEDMAN (1971)
Mercados em que os produtos são
comprados e vendidos por meio de
processos formais de lances.
Há vários tipos de leilões:
Aberto versus fechados
Primeiro preço e segundo preço.
Valor privado e valor comum
LEILÕES
TIPOS DE LEILÃO
Leilão inglês (ou oral)
Leilão em que o vendedor solicita ativamente lances
mais altos de um grupo de potenciais compradores.
Leilão holandês
Leilão em que um vendedor inicia oferecendo o item a
um preço relativamente alto que depois é reduzido em
quantias fixas até que ocorra a venda.
Leilão de lances fechados
Leilão em que todos os lances são feitos
simultaneamente em envelopes lacrados e o vencedor
é aquele que oferece maior valor.
●
TIPOS DE LEILÃO
Leilão de primeiro preço
Leilão em que o preço de venda é igual ao lance mais alto.
Leilão de segundo preço
Leilão em que o preço de venda é igual ao segundo lance
mais alto.
Leilão de valor privado
Leilão em que cada potencial comprador sabe qual é sua
avaliação individual do objeto leiloado e as avaliações
diferem de um comprador para outro.
Leilão de valor comum
Leilão em que o item a ser leiloado tem o mesmo valor para
todos os potenciais compradores, mas este não sabe
exatamente qual é o valor e, por isso, as estimativas variam.
ESTRATÉGIAS EM LEILÕES DE VALOR
PRIVADO
Qualquer que seja o tipo do leilão, cada comprador
deve ter uma estratégia.
Em um leilão inglês, a estratégia é a escolha do valor
em que se deixará de oferecer lances.
Em um leilão holandês, a estratégia é o preço que os
indivíduos esperam utilizar para fazer o único lance.
Em um leilão de lances fechados, a estratégia é a
escolha do lance a ser colocado no envelope.
Suponhamos que você e outras quatro pessoas
estejam participando de um leilão oral para comprar
um pote de moedas, que irá para o vencedor a um
preço igual ao lance mais alto.
Depois de estimar o número de moedas no pote, qual
será sua decisão de lances mais favorável?
Maldição do vencedor
Situação em que o vencedor de um leilão de valor
comum obtém pior resultado por haver
superestimado o valor do item e oferecido um lance
maior.
ESTRATÉGIAS EM LEILÕES DE VALOR
COMUM
Em um leilão de valor privado, incentive o maior número
possível de compradores a participar.
Em um leilão de valor comum,
(a) utilize um leilão aberto em vez de um de lances
fechados, pois, como regra geral, um leilão inglês
(aberto) de valor comum gera maior receita esperada
do que um leilão de lances fechados; e
(b) revele informações sobre o valor real do objeto em
leilão para reduzir a preocupação com a maldição do
vencedor e incentivar mais lances.
Em um leilão de valor privado, estabeleça um lance
mínimo igual, ou até mesmo um pouco superior, ao valor
que o faria guardar o bem para uma venda futura.
MAXIMIZAÇÃO DA RECEITA DO LEILÃO
LANCES E COALIZÕES
Os compradores também podem aumentar
o poder de barganha ao reduzirem o
número de participantes no leilão ou a
frequência de lances. Em alguns casos, isso
pode ser conseguido legalmente por meio
da formação de grupos de compradores;
mas a manobra também pode ser feita
ilegalmente, graças a acordos de coalizão
que violam a legislação antistruste.
Como o eBay conseguiu dominar o mercado de leilões
pela Internet? Por que outros sites de leilão (como o do
Yahoo ou o da Amazon) não conseguiram avançar
sobre a fatia de mercado do eBay?
A resposta é que os leilões por Internet estão sujeitos a
externalidades de difusão muito fortes.
Se você quisesse leiloar algumas moedas raras ou
cartões do Pokémon, qual site de leilão você
escolheria?
Aquele que tivesse o maior número de compradores potenciais.
Da mesma maneira, se você estivesse atrás de moedas raras ou cartões do
Pokémon, você escolheria o site com o maior número de vendedores.
Como foi o primeiro grande site de leilão na Internet, o eBay já começou com a
maior fatia de mercado, e ela cresceu graças à externalidade de difusão.