Buscar

Slides da Aula 4 - Teoria dos Jogos

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Aula 4 Teoria dos jogos e
estratégia competitiva
1
● Introdução
● Parte1 - Jogos Estáticos
○ Estratégias Dominadas e Dominantes e Eficiência de 
Pareto 
○ Equilíbrio de Dominância Iterada
○ Equilíbrio de Nash
○ Estratégias Mistas
● Parte 2 - Jogos Dinâmicos
○ Jogos Sequenciais
○ Jogos Repetidos
○ Jogos com um número finito de repetições
○ Jogos Repetidos Infinitamente
● Jogos Evolucionários
● Teoria dos Jogos Comportamental
● Leilões
Tópicos
2
Introdução
3
• Teoria: Um conjunto organizado e coerente de ideias que 
nos ajudam a entender, explicar e fazer previsões.
Jogos e decisões estratégicas
4
Jogos e decisões estratégicas
Previsão da 
teoria dos 
jogos
A teoria dos Jogos:
• Captura uma importante força 
motriz
• Fornece uma referência útil para a 
análise
5
Lei do 
movimento
no vácuo
Jogos e decisões estratégicas
• “Você pode descobrir muito mais 
sobre uma pessoa em uma hora de 
jogo de que em um ano de 
conversa” (Platão, 427 A.C. - 347 
A.C.)
6
 
 
Jogos e decisões estratégicas
• Você interage com outras pessoas
• O que é melhor para você depende 
das ações das outras pessoas
• A teoria dos jogos ajuda a estudar 
como as pessoas se comportam 
em situações estratégicas.
7
Jogos e decisões estratégicas
• Por que precisamos da teoria dos 
jogos, em vez da teoria da 
maximização, para analisar uma 
situação estratégica?
• Porque precisamos de uma teoria 
adicional para analisar como um 
jogador antecipa o comportamento 
dos outros jogadores.
8
Aplicações: A teoria dos jogos tem aplicações nas seguintes 
áreas: 
• Economia
• Psicologia
• Ciências políticas
• Sociologia
• Biologia
• Ciência da computação.
Jogos e decisões 
estratégicas
9
Tudo é um jogo:
• poker, xadrez, futebol, dirigir, namoro, mercado de 
ações, Propaganda, estabelecer preços, entrar em 
novos mercados, construir uma reputação
• Negociar, fazer sociedades (com 1 ou mais sócios), 
procurar emprego no mercado de trabalho, selecionar 
candidatos a uma vaga
• Elaborar contratos, leilões, seguros, regulamentos 
ambientais
• Relações internacionais, acordos comerciais, campanhas 
eleitorais
• Muitas pesquisas econômicas modernas incluem elementos 
teoria dos jogos.
Onze pesquisadores de teoria dos jogos ganharam o Prêmio 
Nobel de Economia até o momento.
Jogos e decisões estratégicas
10
Jogos e decisões estratégicas
NÃO ESTAMOS 
BRIGANDO, 
MAMÃE...
… ESTAMOS 
APRENDENDO 
TEORIA DOS JOGOS
11
Breve Histórico
□ Nascido na Hungria, Von 
Neumann emigrou para os 
Estados Unidos na década 
de 1930. 
□ Sua primeira publicação 
sobre jogos data de 1928 
(“Zur Theorie der 
Gesellschaftsspiele”, 
Mathematische Annalen 100, 
295-320).
12
 
 
□O livro The Theory of Games and 
Economic Behavior foi publicado 
em 1944 e escrito em co-autoria 
com o economista alemão Oskar 
Morgenstern (1902-1977), também 
a esta altura emigrado para os 
Estados Unidos.
Breve Histórico
13
Breve Histórico
14
Jogo de soma zero com duas 
pessoas - é um jogo com dois 
jogadores (Jogador A e Jogador 
B), de tal forma que:
□A perda de um jogador é igual 
ao ganho do outro ("soma 
zero").
□O resultado do jogo é 
determinado pela escolha de 
cada jogador entre um 
conjunto fixo e finito de 
movimentos.
□Podemos representar o jogo 
usando uma matriz de payoffs 
que são os valores (utilidade) 
que cada jogador recebe 
quando o jogo termina.
Breve Histórico
Jog. A
Jog. B
Pedra Papel Tesoura
Pedra 0, 0 -1, 1 1, -1
Papel 1, -1 0, 0 -1, 1
Tesoura -1, 1 1, -1 0, 0
15
Payoffs de (Jog. A, Jog. B)
□Embora tenha sido a pedra 
fundamental da teoria dos jogos, 
The Theory of Games and 
Economic Behavior tinha uma 
limitação séria, limitação esta que 
era o fato de se concentrar em 
jogos de soma zero.
□O livro:
■ Definiu a representação de jogos 
em forma extensiva
■ Discutiu cooperação e formação 
de coalizões entre os jogadores.
Breve Histórico
16
□As ferramentas para 
analisar um número maior 
de modelos de interações 
estratégicas foram 
desenvolvidos a partir de 
1950, por:
■ John F. Nash, Jr.
■ John C. Harsanyi 
■ Reinhard Selten
□Os três foram premiados 
com o Nobel de economia 
em 1994.
Breve Histórico
17
□Nash definiu, em um 
artigo de 1951 (“Non-
Cooperative Games”, 
Annals of Mathematics 54, 
286-295), uma noção de 
equilíbrio para jogos, que 
não se restringia apenas 
aos jogos de soma zero.
Breve Histórico
Cidade Y
Cidade X
150 carros estão viajando de X para Y
(as distâncias então entre parênteses)
Tempo de viagem = 
(distância) + número de 
carros na estrada
payoffs = -(tempo de 
viagem)
18
 
 
□O equilíbrio de Nash no 
trânsito é 100 carros 
viajando pela estrada 
mais curta, 0 na estrada 
mais longa e 50 na 
estrada intermediária.
□Ninguém pode 
economizar tempo 
mudando de estrada, logo 
ninguém tem incentivo 
para mudar sua decisão.
Breve Histórico
Cidade Y
Cidade X
150 carros estão viajando de X para Y
(as distâncias então entre parênteses)
Tempo de viagem = (distância) + 
(número de carros na estrada)
payoffs = -(tempo de viagem)
19
□A principal contribuição do economista húngaro John C. 
Harsanyi (1920-2000) para a teoria dos jogos está 
relacionada ao fato de que, muitas vezes, alguns jogadores 
dispõem de informação privilegiada em relação aos demais 
sobre algum elemento importante do jogo.
□Em outros termos, temos uma situação de informação 
assimétrica. Harsanyi desenvolveu um modelo para tratar 
deste tipo de situação, ao qual denominou modelo de 
informação incompleta.
□Ele mostrou que o conceito de equilíbrio de Nash poderia 
ser estendido para os modelos de informação incompleta.
Breve Histórico
20
□O matemático e economista alemão Reinhard Selten 
(1930-) foi responsável por um refinamento da noção de 
equilíbrio, o qual ficou conhecido como “equilíbrio de 
Nash perfeito em subjogos”.
□O conceito de Equilíbrio de Nash Perfeito em Subjogos 
resultou em análises importantes, como as análises de 
compromissos e ameaças críveis.
Breve Histórico
21
□Na guerra fria entre Estados Unidos e a extinta 
União Soviética, teóricos de jogos tiveram uma 
participação importante.
□Em 1960, Thomas C. Schelling (Nobel em 
2005) publicou um de seus mais importantes 
livros, The Strategy of Conflict em um dos 
auges da Guerra Fria entre os Estados Unidos 
e a então União Soviética. 
Breve Histórico
22
• Jogos Estáticos - os jogadores movem-se 
simultaneamente e não há repetição do jogo
• Jogos Dinâmicos - os jogadores movem-se 
sequencialmente ou movem-se simultaneamente 
repetidamente ao longo do tempo, por isso, um jogador tem 
informações perfeitas sobre os movimentos anteriores de 
outros jogadores.
Classificação Geral dos 
Jogos
23
Parte 1 - Jogos Estáticos
24
 
 
• Jogo – situação na qual jogadores 
(participantes) tomam decisões 
estratégicas que levam em conta 
as atitudes e respostas uns dos 
outros.
• As regras do Jogo - Os 
elementos essenciais de um um 
jogo são os jogadores, as ações, 
os payoffs e as informações. 
Esses elementos reunidos são 
conhecidos como as regras do 
jogo.
Jogos e decisões estratégicas
25
1. Jogadores - são os indivíduos que tomam as decisões. 
Geralmente, a meta de cada jogador é maximizar sua 
utilidade pela escolha de ações.
2. Ação - é uma escolha que o jogador pode fazer
3. Payoffs – valores (utilidade) que cada jogador recebe 
quando o jogo termina.
4. Conjunto de Informações do jogador - é o conhecimento 
em dado instante do tempo dos valores das diferentes 
variáveis.
Jogos e decisões 
estratégicas
26
Jogos e decisões 
estratégicas
SEI QUE O JOÃO 
ADORA CARROS 
DE CORRIDA...
… ENTÃO SE EU CORTAR UM 
PEDAÇO PEQUENO COM AQUELE 
CARRO DE CORRIDA NELE, ELE 
VAI ESCOLHER ELE E DEIXAR O 
RESTO PARA MIM!
• É melhor cortar ou 
escolher o pedaço?
A resposta depende das 
informações:
• Se você conhece 
muito sobre a outra 
pessoa, é melhor 
cortar
• Se você não conhece 
a outra pessoa e ela 
não te conhece, é 
melhor escolher
• O conjunto de 
informações 
importa 27
A) Economia Normal
ExemploLavanderia Nova
Lavanderia Velha
Preço Baixo Preço Alto
Entra -100, -50 100, 100
Permanece fora 0, 50 0, 300
B) Economia em Recessão
Lavanderia Nova
Lavanderia Velha
Preço Baixo Preço Alto
Entra -160, -110 40, 40
Permanece fora 0, -10 0, 240
28
Payoffs de (Lavanderia Nova, Lavanderia Velha)
Payoffs de (Lavanderia Nova, Lavanderia Velha)
• Estratégia do jogador – é uma regra que ele usa para 
decidir a ação que irá escolher a cada instante do jogo, 
dado seu conjunto de informação.
• Conjunto de estratégias - é o conjunto de estratégias 
disponíveis para o jogador.
Exemplo: 
O conjunto de estratégias da Lavanderia Velha {
1- Preço alto se a Lavanderia Nova entrar, Preço baixo se a 
lavanderia Nova permanecer fora,
2- Preço baixo se a Lavanderia Nova entrar, Preço alto se a 
lavanderia Nova permanecer fora,
3- Preço alto, não importa o que 
4- Preço baixo, não importa o que }
Jogos e decisões 
estratégicas
29
1. Estratégia pura - cada jogador escolhe uma estratégia 
com certeza (atribui a probabilidade 1 a uma única 
estratégia)
2. Estratégia mista - um jogador escolhe entre as estratégias 
possíveis de acordo com as probabilidades que ele atribui 
a elas (atribui uma probabilidade para cada estratégia).
Jogos e decisões 
estratégicas
30
 
 
Equilíbrio - é uma combinação 
de estratégias que é a melhor 
estratégia para cada jogador do 
jogo
Jogos e decisões estratégicas
31
Estratégias Dominadas e 
Dominantes e Eficiência de Pareto
32
• Estratégia dominada – é uma estratégia estritamente 
inferior a algumas outras estratégias, não importando qual a 
estratégia escolhida pelo adversário, no sentido que 
qualquer que seja a estratégia que eles escolham, o payoff 
da estratégia dominada é menor.
Estratégias dominadas
33
• Estratégia dominante – é a melhor estratégia de um 
jogador, não importando o que o oponente faça.
• Equilíbrio em estratégia dominante - é uma combinação 
de estratégias, que consiste na estratégia dominante de 
cada jogador.
Exemplo: Dilema dos prisioneiros
Estratégias dominantes
Prisioneiro 1
Prisioneiro 2
Fazer silêncio Falar
Fazer silêncio -1, -1 -10, 0
Falar 0, -10 -8, -8
34Payoffs de (Prisioneiro 1, Prisioneiro 2)
• Jogo cooperativo – aquele no qual os participantes podem 
negociar contratos vinculativos de cumprimento obrigatório 
que lhes permitam planejar estratégias em conjunto.
• Jogo não cooperativo – jogo no qual a negociação e a 
existência de mecanismos que obriguem o cumprimento de 
contratos não são possíveis.
• Em qualquer jogo, tenha em mente o seguinte ponto-chave:
É essencial compreender o ponto de vista do oponente e 
deduzir as prováveis respostas dele às suas ações.
Jogos não cooperativos versus jogos 
cooperativos
35
• Jogo cooperativo sem conflito – membros de uma equipe 
escolhem qual tarefa cada um deve realizar, com mesmo 
grau de dificuldade, de modo a coordenar seus esforços
• Jogo cooperativo com conflito - A negociação com 
relação ao preço entre um monopolista e um monopsonista.
• Jogo não cooperativo com conflito – O dilema dos 
prisioneiros.
• Jogo não cooperativo sem conflito – Duas empresas 
estabelecem o padrão de um produto sem comunicar uma 
com a outra.
Jogos não cooperativos versus jogos 
cooperativos
36
 
 
• Quando a situação de pelo 
menos um agente melhora, 
sem que a situação de nenhum 
dos outros agentes piore, diz-
se que houve uma melhoria 
paretiana, ou uma melhoria 
no sentido de Pareto.
• Conceito assim denominado 
em homenagem ao economista 
italiano que o formulou, Vilfredo 
Pareto (1848-1923).
Jogos não cooperativos versus jogos 
cooperativos
37
Jogos não cooperativos versus jogos 
cooperativos
ESTOU 
MELHOR!
MELHORIA DE 
PARETO!
EU 
TAMBÉM!
ESTOU 
MELHOR!
TÔ NA 
MESMA.
ESTOU 
MELHOR!
EI! ALGUÉM 
ROUBOU TODO 
MEU 
DINHEIRO!
ESTOU 
BEM!
EU 
TAMBÉM!
ESTOU BEM! EU TAMBÉM!
ESTOU 
BEM!
EU 
TAMBÉM!
MELHORIA DE 
PARETO!
MELHORIA DE 
PARETO!
38
• A teoria de jogos cooperativos frequentemente leve em 
consideração questões de justiça, equidade e eficiência de 
Pareto.
• Se em uma dada situação, não é mais possível melhorar a 
situação de um agente sem piorar a situação de outro 
agente, diz-se que esta situação é um ótimo de Pareto.
• Um equilíbrio é eficiente no sentido de Pareto se nenhum 
jogador pode melhorar seu payoff sem que o payoff do outro 
jogador piore.
Jogos não cooperativos versus jogos 
cooperativos
39
• Um equilíbrio é eficiente no sentido de Pareto se nenhum 
jogador pode melhorar seu payoff sem que o payoff do outro 
jogador piore.
• O equilíbrio do Jogo abaixo é eficiente no sentido de 
Pareto?
Jogos não cooperativos versus jogos 
cooperativos
40
Prisioneiro 1
Prisioneiro 2
Fazer silêncio Falar
Fazer silêncio -1, -1 -10, 0
Falar 0, -10 -8, -8
Payoffs de (Prisioneiro 1, Prisioneiro 2)
• O conceito de melhoria paretiana é muito importante para a 
teoria econômica, uma vez que ele permite identificar 
possibilidades de aumento de eficiência que não teriam, em 
princípio, razão para enfrentar nenhum tipo de oposição.
• Se, em virtude de alguma mudança, alguém melhora sem 
que ninguém piore, por que alguém haveria de se opor a 
essa mudança que produz maior eficiência?
Jogos não cooperativos versus jogos 
cooperativos
41
• Impor uma tarifa elevada sobre as importações que chegam 
de outro país pode parecer uma boa idéia para um país 
isoladamente, mas se todos os países tomam a mesma 
decisão, o comércio internacional se reduz e todos saem 
prejudicados.
Jogos não cooperativos versus jogos 
cooperativos
42
País 1
País 2
Livre Comércio Impor tarifas
Livre Comércio 5, 5 1, 7
Impor tarifas 7, 1 3, 3
Payoffs de (País 1, País 2)
 
 
• Jogos em que ambos os jogadores possuem estratégias 
dominantes podem ser analisados facilmente, pois a 
estratégia ótima para cada jogador pode ser determinada 
sem a preocupação com as ações dos outros.
• Infelizmente, nem todos os jogos apresentam estratégias 
dominantes para cada um dos jogadores. 
Estratégias dominantes
43
Equilíbrio de Dominância 
Iterada
44
Entendendo a Lógica da Situação: a 
Batalha do Mar de Bismarck
□Em dezembro de 1942 o alto comando de 
guerra japonês decidiu transferir um maciço 
reforço da China e do Japão para Lae em 
Papua Nova Guiné.
□ Isso permitiria aos japoneses se recuperarem 
da derrota de Guadacanal e se prepararem 
para a próxima ofensiva aliada.
□Contudo, a movimentação de um volume 
grande de tropas por mar tinha um risco 
elevado, pois o poderio aéreo aliado na área 
era muito forte.
45 46
Entendendo a Lógica da Situação: 
a Batalha do Mar de Bismarck
□Mesmo assim os japoneses 
reuniram oito destróieres, oito 
barcos transportadores de tropas 
e aproximadamente 100 aviões 
de escolta para a operação.
□A frota japonesa partiu de 
Rabaul, também na Papua Nova 
Guiné, em 28 de fevereiro de 
1943, transportando em torno de 
6.900 soldados para reforçar 
suas linhas de defesa em Lae, 
navegando à velocidade 
máxima.
47
Entendendo a Lógica da Situação: 
a Batalha do Mar de Bismarck
□Um dado importante da situação era o fato de 
que o comboio japonês dispunha de duas rotas 
alternativas:
■1) A rota pelo sul de Papua Nova Guiné, que 
apresentava tempo bom e boa visibilidade
■2) A rota pelo norte, que apresentava tempo 
ruim e baixa visibilidade.
□Em qualquer uma das duas rotas, a viagem da 
frota japonesa se estenderia por 3 dias.
48
 
 
Entendendo a Lógica da Situação: 
a Batalha do Mar de Bismarck
□As forças aliadas, por outro lado, somente 
possuíam aviões de reconhecimento para 
pesquisar uma rota por vez.
□E a busca em qualquer uma das rotas 
consumia um dia inteiro.
□Desta forma, se as forças aliadas enviassem 
seus aviões de reconhecimento para a rota 
certa, poderiam começar o ataque em seguida.
49
Entendendo a Lógica da Situação: 
a Batalha do Mar de Bismarck
□Porém, se mandassem os aviões para a rota 
errada, perderiam um dia de bombardeios por 
terem escolhido a rota errada, 
independentemente do tempo estarbom ou 
ruim.
□Além disso, havia uma boa chance de 
perderem um dia de bombardeios na rota norte, 
pois ela apresentava tempo ruim.
50
Entendendo a Lógica da Situação: 
a Batalha do Mar de Bismarck
□Vamos desenvolver agora a seguinte atividade:
□ Imagine que você é o comandante das forças 
aliadas.
□Por qual rota você daria início às buscas?
□ Justifique a sua resposta.
51
Entendendo a Lógica da Situação: 
a Batalha do Mar de Bismarck
□ Qual o equilíbrio em estratégia 
dominante?
□ Não existe estratégia dominante 
para as tropas aliadas, logo não 
existe equilíbrio em estratégia 
dominante
Tropas 
Aliadas
Comboio Japonês
Norte Sul
Norte 2, -2 2, -2
Sul 1, -1 3, -3
52
Payoffs de 
(Tropas Aliadas, Comboio Japonês)
Equilíbrio de dominância iterada
□ Uma estratégia é fracamente dominante se ela é pelo 
menos tão boa quanto qualquer estratégia e melhor do 
que algumas estratégias
□ Uma estratégia é fracamente dominada se existir uma 
outra estratégia que é possivelmente melhor e nunca 
pior, i.e. fornecendo um payoff maior em alguma 
combinação de estratégias e nunca fornecendo um 
payoff menor.
□ Um equilíbrio de dominância iterada é uma 
combinação de estratégias encontrada ao excluirmos 
uma estratégia fracamente dominada de um dos 
jogadores, recalcularmos para encontrar quais 
estratégias restantes são fracamente dominadas, 
excluímos uma delas e continuamos o processo até 
sobrar apenas uma estratégia para cada jogador
53
Entendendo a Lógica da Situação: 
a Batalha do Mar de Bismarck
□ As tropas aliadas decidem que 
o comboio Japonês irá escolher 
Norte, pois é uma estratégia 
fracamente dominante
□ As tropas aliadas eliminam a 
estratégia “O comboio Japonês 
escolhe Sul” 
□ Logo, ao deletar a coluna Sul as 
Tropas Aliadas escolhem Norte, 
pois é uma estratégia dominante
□ A combinação de estratégias 
(Norte, Norte) é um equilíbrio de 
dominância iterada.
Tropas 
Aliadas
Comboio Japonês
Norte Sul
Norte 2, -2 2, -2
Sul 1, -1 3, -3
54
Payoffs de 
(Tropas Aliadas, Comboio Japonês)
 
 
55
● Em primeiro de março o comboio japonês foi avistado por 
um bombardeiro de patrulha B-24 Liberator.
● Os aliados tinham enviado seus aviões de reconhecimento 
para a rota norte e encontraram os japoneses ainda no 
primeiro dia.
● Após este primeiro contato, bombardeiros pesados norte-
americanos foram enviados, mas não conseguiram 
localizar o comboio japonês, devido ao mau tempo.
● No dia 2 de março houve novo contato visual com o 
comboio e vários B-17 Fortalezas Voadoras atacaram, 
afundando navios de suprimento e transporte.
● O Japão perdeu todos seus navios de transporte e metade 
(quatro) de seus destróieres: apenas 800 soldados 
conseguiram chegar ao seu destino em Lae.
● Calcula-se a perda de soldados e marinheiros japoneses 
em torno de 2.900 homens.
Entendendo a Lógica da Situação: a 
Batalha do Mar de Bismarck
56
Bombardeio de um Transportador na 
Batalha do Mar de Bismarck
57
Ataque de Aviões USAAF A-20
58
Aplicação Econômica da Batalha do Mar de 
Bismarck
Duas firmas, uma Norte-Americana e 
uma Japonesa, querem maximizar 
sua fatia de um mercado de tamanho 
constante, escolhendo entre dois 
tipos de produtos: 
□ Modelo de Luxo
□ Modelo Popular
□ A firma Norte-Americana tem uma 
vantagem de marketing e quer 
competir no mesmo mercado que 
sua concorrente.
□ A firma Japonesa prefere ficar 
sozinha num dos mercados
Tropas 
Aliadas
Comboio Japonês
Norte Sul
Norte 2, -2 2, -2
Sul 1, -1 3, -3
Fabricante
Americano
Fabricante Japonês
Modelo de 
Luxo
Modelo 
Popular
Modelo de 
Luxo 2, -2 2, -2
Modelo 
Popular 1, -1 3, -3
59Payoffs de 
(Fabricante Americano, Fabricante Japonês)
Payoffs de 
(Tropas Aliadas, Comboio Japonês)
Equilíbrio de Nash
60
 
 
• Para determinar o provável resultado de um jogo, 
procuramos estratégias “auto implementáveis” ou “estáveis”.
• O equilíbrio de Nash é um conjunto de estratégias no qual 
cada jogador faz o melhor que pode em função das ações 
de seus oponentes.
• Equilíbrio de Nash - é um conjunto de estratégias em que 
nenhum jogador tem incentivo de desviar de sua estratégia, 
dado que os outros jogadores não irão desviar
● Formalmente, um conjunto de estratégias (s*, s*) constitui 
um equilíbrio de Nash se: jogador i, π∀ i(s*i, s*-i) ≥ πi(s’i, s’-i), 
 s∀ ’i 
Equilíbrio de Nash
61
Equilíbrio de Nash 
Jogador 1 Jogador 2Melhor 
Resposta
62
• Muitas vezes não há equilíbrio em estratégia dominante
• Todo equilíbrio em estratégia dominante é um equilíbrio de 
Nash, mas nem todo equilíbrio de Nash é um equilíbrio em 
estratégia dominante.
• Algumas vezes não há equilíbrio de Nash em estratégias 
puras, em outras, há diversos.
• Sempre há pelo menos um equilíbrio de Nash, em 
estratégias puras ou em estratégias mistas.
Teorema 1 (Nash 1950): Todo jogo finito tem um equilíbrio 
(potencialmente em estratégias mistas).
Equilíbrio de Nash
63
Vamos encontrar o equilíbrio de Nash do jogo dos porcos na 
caixa
● Um porco grande e um pequeno são colocados numa caixa 
com um botão de controle numa ponta e uma máquina que 
libera comida na outra ponta.
● Quando um porco pressiona o botão sua perda de utilidade 
é equivalente a 2 unidades de comida, por causa do 
esforço, e a máquina libera 10 unidades de comida
● Se o porco grande chegar na comida primeiro o porco 
pequeno consegue comer apenas as sobras da comida (1 
unidade).
● Se o porco pequeno chegar na comida primeiro, ele come 
4 unidades de comida, se eles chegam ao mesmo tempo, o 
porco pequeno come 3 unidades de comida.
Equilíbrio de Nash
64
Vamos encontrar o equilíbrio de Nash do jogo dos porcos na 
caixa
Equilíbrio de Nash
Custo para pressionar 
o botão = 2 unidades
Quando o botão é 
pressionado, a comida 
aparece = 10 unidades
Exemplo: Porcos na Caixa
65
Equilíbrio de Nash
Porco Grande
Porco pequeno
Aperta Espera
Aperta 5, 1 4, 4
Espera 9, -1 0, 0
(Aperta, Espera) é o único equilíbrio de Nash
A combinação de estratégias (aperta, aperta) gera um payoff 
de 5 para o porco grande (10 unidades de comida, menos 
3 que o porco pequeno come, menos 2 por causa do 
esforço) e 1 para o porco pequeno (3 unidades de comida, 
menos 2 por causa do esforço).
66
Payoffs de (Porco Grande, Porco Pequeno)
 
 
Questão 11 (Anpec 2003) - Considere um jogo na forma 
normal resumido em termos da seguinte matriz de ganhos:
a) ( ) Para β = 1, U é uma estratégia dominante para o 
jogador 1 desde que α > 1.
b) ( ) Para α = 2 e β = 1, existe um único equilíbrio de Nash 
em estratégias puras.
c) ( ) Para α = 7 e β = 6, o equilíbrio de Nash em estratégias 
puras é Pareto eficiente.
d) ( ) Para α = 2 e β = 1, existe um único equilíbrio de Nash 
em estratégias mistas, no qual o jogador 1 joga U com 
probabilidade ½ e o jogador 2 joga L com probabilidade ½. 
Exemplo 
Jogador 1
Jogador 2
L R
U 3, 1 α, 0
D 0, 0 β, β
67
Payoffs de (Jogador 1, Jogador 2)
Equilíbrio de Nash
Homem
Mulher
Futebol Cinema
Futebol 2, 1 0, 0
Cinema 0, 0 1, 2
(Futebol, Futebol) e (Cinema, Cinema) são equilíbrios de 
Nash
68
Payoffs de (Homem, Mulher)
• Duas empresas produtoras de cereais matinais defrontam-
se com um mercado no qual duas novas variedades de 
cereais poderão ser lançadas com sucesso, desde que 
cada variedade seja introduzida apenas por uma empresa. 
• Há mercado para um novo cereal “crocante” e para um novo 
cereal “açucarado”, mas cada uma das empresas dispõe de 
recursos para lançar apenas um produto novo. 
• Portanto, a matriz de payoff para as duas empresas pode 
ser semelhante à da tabela a seguir.
O problema da escolha 
de produto
69
• Observe que o canto superior direito da matriz de payoff 
contém um equilíbrio de Nash. 
• Cada um dos equilíbrios de Nash é estável. 
• Entretanto, sem informações adicionais, não teremos meios 
de saber qual equilíbrio provavelmente resultará — ou se 
algum deles vai de fato ocorrer.
O problema da escolha 
de produto
70
• Decerto, ambas as empresas terão fortes estímulos paraalcançar um dos dois equilíbrios de Nash — caso ambas 
venham a produzir o mesmo tipo de cereal, as duas 
sofrerão prejuízos.
• O fato de as duas empresas não estarem autorizadas a 
entrar em acordo não significa que elas não possam 
alcançar um equilíbrio de Nash. 
• À medida que um setor se desenvolve, em geral se 
desenvolvem formas de entendimento, quando as empresas 
sinalizam umas para as outras a respeito dos caminhos que 
o setor deverá trilhar.
O problema da escolha 
de produto
71
Escolha do teclado
● Dois fabricantes decidem um padrão para o teclado de 
seus computadores
● QWERTY: não explicitamente projetado para a digitação 
mais eficiente
● Dvorak: projetado para digitação mais rápida
Equilíbrio de Nash 
72
 
 
Os equilíbrios de Nash são (QWERTY, QWERTY) e (Ótimo, 
Ótimo)
● Uma vez que a sociedade está presa no equilíbrio ruim 
(QWERTY, QWERTY), é difícil sair dele
Equilíbrio de Nash 
Fabricante 1
Fabricante 2
QWERTY Ótimo
QWERTY 1, 1 0, 0
Ótimo 0, 0 2, 2 
73
Payoffs de (Fabricante 1, Fabricante 2)
Equilíbrio de Nash
“Agora que já conseguimos nosso primeiro bilhão, vamos 
parar de tomar decisões jogando ‘pedra, papel e tesoura’.”
74
A propaganda como um dilema dos prisioneiros
Em 1º de janeiro de 1971 o congresso dos Estados Unidos 
aprovou uma lei proibindo o anúncios de cigarros na 
televisão.
Aplicação
Empresa 2
Empresa 1
Não Anunciar Anunciar
Não Anunciar 500, 500 0, 750
Anunciar 750, 0 250, 250
75
Payoffs de (Empresa 2, Empresa 1)
Exemplo: Dilema dos prisioneiros
Prisioneiro 1
Prisioneiro 2
Fazer silêncio Falar
Fazer silêncio -1, -1 -10, 0
Falar 0, -10 -8, -8
Equilíbrio de Nash 
Prisioneiro 1
Prisioneiro 2
Fazer silêncio Falar
Fazer silêncio 0, 0 -10, 0
Falar 0, -10 -8, -8
Exemplo: Dilema do criador de modelos
76
Payoffs de (Prisioneiro 1, Prisioneiro 2)
Payoffs de (Prisioneiro 1, Prisioneiro 2)
Equilíbrio de Nash 
Heródoto (429 A.C.) descreve a história de uma conspiração 
contra o imperador da Pérsia, que tem um raciocínio do tipo 
dilema dos prisioneiros.
● Um grupo de nobres se reúne e decide derrubar o 
imperador. Eles decidem esperar até a próxima reunião
● Um deles, chamado Dário, falou que se eles esperassem, 
ele sabia que um deles iria avisar o imperador da 
conspiração, porque se ninguém falasse ele o faria
● Ele também encontrou uma solução
● Eles iriam imediatamente ao palácio e matariam o 
imperador.
Nobre 1 Nobre 2
Fazer silêncio Falar
Fazer silêncio 7, 7 -10, 10
Falar 10, -10 0, 0
77Payoffs de (Nobre 1, Nobre 2)
Equilíbrio de Nash 
A conspiração também ilustra uma forma 
de jogo de coordenação. 
● Depois de matar o imperador, os 
nobres queriam selecionar um deles 
para ser o imperador
● Ao invés de brigar eles concordaram 
em ir a um certo monte ao 
amanhecer
● O dono do cavalo que rinchasse 
primeiro seria o imperador
● Heródoto conta que o cuidador do 
cavalo de Dário manipulou o 
esquema aleatório para que ele se 
tornasse o novo imperador.
78
 
 
Equilíbrio de Nash 
Os clientes estão espalhados e compram dos vendedores que 
estão mais próximos deles
Os vendedores decidem onde ficar e querem o maior número 
de clientes possível. 
Qual o equilíbrio de Nash para o jogo de localização?
79
Equilíbrio de Nash 
Eleições 1998
Eleições 2002
80
Equilíbrio de Nash 
● “O petista chega ao cargo mais conservador, com 
inflexão ao centro e sem assustar a direita do país [com 
quem até se associou para atingir a vitória]. O petista, 
eleito no dia do seu aniversário, assume o poder se 
dizendo disposto a firmar um pacto social com todos os 
setores da sociedade para resolver a crise pela qual o 
país atravessa.
● Sinal da aproximação e do bom trânsito do PT com 
setores conservadores foi a escolha do empresário José 
Alencar Gomes da Silva, 71, como vice na chapa. Político 
mineiro do PL, o senador será um dos interlocutores do 
novo governo com setores empresariais e conservadores 
do "establishment".(Folha de São Paulo Online, negrito 
adicionado)
81
Equilíbrio de Nash 
1º Turno das 
Eleições de 
2018
82
2º Turno das 
Eleições de 
2018
A Estratégia do Conflito 
• O livro de Thomas Schelling a Estratégia do Conflito, 
escrito em 1960 tem bastante aplicações modernas.
83
Pontos Focais
• No livro a Estratégia do Conflito, Thomas Schelling 
examina ameaças, sequestros e acordos.
• Talvez ele seja mais conhecido por seus jogos de 
coordenação
• Uma das contribuições importantes de Thomas 
Schelling, (ganhador do Prêmio Nobel de Economia em 
2005) é o conceito de ponto focal.
• Um ponto focal é um elemento que se destaca em um 
contexto e que permite aos indivíduos coordenarem suas 
decisões.
• Ele promove um resultado melhor para todos, mesmo 
quando não há a possibilidade de comunicação.
84
 
 
Pontos Focais
• Vamos ilustrar com um exemplo. Imagine que você 
chegou a uma pequena cidade onde deve encontrar uma 
pessoa, mas com a qual não tem como se comunicar 
para definir o local de encontro.
• Podemos supor que o seu celular descarregou e que 
você não tem como carregá-lo.
85
Pontos Focais
□ Imagine então que a cidade possui 100 casas, duas 
escolas e uma igreja.
□ Para onde você iria para se encontrar com a pessoa com 
quem você tem de encontrar, sem poder se comunicar?
86
Pontos Focais
□ A resposta é a igreja: é o único elemento que se destaca 
na cidade.
□ Um ponto focal é um elemento que se destaca do 
contexto, e que serve para os agentes coordenarem as 
suas escolhas, sem que seja necessário se comunicar.
87
Pontos Focais
• Esse é o papel, por exemplo, de um clube que seja 
frequentado por empresários que queiram fechar 
negócios.
• Ou de um lugar que serve de ponto de encontro para os 
torcedores de um clube de futebol... E por aí vai.
• Também é o caso dos chamados “conluios tácitos”, em 
que as empresas se coordenam em um cartel, sem que 
haja comunicação entre elas.
88
Pontos Focais
□ Neste caso basta a existência de uma empresa que sirva 
de líder às demais, anunciando publicamente seu preço, 
que será acompanhado pelas outras, como um ponto 
focal.
□ Pontos focais podem criar situações interessantes, com 
recomendações para lidar com determinadas situações 
que não são intuitivas.
89
Pontos Focais
□ Considere dois jogadores, Maria e João, que 
enfrentam três possibilidades de para coordenar suas 
decisões: α (alfa), β (beta) e γ (gama).
□ As recompensas se encontram descritas no jogo a 
seguir.
Maria
João
α β γ
α 3, 3 0, 0 0, 0
β 0, 0 1, 1 0, 0
γ 0, 0 0, 0 3, 3
90
Payoffs de (Maria, João)
 
 
Pontos Focais
□ No jogo descrito acima, coordenar suas decisões em α e 
γ produz para Maria e João uma recompensa de 3 para 
cada um.
□ Já coordenar suas decisões em β gera uma recompensa 
de apenas 1 para cada um.
91
Pontos Focais
□ Como João e Maria devem agir?
□ Pode-se imaginar que o mais interessante seria ambos os 
jogadores escolherem α ou γ. 
□ Com isto, cada um deles iria auferir a maior recompensa 
(3).
□ Se ambos escolherem β, cada um obterá uma 
recompensa de apenas 1.
□ Mas na verdade as coisas não são tão simples assim.
□ Em primeiro lugar, vamos lembrar que se trata de um jogo 
simultâneo.
92
Pontos Focais
□ Por ser um jogo simultâneo, João e Maria não conhecem 
as decisões um do outro.
□ Assim, há o risco de tomarem decisões descoordenadas.
□ Por exemplo, há o risco de (α, γ), ou seja, de Maria 
decidir α e João decidir γ, e com isto a recompensa de 
cada um ser 0!
□ Ou de (γ, α), ou seja, de Maria decidir γ e João decidir α, 
e com isto a recompensa de cada um ser novamente 0!
93
Pontos Focais
□ Na verdade, a única forma de evitar a descoordenação na 
ausência de possibilidades de comunicação é João e 
Maria escolherem (β, β)!
□ Com isto eles assegurariam uma recompensa de 1 para 
cada um deles, o que é melhor do que 0!
□ A razão disto é que (β, β) é um ponto focal! É a única 
combinação de estratégias no jogo que possui uma 
recompensa que se diferencia das demais.
□ Com isto eles assegurariamuma recompensa de 1 para 
cada um deles, o que é melhor do que 0!
94
Pontos Focais
□ Imagine que Maria e João estão em um shopping.
□ E que há vários restaurantes (que Maria gosta) e várias 
lojas de equipamentos eletrônicos (que João gosta).
□ Mas há apenas uma livraria, que ambos gostam, mas não 
tanto quanto os restaurantes e as lojas de produtos 
eletrônicos.
□ Para onde eles deveriam ir para se encontrarem, se 
algum celular estiver descarregado?
95
Estratégias Mistas
96
 
 
Estratégias Mistas
1. Estratégia pura - cada jogador escolhe uma estratégia 
com certeza (atribui a probabilidade 1 a uma única 
estratégia)
2. Estratégia mista - um jogador escolhe entre as 
estratégias possíveis de acordo com as probabilidades 
que ele atribui a elas (atribui uma probabilidade para 
cada estratégia).
97
Estratégias Mistas
• Estratégias mistas ocorrem frequentemente no mundo 
real
– Um jogador de futebol quando está com a bola 
próximo da grande área pode driblar, dar um passe 
ou chutar para o gol. 
– O mais importante é escolher uma ação que 
surpreenda o adversário!
98
Estratégias Mistas
• Para encontrar o equilíbrio de Nash em estratégias 
mistas use o método de igualar os payoffs 
• O fundamento deste método é: quando um jogador usa 
uma estratégia mista em equilíbrio, ele deve obter o 
mesmo payoff de cada uma das estratégias puras 
utilizadas na estratégia mista.
• Se uma de suas estratégias mistas tiver um payoff 
maior, o jogador deveria usar apenas ela ao invés da 
estratégia mista.
99
Estratégias Mistas
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
puras
Resposta: (Continuar, Desviar) e (Desviar, Continuar)
Smith
Jones
Continuar Desviar
Continuar -3, -3 2, 0
Desviar 0, 2 1, 1
Jogo do Frango
100
Payoffs de (Smith, Jones)
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
payoffJones(Desviar) = 0·(θSmith) + 1·(1-θSmith) (1)
payoffJones(Continuar) = -3·(θSmith) + 2·(1-θSmith) (2)
Igualando (1) com (2), e resolvendo para θSmith temos:
0·(θSmith) + 1·(1-θSmith) = -3·(θSmith) + 2·(1-θSmith) ⇒
 ⇒ 1 - θSmith = 2 - 5θSmith θ⇒ Smith = 0,25 
Smith JonesContinuar (θJones) Desviar (1-θJones)
Continuar (θSmith) -3, -3 2, 0
Desviar (1-θSmith) 0, 2 1, 1
Jogo do Frango
101
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
• Pode-se fazer um cálculo semelhante para encontrar θJones 
• Porém como o jogo é simétrico, θJones = 0,25, portanto o 
equilíbrio de Nash é θ = 0,25.
• Eles escolhem continuar com probabilidade 0,25.
• A probabilidades deles morrerem é θ·θ = 0,0625
• A probabilidade deles sobreviverem, uma informação muito 
importante para suas mães é (1 - 0,0625) = 0,9375
Smith JonesContinuar (θ) Desviar (1-θ)
Continuar (θ) -3, -3 2, 0
Desviar (1-θ) 0, 2 1, 1
Jogo do Frango
102
 
 
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
Mimi
Jeff
Procurar Emprego Descansar
Ajudar 4, 2 -1, 4 
Não Ajudar -1, 1 0, 0
103
Payoffs de (Mimi, Jeff)
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
payoffJeff(Procurar Emprego) = 2·(θMimi) + 1·(1-θMimi) (1)
payoffJeff(Descansar) = 4·(θMimi) + 0·(1-θMimi) (2)
Igualando (1) com (2), e resolvendo para θMimi temos:
2·(θMimi) + 1·(1-θMimi) = 4·(θMimi) + 0·(1-θMimi) ⇒
 ⇒ 1 + θMimi = 4θMimi θ⇒ Mimi = ⅓ = 0,333 104
Mimi
Jeff
Procurar Emprego (θJeff) Descansar
Ajudar (θMimi) 4, 2 -1, 4 
Não Ajudar -1, 1 0, 0
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
payoffMimi(Ajudar) = 4·(θJeff) - 1·(1-θJeff) (1)
payoffMimi(Não Ajudar) = -1·(θJeff) + 0·(1-θJeff) (2)
Igualando (1) com (2), e resolvendo para θJeff temos:
4·(θJeff) - 1·(1-θJeff) = -1·(θJeff) + 0·(1-θJeff) ⇒
 ⇒ -1 + 5θJeff = -θJeff θ⇒ Jeff = = 0,166 ⅙ 105
Mimi
Jeff
Procurar Emprego (θJeff) Descansar
Ajudar (θMimi) 4, 2 -1, 4 
Não Ajudar -1, 1 0, 0
Estratégias Mistas
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
puras
Resposta: Não tem equilíbrio em estratégias puras
Governo
Necessitado
Trabalhar Descansar
Ajudar 3, 2 -1, 3 
Não Ajudar -1, 1 0, 0
Jogo do Bem-estar
106
Payoffs de (Governo, Necessitado)
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
Jogo do Bem-estar
payoffNecessitado(Trabalhar) = 2·(θG) + 1·(1-θG) (1)
payoffNecessitado(Descansar)= 3·(θG) + 0·(1-θG) (2)
Igualando (1) com (2), e resolvendo para θG temos:
2·(θG) + 1·(1-θG) = 3·(θG) + 0·(1-θG) ⇒
 ⇒ 1 + θG = 3θG θ⇒ G = 1/2 = 0,5 107
Governo NecessitadoTrabalhar (θN) Descansar
Ajudar (θG) 3, 2 -1, 3 
Não Ajudar -1, 1 0, 0
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
Jogo do Bem-estar
payoffGoverno(Ajudar) = 3·(θN) - 1·(1-θN) (1)
payoffGoverno(Não Ajudar) = -1·(θN) + 0·(1-θN) (2)
Igualando (1) com (2), e resolvendo para θNtemos:
3·(θN) - 1·(1-θN) = -1·(θN) + 0·(1-θN) ⇒
 ⇒ -1 + 4θN= -θN θ⇒ N= 1/5 = 0,2 108
Governo NecessitadoTrabalhar (θN) Descansar
Ajudar (θG) 3, 2 -1, 3 
Não Ajudar -1, 1 0, 0
 
 
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
payoffGoverno = θG·[3·(θN) + (-1)·(1-θN)]+[1-θG][-1(θN) + 0·(1-θN)
 = θG·[3·θN - 1 + θN)] - θN + θG·θN
 = θG·[5·θN - 1] - θN (1)
Derivando (1) e igualando a zero, temos
Jogo do Bem-estar
Governo NecessitadoTrabalhar (θN) Descansar
Ajudar (θG) 3, 2 -1, 3 
Não Ajudar -1, 1 0, 0
109
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
payoffNecessitado = θN·[2·(θG) + 1·(1-θG)] + (1 - θN)·[3·(θG) + 0·(1-θG)]
 = 2·θN·θG + θN - θN·θG + 3·θG - 3·θN·θG
 = - θN·(2θG - 1) + 3·θG (2)
Derivando (2) e igualando a zero, temos
Jogo do Bem-estar
110
Governo NecessitadoTrabalhar (θN) Descansar
Ajudar (θG) 3, 2 -1, 3 
Não Ajudar -1, 1 0, 0
• Portanto, no equilíbrio de Nash, o governo escolhe ajudar 
com probabilidade 0,5 e o necessitado escolhe trabalhar 
com probabilidade 0,2
• Alternativamente, pode-se interpretar o equilíbrio de Nash da 
seguinte forma, supondo que ao invés de um necessitado, 
existam muitos necessitados com comportamento idêntico: o 
governo escolhe ajudar com probabilidade 0,5 e 20% dos 
necessitados escolhem trabalhar.
Encontre o(s) equilíbrio(s) de Nash do Jogo em estratégias 
mistas.
Jogo do Bem-estar
111
Governo NecessitadoTrabalhar (θN) Descansar
Ajudar (θG) 3, 2 -1, 3 
Não Ajudar -1, 1 0, 0
Parte 2 - Jogos Dinâmicos
112
• Jogos dinâmicos - os jogadores movem-se 
sequencialmente ou movem-se simultaneamente 
repetidamente ao longo do tempo, por isso, um jogador tem 
informações perfeitas sobre os movimentos anteriores de 
outros jogadores.
Jogos dinâmicos
113
2.1 Jogos Sequenciais
114
 
 
• Jogos sequenciais – aqueles em que os jogadores se 
movem em resposta a ações e reações do oponente.
• Problema modificado da escolha de produtos:
• Os dois novos cereais continuam sendo lucrativos desde 
que cada um seja introduzido por apenas uma empresa.
Jogos sequenciais
115
Payoffs de (Empresa 1, Empresa 2)
• Imagine que a Empresa 1 possa iniciar mais rapidamente a 
produção e lançar primeiro seu cereal. 
• Em consequência disso, teremos um jogo sequencial: 
○ A Empresa 1 faz o lançamento de um novo cereal e, 
posteriormente, a Empresa 2 fará o seu. 
• Qual deverá ser o resultado desse jogo? 
Jogos sequenciais
116
• Forma extensiva de um jogo – representação de possíveis 
movimentos de um jogo no formato de uma árvore de 
decisões.
• Forma extensiva do jogo da escolha do produto:
Forma extensiva de um jogo
117
Payoffs de (Empresa 1, Empresa 2)
O que podemos aprender com esses jogos?
É melhor ser o jogador 1 ou o jogador 2?
Diferenças entre um jogo estático e um jogo dinâmico 
sequencial:
● Num jogo de decisão simultânea os jogadores têm poucas 
informações sobre a escolha do adversário, pois não tem a 
oportunidade de observar um ao outro.
● Num jogo sequencialo segundo jogador adquire 
informações sobre a ação do primeiro jogador antes de 
tomar sua decisão.
Jogos sequenciais
118
Qual o problema para encontrar o equilíbrio de Nash desse 
jogo?
● Esse jogo ignora quem se moveu primeiro.
● Smith escolheu primeiro, então parece razoável permitir ou 
até mesmo exigir que Jones repense sua estratégia depois 
que Smith se movimenta.
Jogos sequenciais
Smith Jones
Disco Grande Disco Pequeno
Disco Grande 2, 2 -1, -1 
Disco Pequeno -1, -1 1, 1
119
Payoffs de (Smith, Jones)
● Um nó é um ponto no jogo em que algum jogador realiza 
uma ação ou o jogo termina.
● Um sucessor do nó X é um nó que pode ocorrer mais 
tarde no jogo, se X foi atingido.
● Um antecessor do nó X é um nó que deve ser alcançado 
antes que o X possa ser alcançado.
● O nó inicial é um nó sem antecessores.
● O nó final ou ponto final é um nó sem sucessores.
● Um ramo é uma ação do conjunto de ações de um jogador 
em um nó particular.
● Um caminho é uma sequência de nós e ramos que vai do 
nó inicial até um nó final.
Jogos sequenciais
120
 
 
A forma extensiva é uma descrição de um jogo consistindo 
em:
1. Um grupo de nós e ramos que não possui nenhuma 
rotação fechada (closed loops) que sai de um único nó 
inicial para os seus nós finais.
2. Uma uma legenda indicando qual nó pertence a qual 
jogador.
3. Os conjuntos de informações em que os nós de cada 
jogador estão divididos.
4. Os payoffs de cada jogador em cada nó final.
ou
A forma extensiva especifica os n jogadores, a sequência na 
qual eles fazem seus movimentos, as ações que eles podem 
realizar em cada jogada, as informações que cada jogador tem 
sobre os movimentos anteriores dos jogadores e a função de 
payoffs de todas as estratégias possíveis.
Jogos sequenciais
121
Jogo Segue o Líder
Disco pequeno
(1, 1)Disco pequeno
Disco pequeno
Disco Grande
Disco Grande
Disco Grande
Smith
Jones
Jones
(-1, -1)
(-1, -1)
(2, 2)
Conjunto de estratégias de Smith: {1-Disco pequeno, 2- Disco 
Grande}
122
Payoffs de (Smith, Jones)
Jogo Segue o Líder
Disco pequeno
(1, 1)Disco pequeno
Disco pequeno
Disco Grande
Disco Grande
Disco Grande
Smith
Jones
Jones
(-1, -1)
(-1, -1)
(2, 2)
Conjunto de estratégias de Jones: {
1- Disco Grande se Smith escolhe Disco pequeno, Disco 
Grande se Smith escolhe Disco Grande;
2- Disco pequeno se Smith escolhe Disco pequeno, Disco 
Grande se Smith escolhe Disco Grande;
3- Disco pequeno se Smith escolhe Disco pequeno, Disco 
pequeno se Smith escolhe Disco Grande; 
4- Disco Grande se Smith escolhe Disco pequeno, Disco 
pequeno se Smith escolhe Disco Grande}
123
Payoffs de (Smith, Jones)
Sub-jogo - todas as decisões subseqüentes que os jogadores 
podem tomar, dadas as ações já tomadas e os payoffs 
correspondentes.
Equilíbrio de Nash perfeito em subjogos (ENPS) - uma 
combinação de estratégias dos jogadores que são um 
equilíbrio de Nash em cada subjogo.
Indução retroativa - primeiro determine a melhor resposta do 
último jogador a se mover, determine a melhor resposta para o 
jogador que fez a penúltima jogada e repita o processo de 
volta ao início do jogo.
Jogos sequenciais
124
Jogos sequenciais
A líder estabelece sua 
quantidade ofertada
A seguidora estabelece 
sua quantidade ofertada
Lucros 
(𝛑A, 𝛑U)
125Payoffs de (American, United)
Jogos sequenciais
A United joga por último, então as melhores estratégias para a 
united são:
● 64
● 64
● 48
A American joga por penúltimo, a melhor estratégia para a 
American, dada as três estratégias acima da United é
● 96
Portanto o equilíbrio de Nash perfeito em subjogos é 
ENPS = (96, (48|96, 64|64, 64|48)) ou seja
ENPS = {96, 48 se a American escolher 96,
 64 “ “ “ “ 64,
64 “ “ “ “ 48,
O resultado é: American escolhe 96 e United escolhe 48
126
 
 
Jogos sequenciais
● O equilíbrio de Nash perfeito em subjogos requer que os 
jogadores acreditem que seus oponentes agirão de 
maneira ótima - de acordo com seus melhores interesses 
próprios .
● Nem todos os equilíbrios de Nash são equilíbrios de Nash 
perfeitos em subjogos.
127
Jogo Segue o Líder
Disco pequeno
(1, 1)Disco pequeno
Disco pequeno
Disco Grande
Disco Grande
Disco Grande
Smith
Jones
Jones
(-1, -1)
(-1, -1)
(2, 2)
Qual o ENPS?
128
Payoffs de (Smith, Jones)
Jogo Segue o Líder
Disco pequeno
(1, 1)Disco pequeno
Disco pequeno
Disco Grande
Disco Grande
Disco Grande
Smith
Jones
Jones
(-1, -1)
(-1, -1)
(2, 2)
ENPS = (Disco Grande, (Disco pequeno se Smith escolhe 
Disco pequeno, Disco Grande se Smith escolhe Disco 
Grande))
O resultado é: Smith escolhe Disco Grande e Jones escolhe 
Disco Grande. 129
Payoffs de (Smith, Jones)
Segundo McGee (1958), a firma estabelecida se prejudica 
mais ao fazer uma guerra de preços do que ao fazer um 
conluio com a concorrente.
Desencorajamento à entrada
130
Jogadores - Duas empresas, a concorrente e a estabelecida.
A ordem do jogo:
1. A concorrente decide se deseja entrar ou ficar de fora.
2. Se a concorrente entrar, a estabelecida pode fazer um 
conluio com ela ou lutar reduzindo o preço drasticamente.
Payoffs - Os lucros do mercado são 300 ao preço de 
monopólio e 0 ao preço de guerra. Os custos de entrada 
são 10. A concorrência de duopólio reduz a receita do 
mercado para 100, que é dividida uniformemente.
Desencorajamento à entrada
131
Conjunto de estratégias da concorrente: { Entrar, Não entrar}
Conjunto de estratégias da estabelecida: { Fazer conluio se a 
concorrente entrar, Lutar se a concorrente entrar}
● Os equilíbrios de Nash são:
○ (Entrar, Fazer Conluio) e (Não Entrar, Lutar)
Desencorajamento à entrada
Concorrente Estabelecida
Fazer conluio Lutar
Entrar 40, 50 -10, 0 
Não Entrar 0, 300 0, 300
132
Payoffs de (Concorrente, Estabelecida)
 
 
Conjunto de estratégias da concorrente: {Entrar, Não entrar}
Conjunto de estratégias da estabelecida: {Fazer conluio se a 
concorrente entrar, Lutar se a concorrente entrar}
● Qual o equilíbrio de Nash perfeito em subjogos?
Desencorajamento à entrada
Entrar
(40, 50)Fazer conluio
Lutar
Não Entrar
Concorrente
Estabelecida
(-10, 0)
(0, 300)
133
Payoffs de (Concorrente, Estabelecida)
● O equilíbrio de Nash perfeito em subjogos é:
○ (Entrar, Fazer Conluio se a Concorrente Entrar)
Desencorajamento à entrada
Entrar
(40, 50)Fazer conluio
Lutar
Não Entrar
Concorrente
Estabelecida
(-10, 0)
(0, 300)
134
Payoffs de (Concorrente, Estabelecida)
• Vamos supor que eu, como potencial comprador, não esteja 
disposto a pagar mais do que US$ 200.000 por uma casa.
• O vendedor, em última análise, estará disposto a abrir mão 
da casa por qualquer quantia acima de US$ 180.000.
• Posso declarar que jamais pagarei valor superior a 
US$ 200.000 pela casa. 
• Mas tal promessa é digna de crédito? 
• Pode ser, caso o vendedor conheça minha fama de durão e 
saiba que jamais quebrei uma promessa desse gênero.
Estratégia de negociação
135
• Mas suponhamos que eu não tenha tal reputação. 
• Assim, essa promessa, por si só, dificilmente melhorará 
minha posição na negociação.
• Entretanto, ela poderá funcionar se estiver associada a um 
movimento estratégico que lhe dê credibilidade.
• Um possível movimento estratégico poderia ser uma aposta 
para valer feita com uma terceira pessoa, nos seguintes 
termos, por exemplo: “Se eu pagar mais do que US$ 
200.000 por essa casa, darei US$ 60.000 a você”.
• Minha promessa se tornaria digna de crédito.
● Ver cena do filme
Estratégia de negociação
136
• Para desencorajar a entrada de um concorrente, a empresa 
estabelecida deve ser capaz de convencer qualquer 
potencial concorrente de que sua entrada não será 
lucrativa.
• Se a Empresa X acreditar que você está propenso a uma 
acomodação, mantendo o preço alto após sua entrada, 
concluirá que a entrada pode ser lucrativa e entrará.
• Mas e se você puder assumir um compromisso irrevogável 
que modificará seu comportamento caso a entrada ocorra?
• Como oconcorrente em potencial agora sabe que sua 
entrada resultará em guerra, é racional que ele permaneça 
fora do mercado.
Desencorajamento à 
entrada
137
Desencorajamento à entrada
Um jogo em que um jogador pode se comprometer a uma 
estratégia pode ser modelado de duas formas
1. Um jogo em que um equilíbrio imperfeito é aceitável
2. Modificando o jogo para substituir a ação Fazer A por Se 
comprometer a Fazer A, num nó anterior.
Um exemplo de 2. no jogo do Desencorajamento à Entrada é 
reformular o jogo para a estabelecida se mover primeiro
138
 
 
Desencorajamento à entrada
• Movimentos estratégicos - são ações adotadas pelos 
jogadores, que visam alterar alguma característica do jogo, 
em geral a ordem em que os jogadores jogam, ou as 
recompensas dos jogadores.
139
Desencorajamento à entrada
Entrar
Acomodar
Não Entrar
Concorrente
Estabelecida
(3, 7)
(0, 10)
● Qual o equilíbrio de Nash perfeito em subjogos?
○ (Entrar, Acomodar se a Concorrente Entrar)
(1, 2)Lutar
140
Payoffs de (Concorrente, Estabelecida)
Desencorajamento à entrada
• O mesmo jogo depois de um movimento estratégico da 
Dominante, em que ela pode decidir investir em capacidade 
produtiva inflexível (que não pode ser reduzida), ou flexível.
141
Desencorajamento à entrada
O que vai acontecer agora depois desse movimento 
estratégico?
Entrar
(2, 1)Lutar
Acomodar
Não Entrar
Concorrente
Estabelecida
(7, 3)
(10, 0)
Capacidade 
Flexível
Capacidade 
Inflexível
Estabelecida
Entrar
(-1, -1)Lutar
Acomodar
Não Entrar
Concorrente
Estabelecida
(-2, 3)
(8, 0)
142
Payoffs de (Estabelecida, Concorrente)
Desencorajamento à entrada
O resultado do jogo dado pelo equilíbrio de Nash perfeito em 
subjogos é (Capacidade Inflexível, Não Entra)
Entrar
(2, 1)Lutar
Acomodar
Não Entrar
Concorrente
Estabelecida
(7, 3)
(10, 0)
Capacidade 
Flexível
Capacidade 
Inflexível
Estabelecida
Entrar
(-1, -1)Lutar
Acomodar
Não Entrar
Concorrente
Estabelecida
(-2, 3)
(8, 0)
143
Payoffs de (Estabelecida, Concorrente)
Desencorajamento à entrada
Entrar
Construir mais 
alto
Não Entrar
Empresa X
Sears
(-50, 30)
(0, 100)
● Qual o equilíbrio de Nash perfeito em subjogos?
○ (Entrar, Não Construir mais alto se a Empresa X Entrar)
(60, 40)Não Construir mais alto
144
Payoffs de (Empresa X, Sears)
 
 
Desencorajamento à entrada
Entrar
Construir mais 
alto
Não Entrar
Empresa X
Sears
(-50, 40 )
(0, 90)
● Se a Sears tivesse originalmente construído uma plataforma 
no topo de seu edifício pelo custo 10 unidades
● Qual o equilíbrio de Nash perfeito em subjogos?
○ (Não Entrar, Construir mais alto se a Empresa X Entrar)
(60, 30)Não Construir mais alto
145
Payoffs de (Empresa X, Sears)
Jogos sequenciais
Smith Jones
Alto Baixo
Longe 1, 1 1, 1 
Perto 1, 4 0, 2
Longe (1, 1)
Alto
Perto
Baixo
Smith
Jones
(1, 4)
(0, 2)
● Quais os equilíbrios de Nash (fracos)?
● Quais os equilíbrios de Nash perfeitos em subjogos?
● Se há uma pequena probabilidade de erro (Trembling 
hand), qual o ENPS? 146
Payoffs de (Smith, Jones)
2.2 Jogos Repetidos
147
Jogos repetitivos – as ações são tomadas e os decorrentes 
payoffs são recebidos várias vezes, de modo consecutivo.
Características de um jogo repetitivo:
● As regras do jogo não mudam
● A única mudança é que o “histórico” do jogo aumenta na 
medida em que o tempo passa
● A cada repetição do jogo, cada organização poderá 
desenvolver uma reputação a respeito de seu próprio 
comportamento e estudar o dos concorrentes.
● Podem ser de dois tipos:
○ Jogos com um número finito de repetições
○ Jogos Repetidos infinitas vezes
Jogos repetitivos
148
2.2.1 Jogos com um número finito de 
repetições
149
Jogo do Dilema dos Prisioneiros 
repetido
150
Prisioneiro Gustavo Prisioneiro Eduardo
Não Confessa Confessa
Não Confessa 7, 7 -2, 8 
Confessa 8, -2 0, 0
Considere o seguinte Dilema dos Prisioneiros, obtido 
adicionando 8 a cada payoff da matrix vista em sala de aula
 Payoffs de: (Gustavo, Eduardo )
Dois alunos repetirão este jogo 10 vezes. O objetivo é obter a 
soma de payoffs mais alta possível (não apenas obter a 
soma de payoffs mais alta do que o adversário).
 
 
O paradoxo da rede de lojas (Chainstore Paradox) - 
Suponha que o jogo de desencorajamento à entrada seja 
jogado 20 vezes, num contexto de uma rede de lojas que 
está tentando impedir a entrada em 20 mercados onde tem 
lojas.
Jogos com um número finito de 
repetições
151
Concorrente Estabelecida
Fazer conluio Lutar
Entrar 40, 50 -10, 0 
Não Entrar 0, 300 0, 300
Solução: Use indução retroativa.
 
Payoffs de (Concorrente, Estabelecida)
Jogos repetitivos
152
Concorrente Estabelecida
Fazer conluio Lutar
Entrar 40, 50 -10, 0 
Não Entrar 0, 300 0, 300
Solução: Use indução retroativa.
● No último jogo, a concorrente decide entrar e a 
estabelecida irá fazer conluio, não importa qual seja o 
histórico dos outros jogos (o jogo é semelhante ao jogo 
estático).
● Todo mundo sabe que no último jogo a estabelecida fará 
conluio, então ela não tem como fazer uma reputação de 
quem irá lutar, logo no penúltimo jogo ela irá fazer conluio.
● O mesmo acontecerá nos outros 18 jogos (mercados)
● Logo, ela fará conluio em todos os jogos (mercados), 
inclusive no primeiro
Payoffs de (Concorrente, Estabelecida)
Jogos repetitivos
153
Concorrente Estabelecida
Fazer conluio Lutar
Entrar 40, 50 -10, 0 
Não Entrar 0, 300 0, 300
Solução: Use indução retroativa.
● Esse resultado é conhecido como o paradoxo da rede de 
lojas (Selten, 1978)
● Se o jogo estático possui apenas um equilíbrio de Nash, o 
jogo com um número finito de repetições tem um único 
equilíbrio perfeito - o equilíbrio é o mesmo do jogo estático.
● Se o jogo possui mais de um equilíbrio de Nash, então o 
jogo com um número finito de repetições pode ter outros 
equilíbrios perfeitos além do mesmo do jogo estático. 
Payoffs de (Concorrente, Estabelecida)
Jogos com um número finito de 
repetições
154
Prisioneiro Linha Prisioneiro Coluna
Fazer Silêncio Acusar
Fazer Silêncio 5, 5 -5, 10 
Acusar 10, -5 0, 0
Payoffs de: (Linha, Coluna)
Solução: Use indução retroativa.
 
Dilema dos prisioneiros repetido - Suponha que o jogo do 
dilema dos prisioneiros seja jogado 20 vezes
Jogos repetitivos
155
Payoffs de: (Linha, Coluna)
Solução: Use indução retroativa.
● No último jogo, o prisioneiro Linha decide acusar e o 
prisioneiro Coluna irá acusar, pois esse é o equilíbrio de 
Nash.
● Todos sabem que no jogo 20 ambos irão acusar, logo no 
jogo 19 ambos irão acusar.
● O mesmo acontecerá nos outros 18 jogos
● Logo, ambos irão acusar em todos os jogos, inclusive no 
primeiro e esse é o único equilíbrio de Nash
● Esse resultado é conhecido como o paradoxo da rede de 
lojas (Chainstore Paradox) (Selten, 1978)
 
Prisioneiro Linha Prisioneiro Coluna
Negar Acusar
Negar 5, 5 -5, 10 
Acusar 10, -5 0, 0
2.2.2 Jogos Repetidos Infinitamente
156
 
 
Jogo do Dilema dos Prisioneiros 
repetido
157
Prisioneiro Gustavo Prisioneiro Yasmin
Não Confessa Confessa
Não Confessa 7, 7 -2, 8 
Confessa 8, -2 0, 0
Considere o seguinte Dilema dos Prisioneiros, obtido 
adicionando 8 a cada payoff da matrix vista em sala de aula
 Payoffs de: (Gustavo, Yasmin )
Dois alunos repetirão este jogo “infinitas” vezes. O objetivo é 
obter a soma de payoffs mais alta possível (não apenas 
obter a soma de payoffs mais alta do que o adversário).
Payoffs de: (Linha, Coluna)
● É plausível considerar que o jogo dilema dos prisioneiros 
se repete infinitamente
● Não importa se o jogo se repete infinitamente ou se é 
incerto quantas vezes ele vai ser jogado, a análise é a 
mesma.
● Neste caso o Paradoxo da rede de lojas falha, pois o 
raciocínio dele depende do último jogo
● Podemos encontrar um equilíbrio perfeito simples para o 
dilema de prisioneiros repetido infinitamente no qual ambos 
os jogadores cooperam - um jogo no qual ambos os 
jogadores adotam a estratégia intransigente
Jogos repetitivos infinitamente
158
PrisioneiroLinha Prisioneiro Coluna
Negar Acusar
Negar 5, 5 -5, 10 
Acusar 10, -5 0, 0
Payoffs de: (Linha, Coluna)
A estratégia abaixo gera um equilíbrio escolhendo Negar
A estratégia intransigente
1. Comece escolhendo Negar.
2. Continue a escolher Negar a menos que algum jogador 
tenha escolhido Acusar, nesse caso, escolha Acusar para 
sempre.
A estratégia intransigente é um exemplo de uma estratégia de 
gatilho.
Jogos repetitivos infinitamente
159
Prisioneiro Linha Prisioneiro Coluna
Negar Acusar
Negar 5, 5 -5, 10 
Acusar 10, -5 0, 0
Payoffs de: (Linha, Coluna)
Observações:
● Se o prisioneiro Coluna cooperar, ele continuará recebendo 
o payoff alto de (Negar, Negar) para sempre.
● Se ele Acusar, ele receberá o payoff mais alto (Negar, 
Acusar) uma única vez, mas o melhor que pode esperar de 
agora em diante é um payoff (Acusar, Acusar).
Jogos repetitivos infinitamente
160
Prisioneiro Linha Prisioneiro Coluna
Negar Acusar
Negar 5, 5 -5, 10 
Acusar 10, -5 0, 0
Payoffs de: (Linha, Coluna)
Nem toda estratégia que pune Acusar é perfeita. Um exemplo 
notável é a estratégia olho por olho, dente por dente.
Olho por olho, dente por dente
1. Comece escolhendo Negar.
2. Depois disso, no período n escolha a ação que o outro 
jogador escolheu no período (n − 1).
Estratégia “olho por olho, dente por dente” – o jogador 
responde de forma igual às jogadas do oponente, cooperando 
com os oponentes que cooperam e retaliando os que não o 
fazem.
Jogos repetitivos infinitamente
161
Prisioneiro Linha Prisioneiro Coluna
Negar Acusar
Negar 5, 5 -5, 10 
Acusar 10, -5 0, 0
Payoffs de: (Linha, Coluna)
● Se o prisioneiro Coluna usa essa estratégia, o prisioneiro 
Linha não tem incentivo de Acusar na primeira rodada, pois 
se ele cooperar continuará recebendo o payoff alto (Negar, 
Negar).
● Se ele Acusar os jogadores alternarão (Acusar, Negar) com 
(Negar, Acusar) para sempre.
● O payoff médio do prisioneiro Linha com essa alternância é 
menor do que o payoff de (Negar, Negar), então isso 
destrói o ganho de Acusar na primeira rodada.
Jogos repetitivos infinitamente
162
Prisioneiro Linha Prisioneiro Coluna
Negar Acusar
Negar 5, 5 -5, 10 
Acusar 10, -5 0, 0
 
 
Payoffs de: (Linha, Coluna)
● A estratégia olho por olho, dente por dente quase nunca é 
perfeita no Dilema dos Prisioneiros repetido infinitamente, 
porque não é racional para o prisioneiro Coluna punir a 
estratégia Acusar inicial do prisioneiro linha.
● Aderir às punições desta estratégia resultam em uma 
alternância terrível de Acusar e Negar, então seria melhor 
o prisioneiro Coluna ignorar o primeiro Acusar do 
prisioneiro Linha
Jogos repetitivos infinitamente
163
Prisioneiro Linha Prisioneiro Coluna
Negar Acusar
Negar 5, 5 -5, 10 
Acusar 10, -5 0, 0
Payoffs de: (Linha, Coluna)
● A estratégia olho por olho, dente por dente, ao contrário da 
estratégia intransigente, não é perfeita em subjogos.
Jogos repetitivos infinitamente
164
Prisioneiro Linha Prisioneiro Coluna
Negar Acusar
Negar 5, 5 -5, 10 
Acusar 10, -5 0, 0
• Estratégia maximin – estratégia que maximiza o ganho 
mínimo que pode ser obtido.
Estratégias maximin
165
Empresa 1 Empresa 2
Não investe Investe
Não investe 0, 0 -10, 10 
Investe -100, 0 20, 10
Payoffs de (Empresa 1, Empresa 2)
O “equilíbrio” em estratégias maxmin - é o “equilíbrio” 
quando cada jogador utiliza a estratégia maxmin.
O equilíbrio em estratégias maxmin é (Não investe, Investe)
Estratégias maximin
166
Empresa 1 Empresa 2
Não investe Investe
Não investe 0, 0 -10, 10 
Investe -100, 0 20, 10
Payoffs de (Empresa 1, Empresa 2)
Características:
● Parece ser a estratégia razoável porque cada jogador tenta 
se proteger da maior perda possível.
● Não é a melhor estratégia para pessoal aversas ao risco, 
pois a aversão ao risco já está descrita nos payoffs 
(medidos em utilidade)
● Para que a estratégia maxmin seja racional é preciso que o 
jogador acredite que seu adversário escolha a estratégia 
mais prejudicial e tenha o desejo de prejudicar seu 
adversário, ao invés de buscar seu melhor interesse 
pessoal
3 Jogos Evolucionários
167
Jogos Evolucionários
168
● Considere um jogo com jogadores idênticos que competem 
emparelhados
● Suponha que o equilíbrio seja um conjunto de estratégias 
em que nenhum jogador com uma nova estratégia possa 
entrar no ambiente (invadir) e receber um payoff esperado 
maior que os jogadores mais antigos
● No modelo mais comum na biologia, todos os jogadores 
adotam a mesma estratégia no equilíbrio, chamada de 
estratégia evolucionariamente estável (EEE).
● Esse equilíbrio envolve apenas uma estratégia (até aqui 
estudamos um conjunto de estratégias de equilíbrio )
 
 
Jogos Evolucionários
169
● EEE é um refinamento do equilíbrio de Nash, mais restrito 
pois exige de que o EEE não só seja a melhor resposta, 
mas que 
a. Tenha o maior payoff de todas as estratégias usadas no 
equilíbrio (o que exclui os equilíbrios de Nash com 
payoffs assimétricos) e 
b. Seja estritamente a melhor resposta para ela mesma (o 
que exclui os equilíbrios de Nash fracos).
Equilíbrio de Nash e EEE
Homem
Mulher
Futebol Cinema
Futebol 2, 1 0, 0
Cinema 0, 0 1, 2
● (Futebol, Futebol) e (Cinema, Cinema) são equilíbrios de 
Nash em estratégias puras mas não são EEE porque em 
cada um deles o payoff de cada jogador é maior do que o 
do outro
● O equilíbrio de Nash em estratégias mistas é EEE, 
porque o jogador que usa a estratégia de equilíbrio recebe 
um payoff tão alto quanto qualquer outro jogador 170
Payoffs de (Homem, Mulher)
Jogos Evolucionários
171
● Definição: Uma estratégia s* é uma estratégia 
evolucionariamente estável, ou EEE, se usando a notação 
π(si,si-1) para o payoff do jogador i quando seu oponente 
usa a estratégia s-i , para qualquer outra estratégia s’ ou
1. π(s*,s*) > π(s’,s*)
ou
(a)π(s*,s*) = π(s’,s*)
e
(b)π(s*,s’) > π(s’,s’)
Jogos Evolucionários
172
(a) π(produção baixa, produção baixa) = π(produção alta, 
produção baixa),
e 
(b) π(produção baixa, produção alta) > π(produção alta, 
produção alta),
Portanto, produção baixa, não é EEE
Equilíbrio de Nash e EEE
Smith
Jones
Produção baixa Produção alta
Produção baixa 1, 1 1, 1
Produção alta 1, 1 2, 2
● (Produção baixa, Produção baixa) e (Produção alta, 
Produção alta) são equilíbrios de Nash em estratégias 
puras mas (Produção baixa, Produção baixa) não é EEE 
porque não é estritamente a melhor resposta para ela 
mesma
173
Payoffs de (Smith, Jones)
Equilíbrio de Nash e EEE
Pássaro Um
Pássaro Dois
Agredir (Hawk) Acalmar (Dove)
Agredir (Hawk) -1, -1 2, 0
Acalmar (Dove) 0, 2 1, 1
● Há duas populações de pássaros, que se comportam de 
forma agressiva ou pacífica. 
● Dois pássaros dessa população decidem seu 
comportamento ao se encontrarem
● Um recurso com valor V = 2 está em jogo quando dois 
pássaros se encontram
● Se ambos se agredirem eles recebem um payoff esperado 
de -1 174
Payoffs de (Pássaro Um, Pássaro Dois)
 
 
Equilíbrio de Nash e EEE
Pássaro Um
Pássaro Dois
Agredir (Hawk) Acalmar (Dove)
Agredir (Hawk) -1, -1 2, 0
Acalmar (Dove) 0, 2 1, 1
● Há algum equilíbrio de Nash em estratégias puras?
● Há alguma EEE?
● Há dois equilíbrios de Nash assimétricos em estratégias 
puras
● Não há nenhuma EEE em estratégias puras
● Para encontrar o EEE utilizamos a mesma técnica que 
utilizamos para encontrar o Equilíbrio de Nash em 
estratégias mistas 175
Payoffs de (Pássaro Um, Pássaro Dois)
Equilíbrio de Nash e EEE
Pássaro Um
Pássaro Dois
Agredir (Hawk) (θ) Acalmar (Dove)
Agredir (Hawk)(θ) -1, -1 2, 0
Acalmar (Dove) 0, 2 1, 1
Payoffpássaro um (Agredir) = -1·θ + 2·(1-θ) (1)
Payoffpássaro um (Acalmar) = 0·θ + 1·(1-θ) (2)
Igualando (1) e (2), temos:
-θ + 2 - 2θ = 1 - θ θ = 0,5⟹
● O equilíbrio é estável: se 60% da população decide Agredir, 
se um pássaro decidir Acalmar, terá um payoff maior, logo 
sua população aumenta e a proporção volta para 50%
 
176
Payoffs de (Pássaro Um, Pássaro Dois)
Exercício
(2016,Q3)Há muito tempo atrás, uma planície era frequentada por 
guerreiros e comerciantes. Quando por acaso dois comerciantes se 
encontravam, trocavam mercadorias, o que rendia ganho de +5 para 
cada um. Quando dois guerreiros se encontravam, lutavam 
ferozmente, de modo que o pay-off resultante para ambos era -5. 
Mas quando um guerreiro encontrava um comerciante, pilhava os 
bens deste, obtendo pay-off de +10 e deixando o comerciante com 
0. Quando o ganho de um tipo superava o do outro, a proporção de 
indivíduos pertencentes a esse tipo crescia. Considere a proporção 
de guerreiros na população. Avalie as proposições:
(0) ( ) Quanto maior a proporção de guerreiros, menor o ganho 
esperado de ser comerciante.
(1)( ) Quanto maior a proporção de guerreiros, menor o ganho 
esperado de ser guerreiro.
(2)( ) No equilíbrio de Nash, p = 0,6.
(3)( ) O ganho esperado de guerreiros e comerciantes, em 
equilíbrio, será 3,5.
(4)( ) O equilíbrio não é evolucionariamente estável. 177
4 Teoria dos Jogos Comportamental
178
Economia Comportamental
179
● Até agora, assumimos que as pessoas são racionais e que 
maximizam sua utilidade.
● A economia comportamental adiciona o conhecimento da 
psicologia e de pesquisas empíricas sobre cognição 
humana e tendências emocionais no modelo econômico 
para melhorar as previsões sobre as decisões econômicas
○ Exemplo: Preferências transitivas (teoria do 
consumidor). Weinstein (1968) descobriu que 93% dos 
adultos, ao escolher 10 produtos, ordenados em pares, 
deram respostas transitivas, enquanto que apenas 
79,2% das crianças entre 9 e 12 anos deram respostas 
transitivas
Teoria dos Jogos Comportamental
180
No jogo estático abaixo, qual o resultado esperado (equilíbrio 
de Nash)?
● Escolha um valor percentual entre 0% e 100%. Você e um 
colega irão dividir um bolo, vocês não ganham nada se a 
soma do percentual for acima de 100% e ganham o 
percentual escolhido se ele for menor ou igual a 100%.
 
 
Teoria dos Jogos Comportamental
181
● 5/14 = 35% escolheu 50%
Teoria dos Jogos Comportamental
182
● 5/15 = 33,3% escolheu 50%
Teoria dos Jogos Comportamental
183
As pessoas podem estar sujeitas a tendências emocionais ou 
podem ter um poder limitado de realizar cálculos, o que pode 
gerar decisões irracionais. 
● Um exemplo em que ocorrem estratégias não ótimas são 
os jogos de intimação (ultimatum games)
● Nesses jogos uma pessoa (o proponente) faz uma 
proposta do tipo “pegar ou largar” para outra pessoa (o 
respondedor)
● O respondedor tem que aceitar ou rejeitar a proposta e não 
tem nenhuma oportunidade de fazer uma contraproposta
● O jogo de intimação pode ser visto como um jogo 
sequencial em que o proponente se move primeiro 
Jogo de Intimação
184
● O jogo consiste em dividir $ 10. 
● Um proponente faz uma proposta de um valor específico 
para o respondente
● A outra pessoa decide se aceita ou rejeita a proposta
○ Se aceitar, a pessoa fica com o valor ofertado e o 
proponente fica com o resto dos $10.
○ Se rejeitar, ambos ficam com $ 0.
Jogo de Intimação
185
● O jogo consiste em dividir $ 10. 
● Um proponente faz uma proposta de um valor específico 
para o respondente
● O respondente decide se aceita ou rejeita a proposta
○ Se aceitar, o respondente fica com o valor ofertado e o 
proponente fica com o resto dos $10.
○ Se rejeitar, ambos ficam com $ 0.
● Qual o E.N.P.S desse jogo?
● Usando indução retroativa, sabemos que a melhor 
resposta do último jogador é aceitar, se a oferta x for 
positiva
● Logo, a melhor estratégia para o penúltimo jogador é 
escolher o menor valor possível positivo de x, $ 0,01
Experimento
186
● Camerer (2004), designou aleatoriamente estudantes num 
laboratório de informática para serem proponentes e 
respondentes. 
● O jogo consistia em dividir $ 10
● O valor mais comum de ofertas foi entre $ 3 e $ 4, muito 
maior que a oferta “racional”
● Ofertas menores que $ 2 foram muito raras, e quando 
ocorriam, eram rejeitadas cerca de metade das vezes em 
que foram ofertadas
● Mesmo quando o valor a ser dividido era de $ 100, a oferta 
era cerca de 30% a 40 % do valor total
● Eckel e Grossman (1996), descobriram que os homens são 
mais propensos que as mulheres a punir, se o custo 
pessoal é alto num jogo de intimação
 
 
5 Leilões
187
Leilão - uma venda em que 
uma propriedade ou um 
serviço é vendido para a 
pessoa que ofertar o maior 
lance.
● Casas
● Carros
● Cavalos
● Relíquias
● Obras de arte
Leilões
188
● Contratação de serviços e 
compra produtos pelo Governo
● Ondas de rádio para estações 
de rádio
● Partes do espectro 
eletromagnético para telefone 
celular
● Mercado de energia elétrica e 
transporte
Leilões
189
● Títulos do Tesouro
● Direitos de transmitir eventos 
esportivos, como por exemplo 
diversos campeonatos de 
futebol
Leilões
190
Três componentes principais:
1. O número de unidades vendidas
2. O formato dos lances
3. O valor que os potenciais compradores atribuem ao bem.
Leilões
191
• Leilão inglês (ou oral) – leilão em que o vendedor solicita 
ativamente lances mais altos de um grupo de potenciais 
compradores.
• Leilão holandês – leilão em que um vendedor inicia 
oferecendo o item a um preço relativamente alto que depois 
é reduzido em montantes fixos até que ocorra a venda.
Leilões
192
 
 
• Leilão de primeiro preço (Leilão de lances fechados de 
1º preço) – Cada participante submete um lance, sem 
saber o valor dos outros lances. O participante com lance 
mais alto paga o valor de seu lance e ganha o objeto.
• Leilão de segundo preço (Leilão de lances fechados de 
2º preço) – Cada participante submete um lance, sem 
saber o valor dos outros lances. Os lances são abertos e o 
participante com lance mais alto paga o valor do segundo 
maior lance e ganha o objeto.
Leilões
193
● Leilão em que todos pagam - leilão em que todos os 
lances são feitos simultaneamente. O participante que der 
o maior lance vence, e cada participante paga o valor do 
seu lance.
Exemplos:
● Os competidores em competições esportivas ou eleições 
gastam seu tempo, esforços e dinheiro, sem nenhum 
reembolso para os perdedores.
● A corrida armamentista nuclear foi um exemplo clássico de 
lances excessivos. 
Leilões
194
1. Leilão de lance fechado de primeiro preço. Cada 
pessoa submete um lance pelo classroom. 
2. Leilão de lance fechado de segundo preço. Cada 
pessoa submete um lance pelo classroom. 
3. Leilão em que todos pagam. Cada pessoa submete um 
lance pelo classroom 
4. Leilão Inglês
5. Leilão Holandês 
Leilões
195
• Leilões de valor comum – leilões em que o item a ser 
leiloado tem o mesmo valor para todos os potenciais 
compradores, mas estes não sabem exatamente qual é o 
valor e, por isso, suas estimativas variam.
• Leilões de valor privado – cada comprador em potencial 
atribui um valor pessoal diferente para o bem e as 
avaliações podem diferir muito de um comprador para outro.
• O payoff do vencedor é a diferença entre o preço de 
reserva e o preço pago (excedente do consumidor)
• O payoff do(s) perdedor(es) é zero
Leilões
196
Estratégia para o leilão de segundo preço com lance 
fechado
● A estratégia é a escolha do lance a ser colocado no 
envelope
● Qual a melhor estratégia em um leilão tradicional de 
segundo preço com lance fechado?
● Escolher seu valor mais alto domina fracamente todas as 
outras estratégias de lance:
● A estratégia de ofertar o seu valor máximo deixa-o tão 
bem quanto, ou melhor, do que ofertar qualquer outro 
valor.
Leilões - Estratégias de lances em 
leilões de valor privado
197
● Você deveria dar um lance maior que o preço que você 
avalia (suponha que você avalia o bem em v = $ 100) ?
Suponha que você ofereça $ 120. Existem três possibilidades.
1. Se o lance mais alto dos outros competidores for maior que 
$ 120, então você não compra o bem e não recebe 
nenhum excedente do consumidor.
2. Se o lance mais alto de todos for inferior a US $ 100, 
digamos p = 85. Você ganhará e receberá o mesmo 
excedente doconsumidor que receberia se tivesse licitado 
US $ 100. Excedente = v - p = 100 - 85 = 15.
3. Se a oferta mais alta de um concorrente fosse entre US $ 
100 e US $ 120 - digamos, US $ 110 -, fazer lances 
maiores que o preço que você avalia faz com que você 
ganhe, mas você adquire o bem por um valor maior que o 
valor que você atribui a ele e recebe um excedente 
negativo: - $ 10 ( v - p = $ 100 - $ 110).
Leilões - Estratégias de lances em 
leilões de valor privado
198
 
 
Você deveria oferecer menos do que o preço máximo que 
você avalia, digamos, US $ 90?
● Não,
○ porque você só diminui as chances de ganhar sem 
afetar o preço que você paga se vencer.
Assim dá no mesmo ou é o melhor oferecer o preço que você 
avalia do que um valor a mais ou a menos.
Leilões - Estratégias de lances em 
leilões de valor privado
199
Estratégia para o leilão inglês
● A estratégia é a escolha do valor em que se deixará de 
oferecer lances
● O vendedor usa um leilão inglês para vender uma escultura 
para potenciais compradores com vários valores privados.
● Sua melhor estratégia é aumentar o lance atual mais alto, 
desde que seu lance seja menor do que o valor que você 
atribui ao bem, US $ 100.
Leilões - Estratégias de lances em 
leilões de valor privado
200
Estratégia para o leilão holandês e leilão de primeiro 
preço com lance fechado
A estratégia é o preço que os indivíduos esperam para fazer o 
único lance (leilão holandês) ou a escolha do lance a ser 
colocado no envelope (leilão com lance fechado)
● A melhor estratégia é ofertar um preço menor do que você 
avalia o bem.
● Por quê?
○ Você reduz sua chance de ganhar mas aumenta seu 
excedente do consumidor
● A melhor estratégia é ofertar um valor igual ou um pouco 
maior que o valor que você espera que será a segunda 
maior oferta, dado que o seu é o maior valor.
● O resultado é que o vencedor é a pessoa que oferta o 
maior valor, mas o vencedor paga aproximadamente o 
segundo maior valor.
Leilões - Estratégias de lances em 
leilões de valor privado
201
• Maldição do vencedor – O lance do vencedor do leilão 
excede o valor do item de valor comum.
• A maldição do vencedor ocorre quando os potenciais 
compradores estão incertos sobre o valor real do bem.
• Quando se oferecem mais informações aos potenciais 
compradores, aqueles que são avessos a riscos serão 
encorajados a fazer mais lances, pois estarão mais 
confiantes de que podem prever a possibilidade da 
maldição do vencedor.
• A maldição do vencedor é mais comum no leilão de lance 
fechado que no leilão Inglês.
• Se pelo menos 2 potenciais compradores são otimista 
demais, pode ocorrer a maldição do comprador num leilão 
Inglês
Leilões de valor comum
202
1. Incentivar a participação de um grande número de 
potenciais compradores
2. Em um leilão de valor comum:
○ Revele informações sobre sobre o valor real do objeto 
para reduzir preocupações com a maldição do vencedor
3. Estabeleça um lance mínimo
Maximização da receita de um leilão
203

Continue navegando