Aula 16 - Teoria dos Jogos

•

USP-SP

0

Caio Castro

08/07/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 52 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 52 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 52 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Microeconomia I

17.505 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Microeconomia para a Anpec 
Theo Cotrim Martins 
E-mail: theocm@gmail.com 
mailto:theocm@gmail.com
Aula 16 
TEORIA DOS JOGOS 
V-Caps. 28 e 29; N-Cap. 8 
Agenda 
• O que define um jogo 
• Equilíbrio de Nash 
• Dilema dos Prisioneiros 
• O Jogo do Dormitório 
• Estratégias Mistas 
• Jogos Repetidos 
• Jogos Característicos e Conjuntos de Informação 
• Questões Anpec 
• Anexo: Eq. de Nash Estrito vs Eq. de Nash Não-Estrito 
 
 
Teoria dos Jogos 
• Todos os jogos têm três elementos: 
i. jogadores 
ii. estratégias 
iii. payoffs 
• Os jogos podem ser cooperativos ou não-
cooperativos. 
Jogadores 
• Cada unidade de decisão em um jogo é chamado de 
jogador. 
– Pode ser um indivíduo, uma firma, um país, etc.. 
• Cada jogador pode escolher entre diferentes ações, 
chamadas de estratégias. 
Estratégias 
• As estratégias podem ser simples ou complexas. 
• Em jogos não-cooperativos, os jogadores não sabem 
qual será a estratégia utilizada pelos outros 
jogadores. 
Payoffs 
• O retorno final para os jogadores no final do jogo é 
chamado de payoffs. 
• Payoffs são usualmente medidos em termos de 
utilidade, mas outros tipos de payoff também são 
comuns. 
• Os jogadores conseguem ordenar os payoffs 
associados a um determinado jogo. 
Notação 
• Iremos denominar um jogo G entre dois jogadores 
(A e B) por: 
𝐺[𝑆𝐴, 𝑆𝐵 , 𝑈𝐴(𝑎, 𝑏), 𝑈𝐵(𝑎, 𝑏)] 
 onde: 
SA = estratégias do jogador A (a  SA). 
SB = estratégias do jogador B (b  SB). 
UA = utilidade obtida pelo jogador A quando uma dada 
estratégia é utilizada. 
UB = utilidade obtida pelo jogador B quando uma dada 
estratégia é utilizada. 
Equilíbrio de Nash 
• Um par de estratégias (𝑎∗, 𝑏∗) é definida como 
equilíbrio de Nash se 𝑎∗ é a melhor estratégia para 
o jogador A quando o jogador B joga 𝑏∗, e 𝑏∗ é a 
melhor estratégia para o jogador B quando o 
jogador A joga 𝑎∗. 
 
• Em um equilíbrio de Nash, os participantes não têm 
incentivos a mudar seus comportamentos. 
Equilíbrio de Nash 
• Um par de estratégias (a*,b*) é definida como 
Equilíbrio de Nash se: 
UA(a*,b*)  UA(a’,b*) para todo a’SA 
UB(a*,b*)  Ub(a*,b’) para todo b’SB 
Equilíbrio de Nash 
• Não são todos os jogos que têm equilíbrio de Nash 
em estratégias puras. 
• Alguns jogos têm mais de um equilíbrio de Nash. 
Dilema dos Prisioneiros 
• O equilíbrio de Nash não é desejável (não é Pareto). 
 
 B’s Strategies 
 Confess 
Not 
Confess 
Confess 
A: 3 years 
B: 3 years 
A: 6 months 
B: 10 years 
 
 
A’s Strategies 
Not 
Confess 
A: 10 years 
B: 6 months 
A: 2 years 
B: 2 years 
 
 
Dilema dos Prisioneiros 
• Um acordo entre os prisioneiros para não confessar 
gera um resultado com menos tempo de cadeia 
(melhora de Pareto). 
– Entretanto esta solução não é estável. 
 
• Os dois têm a estratégia confessar como dominante. 
– {𝐶𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝐶𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟} é um equilíbrio de Nash. 
 
O Jogo do Dormitório 
• Suponha que existam dois estudantes que têm que 
decidir o volume para escutar seus rádios. 
– Cada um pode escolher escutar alto (L) ou baixo (S). 
A 
L 
S 
A escolhe alto (L) ou baixo (S) 
B 
B 
L 
S 
L 
S 
B faz uma escolha 
similar. 
7,5 
5,4 
6,4 
6,3 
Os payoffs estão 
em termos de 
utilidade. 
Nenhum jogador 
conhece a 
estratégia do outro. 
 
O Jogo do Dormitório 
O Jogo do Dormitório 
 B’s Strategies 
 L S 
L 7,5 5,4 
 
 
A’s Strategies 
S 6,4 6,3 
 
 
• As vezes é mais conveniente descrever o jogo em 
forma de matriz (ao invés da forma extensiva): 
O Jogo do Dormitório 
• Escutar alto é uma estratégia dominante para o 
jogador B. 
– Estratégia L gera mais utilidade para B que a 
estratégia S, independentemente da estratégia que A 
escolha. 
• O jogador A reconhece que B tem uma estratégia 
dominante. 
– A irá escolher a estratégia que lhe dá a maior 
utilidade, dada a escolha de L por B. 
O Jogo do Dormitório 
• Assim, 𝐴 irá escolher escutar música alta. 
• O resultado 𝐴: 𝐿, 𝐵: 𝐿 é um equilíbrio de Nash. 
Jogos sem Equilíbrio de Nash 
 
 
B’s Strategies 
 
 
A’s 
Strategies 
Pedra Tesoura Papel 
Pedra 0,0 1,-1 -1,1 
Tesoura -1,1 0,0 1,-1 
Papel 1,-1 -1,1 0,0 
 
 
Jogos sem Equilíbrio de Nash 
 
 
B’s Strategies 
 
 
A’s 
Strategies 
Pedra Tesoura Papel 
Pedra 0,0 1,-1 -1,1 
Tesoura -1,1 0,0 1,-1 
Papel 1,-1 -1,1 0,0 
 
 
Jogos com dois Equilíbrios de Nash 
 
B’s Strategies 
 
 
A’s Strategies 
 Ballet Futebol 
Ballet 2,1 0,0 
Futebol 0,0 1,2 
 
 
• “Batalha dos Sexos”: 
Jogos com dois Equilíbrios de Nash 
 
B’s Strategies 
 
 
A’s Strategies 
 Ballet Futebol 
Ballet 2,1 0,0 
Futebol 0,0 1,2 
 
 
• “Batalha dos Sexos”: 
Estratégias Dominantes 
• Uma estratégia 𝑠𝑖
∗ é dominante para o jogador i se 
ela é uma melhor resposta para qualquer perfil de 
estratégias dos outros jogadores. 
• O “dilema dos prisioneiros” apresenta uma 
estratégia dominante (não confessar). 
• Já a batalha dos sexos não possui uma estratégia 
dominante. A melhor estratégia de um jogador 
depende do que o outro faz. 
Estratégias Mistas 
• Até agora vimos os equilíbrios em estratégias puras, 
quando os jogadores fazem uma escolha específica. 
• Entretanto, os jogadores poderiam utilizar 
estratégias mistas, que consiste em fazer escolhas 
aleatórias, com base em um conjunto de 
probabilidades. 
Estratégias Mistas 
• Jogos sem equilíbrios de Nash em estratégias puras 
sempre têm equilíbrio de Nash em estratégias 
mistas. 
• Jogos “normais”[1] possuem um número ímpar de 
equilíbrios (Nash Pura + Nash Mista). 
 
[1] Jogos sem empates no payoff. 
Estratégias Mistas 
• O equilíbrio de Nash em estratégias mistas é o 
conjunto de probabilidades, para os dois agentes, 
que equilibra as ações dos indivíduos. 
 
• Cada jogador precisa garantir que o outro jogador 
tem o mesmo payoff esperado independente da 
estratégia adotada. 
Estratégias Mistas 
• Na batalha dos sexos, além do equilíbrio de Nash em 
estratégias puras, há um equilíbrio de Nash em 
estratégias mistas. 
• Neste equilíbrio o jogador A joga ballet 2/3 das 
vezes e futebol 1/3 das vezes e o jogador B joga 
ballet 1/3 das vezes e futebol 2/3 das vezes. 
Cooperação e Repetição 
• A cooperação entre os jogadores pode resultar em 
situações preferíveis em relação ao equilíbrio de 
Nash. 
– Entretanto a cooperação é instável. 
• Jogos repetidos podem levar à cooperação. 
Jogo do Dormitório em Dois Períodos 
• Vamos assumir que A escolhe antes o volume de seu 
som e depois B faz sua escolha. 
• A escolha da estratégia de B deve levar em 
consideração a estratégia adotada pelo jogador A. 
A 
L 
S 
A escolhe alto (L) ou baixo (S) 
B 
B 
L 
S 
L 
S 
B faz uma escolha 
similar já sabendo a 
escolha de A. 
7,5 
5,4 
6,4 
6,3 
Então, devemos 
colocar as estratégias 
de B de uma forma 
que leve em 
consideração as 
informações das 
escolhas de A. 
Jogo do Dormitório em Dois Períodos 
Jogo do Dormitório em Dois Períodos 
B’s Strategies 
L,L L,S S,L S,S 
 
A’s 
Strategies 
L 7,5 7,5 5,4 5,4 
S 6,4 6,3 6,4 6,3 
• Cada estratégia de B é colocada como um par de 
ações que depende da estratégia de A. 
Jogo do Dormitório em Dois Períodos 
B’s Strategies 
L,L L,S S,L S,S 
 
A’s 
Strategies 
L 7,5 7,5 5,4 5,4 
S 6,4 6,3 6,4 6,3 
• Existem três equilíbrios de Nash: 
 A:L, B:(L,L) 
 A:L, B:(L,S) 
 A:S, B:(S,L) 
Jogo do Dormitório em Dois Períodos 
B’s Strategies 
L,L L,S S,L S,S 
 
A’s 
Strategies 
L 7,5 7,5 5,4 5,4 
S 6,4 6,3 6,4 6,3 
• A:L, B:(L,S) e A:S, B:(S,L) não são plausíveis. 
 Incorporam acordos não críveis por parte de B. 
Jogo do Dormitório em Dois Períodos 
• Então, o jogo se reduz ao payoff onde (L,L) é a 
estratégia dominante para B. 
– A reconhece isto e irá escolher L. 
 
• Este é um Equilíbrio Perfeito de Subjogo: 
– É um equilíbrio de Nash em que as estratégias de 
cada jogador não envolvem acordos (ameaças)não 
críveis. 
Equilíbrio Perfeito de Subjogo 
• Um “subjogo” é uma porção de um jogo maior que 
se inicia em determinado “nó” e inclui todas as 
futuras ações. 
• Para se candidatar a um equilíbrio perfeito de 
subjogo, a estratégia deve ser um equilíbrio de Nash 
em cada subjogo do jogo maior. 
• Nota: jogos simultâneos possuem apenas um 
subjogo. 
Jogos Repetidos 
• Muitas situações econômicas podem ser modeladas 
como jogos que são jogados repetidamente. 
 
• O número de repetições é muito importante. 
– Em jogos com um número finito de repetições, há 
pouco espaço para o desenvolvimento de estratégias 
inovadoras. 
– Jogos que possuem um número infinito de repetições 
oferecem uma gama de opções maior. 
 
Dilema do Prisioneiro: Jogo Finito 
B’s Strategies 
L R 
 
A’s 
Strategies 
U 1,1 3,0 
D 0,3 2,2 
• Se o jogo for jogado uma única vez, o equilíbrio de 
Nash A:U, B:L será o resultado esperado. 
Dilema do Prisioneiro: Jogo Finito 
B’s Strategies 
L R 
 
A’s 
Strategies 
U 1,1 3,0 
D 0,3 2,2 
• Este resultado é inferior a A:D, B:R para cada 
jogador. 
Dilema do Prisioneiro: Jogo Finito 
• Suponha que este jogo é repetido por um número 
finito de períodos (T). 
• Qualquer estratégia expandida em que A promete 
jogar D na última rodada não é crível. 
– No instante T, A irá jogar U. 
• A mesma lógica se aplica ao jogador B. 
Dilema do Prisioneiro: Jogo Finito 
• Qualquer equilíbrio perfeito de subjogo para este 
jogo requer o equilíbrio de Nash na rodada final. 
– A:U,B:L 
• Esta lógica se aplica para o período 𝑇 − 1. 
• O único equilíbrio perfeito de subjogo neste jogo 
finito requer o equilíbrio de Nash em cada rodada. 
Jogos com Infinitas Repetições 
• Neste caso, cada jogador pode anunciar uma 
estratégia de início. 
– Prometer cooperar desde que o outro jogador 
coopere. 
– Quanto o outro jogador deixar de cooperar, o 
primeiro deixa de cooperar e o jogo volta ao 
equilíbrio de Nash. 
Jogos com Infinitas Repetições 
• A estratégia anunciada pode ser um Equilíbrio 
Perfeito de Subjogo se ela é crível. 
• Isto dependerá dos payoffs e da taxa de desconto. 
Jogos com Infinitas Repetições 
• Se  é a taxa de desconto do jogador B (ou do 
jogador A), o valor presente da cooperação contínua 
é dada por: 
 2 + 2 + 22 + … = 2/(1-) 
• O payoff da traição é: 
3 + 1 + 21 + …= 2 + 1/(1-) 
• A cooperação será crível se: 
2/(1-) > 2 + 1/(1-) 
 > ½ 
Jogos Característicos (Varian) 
• Jogos de coordenação: ganhos dos participantes são 
maiores quando eles coordenam suas estratégias. 
Ex: batalha dos sexos, dilema dos prisioneiros. 
• Jogos de competição: ganho de um participante é 
igual às perdas de outro. Ex: jogo de soma zero. 
• Jogos de compromisso: jogo sequencial no qual um 
dos jogadores se compromete a seguir determinada 
estratégia. 
Conjunto de Informação 
• Informação Incompleta: jogadores não conhecem 
alguns dos elementos que definem as regras do jogo 
(ex: payoffs, conjunto de estratégias, número de 
jogadores, etc..). Ex: poker. 
• Informação Completa: jogadores conhecem todos 
os elementos do jogo. Ex: dilema dos prisioneiros. 
Conjunto de Informação 
• Informação Perfeita: jogadores sabem exatamente 
em qual nó da árvore de decisão estão. Ou seja, 
jogadores sabem exatamente o que ocorreu nos 
movimentos prévios. 
• Informação Imperfeita: jogadores não sabem o nó 
da árvore em que estão. Ex: todo jogo simultâneo é 
de informação imperfeita. 
Anpec 2014 – Q13 
Anpec 2008 – Q15 
 
 
O jogo acima é repetido infinitas vezes. Seja δ* o menor 
fator de desconto intertemporal que permite implementar 
a lista de estratégias Pareto-eficientes, como equilíbrio 
perfeito de subjogo, em que a estratégia de punição é do 
tipo gatilho (trigger strategy), isto é, se um jogador desvia-
se do acordo, ele é punido com o equilíbrio de Nash 
Pareto-dominado do jogo-estágio para sempre. Calcule 
100× δ * (isto é, cem vezes δ*). 
Respostas 
• Q13 – 2014: F V V F V 
• Q15 – 2008: 25 
 
ANEXO 
Nash Estrito vs Não-Estrito 
Equilíbrio de Nash 
• Um par de estratégias (a*,b*) é definida como 
Equilíbrio de Nash (usual) se: 
UA(a*,b*)  UA(a’,b*) para todo a’  SA 
UB(a*,b*)  Ub(a*,b’) para todo b’  SB 
Equilíbrio de Nash Estrito 
• Um par de estratégias (a*,b*) é definida como 
Equilíbrio de Nash estrito se: 
UA(a*,b*) > UA(a’,b*) para todo 𝑎’  𝑆𝐴 
UB(a*,b*) > Ub(a*,b’) para todo 𝑏’  𝑆𝐵