05 2014 1aparte

•
UFF

Leonardo Sena Comarella
29.10.2018
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Teoria dos Jogos e Gerenciamento Orçamentária

29 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
5. Estratégias mistas 
Teoria dos Jogos 
Faculdade de Economia, UFF 
Prof. Fábio D. Waltenberg 
Março/Abril de 2014 
Programa 
1. Estratégias puras versus mistas 
2. Melhores respostas e equilíbrio de Nash 
1. Com estratégias puras 
2. Com estratégias mistas 
3. Jogos estritamente competitivos (ou “de 
soma zero”) 
4. Minimax-maximin 
 
Referências 
 Boa parte dos slides usados neste tópico 
acompanham livro do Varian 
 Leituras complementares ao cap. 5 de Fiani 
 Cap. 28: Teoria dos jogos 
 Cap. 29: Aplicações da teoria dos jogos 
 Em tudo o que disser respeito a estratégias 
mistas 
3 
4 
Prólogo 
D 
L 
2 
1 
U 
R 
2,-2 0,0 
1,-1 x,-x 
Que ENs possui o jogo abaixo? 
Se x < 0, então U ?? 
5 
Prólogo 
D 
L 
2 
1 
U 
R 
2,-2 0,0 
1,-1 x,-x 
Se x < 0, então U domina D 
Se x < 1, então L ?? 
Que ENs possui o jogo abaixo? 
6 
Prólogo 
D 
L 
2 
1 
U 
R 
2,-2 0,0 
1,-1 x,-x 
Se x < 0, então U domina D 
Se x < 1, então L domina R 
Portanto, se x < 0 então o 
EN é ?? 
Que ENs possui o jogo abaixo? 
7 
Prólogo 
D 
L 
2 
1 
U 
R 
2,-2 0,0 
1,-1 x,-x 
Se x < 0, então U domina D 
Se x < 1, então L domina R 
Portanto, se x < 0, então o 
EN é (U, L) 
E se 0 < x < 1, o EN é ?? 
Que ENs possui o jogo abaixo? 
8 
Prólogo 
D 
L 
2 
1 
U 
R 
2,-2 0,0 
1,-1 x,-x 
Se x < 0, então U domina D 
Se x < 1, então L domina R 
Portanto, se x < 0 então o 
EN é (U, L) 
E se 0 < x < 1, o EN é 
(D, L) 
Se x > 1, então ?? 
Que ENs possui o jogo abaixo? 
9 
Prólogo 
D 
L 
2 
1 
U 
R 
2,-2 0,0 
1,-1 x,-x 
Se x < 0, então U domina D 
Se x < 1, então L domina R 
Portanto, se x < 0 então o 
EN é (U, L) 
E se 0 < x < 1, o EN é 
(D, L) 
Se x > 1, então não há 
EN em estratégias puras 
Que ENs possui o jogo abaixo? 
10 
Estratégias puras 
Jogador B 
Jogador A 
Há algum equilíbrio de Nash em estratégias 
puras? 
(1,2) (0,4) 
(0,5) (3,2) 
U 
D 
L R 
11 
Estratégias puras 
Jogador B 
Jogador A 
(U,L) é um equilíbrio de Nash? 
(1,2) (0,4) 
(0,5) (3,2) 
U 
D 
L R 
12 
Estratégias puras 
Jogador B 
Jogador A 
(U,L) é um equilíbrio de Nash? Não 
(U,R) é um equilíbrio de Nash? 
(1,2) (0,4) 
(0,5) (3,2) 
U 
D 
L R 
13 
Estratégias puras 
Jogador B 
Jogador A 
(U,L) é um equilíbrio de Nash? Não 
(U,R) é um equilíbrio de Nash? Não 
(D,L) é um equilíbrio de Nash? 
(1,2) (0,4) 
(0,5) (3,2) 
U 
D 
L R 
14 
Estratégias puras 
Jogador B 
Jogador A 
(U,L) é um equilíbrio de Nash? Não 
(U,R) é um equilíbrio de Nash? Não 
(D,L) é um equilíbrio de Nash? Não 
(D,R) é um equilíbrio de Nash? 
(1,2) (0,4) 
(0,5) (3,2) 
U 
D 
L R 
15 
Estratégias puras 
Jogador B 
Jogador A 
(U,L) é um equilíbrio de Nash? Não 
(U,R) é um equilíbrio de Nash? Não 
(D,L) é um equilíbrio de Nash? Não 
(D,R) é um equilíbrio de Nash? Não 
(1,2) (0,4) 
(0,5) (3,2) 
U 
D 
L R 
16 
Estratégias puras 
Jogador B 
Jogador A 
Portanto, o jogo não tem equilibrios de Nash em 
estratégias puras. O jogo apresenta um equilíbrio de 
Nash, porém, apenas em estratégias mistas 
(1,2) (0,4) 
(0,5) (3,2) 
U 
D 
L R 
17 
Estratégias mistas 
 Ao invés de jogar somente Em cima (U) ou 
Embaixo (D), o Jogador A escolhe distribuição de 
probabilidades (pU,1-pU), de modo a jogar U com 
probabilidade pU, e D com probabilidade 1-pU 
 Desta forma, o Jogador A alterna as estratégias 
puras U e D 
 A distribuição de probabilidades (pU,1-pU) é 
uma estratégia mista para o Jogador A 
18 
Estratégias mistas 
 Analogamente, o Jogador B escolhe uma 
distribuição de probabilidades (pL,1-pL), de modo 
a jogar Esquerda (L) com probabilidade pL, e 
Direita (R) com probabilidade 1-pL 
 Assim, o Jogador B alterna as estratégias puras 
L e R 
 A distribuição de probabilidades (pL,1-pL) é 
uma estratégia mista para o Jogador B 
19 
Aula anterior… 
O jogo da moeda Jogador 2 
A B 
Jogador 1 A 1, -1 -1, 1 
B -1, 1 1, -1 
 Imagine que o jogo acima se repita 100 vezes 
1. Sendo você o Jogador 1, quantas vezes você jogaria 
A e quantas vezes você jogaria B? 
2. Por que? (Em especial, indique o comportamento 
que você espera de B!) 
20 
Aula anterior… 
O jogo da moeda Jogador 2 
A B 
Jogador 1 A 1, -1 -1, 1 
B -1, 1 1, -1 
 Imagine que o jogo acima se repita 100 vezes 
1. Sendo você o Jogador 1, quantas vezes você jogaria A e quantas vezes 
você jogaria B? Vocês: quase todos respondem 50xA e 50xB 
2. Por que? (Em especial, indique comportamento esperado de B!) 
 Respostas variadas: em geral, fazendo menções a: “minimizar 
riscos”; “precaver-se contra B”; “confundir B”; “surpreender B”; 
“diversificar”, “para não ficar manjado”, 
21 
Estratégias mistas 
Jogador B 
Jogador A 
Este jogo não tem equilibrios de Nash em estratégias 
puras, mas tem equilíbrio de Nash em estratégias 
mistas. Como calculá-lo? 
(1,2) (0,4) 
(0,5) (3,2) 
U 
D 
L R 
22 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, pL R, 1-pL 
23 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, pL R, 1-pL 
O valor esperado, para A, de escolher U é ?? 
24 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, pL R, 1-pL 
O valor esperado de escolher U é 1.pL + 0.(1-pL) = pL 
O valor esperado, para A, de escolher D é ?? 
25 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, pL R, 1-pL 
O valor esperado, para A, de escolher U é pL 
O valor esperado, para A, de escolher D é 3(1 - pL) 
26 
O valor esperado, para A, de escolher U é pL 
O valor esperado, para A, de escolher D é 3(1 - pL) 
Se pL > 3(1 - pL), então A escolherá apenas U, mas já 
sabemos que não há EN em que A jogue apenas U 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, pL R, 1-pL 
27 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, pL R, 1-pL 
O valor esperado, para A, de escolher U é pL 
O valor esperado, para A, de escolher D é 3(1 - pL) 
Se pL < 3(1 - pL), então A escolherá apenas D, mas 
já sabemos que não há EN em que A jogue apenas D 
28 
Para haver Eq. Nash, necessariamente devemos ter: 
 pL = 3(1 - pL)  pL = 3/4 
Se for esta a forma de B alternar suas escolhas entre L e R, 
então A será indiferente entre U ou D 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, pL R, 1-pL 
29 
Para haver Eq. Nash, necessariamente devemos ter: 
 pL = 3(1 - pL)  pL = 3/4 
Se for esta a forma de B alternar suas escolhas entre L e R, 
então A será indiferente entre U ou D 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, 3/4 R, 1/4 
30 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, 3/4 R, 1/4 
31 
Estratégias mistas: Em grupo! 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
O valor esperado, para B, de escolher L é ?? Em grupo!!! 
O valor esperado, para B, de escolher R é ?? Em grupo!!! 
L, 3/4 R, 1/4 
32 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2)(0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
O valor esperado, para B, de escolher L é 2pU + 5(1 - pU) 
O valor esperado, para B, de escolher R é 4pU + 2(1 - pU) 
L, 3/4 R, 1/4 
O valor esperado, para B, de escolher L é 2pU + 5(1 - pU) 
O valor esperado, para B, de escolher R é 4pU + 2(1 - pU) 
Se 2pU + 5(1 - pU) > 4pU + 2(1 - pU) então B escolherá 
só L, mas sabemos não haver EN em que B jogue apenas L 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, 3/4 R, 1/4 
O valor esperado, para B, de escolher L é 2pU + 5(1 - pU) 
O valor esperado, para B, de escolher R é 4pU + 2(1 - pU) 
Se 2pU + 5(1 - pU) < 4pU + 2(1 - pU) então B escolherá 
só R, mas sabemos não haver EN em que B jogue apenas R 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, pU 
D, 1-pU 
L, 3/4 R, 1/4 
35 
Para haver Eq. Nash, necessariamente devemos ter: 
2pU + 5(1 - pU) = 4pU + 2(1 - pU)  pU = 3/5; 
Se for esta a forma de A alternar suas escolhas entre U e D, 
então B será indiferente entre L ou R 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, 3/5 
D, 2/5 
L, 3/4 R, 1/4 
36 
O único equilíbrio de Nash deste jogo consiste em A 
jogar a estratégia mista (3/5, 2/5) e B jogar a 
estratégia mista (3/4, 1/4) 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) (0,4) 
(0,5) (3,2) 
U, 3/5 
D, 2/5 
L, 3/4 R, 1/4 
37 
A resultado será (1,2) com probabilidade: 
 3/5 × 3/4 = 9/20 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) 
 9/20 
(0,4) 
(0,5) (3,2) 
U, 3/5 
D, 2/5 
L, 3/4 R, 1/4 
38 
A resultado será (0,4) com probabilidade: 
 3/5 × 1/4 = 3/20 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) 
 9/20 
(0,4) 
3/20 
(0,5) (3,2) 
U, 3/5 
D, 2/5 
L, 3/4 R, 1/4 
39 
A resultado será (0,5) com probabilidade: 
 2/5 × 3/4 = 6/20 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) 
 9/20 
(0,4) 
3/20 
(0,5) 
 6/20 
U, 3/5 
D, 2/5 
L, 3/4 R, 1/4 
(3,2) 
40 
A resultado será (3,2) com probabilidade: 
 2/5 × 1/4 = 2/20 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) 
 9/20 
(0,4) 
3/20 
(0,5) 
 6/20 
(3,2) 
 2/20 
U, 3/5 
D, 2/5 
L, 3/4 R, 1/4 
41 
A recompensa esperada de A no Eq. Nash é: 
 1×9/20 + 3×2/20 = 3/4 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) 
 9/20 
(0,4) 
3/20 
(0,5) 
 6/20 
(3,2) 
 2/20 
U, 3/5 
D, 2/5 
L, 3/4 R, 1/4 
42 
A recompensa esperada de A no Eq. Nash é: 
 1×9/20 + 3×2/20 = 3/4 
A recompensa esperada de B no Eq. Nash é: 
 2×9/20 + 4×3/20 + 5×6/20 + 2×2/20 = 16/5 
Estratégias mistas 
Jogador B 
Jogador A 
(1,2) 
 9/20 
(0,4) 
3/20 
(0,5) 
 6/20 
(3,2) 
 2/20 
U, 3/5 
D, 2/5 
L, 3/4 R, 1/4 
Teoria dos Jogos - Prof. Waltenberg 43 
Aula passada: 
“jogo do bem público” 
 Quatro jogadores não podem se comunicar 
 Cada um, inclusive você, recebe 10 fichas 
 Cada um pode: 
 Manter um certo número de fichas 
 Depositar um certo número de fichas num cofre comum 
 O ganho de cada jogador é igual a: 
 R$20,00 x fichas mantidas + R$10,00 x número total de fichas 
depositado por todos os jogadores no cofre comum 
 Ex: Se você guardou 3 fichas e cada um dos outros três 
jogadores também, então, você ganhará 20x3 + 10x(7x4) 
 Quantas fichas você deposita no cofre comum? 
Teoria dos Jogos - Prof. Waltenberg 44 
Aula passada: 
“jogo do bem público” 
 Versão simples de “jogo do bem público” 
 Comece com contribuição de 5, supondo que outros 
3 também depositaram 5: ganho é 20*5 + 10*(4*5) = 
$300 
 Se os outros 3 depositam 5 e você deposita 4, seu 
ganho é: 20*6+10*(3*5+4) = $310 > $300 
 Se os outros 3 depositam 5 e você deposita 0, seu 
ganho é: 20*10+10*(3*5) = $350 > $310 > $300 
 Você (e cada jogador) tem interesse em diminuir 
a contribuição individual 
Teoria dos Jogos - Prof. Waltenberg 45 
Aula passada: 
“jogo do bem público” 
 O único equilíbrio de Nash é ausência de 
contribuição ao cofre comum 
 Em qualquer outra situação, você (e todo jogador) se 
arrependerá de ter posto alguma ficha no pote comum 
 Cada um ganha apenas 20x10+0x4 = $200, que é menos 
do que se houvesse cooperação entre os jogadores 
 Comportamento de carona (free-rider ou passageiro 
clandestino): 
 Claro conflito entre interesse individual e coletivo 
 Se todos contribuíssem com todas as fichas, cada um 
ganharia 10*40 = $400 > $200 
Teoria dos Jogos - Prof. Waltenberg 46 
Aula passada: 
“jogo do bem público” 
 Graduação 2009 – Média: 5,79 
 Graduação 2011: 2,13 
 Mestrado 
 2010/2011: 4,00 
 M2012: 5,0 
 M2013: 4,5 
 M2014: 3,75 
 Moda sempre é 0 
 Ao lado, resultados de vocês 
(impressionante…) 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
1 
2 
10 
10 
10 
10 
10 
10 
Média = 3,32 
Teoria dos Jogos - Prof. Waltenberg 47 
Aula passada: 
“jogo do bem público” 
 Resultados empíricos: 
 Literatura 
 Em jogos de uma só rodada, média de 40% a 60% 
das fichas depositadas 
 Em jogos repetidos: cerca de 50% na primeira rodada 
e depois declínio 
 Portanto, comportamento de “carona” não é regra 
 Em contradição com auto-interesse 
 (Em contradição com respostas de vocês) 
Teoria dos Jogos - Prof. Waltenberg 48 
Aula passada: 
“jogo do bem público” 
 Às vezes chamado de dilema do prisioneiro com n 
jogadores, pois estrutura é a mesma: não 
colaborar é estratégia dominante, porém 
cooperação de todos é melhor 
 Apresentação de Bowles: n jogadores recebem 
uma dotação y e, simultaneamente, selecionam 
montante ci para contribuir para o bem público 
 A recompensa de cada jogador é: 
πi = y – ci + mΣjcj 
para j = 1,…, n 
m < 1 < mn m<1: melhor 
resposta individual é 
não contribuir 
mn>1: payoff total é 
máximo quando 
todos contribuem 
integralmente 
Teoria dos Jogos - Prof. Waltenberg 49 
Aula passada: 
“jogo do bem público” 
 Fehr e Gaechter (2002): estrutura de bens públicos, 
porém, depois de serem feitas as contribuições, são 
reveladas (por um número de identificação, não 
pelo nome) e há possibilidade de punir quem 
contribui com pouco 
 Resultados: 
 Punições são aplicadas a quem contribui com pouco 
 Contribuintes avarentos aumentam contribuições 
 Voltaremos a estes temas no final do curso 
50 
 Um jogo com: 
 Número finito de jogadores… 
 Cada um com um número finito de 
estratégias puras… 
 Tem ao menos um equilíbrio de Nash 
 Assim, se o jogo não tiver equilíbrio de Nash 
em estratégias puras… 
 Necessariamente terá ao menos um 
equilíbrio de Nash em estratégias mistas 
Melhores respostas e 
equilíbrios de Nash 
51 
 Em qualquer equilíbrio de Nash (EN), cada 
jogador escolhe a “melhor resposta” às 
escolhas feitas por todos os outros jogadores 
 Um jogo pode ter mais de um EN 
 Como podemos localizar todos os EN de 
um jogo? 
 Se há mais de um EN, podemos afirmar 
que um é mais provável de ocorrer do que 
outro? 
Melhores respostas e 
equilíbrios de Nash 
52 
Melhores respostas e 
equilíbrios de Nash 
 Pensem num jogo 2×2 
 A pode escolher entre as ações aA1 e a
A
2 
 B pode escolher entre as ações aB1 e a
B
2 
 Há quatro combinações de ações: 
(aA1, a
B
1), (a
A
1, a
B
2), (a
A
2, a
B
1), (a
A
2, a
B
2) 
 Cada combinação poderá proporcionar 
recompensas diferentes aos jogadores 
53 
Melhores respostas e 
equilíbriosde Nash 
 Suponha que os ganhos de A e B, quando as 
ações escolhidas forem aA1 e a
B
1, sejam: 
UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
 Analogamente, suponha que: 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7 
 
54 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7 
 
55 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7 
 Se B escolhe a ação aB1, então a melhor 
resposta de A é ?? 
 
56 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7 
 Se B escolhe a ação aB1, então a melhor 
resposta de A é a ação aA1 (pois 6 > 4) 
57 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7 
 Se B escolhe a ação aB1, então a melhor 
resposta de A é a ação aA1 (pois 6 > 4) 
 Se B escolhe a ação aB2, então a melhor 
resposta de A é ?? 
58 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7 
 Se B escolhe a ação aB1, então a melhor 
resposta de A é a ação aA1 (pois 6 > 4) 
 Se B escolhe a ação aB2, então a melhor 
resposta de A é a ação aA2 (pois 5 > 3) 
59 
Melhores respostas e 
equilíbrios de Nash 
 Se B escolhe aB1, então A escolhe a
A
1 
 Se B escolhe aB2, então A escolhe a
A
2 
 A “curva” de melhor resposta de A é: 
Melhor 
resposta 
de A 
aA1 
aA2 
aB2 a
B
1 Ação de B 
+ 
+ 
60 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7 
 
61 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7. 
 Se A escolhe a ação aA1, então a melhor 
resposta de B é ?? 
62 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7. 
 Se A escolhe a ação aA1, então a melhor 
resposta de B é a ação aB2 (porque 5 > 4) 
63 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7. 
 Se A escolhe a ação aA1, então a melhor 
resposta de B é a ação aB2 (porque 5 > 4) 
 Se A escolhe a ação aA2, então a melhor 
resposta de B é ?? 
64 
Melhores respostas e 
equilíbrios de Nash 
 UA(aA1, a
B
1) = 6 e U
B(aA1, a
B
1) = 4 
UA(aA1, a
B
2) = 3 e U
B(aA1, a
B
2) = 5 
UA(aA2, a
B
1) = 4 e U
B(aA2, a
B
1) = 3 
UA(aA2, a
B
2) = 5 e U
B(aA2, a
B
2) = 7 
 Se A escolhe a ação aA1, então a melhor 
resposta de B é a ação aB2 (porque 5 > 4) 
 Se A escolhe a ação aA2, então a melhor 
resposta de B é a ação aB2 (porque 7 > 3) 
65 
Melhores respostas e 
equilíbrios de Nash 
 Se A escolhe aA1 , então B escolhe a
B
2 
 Se A escolhe aA2 , então B escolhe a
B
2 
 A “curva” de melhor resposta de B é: 
Ação 
de A a
A
1 
aA2 
aB2 a
B
1 Melhor resposta de B 
66 
Melhores respostas e 
equilíbrios de Nash 
 Se A escolhe aA1 , então B escolhe a
B
2 
 Se A escolhe aA2 , então B escolhe a
B
2 
 A “curva” de melhor resposta de B é: 
Ação 
de A a
A
1 
aA2 
aB2 a
B
1 Melhor resposta de B 
Notem que aB2 é 
ação estritamente 
dominante para B 
67 
Melhores respostas e 
equilíbrios de Nash 
Resposta de A 
aA1 
aA2 
aB2 a
B
1 
aA1 
aA2 
aB2 a
B
1 
+ 
+ 
Escolha de A 
Escolha de B Resposta de B 
Como as curvas de melhores respostas 
podem ser usadas para localizar os EN? 
B A 
68 
Melhores respostas e 
equilíbrios de Nash 
Resposta de A 
aA1 
aA2 
aB2 a
B
1 
+ 
+ 
Resposta de B 
Há equilíbrio de Nash? 
Sobrepondo-as! 
69 
Melhores respostas e 
equilíbrios de Nash 
aA1 
aA2 
aB2 a
B
1 
+ 
+ 
Há equilíbrio de Nash? 
Resposta de A 
Resposta de B 
 
Sim, (aA2, a
B
2). Por que? 
aA2 é melhor resposta a a
B
2 
aB2 é melhor resposta a a
A
2 
70 
Melhores respostas e 
equilíbrios de Nash 
6,4 3,5 
5,7 4,3 
aA1 
aA2 
aB1 a
B
2 
Jogador B 
Jogador A 
Aqui está a forma 
estratégica do jogo 
aA2 é a única melhor resposta a a
B
2 
aB2 é a única melhor resposta a a
A
2 
 
Há um 2° EN em 
estratégias puras? 
71 
Melhores respostas e 
equilíbrios de Nash 
6,4 3,5 
5,7 4,3 
aA1 
aA2 
aB1 a
B
2 
Jogador B 
Jogador A 
Há um 2° EN em 
estratégias puras? 
Não, porque 
aB2 é ação estrita- 
mente dominante 
para o Jogador B 
aA2 é a única melhor resposta a a
B
2 
aB2 é a única melhor resposta a a
A
2 
Aqui está a forma 
estratégica do jogo