Buscar

ANPEC AULA 9. Estratégias e Jogos - II

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 27 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
AULA 9 : ESTRATÉGIAS E JOGOS - II 
 
 
 
 1. Equilíbrio de Nash: Estratégias Mistas; 
 2. Estratégias Racionalizáveis; 
 3. Informação Incompleta; 
 4. Bibliografia e Exercícios sugeridos 
 
 
 
 
1. Equilíbrio de Nash: Estratégias Mistas 
 
Na aula anterior definimos o Equilíbrio de Nash (EN) 
em estratégias puras e vimos que esta definição 
pressupõe que cada jogador conhece exatamente as 
estratégias a serem escolhidas pelos outros 
jogadores. 
 
Isto é, no EN em estratégias puras, as escolhas 
ótimas de cada jogador são prefeitamente 
previsíveis. 
 
Por outro lado, vimos que nem todo jogo simultâneo 
admite um EN em estratégias puras. 
 
Como entao resolver o problema de determinar um 
EN neste último caso em que não existe um EN em 
estratégias puras, isto é, quando a escolha dos 
jogadores não é previsível ? 
 
A melhor maneira de tratar o problema da escolha 
quando esta não pode ser predita é faze-lo supondo 
que o próprio jogador randomiza suas escolhas. 
 
Com a randomização, as “escolhas” do jogador nao 
são anticipadas nem por ele mesmo, uma vez que ele 
não faz escolhas determinísticas, mas seleciona tal ou 
tal estratégia “com uma certa probabilidade”. 
 
 
Chegamos assim à concepção do que na teoria dos 
jogos convencionou-se chamar estratégias mistas. 
 2
 
Estratégias Mistas 
 
 
Seja o jogo na forma estratégica n
iii uS 1),( ==Γ . 
 
Vamos supor, sem perda de generalidade, que o jogo 
 é finito. Γ
 
Uma estratégia mista para o jogador i é uma 
funçao de probabilidade sobre o seu conjunto de 
estratégias . 
im
iS
 
Formalmente, [ ] )(:1,0: iiiii smsSm →→ é a probabilidade 
que o jogador i escolha a estratégia . is
 
Seja o conjunto das funções de probabilidade que 
o jogador i venha a considerar. 
iM
 
 
Obviamente, o jogador faz escolhas dentro do 
conjunto , que é um conjunto de cardinalidade 
maior que , de modo que ele tem agora muito mais 
escolhas do que antes. 
i
iM
iS
 
Em particular, ele sempre pode escolher uma 
estratégia em particular escrevendo-a como uma 
probabilidade degenerada: 
is
⎩⎨
⎧
≠
==
i
i
i ss
ss
sm
;0
;1
)(
 
Um vetor de estratégias do jogo será notado: 
. 
i
n
i
n Mmmm ×=∈= 11 ),...,(
 
Entao, sendo a utilidade VNM das estratégias 
mistas para o jogador , sua utilidade esperada no 
iu
i
 3
vetor das estratégias mistas e no 
vetor das estratégias puras 
i
n
i
ii Mmmm ×=− ∈= 1),(
),...,1 nss(s = será: 
 
 ∑ ∈− ≡ Siii mmmu ),( s imn susm )()(s )...( 11 (*) 
 
 
 
A expressáo acima diz que a utilidade esperada de 
uma estratégia mista adotada pelo jogador é uma 
combinação convexa da utilidade que ele pode 
auferir das estratégias puras adotadas por todos os 
jogadores. 
 
Esta igualdade pressupõe que os jogadores formam 
suas conjecturas independentemente um do outro. 
 
 
 
Equilíbrio de Nash: Estratégias Mistas 
 
 
Definição 1: O vetor de estratégias mistas 
),...,( 1 nmmm = é um equilíbrio de Nash do jogo niii uS 1),( ==Γ
se Mmmmumu iiiiii ;)ˆ,()ˆ( n,...,2,1i; =∈∀≥ − , 
 
 
No EN em estratégias mistas, cada jogador 
randomiza suas escolhas e está ciente da maneira 
como os outros jogadores randomizam as suas 
escolhas também. 
 
 
No equilíbrio do jogo, nenhum jogador pode melhorar 
seu payoff esperado ao randomizar diferentemente da 
estratégia mista de equilíbrio. 
 
 
Dado o vetor das estratégias mistas ótimas dos outros 
jogadores , o jogador i deverá encontrar os pesos 
 para cada estratégia pura que se lhe apresenta, 
de modo a maximizar a utilidade esperada: 
im−ˆ
)( ii sm is
 4
 
 )ˆ;()()ˆ;( iiiSs iiiii msusmmmu ii −∈− ∑= 
 
Observe que é uma combinação convexa das 
utilidades das diferentes estratégias puras do 
jogador. 
)ˆ;( iii mmu −
)ˆ; ii ms −(iu
 
Desta forma, temos sempre, )ˆ;(max)ˆ;( iiiSsiii msummu ii ∈− ≤ 
para todo . 
ii Mm ∈
 
Abaixo enunciamos um teorema que fornece um 
método para encontrarmos as estratégias mistas de 
Nash de um jogo. 
 
 
 
Teorema 1:(Testes para o EN em estratégias mistas) 
 
As três afirmações abaixo são equivalentes: 
 
(i) é um Equilíbrio de Nash; 
i
n
i
Mm ×=∈ 1ˆ
 
(ii) Para cada jogador i temos: 
 em toda estratégia pura )ˆ;()ˆ( iiii msumu −= ii Ss ∈ 
que tem peso positivo em ; 
imˆ
 em toda estratégia pura )ˆ;()ˆ( iiii msumu −≥ ii Ss ∈ 
que tem peso em ; 0 imˆ
 
(iii) Para cada jogador em toda ,i )ˆ;()ˆ( iiii msumu −≥
estratégia pura . 
ii Ss ∈
 
 
A equivalência entre as três afirmações do teorema é 
facilmente estabelecida: 
 
(i)→(ii): Pela definição do EN temos: 
niMmmmuu iiiiii ,...,2,1;;)ˆ,((m)ˆ =∈∀−≥ . Em particular, se 
 5
ii Ss ∈
)ˆ(i mu ≥
 podemos escolher a estratégia mista 
degenerada: e teremos bem: 
. Resta agora mostrar que 
em toda estratégia pura 
⎩⎨
⎧
≠
==
i
i
i ss
ss
sm
;0
;1
)(
ii Ss
)ˆ;( iii msu −
)ˆ;()ˆ( iiii msumu −=
∈ que tem peso positivo 
em . Pela propriedade da utilidade esperada (*), 
temos que será uma combinação estritamente 
convexa dos números : 
i
u
mˆ
)
)ˆ;( iii msu −
ˆ(mi
)ˆ;()(ˆ iiiSs ii msusmii −∈)ˆ;ˆ( iii mmu − ∑= 
 
Se um dos diferir de , deverá haver pelo 
menos algum maior que . Mas isto contradiria a 
desigualdade já estabelecida. Fica assim 
o item (ii) provado. 
)ˆ;( iii msu −
)ˆ(i mu ≥
)ˆ(mui
)ˆ(mui
)ˆ;( iii msu −
 
(ii)→(iii): Óbvio. 
 
(iii)→(i): Dado que em toda estratégia 
pura , tome 
iim . Ora, sabemos que é 
uma combinação convexa dos , de modo que : 
)ˆ;()ˆ( iiii msumu −≥
M
;( ii su
iS∈is ∈ )ˆ,( iii mmu −
)ˆ im−
)ˆ()()ˆ()ˆ;()()ˆ;( musmmumsusmmmu iSs iiiiiiSs iiiii iiii =≤= ∑∑ ∈−∈−
im
. Como a 
estratégia mista é arbitráriamente escolhida, fica 
assim o item (i) estabelecido. ⊕ 
 
O item (ii) do teorema oferece um método de cálculo 
para se encontrar os equilibrios de Nash em 
estratégia mista: dadas as estratégias dos outros 
jogadores, cada jogador não deve ter incentivo a 
mudar sua estratégia. 
 
Deste modo, todas as estratégias puras que são 
prováveis para ele, devem proporcionar-lhe o mesmo 
retorno. 
 
Um corolário importante do Teorema 1 é que o vetor 
de estratégias puras )ˆ,...,ˆ(ˆ 1 nsss = é um equilíbrio de 
 6
Nash se e sòmente se ele é um equilíbrio de Nash 
randômico em estratégias denegeradas. 
 
A conseqüência prática deste corolário é que, ao 
buscar as estratégias mistas de um equilíbrio de 
Nash, encontraremos também todas as estratégias 
puras de equilíbrio. 
 
Os exemplos seguintes ilustrarão a utilização do 
teorema 1 na resolução do jogo. 
 
 
 
Exemplo 1: 
 
Vimos na aula anterior que a batalha dos sexos 
possui dois EN em estratégias puras: (box,box) e 
(ballet,ballet): 
 
Box Ballet
Box
Ballet
Mulher
Homem
( 0 , 0 ) 
( 1 , 2 )
( 2 , 1 )
( 0 , 0 )
 
 
 
Na verdade este jogo possui ainda um terceiro 
equilíbrio em estratégias mistas: 
 
Com efeito, denotando por )1,(1 ppm −≡ e as 
estratégias mistas do Homem e da Mulher 
respectivamente, temos os seguintes retornos 
esperados de cada alternativa: 
)1,(2 qqm −≡
 
Para o Homem: )1(02);( 21 qqmboxu −+= 
 e )1(10);( 21 qqmballetu −+= 
 
Para a Mulher: )1(0);( 12 ppmboxu −+= 
 )1(20);( 12 ppmballetu −+= 
 7
 
Pelo teorema 1, o equilibrio requererá a igualdade 
dos retornos esperados das duas escolhas do Homem 
e da Mulher, isto é: 
 
 qq −= 12 
 )1(2 pp −= 
 
A solução conjunta destasduas equações fornece: 
3/1=q e 3/2=p . A Mulher randomizará sua escolha 
apostando 3/1 no box e 3/2 no ballet, enquanto que o 
Homem fará o contrário, apostará 3/2 no box e 3/1 no 
ballet. 
 
O terceiro EN deste jogo, será portanto: 
. ))3/2,3/1(,)3/1,3/2(()ˆ,ˆ(ˆ 21 == mmm
 
Os retornos esperados dos dois jogadores serão: 
 
 
3/21)3/2)(3/1(0)3/1)(3/1(0)3/2)(3/2(2)3/1)(3/2(1 =+++=u 
 
 
3/22)3/1)(3/2(0)3/2)(3/2(0)3/1)(3/1(1)3/1)(3/2(2 =+++=u 
 
 
Note que 3/2 é também o retorno esperado de cada 
alternativa dos dois jogadores. 
 
 
Utilidade esperada do jogo inteiro 
 
 
Observe que a condiçao (ii) do teorema 1 implica que 
os equilíbrios em estratégia pura deste jogo não 
poderão ser obtidos da maneira como o fizemos 
acima, igualando o retorno esperado de cada 
alternativa. 
 
 
Para obtermos todos os equilíbrios do jogo de uma só 
vez, escreveremos a utilidade esperada do jogo 
inteiro, para cada jogador, e em seguida escolhemos 
 8
as probabilidades que maximizam a utilidade 
esperada de cada um deles: 
 
 
)1()13(
)1(0)1)(1(1)1(02),( 211
qqp
qpqpqppqmmu
−+−=
−+−−+−+= 
 
 
 
)1(2)23(
)1(0)1)(1(2)1(01),( 122
ppq
qpqpqppqmmu
−+−=
−+−−+−+= 
 
 
O Homem deve escolher p que maximiza , 
dado . Logo: 
),( 211 mmu
q
 
Se ;03/1 =→< pq 
 
Se ;13/1 =→> pq 
 
Se pq →= 3/1 qualquer. 
 
 
A Mulher deve escolher que maximiza , 
dado 
q ),( 122 mmu
p . Logo: 
 
Se ;03/2 =→< qp 
 
Se ;13/2 =→> qq 
 
Se qp →= 3/2 qualquer. 
 
 
As relações de p com q para o homem (em vermelho) 
e de com q p para a mulher (em verde) são 
apresentadas no gráfico abaixo: 
 
 
 
 
 9
 
 
 
Fig.1: Estratégias mistas ótimas na 
 Batalha dos Sexos 
 
1/3
2/3
1
0 1 p
q
EN1
EN2
EN3
 
 
 
Como vemos na figura acima, além do equilíbrio em 
estratégia mista (EN3) obtido anteriormente, 
aparecem os dois outros equilíbrios em estratégia 
pura: EN1 em que ambos vão ao ballet; 
e : EN2 em que ambos vão ao box. 
))1,0(,)1,0((=
))0,1(,)0,1((=
 
 
Exemplo 2: 
 
Vamos agora considerar uma situação um pouco mais 
complexa. 
 
 10
Trata-se do jogo da Figura 1 da Aula 8, reproduzido 
abaixo, no qual o jogador 1 possui três estratégias 
alternativas. 
 
 
 
a2 b2
a1
b1
c1
Jogador 2
Jogador 1
( -1 , 4 )
( 2 , - 2 ) 
( 0 , 1 )
( 6 , 2 )
( -2 , 4 )
( 2 , -6 )
 
 
Notemos )1,,( 21211 ppppm −−≡ e )1,(2 qqm −≡ as estratégias 
mistas do jogador 1 e do jogador 2, respectivamente. 
 
Os retornos esperados de cada alternativa são: 
 
Para o jogador 1: 
 17)1(6);( 211 −=−−= qqqmau 
 24)1(22);( 211 +−=−+−= qqqmbu 
 qqqmcu 2)1(02);( 211 =−+= 
Para o jogador 2: 
 6108)1(642);( 212121122 −+=−−−+= ppppppmau 
 1)(3)1(24);( 212121122 +−=−−+−= ppppppmbu 
 
Observe no conjunto de equações do jogador 1, que 
não existe um único valor para q que compatibiliza a 
igualdade entre as 3 equaçoes, de modo que, pelo 
teorema 1 (ii), o jogador 1 não jogará uma das suas 
estratégias disponíveis. Qual será ela ? 
 
Por outro lado, não poderá ocorrer, pois este 
valor não resolve duas das três equaçoes 
simultaneamente. 
0=q
Logo, no equilíbrio, o jogador 2 adotará uma 
estratégia mista. 
 
 11
Igualando entao a utilidade esperada das duas opções 
do jogador 2: 1)(36108 2121 +−=−+ pppp , vem: 
 
 07135 21 =−+ pp (*) 
 
que é uma das equações que determinará a estratégia 
mista ótima do jogador 1. 
 
Vamos entao calcular o valor esperado do jogo todo, 
para cada jogador: 
 
qqpqp
qppqppqpqpqpqpmmu
2)31(2)15(
)1)(1(0)1(2)1(22)1(6),(
21
21212211211
+−+−=
−−−+−−+−+−−−=
 
1)(3)7135(
)1)(1(1)1(6)1(24)1(42),(
2121
21212211122
+−+−+=
−−−+−−−−−+−+=
ppppq
qppqppqpqpqpqpmmu
 
Vamos primeiro verificar se a estratégia do jogador 
1 é provável: 
1c
 
Igualando qqpqpmmu 2)31(2)15(),( 21211 +−+−= com qmcu 2);( 211 = 
vem: 
 0)31(2)15( 21 =−+− qpqp (**) 
 
 
Se 5/1=q entao, por (**), 02 =p e, por (*) , 
valor que é inadmissível; 
5/71 =p
 
Se 3/1=q entao, por (**), 01 =p e, por (*) de 
modo que 
13/72 =p
13/61 21 =−− pp . Como a estratégia é 
improvável neste caso, pelo teorema 1 (ii) devemos 
checar que seu valor esperado 
1a
)3/413/717 −( ==−= q não 
será maior que o valor esperado do jogo. 
 
Ora, 3/23/2)3/31(13/14)13/5(01 =+−+−=u
3
 valor que é menor 
que /4 . 
 
 12
Vemos assim que a equação (**) é incompatível com 
o equilíbrio, de modo que o jogador 1 não jogará a 
estratégia . 
1c
 
 Logo, 101 2121 =+→=−− pppp . Substituindo este 
resultado na equação (*) obtemos: 4/31 =p e . 4/12 =p
 
Para achar o valor de , igualamos com 
, o que dá: 
q 17);( 211 −= qmau
24);( 211 +−= qmbu 11/3=q 
 
De acordo com o teorema 1 (ii), resta por fim checar 
que, com estas probabilidades, a utilidade esperada 
da estratégia 
1c )11/62( == q não excede a utilidade 
esperada do jogo inteiro para o jogador 1. 
 
Temos com efeito: 
 
 
11/10
)11/3(2))11/3(31)(4/1(2)1)11/3(5)(4/3(1
=
+−+−=u 
valor este que é maior que 11/6 . 
 
Além disso, 
2/5
)4/14/3(30)4/3(2
=
−+=u 
 
Podemos verificar também que as utilidades 
esperadas das estratégias prováveis igualam as 
utilidades esperadas para o jogo inteiro dadas acima, 
para cada jogador. 
 
Portanto, ))11/8,11/3(,)0,4/1,4/3(()ˆ,ˆ(ˆ 21 == mmm
)2
 é o 
equilíbrio de Nash em estratégia mista deste jogo, 
com vetor de retornos esperados: /5,11/10( . 
 
Enunciamos agora o teorema que garante a existência 
de pelo menos um equilíbrio de Nash em estratégia 
mista em todo jogo finito. 
 
 
 
 
 13
Teorema 1:(Existência de EN em estratégias mistas) 
 
Em todo jogo onde os conjuntos de n
iii uM 1),( ==Γ
estratégias puras são finitos, sempre existe um 
ni SS ,...,
equilíbrio de Nash em estratégias mistas. 
 
 
 
 
 
 
2. Estratégias Racionalizáveis 
 
 
 
 
Na Aula 8 definimos as estratégias estritamente 
dominadas de um jogador e vimos que estas poderiam 
ser eliminadas independentemente do que o jogador 
possa antecipar sobre as estratégias dos outros 
jogadores. 
 
Usamos entao o conhecimento compartilhado sobre a 
racionalidade dos jogadores e sobre a estrutura do 
jogo para justificar a definição de um equilíbrio em 
estratégias estritamente dominadas, baseado na 
eliminação destas estratégias. 
 
Veremos nesta seção que o conhecimento 
compartilhado da estrutura do jogo e da racionalidade 
individual, permitirá aos jogadores eliminarem do 
jogo mais do que apenas suas estratégias 
estritamente dominadas. 
 
Primeiramente, definiremos o que é a melhor 
resposta de um jogador à uma dada ação do outro 
jogador e, em seguida, explicaremos o que é uma 
estratégia racionalizável, um conceito introduzido 
por Bernheim e Pierce, em 1984. 
 
 
 14
Definição 2: A estratégia 
ii Mm ∈ é uma melhor 
resposta do jogador i para a estratégia ii Mm −− ∈ 
adotada pelos outros jogadores se: 
 
 
iiiiiiii Mmmmummu ∈′′≥ −− ;),(),( 
 
A estratégia nunca é uma melhor resposta do 
ii Mm ∈
jogador se não existe para a qual é a melhor i im− im
resposta. 
 
 
 
À partir desta definição, observe que uma estratégia 
estritamente dominada nunca é uma melhor resposta 
para o jogador. 
Entretanto, uma dada estratégia pode nunca ser a 
melhor resposta do jogador e, no entanto, não ser 
estritamente dominada. 
 
 
Temos disso um exemplo no jogo da Figura 1 da Aula 
8, reproduzido como exemplo 2 na seção anterior: 
para o jogador1, a escolha 
1c nunca é melhor 
resposta deste jogador, muito embora ela não seja 
uma estratégia estritamente dominada no seu jogo. 
 
 
A hipótese do conhecimento compartilhado da 
estrutura do jogo e da racionalidade dos jogadores 
permitirá eliminar iterativamente as estratégias que 
nunca são a melhor resposta dos jogadores. 
 
 
Isto será possível porque um jogador racional jamais 
adotará uma estratégia que nunca é melhor resposta 
para ele, uma vez que ele terá por certo que os outros 
jogadores também não jogarão aquelas que nunca 
são melhor resposta para eles. 
 
Não por acaso, no jogo do exemplo 2, o equilíbrio de 
Nash prescreve para o jogador 1 probabilidade 0 para 
a estratégia . 
1c
 15
 
Como nunca é a melhor resposta para o jogador 1, 
esta alternativa poderia ter sido eliminada do jogo, e 
o único equilibrio de Nash equivalente 
1c
))11/8,11/3(,)4/1,4/3(( seria obtido no jogo assim 
reduzido. Cheque isto ! 
 
 
Observe que, ao eliminarmos estratégias que nunca 
são melhor resposta, estaremos eventualmente 
eliminando mais do que se eliminássemos sòmente as 
estratégias estritamente dominadas. 
 
 
As estratégias que sobrevivem à eliminação iterada 
das estratégias que nunca são melhor resposta, são as 
que o jogador racional pode justificar ou melhor, 
racionalizar afirmativamente, através de conjecturas 
razoáveis sobre a escolha dos outros jogadores. 
 
 
 
Definição 3: As estratégias de que sobrevivem à 
iM
eliminação iterada das alternativas que nunca são a 
melhor resposta de são ditas estratégias i
racionalizáveis do jogador i. 
 
 
 
Exemplo 3: Considere o jogo proposto pelo próprio 
 Berheim, representado na Figura 2a. 
abaixo: 
 
 
 
 
 
 
 
 
 
 
 
 
 16
 
 Fig.2a: Eliminação de estratégias não 
 racionalizáveis 
 
 
a1
a2
a3
a4
b1 b2 b3 b4
( 0 , 7 ) ( 2 , 5 ) ( 7 , 0 ) ( 0 , 1 )
( 5 , 2 ) ( 3 , 3 ) ( 5 , 2 ) ( 0 , 1 )
( 7 , 0 ) ( 2 , 5 ) ( 0 , 7 ) ( 0 , 1 )
( 0 , 0 ) ( 0 , -2 ) ( 0 , 0 ) ( 10 , -1 )
J
o
g
a
d
o
r
1
Jogador 2
 
 
 
Vemos neste jogo que a estratégia nunca é a 
melhor resposta para o jogador 2 e, em conseqüência, 
pode ser eliminada. 
4b
 
Eliminando-se a estratégia do jogo, a estratégia 
do jogador 1 é estritamente dominada pela estratégia 
, de modo que também pode ser eliminada. 
4b 4a
2a
 
 
As estratégias remanescentes serão as estratégias 
racionalizáveis dos dois jogadores, conforme 
aparecem na Figura 2b: 
 
 
 
 
 
 
 
 17
Fig.2b: Estratégias Racionalizáveis 
 
a1
a2
a3
b1 b2 b3
( 0 , 7 ) ( 2 , 5 ) ( 7 , 0 )
( 5 , 2 ) ( 3 , 3 ) ( 5 , 2 )
( 7 , 0 ) ( 2 , 5 ) ( 0 , 7 )
J
o
g
a
d
o
r
1
Jogador 2
 
 
 
As estratégias racionalizáveis dos dois jogadores 
são: { } e { respectivamente. 321 ,, aaa }321 ,, bbb
 
Com efeito, para o jogador 1: 
 
 é a melhor resposta à ; 
1a 3b
 é a melhor resposta à ; 
2a 2b
 é a melhor resposta à ; 
3a 1b
 
Para o jogador 2: 
 é a melhor resposta à ; 
1b 1a
 é a melhor resposta à ; 
2b 2a
 é a melhor resposta à ; 
3b 3a
 
 
Temos aqui um EN em estratégia pura, , com 
payoff . 
),( 22 ba
)3,3(
 
 
 18
O importante a observar aqui é que a escolha de 
qualquer estratégia por um jogador é agora 
racionalizável, no sentido que ele pode fundamentar 
a sua crença na resposta do outro jogador, através de 
uma cadeia (infinita) de justificações. 
 
Por exemplo, o jogador 1 escolherá com base na 
crença de que o jogador 2 jogará . 
2a
2b
 
O jogador 1 justificará para si mesmo esta crença, 
com base na idéia de que o jogador 2 imagina que ele 
jogará , a qual é uma idéia razoável se ele, jogador 
1, acredita que o jogador 2 escolherá porque ele 
pensa que o jogador 1 escolherá , etc. 
2a
2b
1a
 
Assim, ao escolher o jogador 1 pode construir uma 
cadeia de justificações , onde a escolha 
de cada elemento da sequencia é justificado pela 
escolha do elemento seguinte. 
2a
,....),,,,( 12222 ababa
 
Outro exemplo: o jogador 1 poderá escolher (que 
não é a escolha de Nash) com base na seguinte 
cadeia de justificação: 
1a
 
O jogador 1 acredita que o jogador 2 escolherá . Ele 
justifica esta crença imaginando que o jogador 2 acha 
que ele, jogador 1, jogará . Ele justifica esta 
hipótese pensando que o jogador 2 pensa que o 
jogador 1 acha que ele, jogador 2, jogará . E assim 
por diante. 
3b
3a
1b
 
 
Assim, a escolha de pelo jogador 1 é racionalizada 
pela cadeia de justificações . 
1a
...)...,,,,,,,,,( 13311331 babababa
 
 
 
 
 
 
 19
 
3. Informaçao Incompleta 
 
 
 Até aqui supusemos que os jogadores tem 
conhecimento comum não apenas da estrutura do 
jogo como também das características pessoais ou 
preferencias um do outro. 
 
Situações com informação completa são importantes 
como marco teórico da análise das decisões 
estratégicas, mas nem sempre freqüentes no mundo 
real. 
 
Em jogos competitivos, as firmas não conhecem os 
custos marginais umas das outras; em jogos de 
baralho, o jogador conhece as cartas da sua mao, 
mas não as dos seus parceiros ou adversários, etc. 
 
Assim, em muitas situações concretas os jogadores 
dispõem de informação incompleta. 
 
O desconhecimento uns dos outros pode levar os 
jogadores a fazerem conjecturas recíprocas sobre as 
preferenciais ou possíveis ações uns dos outros, um 
pouco no sentido da racionalidade vista 
anteriormente. 
 
Todavia, o problema do encadeamento de 
conjecturas que poderiam gerar situações de 
informação incompleta dos jogadores, foi 
contornado pelo enfoque inaugurado por Harsanyi 
(1967-68). 
 
Na abordagem de Harsanyi, as preferências dos 
jogadores tem uma representaçao paramétrica 
através do tipo, este formalizando a realização de 
uma variável aleatória. 
 
A distribuição desta variável aleatória é de 
conhecimento comum dos jogadores, mas a sua 
realização é observada únicamente pelo jogador. 
 
 20
Nesta formulação, o jogo com informação 
incompleta assume a forma de um jogo com 
informação imperfeita. 
 
A Natureza produz o primeiro moto do jogo, 
fornecendo as realizações das variáveis aleatórias de 
cada jogador, as quais identificarão as preferências 
de cada um, melhor dizendo, os tipos individuais. 
 
O jogador observa a realização da sua variável 
aleatória unicamente, não a dos outros. 
 
Em virtude desta assimetria de informação existente 
entre os jogadores, a qual os obriga a considerar as 
probabilidades a priori das preferências uns dos 
outros, estes jogos passaram a chamar-se jogos 
Bayesianos. 
 
Um exemplo extraído do livro de Mas-Colell, Wiston 
e Green, Microeconomic Theory, p.254, ajudará a 
entender melhor este tipo de jogo. 
 
Considere o Dilema dos Prisioneiros modificado no 
qual o prisioneiro 1 é irmão do Delegado. Este 
promete a seu irmão prisioneiro que, se ambos os 
prisioneiros não confessarem, ele será liberado sem 
pena, enquanto que a penalidade do prisioneiro 2 
continuará sendo neste caso a mesma, 2 anos de 
prisão. 
 
Fig.3a: Dilema dos prisioneiros modificado: 
 O prisioneiro 1 é irmão do Delegado 
 
C ÑC
C
ÑC
Prisioneiro 2
Prisioneiro 1
( - 1 , - 10 )
( 0 , - 2 ) 
( - 5, - 5 )
( - 10 , -1 )
 
 21
 C: confessa ; ÑC: não confessa 
 
Note que agora, para o prisioneiro 1, se o outro 
confessa ele também confessa, mas se o outro não 
confessa, sua melhor resposta será de não confessar 
também. 
 
O jogador 2 continuará tendo por estratégia 
estritamente dominanteconfessar. 
 
Logo eliminando-se a opçao ÑC do prisioneiro 2, a 
melhor resposta do prisioneiro 1 continuará sendo 
confessar, de modo que o EN deste jogo modificado 
não ficará alterado: (C,C). 
 
Considere agora a situaçao na qual o prisioneiro 2 
detesta dedurar o colega, a ponto de considerar uma 
autopunição psicológica equivalente a 6 anos de 
prisão adicional caso venha a denunciar o seu amigo. 
 
A forma normal deste jogo novamente modificado 
ficaria assim: 
 
Fig.3b: Dilema dos prisioneiros modificado: 
 O prisioneiro 2 detesta dedurar 
 
C ÑC
C
ÑC
Prisioneiro 2
Prisioneiro 1
( - 1 , - 10 )
( 0 , - 2 ) 
( - 5, - 11)
( - 10 , -7 )
 
 
 
 
Note que agora, nesta variante, ÑC é a estratégia 
dominante do prisioneiro 2. 
 22
Com base nas variantes das Figuras 3a. e 3b., temos 
agora dois “tipos” para o prisioneiro 2: o tipo que 
prefere “confessar”, da Figura 3a. (tipo I), e o tipo 
que prefere “não confessar”, da Figura 3b (tipo II). 
 
Como o prisioneiro 1 deverá escolher sua estratégia, 
uma vez que: ele conhece os payoffs das duas 
variantes do jogo, mas nao sabe qual dos dois “tipos” 
do seu companheiro irá se manifestar ? 
 
Suponha que o prisioneiro 1 avalie em μ a 
probabilidade a priori que o prisioneiro 2 seja do 
primeiro tipo, e 01 >− μ do segundo tipo. 
 
De acordo com Harsanyi, este jogo com informação 
incompleta pode ser transformado em um jogo com 
informação imperfeita, escrito na forma extensiva, 
onde o primeiro jogador a mover é a Natureza, 
fornecendo a realização do tipo μ , mas sòmente ao 
prisioneiro 2. 
 
Fig4: O Dilema dos Prisioneiros Modificado com 
 Informação Incompleta 
 
 
C ÑC C
C ÑC ÑC ÑCÑC
⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−
5
5
⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−
10
1
⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−
1
10
⎟⎟⎠
⎞⎜⎜⎝
⎛
− 2
0
⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−
7
10
⎟⎟⎠
⎞⎜⎜⎝
⎛
− 2
0
Natureza
Prisioneiro 1
Prisioneiro 2 Prisioneiro 2
μ μ−1
ÑC
C C C
⎟⎟⎠
⎞
⎜⎜⎝
⎛
−
−
10
1⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−
11
5
 
 23
 
À partir da Figura 4, vemos que agora, uma estratégia 
pura para o prisioneiro 2 deve especificar, para cada 
realização do seu tipo (dado pela Natureza), as ações 
que ele pode empreender. 
 
Assim, 4 estratégias puras estão à disposição do 
prisioneiro 2: 
 
 1. (C se tipo I , C se tipo II) 
 2. (C se tipo I , ÑC se tipo II) 
 3. (ÑC se tipo I , C se tipo II) 
 4. (ÑC se tipo I , ÑC se tipo II) 
 
Estamos agora em medida de resolver o equilíbrio de 
Nash Bayesiano, em estratégias puras, deste jogo. 
 
Para o prisioneiro 2, como ele conhece o seu tipo, C 
é sua estratégia dominante no tipo I e ÑC é sua 
estratégia dominante no tipo II, sua estratégia de 
equilíbrio será evidentemente a segunda acima: 
 
 (C se tipo I , ÑC se tipo II) =2sˆ
 
Para o prisioneiro 1, como ele sabe que o outro 
confessará se for do tipo I e não confessará se for do 
tipo II, ele adotará a estratégia que lhe proporciona o 
maior retorno esperado. 
 
Assim, ele confessará se o retorno esperado de C for 
maior que o retorno esperado de ÑC, isto é se: 
 
 )1(010)1)(1(5 μμμμ −+−>−−+− , 
 
ou ainda, se 6/1>μ . 
 
 
 
 Logo: 
⎪⎩
⎪⎨
⎧
=
<
>
=
6/1;,
6/1;
6/1;
1ˆ
μ
μ
μ
ÑCC
ÑC
C
s
 
 24
Assim, o prisioneiro 1 confessará se a probabilidade 
do prisioneiro 2 ser do tipo que confessa for maior 
que 1/6, e não confessará se esta probabilidade for 
menor, isto é, suficientemente baixa. 
 
Observe a assimetria de informação existente neste 
jogo: o prisioneiro 2 tem informação completa, mas 
não o prisioneiro 1. 
 
Mas a desinformação do prisioneiro 1 porta sobre o 
tipo de prisioneiro 2, com quem ele deve tratar. 
 
Assim, o prisioneiro 1 maximiza seu retorno esperado 
baseado em uma distribuição de probabilidade a 
priori definida sobre o tipo do seu companheiro, cuja 
realização ele efetivamente não observa. 
 
Mas os dois agentes maximizam o retorno esperado. 
 
Esta é também uma característica do equilíbrio de 
Nash Bayesiano: cada jogador maximiza seu retorno 
esperado, mas não calculado com base em uma 
distribuição de probabilidade a ser determinada 
endógenamente, como no EN em estratégias mistas. 
 
No equilíbrio Bayesiano o retorno esperado é 
calculado com base na distribuição comum dos tipos, 
sendo que a realização “marginal” destes tipos é de 
conhecimento apenas individual. 
 
Vamos encerrar esta sessão definindo formalmente o 
equilíbrio de Nash Bayesiano, em estratégias puras. 
 
 
Jogos Bayesianos 
 
Em um jogo Bayesiano onde os jogadores adotam 
estratégias puras, cada jogador i tem funçao payoff 
);,( iiii ssu θ− onde ii Θ∈θ é uma variável aleatória dada 
pela Natureza que é observada sòmente pelo próprio 
jogador i . 
 
A distribuiçao conjunta dos s´θ é dada por ),...,( 1 nF θθ , a 
qual é supostamente conhecida de todos os jogadores. 
 25
 
Aqui, o suporte da distribuição conjunta é 
, o qual pode ser finito ou infinito. 
nΘ××Θ=Θ ...1
 
Uma estratégia pura para o jogador i em um jogo 
Bayesiano é uma regra de decisão )( iis θ que 
especifica sua escolha estratégica para cada 
realização do seu tipo. 
 
Assim, o retorno esperado pelo jogador i , dado o 
vetor das estratégias puras dos jogadores 
será: 
(.)(.),...,1 nss n
 
 );)(),...,(((.))(.),...,(~ 111 innini ssuEssu θθθθ= 
 
onde o valor esperado é calculado com a medida dF
definida à partir da distribuição conjunta F de todos 
os tipos ),...,( 1 nθθθ = . 
 
 
Definição 4: Equilíbrio de Nash Bayesiano 
 (Estratégias Puras) 
 
Um equilíbrio de Nash Bayesiano em estratégias 
puras é um vetor de regras de decisão tal (.)(.),...,1 nss
que, para todo i , temos: ),...,2,1( ni =
 
 (.)),(.)(~(.)),(.)(~ *1 iiiii ssussu −− ≥ 
 
 
para toda outra regra decisão factível ao jogador (.)*is
i . 
 
 
 
A Proposição seguinte ajudará a precisar melhor o 
EN Bayesiano: 
 
 
 
 26
 
Proposiçao 1: O vetor de regras de decisão (.)(.),...,1 nss
é um equilíbrio de Nash Bayesiano de um jogo 
Bayesiano se e sòmente se, para todo jogador e toda i
realização provável 
ii Θ∈*θ do seu tipo, temos: 
 
 );)(,´();)(,)(( **1
***
1 liiiiliiiii ssuEssuE ii θθθθθθθ θθ −−−− −− ≥ 
 
 
 
para toda outra estratégia pura 
ií Ss ∈, . 
 
 
Aqui, o valor esperado dos retornos é calculado sobre 
as realizações possíveis das variáveis aleatórias dos 
outros jogadores, condicionada à cada realização *
iθ 
do jogador i . 
 
A proposição acima nos informa que cada tipo de 
jogador pode ser pensado como um jogador à parte 
que maximiza seu retorno esperado com base na 
distribuição condicionada das escolhas estratégicas 
dos outros jogadores. 
 
 
Em jogos seqüenciais, a serem estudados na próxima 
aula, quando um ou mais jogadores tem informação 
incompleta, a fórmula de Bayes para probabilidade 
condicional é usada. 
 
Quando o jogador observa a escolha feita pelo 
jogador na etapa anterior, ele poderá revisar sua 
distribuição de probabilidade a priori para as etapas 
seguintes, com base na observação destas escolhas, 
de acordo com a regra de Bayes. 
 
 
 
 
 
 
 27
 
 
 
 
 
4. Bibliografia e Exercícios Sugeridos 
 
 
 
Bibliografia: 
 
[SN] Cap.8 
[VO] Cap.16 
[JR] Cap.7 
 
 
 
Exercícios Sugeridos. 
 
Anpec: 
 2012/ Q08 
 2011/ Q11 
 2010/ Q10 
 2009/ Q11 
 2008/ Q09 
 2007/ Q11 
 2006/ Q10,Q11 
 2005/ Q11,Q12 
 2004/ Q11,Q14 
 2003/ Q11,Q12 
 
 
[SN]: 8.1-8.5

Outros materiais