Buscar

ANPEC AULA 8. Estratégias e Jogos - I

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
AULA 8 : ESTRATÉGIAS E JOGOS - I 
 
 
 
 1. Conceitos básicos; 
 2. Estratégias Dominantes e Dominadas; 
 3. O Dilema dos Prisioneiros; 
 4. Equilíbrio de Nash: Estratégias puras 
 5. Estratégias comportamentais: minmax e maxmin 
 6. Bibliografia e Exercícios sugeridos 
 
 
 
1. Conceitos Básicos 
 
Nos dois capítulos anteriores analisamos o problema 
da escolha ótima de um agente individual quando 
confrontado com um ambiente de incerteza quanto às 
conseqüências das suas decisões. 
 
Neste e nos próximos dois capítulos estudaremos o 
problema da decisão do agente em uma situação mais 
complexa, em que há outros agentes decisores cujas 
escolhas podem afetar os resultados obtidos pelas 
escolhas deste agente. 
 
Em outras palavras, temos um contexto decisório 
interativo, em que as escolhas individuais assumem 
um caráter estratégico. 
 
Na literatura, convencionou-se chamar tais situações 
de Jogos, sobre os quais desenvolveu-se todo um 
conjunto teórico chamado teoria dos jogos. 
 
 
 
Jogos 
 
 
Trata-se de um problema de decisão em um contexto 
estratégico, no qual as escolhas de um jogador 
interagem e afetam as decisões tomadas pelos outros 
jogadores. 
 
 2
Todo jogo possui três ingredientes: 
 
a) Jogadores 
 
Jogadores são os tomadores de decisão, que podem 
ser indivíduos (como em um jogo de baralho), firmas 
(em um mercado concorrencial), países (em um 
conflito militar), etc. 
 
Portanto, jogadores são os participantes do jogo, 
aptos a escolher entre um conjunto de ações 
alternativas. 
 
Em um jogo com n indexamos os jogadores pelo 
índice ni ,...,2,1=
 
 
b) Estratégias 
 
Uma estratégia é uma sequencia de escolhas 
alternativas que se abrem ao jogador ao longo do 
jogo. 
 
Em um mesmo jogo, múltiplas estratégias se abrem 
normalmente para cada jogador. 
 
Estas estratégias podem envolver uma única ação 
simples (tipo aumentar ou não o preço) ou 
condicionada (tipo aumentar o preço somente se mais 
de 50% dos competidores o fizerem) ou uma 
sequencia de ações, uma em cada nó de decisão 
(como em um jogo seqüencial). 
 
O conjunto de estratégias abertas no jogo para o 
jogador será notado . Uma estratégia em 
particular será: . 
i iS
ii Ss ∈
 
 
c) Resultados 
 
Um resultado do jogo é uma recompensa (payoff), 
uma renda, uma utilidade, o produto de um jogo, 
recebido pelo jogador ao final do jogo. 
 
 3
Este resultado é funçao das estratégias adotadas 
pelos jogadores. 
 
Em um jogo com n jogadores, se é a estratégia 
adotada pelo jogador , denotamos o vetor das 
estratégias dos outros 
is
i
1−n jogadores por: 
 ),...,,,...,( 111 niii sssss +−− =
 
Deste modo, o resultado do jogo para o jogador 
será a funçao: 
i
 
 ),(),(:......: 1 iiiiinii ssussRSSSu −− →→×××× 
 
onde é a recompensa (payoff) do jogador 
quando ele adota a estratégia e os outros 
participantes adotam suas estratégias em . 
),( iii ssu − i
is
is−
 
 
Conjuntos de Informação 
 
Cada jogador, no momento em que é chamado a 
jogar, possui um determinado conjunto maior ou 
menor de elementos que informam à ele sobre: 
 
(i) as escolhas efetuadas pelos outros 
jogadores que atuaram antes dele; 
 
(ii) os resultados do jogo depois das escolhas 
efetuadas por ele. 
 
 
 
Tipologia dos Jogos 
 
 
a) Do ponto de vista da atitude dos jogadores, um 
jogo pode ser cooperativo ou não cooperativo. 
 
No jogo cooperativo, abre-se a possibilidade dos 
jogadores formarem uma coalisao, jogarem de 
maneira préviamente concertada entre si, de modo a 
maximizar o resultado agregado do jogo. Por 
 4
exemplo, o mercado de um determinado produto, 
dominado por um cartel de ofertantes é um exemplo. 
 
No jogo não cooperativo, dadas as escolhas dos 
outros, cada jogador faz suas escolhas 
independentemente, de modo a maximizar o seu 
resultado. Um mercado onde os ofertantes de um 
produto homogêneo competem entre si escolhendo 
quantidades (Cournot) é modelado como um jogo não 
cooperativo. 
 
 
b) Do ponto de vista das estratégias, os jogos podem 
ser finitos ou infinitos, de acordo com a natureza do 
conjunto das suas estratégias. 
 
O conjunto de estratégias de cada jogador , , pode 
ser discreto, finito ou infinito (como um jogo “par-
ímpar” jogado um número finito de vezes, ou uma 
infinidade de vezes) ou contínuo (como um jogo de 
Bertrand) onde uma estratégia pode ser a escolha de 
um preço abaixo de um determinado limite, isto é, 
dentro de um conjunto infinito de valores. 
i iS
 
 
c) Do ponto de vista da ordem das jogadas, um jogo 
pode ser simultâneo, ou seqüencial. 
 
No jogo simultâneo, os jogadores fazem suas 
escolhas simultâneamente. 
 
No jogo seqüencial, existe uma ordem pre-
estabelecida para as intervenções de cada jogador. 
 
Jogos sequenciais são considerados jogos dinâmicos. 
 
 
 5
d) Do ponto de vista da freqüência, jogos 
simultâneos podem ser jogados uma única vez ou 
entao jogados repetidamente, um número finito ou 
infinito de vezes. 
 
O jogo que é repetido, em um contexto dinâmico, é 
chamado jogo estágio. 
 
 
e) Do ponto de vista dos conjuntos de informação 
dos jogadores, um jogo pode envolver informação 
perfeita ou informação imperfeita. 
 
 Em um jogo com informação perfeita, os 
conjuntos de informação, de todos os jogadores, são 
constituídos, cada um deles, por um único nó de 
decisão. 
 
Do contrário, quando um mesmo conjunto de 
informação envolve mais de um nó de decisão, trata-
se de um jogo com informação imperfeita. 
 
Jogos simultâneos com mais de uma escolha, são 
necessáriamente jogos com informação imperfeita, 
como veremos adiante. 
 
 
f) Do ponto de vista do conhecimento dos jogadores, 
um do outro e dos resultados do jogo, os jogos 
podem ter informação completa ou incompleta. 
 
O caso de um jogo com informação completa é o de 
uma situação em cada jogador conhece perfeitamente 
as condiçoes de escolha e as preferências de cada 
jogador. 
 
Quando isto não ocorre, temos um jogo com 
informação incompleta. 
 
Situações com informação incompleta ocorrem por 
exemplo, em um mercado concorrencial no qual as 
firmas não conhecem os custos médios das 
concorrentes; em uma negociação salarial com 
ameaças de greve, a construtora não conhece a 
 6
capacidade do sindicato mobilizar os trabalhadores e 
sustentar um longo período de paralisação, etc. 
 
 
g) Do ponto de vista da sua descrição, os jogos 
podem ter uma representaçao na forma normal ou na 
forma extensiva. 
 
Na forma normal, um jogo entre dois jogadores é 
apresentado como uma tabela a duas entradas, nas 
quais aparecem as várias ações alternativas que se 
apresentam para cada jogador e, no interior da tabela, 
o par de resultados obtidos nas escolhas de cada um 
deles. 
 
 Na Figura 1 abaixo temos um jogo entre dois 
jogadores, o primeiro tem três ações alternativas, 
 , o segundo tem duas ações possíveis, . 
111 ,, cba 22 , ba
 
Cada jogador joga uma única vez; se o jogador 1 
escolhe e o jogador 2 escolhe , o resultado para 
o jogador 1 será 
1a 2a
6),( 211 =aau e para o jogador 2 
. 2),( 122 =aau
 
 
Fig.1:Jogo na forma normal 
 
a2 b2
a1
b1
c1
Jogador 2
Jogador 1
( -1 , 4 )
( 2 , - 2 ) 
( 0 , 1 )
( 6 , 2 )
( -2 , 4 )
( 2 , -6 )
 
 
 7
 
Na forma extensiva, o jogo se apresenta como uma 
árvore de decisão. 
 
Se o jogo é simultâneo qualquer jogador pode figurar 
no topo da árvore; se o jogo for seqüencial, entao a 
ordem importa. 
 
Na Figura 2a. abaixo representamos o jogo 
simultâneo da figura 1. 
 
 
Fig.2a: Jogo simultâneo na forma extensiva: 
 informação imperfeita1
2 2 2
a1 b1 c1
a2 b2 b2 b2a2 a2
⎟⎟⎠
⎞⎜⎜⎝
⎛
2
6
⎟⎟⎠
⎞⎜⎜⎝
⎛−
4
1
⎟⎟⎠
⎞⎜⎜⎝
⎛−
4
2
⎟⎟⎠
⎞⎜⎜⎝
⎛
− 2
2
⎟⎟⎠
⎞⎜⎜⎝
⎛
− 6
2 ⎟⎟⎠
⎞⎜⎜⎝
⎛
1
0
CI 2
 
 
 
A elipse pontilhada envolvendo os três nós de 
decisão do jogador 2 indicam que estes nós estão no 
mesmo conjunto de informação deste jogador (CI2). 
 
Isto significa que, ao fazer sua escolha, ele não sabe 
qual é a escolha feita pelo jogador 1. 
 
 8
 
Como mencionamos acima, o jogo simultâneo é um 
jogo com informação imperfeita, e isto pode ser 
observado na sua forma extensiva: o conjunto de 
informação do jogador 2 (CI2) tem mais de um nó de 
decisão. 
 
Na Figura 2b abaixo apresentamos o jogo anterior 
alterado: o jogador 1 joga primeiro. 
 
Neste caso, temos um jogo seqüencial com 
informação perfeita: o jogador observa a escolha do 
jogador 1 e tem três conjuntos de informação 
distintos, com um único nó de decisão em cada um 
deles. 
 
 
Fig.2b: Jogo seqüencial na forma extensiva: 
 informação perfeita 
 
 
1
2 2 2
a1 b1 c1
a2 b2 b2 b2a2 a2
⎟⎟⎠
⎞⎜⎜⎝
⎛
2
6
⎟⎟⎠
⎞⎜⎜⎝
⎛−
4
1
⎟⎟⎠
⎞⎜⎜⎝
⎛−
4
2
⎟⎟⎠
⎞⎜⎜⎝
⎛
− 2
2
⎟⎟⎠
⎞⎜⎜⎝
⎛
− 6
2 ⎟⎟⎠
⎞⎜⎜⎝
⎛
1
0
 
 
 
Se os resultados representam valores monetários ($), 
qual seria o resultado deste jogo ? 
 
 9
Uma solução não cooperativa, na qual cada jogador 
maximiza o seu resultado, independentemente do 
outro, o jogador 2 escolherá se o jogador 1 
escolher ou e se o jogador 1 escolher . 
2b
1a 1c 2a 1b
 
Os resultados, para o jogador 1 seráo, nos dois 
primeiros casos, ou , respectivamente, ou no 
último caso. 
1− 0 2−
 
Logo, a estratégia ótima para o jogador 1 será “ ”, 
“ se ” para o jogador 2. 
1c
2b 1c
 
Cooperação 
 
Este é no entanto um resultado pífio, o benefìcio 
agregado é , e há possibilidade dos jogadores 
obterem um resultado conjunto melhor. 
110 =+
 
Mas para isso, é necessário que haja cooperação 
entre os jogadores. 
 
Se o jogador 2 se compromete a jogar caso o 
jogador 1 jogar , mediante divisão equitativa do 
valor agregado, o resultado seria 
2a
1a
826 =+ , de modo que 
ambos teriam 4 . 
 
Neste jogo, o comprometimento do jogador 2 é crível 
para o jogador 1, pois o jogador 2 estará obtendo 4 , 
que é um resultado melhor daquele obtido na 
ausência de cooperação (1), e não inferior a qualquer 
outro resultado que ele poderia obter neste jogo. 
 
 
 
2. Estratégias Dominantes e Dominadas 
 
 
 Em muitas situações, o jogador possui uma 
estratégia que é a melhor para ele, qualquer seja a 
ação empreendida pelos outros jogadores. 
 
 10
 
Definição 1: A estratégia 
ii Ss ∈ˆ é uma estratégia 
estritamente dominante para o jogador i se para toda 
outra estratégia , temos, 
ii Ss ∈
 
 
iiiiiiii Ssssussu −−−− ∈∀> ;),(),ˆ( 
 
Obs.: Para a dominância fraca, substitui-se a 
desigualdade estrita na expressão acima pela 
desigualdade fraca ( ). ≥
 
 
Fig.3a: Estratégias estritamente dominantes e 
 dominadas 
a2 b2
a1
b1
c1
Jogador 2
Jogador 1
( -1 , 1 )
( -2, - 1 ) 
( -3 , 2 )
( 1 , -1 )
( -1 , 1 )
( -2 , 5 )
 
 
Na Figura 3a. acima, é uma estratégia estritamente 
dominante para o jogador 1. 
1a
 
O jogador 2 não possui estratégia dominante. 
 
 
No jogo da Figura 1, nenhum dos jogadores possui 
estratégia dominante. 
 
 11
Definição 2: A estratégia 
ii Ss ∈~ é uma estratégia 
estritamente dominada para o jogador se existe i
outra estratégia , tal que , 
ii Ss ∈*
 
 
iiiiiiii Ssssussu −−−− ∈∀< ;)*,(),~( 
 
Obs.: A estratégia 
ii Ss ∈~ é fracamente dominada se a 
desigualdade fraca ( ≤) é admissível na relação 
acima. 
 
Obviamente, se o jogador tem uma estratégia 
dominante, como no jogo precedente da Figura 3a, 
todas as suas outras estratégias serão estratégias 
dominadas. 
 
Na Figura 3b abaixo, para o jogador 1 as estratégias 
 e são fracamente dominadas pela estratégia . 
1a 1b 1c
 
Fig.3b: Estratégias fracamente dominantes e 
 dominadas 
 
 
a2 b2
a1
b1
c1
Jogador 2
Jogador 1
( 4 , 0 )
( 3 , 1 ) 
( 4 , 4 )
( 5 , 1 )
( 6 , 0 )
( 6 , 4 )
 
 
O jogador 2 não possui estratégias dominadas. 
 
 
 
 12
3. O Dilema dos Prisioneiros 
 
 
Vamos apresentar um jogo introduzido na literatura 
por A.W.Tucker na década de 1940, e que se tornou 
célebre na teoria dos jogos: O Dilema dos 
Prisioneiros. 
 
Dois suspeitos de terem conjuntamente cometido um crime 
são presos e colocados em celas separadas. O Delegado tenta 
obter a confissão de ambos, ao passo que os acusados tentam 
obter a menor pena possível. 
O Delegado diz separadamente, à cada um dos presos, que se 
ele for o único a confessar, será beneficiado com uma pena 
levíssima, de 1 ano de prisão apenas, enquanto que o outro 
levará 10 anos de prisão . Se todavia ele for o único a não 
confessar, ele é que receberá a pena de 10 anos de prisão. 
Se ambos confessarem, entao a pena será mais branda, 5 anos 
de prisão para cada um. 
Por fim, se nenhum dos dois confessar, o Delegado informa 
que mesmo assim será possível incriminá-los e que ambos 
receberão uma pena de 2 anos de prisão. 
 
Qual será a solução deste jogo ? 
 
Trata-se de um jogo simultâneo (informação 
imperfeita), representado abaixo na forma normal: 
 
Fig.4a: Dilema dos Prisioneiros 
 
C ÑC
C
ÑC
Prisioneiro 2
Prisioneiro 1
( - 1 , - 10 )
(- 2 , - 2 ) 
( - 5, - 5 )
( - 10 , -1 )
 
 
 
 C: confessa ; ÑC: não confessa 
 13
 
 
 
Note que ambos os jogadores possuem uma estratégia 
estritamente dominada, que é não confessar “ÑC”. 
 
 
Obviamente, se os jogadores são racionais, nunca 
escolherão uma estratégia estritamente dominada. 
 
 
Assim, fazendo a hipótese de que os jogadores são 
racionais, cada jogador eliminará a estratégia 
estritamente dominada, o que levará ao equilíbrio 
desejado pelo Delegado: (C , C), ambos os 
prisioneiros confessam o crime. 
 
 
Observe aqui também que esta solução não é de fato 
a melhor para os prisioneiros: se eles pudessem se 
comunicar, se concertariam para não confessar, pois 
neste caso teriam apenas 1 ano de prisão cada. 
 
 
A solução cooperativa do jogo seria ( ÑC, ÑC ). 
 
 
 
 
Solução de um jogo por eliminação iterada de 
estratégias estritamente dominadas 
 
 
 
Temos entao que em jogos que possuem estratégias 
estritamente dominadas, a solução pode ser 
encontrada quando estas estratégias podem ser 
eliminadas iteradamente, isto é, etapa por etapa. 
 
 
O jogo da Figura 4b ilustrará esta situação: 
 
 
 
 
 14
Fig4b: Eliminação iterada 
 
L R
U
C
D
Jogador 2
Jogador 1
( 0 , -4 )
( -2 , 4 ) 
( -1 , 8 )
( 3 , 0 )
( 1 , -1 )
( 2 , 4 )
( 0 , -5 )
( 3 , 3 )
( 4 , 1 )
M
 
 
A estratégia “C” do jogador 1 é estritamente 
dominada pela estratégia “D¨. 
 
A estratégia “M” do jogador 2 é estritamente 
dominada pela estratégia “R”. 
 
Se cada jogador se comportar racionalmente e cada 
um conjecturar que o outro também se comporte 
racionalmente, as estratégias dominadas serao 
eliminadas e o jogo se simplifica conforme a Figura 
4c abaixo: 
 
Fig4c: Primeira eliminação 
 
L R
U
D
Jogador 2
Jogador 1
( 0 , -4 )
( -1 , 8 )
( 3 , 0 )
( 2 , 4 )
 
 15
 
Note que, após a eliminaçao da estratégia “M” do 
jogador 2, a estratégia “D” do jogador 1 passa a ser 
uma estratégia estritamente dominada pela estratégia 
“U”. 
 
Deste modo, se o jogador 2 acha que o jogador 1 se 
comportará racionalmente, o jogo poderá sofrerá uma 
nova redução, conformeaparece na Figura 4d abaixo: 
 
 
Fig.4d: Segunda eliminação 
 
L R
U
Jogador 2
Jogador 1 ( 0 , -4 )( 3 , 0 )
 
 
 
Neste estágio, o jogo se resolve naturalmente, pois o 
jogador 1 só possui uma estratégia sobrevivente e o 
jogador 2 poderá eliminar a estratégia “R” que passa 
a ser estritamente dominada por “L”. 
 
 
Fig.4e: Terceira e última eliminação 
 
 
 
L
U
Jogador 2
Jogador 1 ( 3 , 0 )
 
 
Sendo o jogador 2 racional, a soluçao do jogo será o 
par de estratégias ( U , L ), com payoff e 
 para os jogadores 1 e 2, respectivamente. 
3),(1 =LUu
0),(2 =ULu
 
 
 16
 
Dois pontos são agora importantes: 
 
 
a) Soluções por eliminação iterada: 
 
 Nem todo jogo finito poderá ser resolvido 
completamente desta maneira: muitos jogos não 
permitem a eliminação iterada das estratégias 
estritamente dominadas até que seu conjunto de 
estratégias se reduza à uma única estratégia, como no 
exemplo acima. 
 
Por exemplo, o jogo da Figura 1, nenhum dos 
jogadores possui estratégia estritamente dominada, de 
modo que não podemos resolver aquele jogo pelo 
método da eliminação iterada. 
 
Formalizando o argumento: 
 
Seja o conjunto inicial de estratégias do jogador i e 
 o conjunto das suas estratégias que sobreviventes 
após a 
iS
k
iS
mak etapa de eliminação. 
 
Por definição temos: k
ii Ss ∈ se 1−∈ kii Ss e não é 
estritamente dominada, 
is
in,...,k 2,1= , com iSlS ≡0 onde é 
o número de estratégias oferecidas ao jogador no 
jogo inicial. 
in
i
 
Um jogo finito admite soluçao por eliminação iterada 
de estratégias estritamente dominadas se, para todo 
jogador , existe um número inteiro de etapas 
, tal que o conjunto se reduz à uma única 
estratégia: . 
i
1−≤ ii nk iklS{ }ikl sS i ˆ=
 
 
b) Estratégias fracamente dominadas 
 
 
É possível resolver um jogo eliminando-se 
iteradamente estratégias fracamente dominadas ? 
 
 17
Sim, é possível, mas este procedimento apresenta o 
resultado indesejável de que mais de uma solução 
pode ser obtida para o mesmo jogo, dependendo da 
ordem com a qual as estratégias fracamente 
dominandas serão eliminadas ! 
 
Para ilustrar isto, retomemos o jogo da Figura 3b. 
 
Neste jogo, o jogador 1 possui duas estratégias 
fracamente dominadas pela estratégia : as 
estratégias e . 
1c
1a 1b
 
O jogador 2 não possui estratégia dominada, mas se 
ele acha que o jogador 1 se comportará racionalmente 
desconsiderando primeiramente a estratégia , o jogo 
fica reduzido conforme a figura abaixo: 
1a
 
Fig.5a: Eliminação da estratégia fracamente 
 dominada 
1a
a2 b2
b1
c1
Jogador 2
Jogador 1
( 3 , 1 ) 
( 4 , 4 )
( 6 , 0 )
( 6 , 4 )
 
 
Agora, na segunda etapa, para o jogador 2 a 
estratégia é fracamente dominada pela estratégia , 
enquanto que, para o jogador 1, a estratégia 
continua sendo fracamente dominada pela estratégia 
. 
2a 2b
1b
1c
 
Se cada jogador conjectura que o outro se comportará 
racionalmente, eliminando sua estratégia fracamente 
dominada do jogo, na etapa 2 obtemos a solução: 
 18
 
 ( c1, b2 ) com payoff para os jogadores. )4,4(
 
Caso o jogador 2 acha que o jogador 1 eliminará 
primeiro a estratégia , o jogo fica reduzido 
conforme a figura abaixo: 
1b
 
Fig.5b: Eliminação da estratégia fracamente 
 dominada 
1b
 
a2 b2
a1
c1
Jogador 2
Jogador 1
( 4 , 0 ) 
( 4 , 4 )
( 5 , 1 )
( 6 , 4 )
 
 
Neste caso, para o jogador 2 a estratégia é 
fracamente dominada pela estratégia , enquanto 
que, para o jogador 1, a estratégia continua sendo 
fracamente dominada pela estratégia . 
2b
2a
1a
1c
 
Novamente, se cada jogador conjectura que o outro se 
comportará racionalmente, eliminando nesta segunda 
etapa sua estratégia fracamente dominada, obtemos a 
solução: 
 
 ( c1, a2 ) com payoff para os jogadores 
1 e 2, respectivamente, que é uma solução diferente 
da anterior. 
)4,6(
 
Vemos assim que a solução do jogo depende da 
ordem com a qual as estratégias dominadas 
fracamente foram eliminadas. 
 
 19
Quid se o jogador 2 achar que o jogador 1 descartará 
as duas estratégias fracamente dominadas e 
simultâneamente ? 
1a 1b
 
Neste caso, na segunda etapa, o jogador 2 será 
confrontado apenas com a última linha da Figura 5b 
acima, de modo que ele estará indiferente entre as 
estratégias e , pois ambas lhe proporcionarão o 
mesmo payoff. 
2a 2b
 
Como esta escolha não é indiferente para o jogador 1, 
se o jogador 2 for “mau”, ele escolherá ; 
2b
Se ele for “benevolente”, escolherá ; 
2a
Se ele for “justo”, buscará uma solução cooperativa, 
prometendo ao jogador 1 a estratégia conjunta 
em troca do payoff médio, equitativo , o que 
representaria uma melhora Paretiana com relaçao ao 
equilíbrio anterior. 
),( 21 ac
)5,5(
 
 
 
4. Equilíbrio de Nash 
 
 
 Anteriormente, mencionamos que existem jogos 
simultâneos finitos onde nenhum jogador possui 
qualquer estratégia estritamente dominada. E 
mencionamos o jogo da Figura 1 como exemplo. 
 
 Como resolver um jogo neste caso? 
 
A resolução desta questão passa pela definição do 
equilíbrio de Nash de um jogo. 
 
No artigo Non-cooperative games de 1951, J.F.Nash 
definiu o equilíbrio de um jogo estratégico que 
atende aos princípios comportamentais da 
regularidade e da racionalidade, e que se tornou 
desde entao no conceito mais importante da Teoria 
dos Jogos. 
 
 20
O princípio de Nash é simples: o vetor das estratégias 
dos jogadores é um equilíbrio para este jogo se 
cada jogador, ciente das escolhas feitas pelos outros, 
não tem incentivo em mudar a sua escolha. 
n
 
Em outras palavras, o equilíbrio de Nash prescreve 
para todos os jogadores, comportamentos que podem 
ser racionalmente sustentados. 
 
As escolhas feitas pelos jogadores podem portar 
sobre as estratégias ou sobre um mix de estratégias. 
 
No primeiro caso, quando ele existe, dizemos que o 
equilíbrio de Nash ocorre em estratégias puras. 
 
No segundo caso, os jogadores não escolhem uma 
estratégia em particular, mas o conjunto delas, cada 
uma com um peso determinado. 
 
Assim, os jogadores escolherão de fato uma 
sequencia de probabilidades para estas estratégias, de 
modo que suas escolhas são feitas entre diferentes 
distribuições de probabilidade. 
 
Dizemos neste caso que o equilíbrio ocorre em 
estratégias mistas. 
 
Vamos definir inicialmente o equilíbrio de Nash em 
estratégias puras. Após alguns exemplos e 
observações, daremos a definição do equilíbrio em 
estratégias mistas. 
 
 
Definição 3: Equilíbrio de Nash (Estratégias Puras) 
 
Sejam o conjunto das estratégias do jogador 
iS i
)n,...,2,1(i = em um jogo com n jogadores e o nSSS ××= ...1
conjunto das estratégias do jogo. 
Seja uma estratégia do jogo, onde o ),...,(; 1 nsssSs =∈
jogador i escolhe a estratégia ii Ss ∈ . 
O jogo pode ser então definido pelo par de estratégias 
e resultados: 
 ),( uS=Γ onde ),...,( 1 nuuu = 
 21
 
e é a funçao resultado (payoff) do jogador i . iu
 
Dizemos que Ss∈ˆ é um equilibrio de Nash (EN) em 
estratégia pura do jogo Γ se, para cada jogador : i
 
 
iiiiii Ssssusu ∈∀≥ − ;)ˆ,()ˆ( 
 
 
Em outras palavras, )ˆ,ˆ(ˆ ii sss −= é um EN para o jogo Γ , 
se, para todo jogador i , dadas as estratégias ótimas 
dos outros jogadores , o melhor que o jogador tem a 
fazer é escolher a estratégia . 
is−ˆ
siˆ
 
Observações e exemplos: 
 
 
(i) Nem todo jogo finito possui equilíbrio de Nash 
 em estratégias puras. 
 
 
 O jogo da Figura 1 anteriornão tem EN. 
 
 O mesmo pode ser dito do jogo tipo par-ímpar: 
 
 
Fig.6a: Jogo sem EN em estratégias puras 
 
Par Impar
Par
Impar
Jogador 2
Jogador 1
( -1 , 1 ) 
( 1 , -1 )
( 1 , -1 )
( -1 , 1 )
 
 22
 
 
Em todo par de estratégias deste jogo, um dos 
jogadores tem incentivo em desviar, isto é, pode 
elhorar seu resultado mudando de estratégia. 
rantem a existência de um EN em 
stratégias puras. 
ii) Quando existe, o EN é estável. 
m 
ncentivo para desviar da estratégia de equilíbrio. 
scolha de ambos os prisioneiros é confessar: (C,C) 
s prisioneiros tem incentivo para não 
onfessar. 
e um deles o fizer, aumentará sua pena de 5 anos ! 
arem, ambos 
erão incentivo unilateral de confessar. 
quele que o fizer, terá sua pena reduzida de 1 ano ! 
 que todos os jogadores adotem 
stratégias Nash. 
de estratégias estritamente 
ominadas é um EN. 
ue o equilíbrio de Nash é 
acionalizável. 
 
m
 
A frente enunciaremos uma proposição estabelecendo 
as condiçoes que ga
e
 
 
(
 
 Por definição, nenhum dos jogadores te
i
 
Por exemplo, no dilema dos prisioneiros, a melhor 
e
 
Muito embora com esta escolha ambos peguem 5 anos 
de prisão, é um EN, pois se ambos confessam, 
nenhum do
c
 
S
 
Por outro lado, a solução cooperativa (NC , NC) não 
é um EN porque se ambos não confess
t
 
A
 
 
(iii) Em virtude da estabilidade do EN, em jogos 
repetidos espera-se
e
 
 
(iv) Em um jogo finito, toda solução obtida por 
eliminação iterada 
d
 
Isto mostra q
r
 23
Por exemplo, no jogo da Figura 3a, a eliminação das 
estratégias estritamente dominadas conduz ao 
equilíbrio (a1,b2), com payoff )1,1(− . 
Como nesta escolha nenhum dos jogadores tem 
incentivo em desviar, é um EN. 
 
Análogamente, o resultado iterado (U,L) com payoff 
 no jogo da Figura 4b é um EN. )0,3(
 
Observe que quando todos os jogadores possuem uma 
estratégia estritamente dominante, o EN é único. 
 
 
(v) Nem todo EN é um equilíbrio com estratégias 
dominantes. 
 
 
O jogo abaixo, chamado batalha dos sexos, ilustrará 
isto. 
 
Fig.6b: Batalha dos sexos 
 
Box Ballet
Box
Ballet
Mulher
Homem
( 0 , 0 ) 
( 1 , 2 )
( 2 , 1 )
( 0 , 0 )
 
 
Nenhum dos jogadores tem estratégia dominante. 
 
O homem prefere assistir à uma luta de box, 
enquanto a mulher prefere assistir à um espetáculo 
de ballet. 
 
 24
Mas ambos preferem estar juntos do que cada um 
seguir sua primeira escolha, um separado do outro. 
 
Este jogo tem dois equilíbrios de Nash: 
 
(box,box) e (ballet,ballet) 
 
Estando juntos, nenhum dos dois membros do casal 
tem incentivo para desviar. 
 
 
(vi) O EN não é necessáriamente único. 
 
 Vide o exemplo da batalha dos sexos. 
 
 EN múltiplos ocorrem frequentemente em 
equilíbrios com estratégias fracamente dominantes, 
como mostrado no jogo da Figura 3b: 
 
Os pares de estratégias (c1,a2) e (c1,b2) são ambos 
equilíbrios de Nash porque nenhum dos jogadores 
tem incentivo estrito em desviar da sua escolha. 
 
A Proposiçao abaixo estabelece as condiçoes que 
garantem a existência de uma EN em estratégias 
puras, no caso em que os conjuntos de escolha dos 
jogadores são infinitos e convexos. 
 
 
Proposição: Existe um EN em estratégias puras para 
o jogo Γ se, para todo jogador i : niii uS 1),( ==
 
(i) é um subconjunto não vazio, convexo e 
compacto do 
iS
inR ; 
(ii) A funçao payoff é contínua em e 
quase côncava em . 
),...,( nii ssu ),...,( 1 nss
is
 
O resultado desta proposiçao tem ampla aplicaçao na 
análise do funcionamento de mercados em 
microeconomia, sob diferentes regimes competitivos, 
nos quais os requerimentos da proposição são 
atendidos. 
 
 25
 
5. Estratégias minMax e Maxmin 
 
 
O Equilíbrio de Nash pressupõe que cada jogador 
maximiza o seu retorno no jogo, dada a estratégia dos 
outros jogadores. 
 
 
Trata-se, portanto, de um equilíbrio não cooperativo 
em que cada jogador é auto-motivado, no sentido que 
ele maximiza uma funçao objetivo pessoal, em 
interesse próprio. 
 
 
No EN, a atitude dos jogadores é neutra, no sentido 
que nenhuma ação de um jogador visa favorecer ou 
prejudicar deliberadamente o interesse dos outros 
jogadores. 
 
 
Mas é possível situações nas quais os jogadores 
adotam uma atitude não neutra, favorável ou 
antagônica aos demais jogadores. 
 
O consenso para empreender açoes benevolentes 
entre os jogadores remetem a jogos cooperativos, dos 
quais não trataremos neste curso. 
 
 
Situações em que o comportamento dos jogadores é 
antagônico são muito comuns na prática, algumas 
das quais são consideradas em economia industrial. 
 
No modelo do preço limite, por exemplo, a firma 
dominante adota uma estratégia de preço não 
maximizadora com o objetivo de prevenir a entrada 
de potenciais concorrentes; 
 
Outro caso é o dumping onde uma firma estabelecida 
adota uma estratégia predatória de preços visando 
infligir perdas duradouras à suas concorrentes mais 
próximas. 
 
 
 26
Definiremos abaixo as estratégias puras e os valores 
minMax e Maxmin de um jogo com dois jogadores, 
e , notando que estas noções se estendem 
para jogos com um número maior de jogadores, e 
admitem também estratégias mistas. 
i
i− 2,1=i
 
Estratégia e Valor minMax 
 
Um jogador adota uma estratégia minMax quando 
quer punir o outro jogador da melhor forma que lhe é 
possível. 
 
Este é o caso em que o jogador i adota um 
comportamento antagônico ao outro jogador. 
 
Como o jogador maximiza o seu payoff para cada 
escolha possível do jogador i , a estratégia minMax 
do jogador i é aquela que minimiza o resultado para 
 das melhores escolhas deste jogador. 
i−
i−
 
Formalmente: 
 
Definição 4: minMax 
 
A estratégia 
ii Ss ∈ é uma estrategia minMax do 
jogador i se 
 
 );(maxminarg iiiSsSsi ssus iiii −−∈∈ −−= 
 
O valor minMax do jogador i é o payoff iu que ele 
obtém quando adota a estratégia minMax 
is : 
 );(maxmin iiiSsSsi ssuu iiii −−∈∈ −−= 
 
 
 
Para ilustrar como funciona a identificação das 
estratégias e dos valores minMax de cada jogador, 
consideramos os jogo da Figura 7: 
 
 
 
 27
 
 
Fig.7: Estratégias minMax e Maxmin 
 
 
a2 b2
a1
b1
c1
Jogador 2
Jogador 1
( 0 , 5 )
( 1 , 1 ) 
( 0 , 0 )
( 4 , 4 )
( 5 , 0 )
( 0 , 0 )
c2
( 0 , 0 )
( 0 , 0 )
( 3 , 3 )
 
 
Pode-se verificar que este jogo possui dois 
equilíbrios em estratégias puras: 
 
EN1= (b1,b2) com payoff (1,1) ; 
EN2= (c1,c2) com payoff (3,3) ; 
 
e um equilibrio em estratégias mistas: 
 
EN3= ((0,3/4,1/4), (0,3/4,1/4), com payoffs esperados 
 (3/4, 3/4). 
 
Vamos agora determinar a estratégia minMax do 
jogador 1: 
 { }),(),,(),,(minarg 1221221221 11 ccubbuabus Ss ∈= 
 
 { } 1122 ),(arg bbbu ==
 
E o valor minMax para o jogador 1 será: 11 =u 
 
Como este jogo é simétrico, temos para o jogador 2: 
 
 { } 22112 ),(arg bbbus == e 12 =u 
 28
 
Vemos assim que se os dois jogadores forem 
antagônicos um ao outro e ambos jogarem estratégias 
minMax, o resultado do jogo será um equilíbrio de 
Nash, mais precisamente, EN1 que é o equilíbrio 
com baixo retorno. 
 
Este exemplo mostra também que o equilíbrio 
minMax de um jogo simultâneo pode ser estável. 
 
 
Estratégia e Valor Maxmin 
 
O jogador que adota uma estratégia Maxmin é uma 
pessoa conservadora, que prefere maximizar seu 
retorno no caso em que o pior venha a acontecer. 
 
Pode ser também uma pessoa paranóica, que tem 
mania de perseguição. 
 
Este é o caso em que o jogador i acha que o outro 
jogador sempre quer o pior para ele. 
 
Como o jogadorminimiza o payoff do jogador 
para cada escolha possível deste jogador, a estratégia 
Maxmin do jogador i é aquela que maximiza o seu 
resultado dentre as escolhas do jogador 
i− i
i− que foram 
mais onerosas para ele. 
 
 
Definição 5: Maxmin 
 
A estratégia 
ii Ss ∈ é uma estratégia Maxmmin do 
jogador i se 
 );(minmaxarg iiiSsSsi ssus iiii −∈∈ −−= 
 
O valor Maxmin do jogador i é o payoff iu que ele 
obtém quando adota a estratégia Maxmin is : 
 );(minmax iiiSsSsi ssuu iiii −∈∈ −−= 
 
 
 29
O valor Maxmin do jogador é também chamado seu 
nível de segurança. 
 
 
Vamos agora achar a estratégia Maxmin do jogador 1: 
 
{ }),(),,(),,(),,(maxarg 2112112112111 11 bcuacucbucaus Ss ∈= 
 
 { }),(),,(),,(),,(arg 211211211211 bcuacucbucau=
 { }1111 ,, cbas = 
 
E o valor Maxmin para o jogador 1 será: 01 =u 
 
Como o jogo é simétrico, temos para o jogador 2: 
 { }2222 ,, cbas = 
 
E o seu valor Maxmin também será: 02 =u 
 
Vemos assim que se os dois jogadores forem 
conservadores, fizerem conjecturas negativas um com 
relação ao outro e se ambos jogarem estratégias 
Maxmin, haverá várias soluções neste jogo: (a1,c2), 
(b1,c2), (c1,a2), (c1,b2), todos com retorno (0,0) para 
os jogadores. 
 
Isto mostra que em jogos nos quais os jogadores 
adotam estratégias Maxmin, as soluções não são 
necessáriamente únicas, nem estáveis. 
 
Estas são características também das soluções 
minMax. 
 
 
 
 
 
 
 
 
 
 
 
 30
6. Bibliografia e Exercícios Sugeridos 
ibliografia:
 
 
 
 
 
 
B 
 
JR] Cap.7 
xercícios Sugeridos
 
[SN] Cap.8 
[V0] Cap.16
[
 
 
 
E . 
11 
 2008/ Q09 
.1-85 
 
 
 
Anpec: 
 2012/ Q09 
 2011/ Q07,Q
 2010/ Q10 
 2009/ Q11 
 
 
[SN]: 8

Continue navegando