unidade3

Teoria dos Jogos

•

Engenharias

Carol D

29/09/2023

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 92 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 92 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 92 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Teoria dos Jogos

3.165 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

UNIDADE III
Estratégias dos
jogos
Nara Medianeira Stefano
Equilíbrio de Nash
Pense no que é uma estratégia; você sabe o que ela signi�ca? Quando ela está
presente na teoria dos jogos, onde ela se encaixa? Quando surge o Equilíbrio de Nash
na Teoria dos jogos, o que ele signi�ca? Pensou em tudo isso? Na realidade, usamos
estratégias para quase tudo na vida e, com isso, buscamos um equilíbrio; mas em
jogos, infelizmente, não existe nenhum equilíbrio de estratégia.
Tudo isso que nos referimos é o Equilíbrio de Nash, que é um conceito dentro da
Teoria dos Jogos em que o resultado ideal de um jogo é aquele em que não há
incentivo para se desviar de sua estratégia inicial. Aqui, o resultado ótimo de um jogo
é aquele em que nenhum jogador tem um incentivo para se desviar de sua estratégia
escolhida depois de considerar a escolha de um oponente. Um jogo pode ter
múltiplos Equilíbrios de Nash ou nenhum.
Ao �nal desta aula, você será capaz de:
reconhecer a importância da estratégia em jogos;
identi�car como se dá o Equilíbrio de Nash;
conhecer o que é incentivo no Equilíbrio de Nash.
Aula 01
Introdução
2
Estratégia
Caro(a) aluno(a), para podermos falar de Equilíbrio de Nash, vamos em primeiro
lugar, discutir o que é estratégia. Você sabia que a estratégia, como conceito, surgiu
em conexão com operações militares? Todos os elementos estavam presentes e
tornaram a estratégia valiosa: recursos �nitos; incerteza sobre a capacidade e as
intenções de um adversário; comprometimento irreversível de recursos; necessidade
de coordenar as ações ao longo do tempo e da distância; incerteza sobre o controle
da iniciativa; e a natureza crítica das percepções mútuas entre os adversários.
Segundo Dranove e Marciano (2017), para que a estratégia seja possível, é necessário
imaginar e avaliar as possíveis consequências de alternativos de ação. Mas
imaginação e poder de raciocínio não são su�cientes; também deve haver
conhecimento da concorrência e os efeitos característicos de ordem superior de
ações alternativas.
Esse conhecimento deve atingir uma massa crítica antes de se tornar realmente
signi�cativo. Até que relacionamentos su�cientes tenham sido integrados para se ver
todo o padrão, o conhecimento não é mais do que as peças individuais de um quebra-
cabeça.
Os requisitos básicos para o desenvolvimento de estratégias são:
uma massa crítica de conhecimento;
capacidade de integrar todo esse conhecimento e examiná-lo como um sistema
dinâmico interativo;
habilidade na análise do sistema para entender a sensibilidade, as defasagens de
tempo, as possibilidades e consequências imediatas e futuras;
imaginação e a lógica para escolher entre alternativas especí�cas;
controle de recursos além das necessidades imediatas;
vontade de renunciar aos benefícios atuais para investir no potencial futuro.
Os indivíduos usam a “estratégia” de várias maneiras diferentes, sendo as mais
comuns: como um plano, um meio de ir daqui para lá; como um padrão nas ações ao
longo do tempo, por exemplo: uma empresa que comercializa regularmente produtos
muito caros está usando uma estratégia “high end”; como posição, isto é, re�ete as
3
decisões de oferecer determinados produtos ou serviços em mercados especí�cos; e
como perspectiva, isto é, visão e direção.
Em um jogo, uma estratégia é um “plano de batalha” que especi�ca a ação que um
jogador fará com as informações disponíveis em cada jogada e por qualquer possível
contingência. Por exemplo, uma empresa pode usar uma estratégia de negócios
simples, produzindo unidades de produção, independentemente do que qualquer
rival faça, ou pode escolher uma estratégia mais complexa na qual produza uma
pequena quantidade, desde que sua rival produza uma pequena quantia no período
anterior e uma grande quantidade de outra forma. Os payoffs de um jogo são a
avaliação dos jogadores sobre o resultado do jogo, como lucros para empresas ou
utilidades para indivíduos.
ATENÇÃO
Estratégia é um termo que se refere a uma teia complexa de pensamentos, ideias,
insights, experiências, objetivos, conhecimentos, memórias, percepções e
expectativas que fornece orientação geral para ações especí�cas em busca de
�ns especí�cos.
4
Assim, o comportamento estratégico é um conjunto de ações que um jogador realiza
para aumentar seu payoff, levando em consideração as possíveis ações de outros
jogadores. Por exemplo, uma empresa pode de�nir um nível de saída, agir para
desencorajar as empresas potenciais de entrar em um mercado ou optar por
empregar uma tecnologia.
Os con�itos frequentemente surgem porque as ações de cada empresa que maximiza
o lucro afetam os lucros de outras empresas. Embora chamemos con�ito o que se dá
entre �rmas ou indivíduos, os envolvidos não consideram essa competição
super�cial. Dessa forma, assumimos que cada jogador deseja obter o maior retorno
possível no �nal do jogo.
Mas quando se está elaborando ou atuando com estratégias e players (ou jogadores),
o conhecimento deve ser uma informação conhecida por todos os jogadores. Em cada
jogo, assumimos que todos os jogadores têm um conhecimento comum sobre as
regras do jogo, sobre o fato de que a recompensa de cada jogador depende das ações
tomadas por todos os jogadores e de que todos querem maximizar os seus
resultados.
Os economistas usam a teoria dos jogos quando a estratégia ótima de um jogador
depende das ações dos outros, o que é chamado de interdependência estratégica.
Figura 1 - Estratégia como um plano de batalha
Fonte: Alvinge / 123RF.
5
Por exemplo, oligopolistas, como os fabricantes de Coca-Cola e a Pepsi, monitoram
cuidadosamente o comportamento um do outro. Como relativamente poucas
empresas competem em tal mercado, cada empresa pode in�uenciar o preço e,
portanto, os pagamentos de empresas rivais.
Logo, para entendermos o equilíbrio de Nash, vimos, nesta seção, o conceito de
estratégia, pois o equilíbrio de Nash é de�nido como a combinação de estratégias em
um jogo, de tal maneira que não haja incentivo para que os jogadores se desviem de
suas escolhas. Na próxima seção, veremos que a(s) estratégia(s) é(são) a(s) melhor(es)
opção(ões) que um jogador pode fazer levando em conta a decisão dos outros
jogadores e que as mudanças na decisão de um jogador só levarão a um resultado
pior se os outros jogadores seguirem a estratégia. Um dos mais conhecidos
equilíbrios de Nash pode ser encontrado no dilema do prisioneiro.
INFOGRÁFICO INTERATIVO
Para consultar o Infográ�co Interativo,
acesse a versão digital deste material
6
Equilíbrio de Nash
Quando a eliminação iterativa de estratégias estritamente dominadas não consegue
prever um resultado único, podemos usar um conceito relacionado. Para qualquer
conjunto de estratégias escolhidas pelos rivais, um jogador deseja usar sua melhor
resposta, a estratégia que maximiza a recompensa de um jogador, considerando suas
crenças sobre as estratégias de seus rivais.
Os economistas geralmente con�am em um conceito de solução introduzido por
John Nash (1951), baseado na crença de que os jogadores usam suas melhores
respostas. Formalmente, um conjunto de estratégias é um Equilíbrio de Nash se,
quando todos os outros jogadores usarem essas estratégias, nenhum jogador puder
obter um retorno maior escolhendo uma estratégia diferente. Uma propriedade
atraente do equilíbrio de Nash é que ele é auto impingido. Se os jogadores usam uma
estratégia de equilíbrio de Nash, nenhum deles quer se desviar escolhendo outra
estratégia.
Figura 2 - Equilíbrio de Nash
Fonte: Vetre Antanaviciute-Meskauskiene / 123RF.
7
Você sabe por que devemos nos preocupar com o equilíbrio de Nash? Existem duas
razões principais. A primeira supõe que os jogadores racionais raciocinam em direção
à solução de um jogo; a segunda supõe que as pessoas encontram o caminho para
uma solução por algum processo evolutivo de tentativa e erro. Muito do poder
preditivo da teoria dos jogos surge da possibilidade de se passar de um lado para
outro entre essas interpretações alternativas.
Raramente sabemos muitosobre os detalhes dos processos evolutivos, mas às vezes
podemos nos antecipar e prever onde eles eventualmente acabarão se perguntarmos
o que os atores racionais fariam na situação em estudo. Segundo Fiani (2015), uma
combinação de estratégias compõe um equilíbrio de Nash quando cada estratégia é a
melhor aceitável às estratégias dos outros jogadores, e isso é verdade para todos os
jogadores.
ATENÇÃO
O Equilíbrio de Nash é a solução para um jogo no qual dois ou mais jogadores têm
uma estratégia; e com cada participante considerando a escolha do oponente, ele
não terá incentivo, nada a ganhar, mudando sua estratégia. A estratégia de cada
jogador é ótima por considerar as decisões de outros jogadores. Cada jogador
ganha porque todos recebem o resultado que desejam.
8
Há muitas interpretações evolutivas possíveis do Equilíbrio de Nash, que diferem no
processo de ajuste por meio do qual os jogadores podem encontrar o caminho para
um equilíbrio. Nos processos de ajuste mais simples, os payoffs de um jogo são
identi�cados com a adequação dos jogadores. Processos que favoreçam estratégias
complexas podem, então, parar de funcionar quando se chegar a um Equilíbrio de
Nash, porque somente as estratégias sobreviventes serão tão adequadas quanto
possível nas circunstâncias.
Assim, não precisamos que nossos jogadores sejam gênios matemáticos para que o
equilíbrio de Nash seja relevante. Se eles costumam prever o comportamento dos
animais muito bem, tampouco o signi�cado evolucionário do equilíbrio de Nash é
con�nado à biologia. Eles têm um papel preditivo sempre que um processo de ajuste
tende a eliminar estratégias que geram baixos retornos.
9
Esse exemplo baseia-se na competição de duopólio da United e da American Airlines na
rota Chicago-Los Angeles (PERLOFF, 2014). Suponha que cada companhia aérea
possa realizar apenas uma das duas ações possíveis: cada uma pode voar 64
(Quantidade – q) ou 48 mil (quantidade) passageiros entre Chicago e Los Angeles por
trimestre. A representação de forma normal desse jogo estático é a matriz de payoff
(matriz de lucro) na Figura 3. Essa matriz de payoff mostra os lucros para cada uma
das quatro combinações possíveis das estratégias que as empresas podem escolher.
SAIBA MAIS
O equilíbrio de Nash é uma concepção de solução mais forte do que a eliminação
iterada de estratégias estritamente dominadas. Nem todos os equilíbrios de
Nash podem ser determinados usando-se a eliminação iterada de estratégias
estritamente dominadas. No entanto, se a eliminação iterada de estratégias
estritamente dominadas produz uma solução que consiste em um único par de
estratégias, então essa combinação de estratégias é o único equilíbrio de Nash
naquele jogo.
10
Por exemplo, se a American escolhe uma grande quantidade, por trimestre, e a United
escolhe uma pequena quantidade por trimestre, os lucros das empresas são os que
estão na célula, no canto inferior esquerdo da matriz de lucro. Essa célula mostra que
o lucro da American (número máximo) é de US $ 5,1 milhões por trimestre e o lucro da
United (número inferior esquerdo) é de US $ 3,8 milhões por trimestre.
Podemos usar a matriz de lucro da Figura 3 para ilustrar que o par de estratégias que
escolhemos usando a eliminação iterativa de estratégias estritamente dominadas é
um equilíbrio de Nash. Ao eliminarmos estratégias estritamente dominadas,
concluímos que ambas as empresas querem de�nir a saída em 64 passageiros.
E se a �rma quiser desviar-se do resultado proposto? Se a American soubesse das
mudanças de estratégias da United e esta da American, não mudaria, porque seu lucro
cairia de US $ 4,1 milhões para US $ 3,8 milhões (PERLOFF, 2014). Pelo mesmo
raciocínio, a United também não gostaria de mudar as estratégias. Ou seja, uma vez
que a outra empresa escolhe 64, essa é a melhor resposta da empresa. Como
nenhuma empresa queira mudar sua estratégia, dado que a outra empresa está
jogando sua estratégia de equilíbrio de Nash, o par de estratégias é um equilíbrio de
Nash.
Figura 3 - Matriz de lucro para um jogo de de�nição de quantidade: estratégia
dominante
Fonte: Adaptada de Perloff (2014).
11
Além disso, para qualquer outra combinação de estratégias, uma ou outra �rma
gostaria de mudar seu comportamento. Portanto, nenhum dos outros pares de
estratégia é um equilíbrio de Nash. Considerando , qualquer uma das
empresas poderia aumentar seu lucro de US $ 4,6 para US $ 5,1 milhões aumentando
sua produção para 64. Se e , a American pode aumentar seu lucro
de US $ 3,8 para US $ 4,1 milhões, aumentando sua quantidade para . Da
mesma forma, a United gostaria de aumentar sua produção quando e
.
Uma análise semelhante aplica-se ao modelo mais geral de Cournot, em que as
empresas podem escolher qualquer resultado desejado. Esse modelo pode ser
apresentado como uma forma normal de jogo com n jogadores (�rmas), uma escolha
de estratégias (qualquer número real, quantidade não negativa) e uma função de
recompensa que é de conhecimento comum (ou seja, todas as �rmas sabem a função
de lucro de cada empresa).
Nós derivamos o equilíbrio de Nash para aquele jogo encontrando as quantidades
que eram as melhores respostas para todas as �rmas. É possível obter esse equilíbrio
de Nash em um modelo duopólio linear de Cournot, eliminando iterativamente
estratégias estritamente dominadas. Com três ou mais empresas, a eliminação
iterativa fornece apenas a observação imprecisa de que a quantidade de cada
empresa não excederá a quantidade de monopólio.
= = 48qA qU
= 48qA = 64qU
= 64qU
= 64qA
= 48qU
12
Segundo Pindyck e Rubinfeld (2018), conceito de equilíbrio de Nash depende muito
da racionalidade individual, pois a escolha da estratégia de cada jogador depende não
apenas de sua própria racionalidade, mas também da racionalidade de seu oponente.
Isso pode ser uma limitação, como mostra o exemplo da Tabela 1. Neste jogo, duas
empresas competem na venda de software (criptogra�a de arquivos). Como as duas
empresas usam o mesmo padrão de criptogra�a, os arquivos criptografados pelo
software de uma empresa podem ser lidos pela outra - uma vantagem para os
consumidores.
ATENÇÃO
Se as �rmas de oligopólio agem de forma independente, a
produção de mercado e os lucros das empresas �cam entre os
níveis competitivo e de monopólio. Em um modelo de Cournot,
cada �rma de oligopólio de�ne sua saída ao mesmo tempo. No
equilíbrio de Cournot (Nash), cada �rma produz seu produto
de melhor resposta – o resultado que maximiza seu lucro –
dado o resultado que seu rival produz. À medida que o número
de empresas Cournot aumenta, o preço, a quantidade e os
lucros de equilíbrio de Cournot aproximam-se dos níveis de
tomada de preços.
13
Tabela 1 - Exemplo de estratégia max-min
Fonte: Pindyck e Rubinfeld (2018, p. 490).
A Empresa 1 tem uma participação de mercado muito maior. Ambas as empresas
estão considerando um investimento em um novo padrão de criptogra�a. Note que
investir é uma estratégia dominante para a Empresa 2 porque, ao fazê-lo, fará melhor,
independentemente do que a Empresa 1 �zer. Dessa forma, a Empresa 1 deve
esperar que a Empresa 2 invista. Nesse caso, a Empresa 1 também faria melhor
investindo (e ganhando R$ 20 milhões) do que não investindo (e perdendo R$ 10
milhões). O resultado (investir, investir) é um equilíbrio de Nash para esse jogo, e é o
único equilíbrio de Nash. Mas observe que os gerentes da Empresa 1 devem ter a
certeza de que os gerentes da Empresa 2 entendem o jogo e são racionais. Se a
Empresa 2 cometer um erro e não investir, seria extremamente caro para a Empresa
1.
Portanto, em jogos em que a eliminação iterada de estratégias estritamente
dominadas não determina um único par de estratégias, pode haver um único
equilíbrio de Nash (como o modelo de Cournot com três ou mais empresas), múltiplos
equilíbrios de Nash ou nenhum equilíbrio de Nash.
Múltiplos Equilíbrios de Nash e mix de Estratégias
Agora vamos considerar um jogo de entrada que tem mais de um equilíbrio de Nash
em estratégias puras.Além disso, além de usar uma estratégia pura, uma empresa
neste jogo de entrada pode empregar uma estratégia mista (ou mix de estratégias) na
qual o jogador escolhe entre possíveis ações, de acordo com as probabilidades que
atribui.
Empresa 1
Empresa 2
Não investir Investir
Não investir 0, 0 -10, 10
Investir -100, 0 20, 10
14
Um jogo de entrada tem ambos os equilíbrios de Nash de estratégia mista (ou mix de
estratégias) e pura. Estratégia pura é uma escolha especí�ca de uma das possíveis
estratégias do jogador em um jogo. A estratégia mista é uma escolha entre duas ou
mais estratégias puras de acordo com probabilidades pré-especi�cadas; ou seja, uma
estratégia pura é uma regra que diz ao jogador qual ação tomar, enquanto uma
estratégia mista é uma regra que diz ao jogador qual dado lançar, moeda a virar ou
outro dispositivo a ser usado para se escolher uma ação.
Suponha que duas empresas estejam considerando a abertura de postos de gasolina
em um ponto de parada numa estrada que não tenha postos de gasolina. Há espaço
físico su�ciente para no máximo dois postos de gasolina. A matriz de lucro da Figura
4 mostra que há demanda su�ciente para que apenas uma estação opere de forma
lucrativa. Se ambas as �rmas entram, cada uma perderá $ 1 (cem mil). Nenhuma das
empresas tem uma estratégia dominante. A melhor ação de cada empresa dependerá
do que a outra empresa �zer.
ATENÇÃO
Uma estratégia pura atribui uma probabilidade de 1 a uma única ação, enquanto
uma estratégia mista é uma distribuição de probabilidade sobre ações. Ou seja, é
uma regra que diz ao jogador qual ação tomar, enquanto uma estratégia mista é
uma regra que diz ao jogador qual dado lançar, moeda a virar ou outro dispositivo
a ser usado para escolher uma ação.
15
Esse jogo tem dois equilíbrios de Nash em estratégias puras: a Empresa 1 entra e a
Empresa 2 não entra ou a Empresa 2 entra e a Empresa 1 não entra. O equilíbrio no
qual apenas a Empresa 1 entra é Nash porque nenhuma das empresas quer mudar
seu comportamento. A Empresa 2 não entra, a Empresa 1 não quer mudar sua
estratégia de entrar para �car fora do mercado. Se mudasse seu comportamento,
passaria de US $ 1 para nada.
Similarmente, a Firma 1 entra, a Firma 2 não quer mudar seu comportamento e
entrar, porque perderia $ 1 em vez de empatar (ganhando $ 0). Onde somente a
Empresa 2 entra é também um equilíbrio de Nash pelo mesmo tipo de raciocínio.
Como os jogadores sabem qual (se algum) equilíbrio de Nash resultará? Eles não
sabem! É difícil ver como as empresas escolhem estratégias, a menos que consigam e
possam impor seu acordo. Por exemplo, a empresa que entra pode pagar à outra
empresa para �car fora do mercado.
Figura 4 - Jogo de entrada simultânea
Fonte: Adaptada de Perloff (2014).
16
Se ambas as empresas usarem essa estratégia mista, cada um dos quatro resultados
na matriz de payoff da Figura 4 será igualmente provável. A probabilidade de que o
resultado em uma célula particular da matriz ocorra é o produto das probabilidades
de que cada jogador escolha a ação relevante, porque suas ações são independentes.
A probabilidade de um jogador escolher uma determinada ação é, portanto, a
probabilidade de ambos escolherem um determinado par de ações (uma célula). A
Empresa 1 tem uma quarta chance de ganhar $ 1 (célula superior direita), um quarto
de chance de perder $ 1 (célula inferior direita) e uma chance e meia de ganhar $ 0
(células superior esquerda e inferior esquerda). Assim, o lucro esperado da empresa
1 – o lucro da empresa em cada resultado possível – aumenta a probabilidade desse
resultado ser: .
SAIBA MAIS
Sem um acordo colusório possível, até mesmo as discussões
entre as empresas antes que as decisões sejam tomadas
di�cilmente ajudarão. Esses puros equilíbrios de Nash não são
atraentes porque exigem que empresas idênticas usem
estratégias diferentes. No jogo de entrada, ambas as empresas
podem usar a mesma estratégia mista. Quando ambas as
empresas entram com uma probabilidade de meio - digamos,
se uma moeda virada surgir - há um equilíbrio de Nash em
estratégias mistas porque nenhuma delas quer mudar sua
estratégia, dado que a outra empresa usa sua estratégia mista
de equilíbrio de Nash.
($1 × ) + (−$ × ) + ($0 × ) = $01
4
1
4
1
2
17
A Empresa 1 usa essa estratégia mista, a Empresa 2 não pode alcançar um lucro
esperado mais alto usando uma estratégia pura. Se a Empresa 2 usa a estratégia pura
de entrar com probabilidade 1, ela ganha $ 1 na metade do tempo e perde $ 1 na
outra metade, então, seu lucro esperado é $ 0. Se �car de fora com certeza, a
empresa 2 ganhará $ 0 com certeza.
Se a Empresa 2 acredita que a Empresa 1 usará sua estratégia mista de equilíbrio, a
Empresa 2 é indiferente sobre qual estratégia pura deve usar (embora considere
apenas as estratégias que têm uma probabilidade positiva na estratégia mista da
empresa). Suponha, ao contrário, que uma das ações na estratégia mista de equilíbrio
tenha um retorno esperado maior do que alguma outra ação. Então, pagaria para
aumentar a probabilidade de que a Empresa 2 tome a ação com o maior retorno
esperado. Porém, se todas as estratégias puras que têm probabilidade positiva em
uma estratégia mista tiverem o mesmo resultado esperado, então, o retorno
esperado da estratégia mista também deverá ter esse retorno esperado. Dessa
forma, a Empresa 2 é indiferente quanto ao uso de qualquer uma dessas estratégias
puras ou qualquer estratégia mista sobre essas estratégias puras.
Por que uma empresa escolheria uma estratégia mista em que sua probabilidade de
entrar seja metade? Em um jogo simétrico, sabemos que ambos os jogadores têm a
mesma probabilidade de entrar ( ). Além disso, para a Empresa 2 usar uma estratégia
mista, ela deve ser indiferente entre entrar ou não entrar; para a Empresa 2 usar uma
estratégia mista, ela deve ser indiferente entre entrar ou não entrar se a Empresa 1
entrar com probabilidade . A recompensa da empresa 2 de entrar será:
. Sua recompensa por não entrar será:
. Equacionando esses dois lucros esperados e resolvendo-
os, temos, assim, que se ambas as empresas usarem uma estratégia mista, em que
entrem com uma probabilidade de metade, haverá um equilíbrio de Nash.
Esse jogo tem dois equilíbrios de Nash de estratégia pura (uma empresa que emprega
a pura estratégia de entrar e a outra de não entrar) e um equilíbrio de Nash de
estratégia mista. Se a Firma 1 decide entrar com uma probabilidade de metade, a
Firma 2 será indiferente entre escolher entrar com probabilidade de 1 (a estratégia
pura de entrar), 0 (a estratégia pura de não entrar) ou qualquer fração entre esses
extremos. No entanto, para as estratégias das empresas constituírem um equilíbrio
de Nash de estratégia mista, ambas as empresas devem optar por entrar com uma
probabilidade de metade.
θ
θ
[θ × (−1) ]+[ (1 − θ) × 1] = 1 − 2θ
[θ × 0 ]+[ (1 − θ) ×] = 0
18
QUESTÃO OBJETIVA
A de�nição é melhor dada em termos de “melhores
respostas”, em que uma melhor resposta para o jogador a
um conjunto de estratégias jogadas por outros jogadores é
simplesmente uma estratégia que resultará no maior
retorno possível para o jogador, dadas as estratégias
jogadas. por outros. Dessa forma, assinale a alternativa
correta sobre a que se refere o conceito apresentado.
Payoffs.
Player.
Estratégia pura.
Equilíbrio de Nash.
Estratégia mista.
19
QUESTÃO OBJETIVA
Nos negócios, preocupa-se o modo como a empresa
compete em um determinado setor ou mercado. Se a
empresa deve prosperar dentro de uma indústria, deve
estabelecer uma vantagem competitiva sobre seus rivais.
Marque a alternativa correta em relação a que o conceito
apresentado se refere.
Equilíbrio de Cournot.
Payoffs.
Equilíbrio de Nash.
Ação
Estratégia.
20
Os jogadores têm informações perfeitas sobre os movimentos de outros jogadores
em períodos anteriores, mas possuem informações imperfeitas dentro de um
período, porque os jogadores se movem simultaneamente. A solução mais conhecida
é o Equilíbrio de Nash,em que cada jogador em um jogo escolhe a estratégia que
gerará o maior retorno, dadas as estratégias escolhidas pelos outros jogadores. No
equilíbrio de Nash, então, expectativa é igual a resultado – comportamento esperado
e comportamento real convergem –, o que não seria verdade em resultados de
equilíbrio não Nash.
Nesta aula, você teve a oportunidade de:
conhecer o que é Equilíbrio de Nash;
veri�car exemplo de aplicação do Equilíbrio de Nash;
distinguir os tipos de estratégia no Equilíbrio de Nash.
Fechamento
21
Jogos Dinâmicos Com Informação
Perfeita
Até agora, estudamos jogos nos quais os jogadores tomam decisões
simultaneamente. Em muitos jogos interessantes, no entanto, um jogador pode se
mover antes de outros jogadores. Um exemplo disso é o modelo de Stackelberg, em
que um jogador é um líder e o outro jogador é um seguidor. Em jogos desse tipo, por
exemplo, o jogador A escolhe a parte superior ou inferior. O jogador B consegue
observar a escolha do primeiro jogador e depois escolhe a esquerda ou à direita.
Estes são chamados jogos de movimento sequencial. Em um jogo de movimento
sequencial, um jogador (o primeiro movimento) realiza uma ação antes de outro
jogador (o segundo movimento). O segundo proponente observa a ação tomada pelo
primeiro proponente antes de decidir que ação deve tomar. Veremos que a
capacidade de se mover primeiro em um jogo de movimento sequencial pode, às
vezes, ter um valor estratégico signi�cativo.
Ao �nal desta aula, você será capaz de:
reconhecer o que são jogos dinâmicos e sequenciais;
veri�car o Equilíbrio de Nash em um subjogo perfeito;
Aula 02
Introdução
22
conhecer jogos repetitivos e diferenciá-los dos sequenciais.
23
Jogos Dinâmicos
De acordo com Perloff (2014), em jogos estáticos de forma normal, os jogadores têm
informações imperfeitas sobre como os outros jogadores vão agir, porque todos se
movem simultaneamente e apenas uma vez. Em contraste, em jogos dinâmicos, os
jogadores se movem sequencialmente ou se movem simultaneamente repetidamente
ao longo do tempo, de modo que um jogador tenha informações perfeitas sobre os
movimentos anteriores de outros jogadores.
Em vez de usar a forma normal, os economistas analisam os jogos dinâmicos em sua
forma extensiva, que especi�ca os n jogadores, a sequência na qual eles fazem seus
movimentos, as ações que podem realizar a cada jogada, as informações que cada
jogador tem sobre o desempenho anterior dos jogadores, os movimentos e a função
de pagamento sobre todas as estratégias possíveis.
Nesta aula, supomos que os jogadores não apenas tenham informações completas
sobre a função de pagamento, mas também tenham informações perfeitas sobre o
jogo até este ponto. Consideramos dois tipos de jogos dinâmicos.
Começamos com um jogo de dois estágios, que é jogado uma vez e, portanto, pode-se
dizer que ocorre em um “período único”. No primeiro estágio, o Jogador 1 se move.
No segundo estágio, o Jogador 2 se move e o jogo termina com os pagamentos dos
jogadores com base em suas ações. Um exemplo de tal jogo é o modelo Stackelberg.
24
Em seguida, examinamos um jogo repetido ou multiperíodo em que um jogo de
movimento simultâneo de período único, como o jogo do dilema dos prisioneiros das
companhias aéreas, é repetido pelo menos duas vezes e possivelmente muitas vezes.
Embora os jogadores se movam simultaneamente em cada período, eles sabem sobre
as jogadas de seus rivais em períodos anteriores, de modo que o movimento anterior
de um rival pode afetar a ação atual de um jogador. Como resultado, é um jogo
dinâmico. Por �m, veremos o comportamento dos jogos repetitivos.
SAIBA MAIS
O modelo Stackelberg (quantidade sequencial) é um modelo de liderança
quantitativa; descreve o comportamento estratégico das indústrias em que há
uma empresa dominante ou um líder natural enquanto as outras empresas são os
seguidores. Assim, se a empresa A toma sua decisão primeiro, a empresa A é a
líder do setor e a empresa B reage ou segue a decisão da empresa A. No entanto,
ao tomar sua decisão, a empresa A deve antecipar como a empresa B reage a essa
decisão.
25
Nos jogos em que os jogadores se movimentam sequencialmente, temos que
distinguir claramente uma ação e uma estratégia. Uma ação é um movimento que um
jogador faz em um ponto especi�cado, como a quantidade de saída que uma empresa
produz nesse período (PERLOFF, 2014).
Uma estratégia é um plano de batalha que especi�ca a ação que um jogador fará com
as informações disponíveis em cada jogada. Por exemplo, a estratégia da American
Airlines pode a�rmar que vai voar 64 mil passageiros entre Chicago e Los Angeles
num determinado trimestre se a United Airlines tiver voado 64 mil no trimestre
anterior, mas que voará apenas 48 mil num trimestre se a United tiver voado 48 mil
no trimestre anterior. Essa distinção entre uma ação e uma estratégia é discutível em
um jogo estático de movimento simultâneo, em que uma ação e uma estratégia são
efetivamente as mesmas.
Jogos Sequenciais e Repetitivos
Supomos que a American e a United Airlines possam escolher apenas níveis de saída
de 96, 64 e 48 milhões de passageiros por trimestre. Se uma empresa, a líder do
modelo Stackelberg, escolhe sua produção antes de seus rivais, os seguidores, o líder
produz mais e obtém um lucro maior do que cada empresa seguidora de custo
idêntico. Isto é, a empresa designada a “mover primeiro” é chamada de líder de
Figura 1 - Jogos dinâmicos
Fonte: Texelart / 123RF.
26
Stackelberg, enquanto a empresa que se move em segundo lugar é chamada de
seguidora de Stackelberg. Um governo pode subsidiar uma �rma de oligopólio
nacional para produzir a quantidade da líder do Stackelberg, que ela vende em um
mercado internacional.
Um exemplo dessa liderança pode ser o domínio da Microsoft nos mercados de
software. Embora a Microsoft possa tomar decisões primeiro, outras empresas
menores reagem às ações da Microsoft ao tomar suas próprias decisões. As ações
desses seguidores, por sua vez, afetam a Microsoft.
A árvore de decisão é a representação de forma normal deste jogo, a não captura a
natureza sequencial dos movimentos das empresas. Para demonstrar o papel dos
movimentos sequenciais, usamos um diagrama de formato extenso ou árvore de jogo,
ATENÇÃO
Nos jogos de movimento sequencial, essas ameaças não incríveis são eliminadas,
restringindo-os aos equilíbrios de Nash que são subindicadores, isto é, para o
equilíbrio em que os primeiros impulsionadores olham para frente e determinam
as melhores respostas dos seus oponentes mais tarde no jogo. Jogos sequenciais
são representados por meio de árvores de decisão (PINDYCK; RUBINFELD,
2018).
27
Figura 2, que mostra a ordem dos movimentos das empresas, as possíveis ações de
cada empresa no momento de sua mudança e os lucros resultantes no �nal do jogo.
Na Figura 2, cada caixa é um ponto de decisão de uma das empresas, chamado de nó
de decisão. O nome na caixa do nó de decisão indica que é a vez daquele jogador se
mover. As linhas ou rami�cações que se estendem para fora da caixa representam
uma lista completa das possíveis ações que o jogador pode fazer naquele ponto do
jogo. No lado esquerdo da �gura, American, o líder, começa escolhendo um dos três
níveis de saída.
Ainda analisando a Figura 2, o United, o seguidor, escolhe uma das três quantidades
depois de aprender o nível de saída que a American escolheu. O lado direito da �gura
mostra os lucros que a American e a United ganham, uma vez que, sequencialmente,
tomaram as medidas para alcançar esse ramo �nal. Por exemplo, se a American
seleciona 64 e a United escolhe 96, a American ganha um lucro de US $ 2,0 milhões
por trimestre e a United ganha US $ 3,1 milhões.
Dentro desse jogo há subjogos. Em um determinado estágio, um subjogo consiste em
todas as decisões subsequentes que os jogadores podem tomar, dadas as ações já
tomadas e os payoffs correspondentes. No segundo estágio em que o United faz uma
escolha, existem três subjogos possíveis.
Figura 2 - Árvore de jogo de StackelbergFonte: Adaptada de Perloff (2014, p. 497).
28
Na Figura 2, se no primeiro estágio a American escolhe , o subjogo relevante
é o nó superior no segundo estágio e seus três ramos. Esse jogo tem quatro subjogos.
Há três subjogos no segundo estágio em que o United toma uma decisão
considerando cada uma das três possíveis ações do primeiro estágio da American,
havendo um subjogo adicional no momento da decisão do primeiro estágio, que é o
jogo inteiro.
Equilíbrio de Nash em um Subjogo Perfeito
Como todo o jogo dinâmico é um subjogo, um equilíbrio de Nash perfeito no subjogo
também é um equilíbrio de Nash. Em contraste, em um jogo de movimento
simultâneo como o dilema dos prisioneiros estáticos, o único subjogo é o próprio
jogo, portanto, não há distinção importante entre o equilíbrio de Nash e o equilíbrio
de Nash perfeito no subjogo.
A Figura 2 mostra a representação em forma normal desse jogo em que no equilíbrio
de Nash para o jogo de movimento simultâneo é para cada empresa escolher 64.
Entretanto, se as empresas se moverem sequencialmente, o equilíbrio perfeito de
Nash do subjogo resultará em um resultado diferente.
= 48qA
29
Como deve a American, a líder, selecionar sua saída no primeiro estágio? Para cada
quantidade possível que pode produzir, a American prevê o que a United produzirá e
escolhe o nível de produção que maximizará seu próprio lucro. Assim, para prever a
ação da American no primeiro estágio, ela determina o que a United (seguidora) fará
no segundo estágio considerando cada possível saída da American no primeiro
estágio. Usando suas conclusões sobre a reação do segundo estágio do United, a
American toma sua decisão no primeiro estágio.
Usando o mesmo raciocínio, a American determina como a United responderá a cada
uma das ações possíveis da American, como o lado direito da �gura ilustra. A
American prevê que:
SAIBA MAIS
Podemos resolver o equilíbrio de Nash perfeito no subjogo usando a indução
reversa, em que primeiro determinamos a melhor resposta do último jogador a se
mover, em seguida determinamos a melhor resposta para o jogador que fez a
penúltima jogada e, depois, repetimos o processo até chegarmos ao movimento
no início do jogo. Em nosso exemplo, retrocedemos da decisão do seguidor,
United, para a decisão da líder, American, sendo o movimento feito da direita
para a esquerda da árvore do jogo.
30
Se a American escolher 48, a United venderá 64, então, o lucro da American
será de US $ 3,8 milhões.
Se a American escolher 64, a United venderá 64, então, o lucro da American
será de 4,1 milhões de dólares.
Se a American escolher 96, a United venderá 48, então, o lucro da American
será de US $ 4,6 milhões.
Para maximizar seu lucro, a American escolhe 96 no primeiro estágio. A estratégia do
United é dar a melhor resposta à ação de primeiro estágio da American: o United
seleciona 64 se a American escolher 48 ou 64, e o United escolhe 48 se a American
escolher 96. Assim, o United responde no segundo estágio, selecionando 48. Nesse
equilíbrio de Nash perfeito para subjogos, nenhuma das empresas quer mudar sua
estratégia.
Dado que a American Airlines de�ne sua produção em 96, a United está usando uma
estratégia que maximiza seu lucro, por isso, não quer mudar. Da mesma forma, dada a
forma como a United responderá a cada nível possível de produção americana, a
American não poderá obter mais lucros do que se vender 96.
31
Em um jogo repetido, uma empresa pode in�uenciar o comportamento de seu rival
ameaçando puni-lo (Figura 3). Por exemplo, uma companhia aérea poderia usar uma
estratégia de baixa quantidade por alguns períodos para indicar à outra empresa seu
desejo de que as duas empresas cooperassem e produzissem essa baixa quantidade
no futuro (PERLOFF, 2014). Se a outra �rma não responder diminuindo sua produção
em períodos futuros, a primeira �rma sofrerá lucros menores por apenas alguns
períodos.
ATENÇÃO
O equilíbrio perfeito de Nash no subjogo requer que os jogadores acreditem que
seus oponentes agirão de maneira ideal - de acordo com seus próprios interesses.
Nenhum jogador tem incentivo para se desviar das estratégias de equilíbrio. A
razão para adicionarmos o requisito da perfeição do subjogo é que queremos
explicar o que acontecerá se um jogador não seguir o caminho de equilíbrio.
32
No entanto, se a outra empresa responder a esse sinal e diminuir sua quantidade,
ambas as empresas poderão produzir com lucro na baixa quantidade a partir de
então. Além de (ou em vez de) sinalizar, uma empresa pode ameaçar punir um rival
por não restringir a saída. Suponha que a American anuncia ou de alguma forma
indica à United que usará a seguinte estratégia de duas partes:
A American produzirá a menor quantidade a cada período desde que a United
faça o mesmo.
Se a United produzir a quantidade maior no período t, a American produzirá a
quantidade maior no período e em todos os períodos subsequentes.
Se a United acreditar que a American seguirá essa estratégia, a United fará US $ 4,6
milhões a cada período se produzir a menor quantidade. Embora a United possa
obter um lucro maior (US $ 5,1 milhões) no período t produzindo a maior quantidade,
ao fazê-lo, reduzirá seu lucro potencial para US $ 4,1 milhões em cada período
seguinte.
Quando trabalhamos com jogos de movimento simultâneo e sequencial, observamos
que eles apresentam resultados diferentes, mas por quê? Dada a opção de agir
primeiro, por exemplo, a American escolhe um grande nível de produção para obter,
Figura 3 - Punição em jogos de empresas
Fonte: Dazdraperma / 123RF.
33
no melhor interesse da United, um nível de produção relativamente pequeno, 48. A
American se bene�cia ao mover-se primeiro e escolher a quantidade de líderes do
Stackelberg.
No jogo de movimento simultâneo, por que a American não anuncia que produzirá a
saída do líder da Stackelberg para induzir a United a produzir o nível de saída do
seguidor da Stackelberg? A resposta é que, quando as empresas se movem
simultaneamente, o United não acredita na advertência da American de que
produzirá uma grande quantidade, porque não é do interesse da American produzir
uma quantidade tão grande de produção.
SAIBA MAIS
Para que a estratégia anunciada de uma empresa seja uma ameaça crível, os
rivais precisam acreditar que a estratégia da empresa foi racional, no sentido de
que é do interesse da empresa usá-la. A intuição do motivo do compromisso ser
uma ameaça credível é a de “pontes em chamas”. Se o general queima a ponte
atrás do exército para que as tropas só possam avançar e não recuar, o exército se
torna um inimigo mais temível – como um animal encurralado. Da mesma forma,
ao limitar suas opções futuras, uma empresa se fortalece.
34
Conforme Perloff (2014), nem todas as empresas podem fazer ameaças credíveis,
porque nem todas as empresas podem assumir compromissos. Normalmente, para
que uma ameaça tenha sucesso, uma empresa deve ter uma vantagem que lhe
permita prejudicar a outra empresa antes que a empresa possa retaliar. Empresas
idênticas que agem simultaneamente não podem ameaçar uma à outra.
Porém, uma �rma pode ser capaz de tornar seu comportamento ameaçador crível se
as �rmas forem diferentes. Uma diferença importante é a capacidade de uma
empresa agir antes da outra.
Jogos repetitivos
Agora, voltaremos para jogos estáticos que são repetidos. Em cada período, há um
único estágio: ambos os jogadores se movem simultaneamente. No entanto, estes são
jogos dinâmicos porque o movimento do Jogador 1 no período t precede o
movimento do Jogador 2 no período, portanto, quanto mais cedo se dá a ação, mais
ela pode afetar o posterior.
Segundo Pindick e Rubinfeld (2018), um jogo repetitivo (Figura 4) é um jogo de
informações quase perfeitas: os jogadores conhecem todos os movimentos de
períodos anteriores, mas não conhecem as jogadas um do outro no período, porque
todos se movimentam simultaneamente.
Figura 4 - Jogos repetitivos
Fonte: Karel Miragaya / 123RF.
35
Em um jogo repetido, uma empresa pode in�uenciaro comportamento de seu rival
ameaçando puni-lo (BÊRNI; FERNANDEZ, 2014). Por exemplo, uma companhia
aérea poderia usar uma estratégia de baixa quantidade por alguns períodos para
indicar à outra empresa seu desejo de que as duas empresas cooperassem e
produzissem essa baixa quantidade no futuro. Se a outra �rma não responder
diminuindo sua produção em períodos futuros, a primeira �rma sofrerá lucros
menores por apenas alguns períodos. No entanto, se a outra empresa responder a
esse sinal e diminuir sua quantidade, ambas as empresas poderão produzir com lucro
na baixa quantidade a partir de então. Além de (ou em vez de) sinalizar, uma empresa
pode ameaçar punir um rival por não restringir a saída.
Agora, considere que a American anuncia ou de alguma forma indica à United que
usará a seguinte estratégia de duas partes:
A American produzirá a menor quantidade a cada período, desde que a United
faça o mesmo.
Se a United produzir a quantidade maior no período t, a American produzirá a
quantidade maior no período e em todos os períodos subsequentes.
Se a United acreditar que a American seguirá essa estratégia, a United sabe que fará
US $ 4,6 milhões a cada período se produzir a menor quantidade. Embora a United
possa obter um lucro maior (US $ 5,1 milhões) no período t produzindo a maior
quantidade, ao fazê-lo, reduzirá seu lucro potencial para US $ 4,1 milhões em cada
período seguinte.
36
A United pode levar a sério essa ameaça da American (porque a melhor resposta da
American será produzir a maior quantidade) se acreditar que não pode con�ar na
United para produzir a menor quantidade. Caso as empresas joguem o mesmo jogo
inde�nidamente, elas deverão achar mais fácil conspirar.
SAIBA MAIS
Assim, a melhor política da United é produzir a menor quantidade em cada
período, a menos que se importe muito com o lucro atual e pouco com os lucros
futuros. Se a United valorizar os lucros futuros quase tanto quanto os atuais, o
ganho de um período de desvios do nível de produção colusivo não compensará
as perdas de lucros reduzidos em períodos futuros, que é a punição que a
American imporá.
37
QUESTÃO OBJETIVA
Permite que a empresa dominante no mercado de�na seu
preço primeiro e, subsequentemente, as empresas
seguidoras otimizem sua produção e preço. Marque a
alternativa correta sobre a que se refere o conceito
apresentado.
Jogos repetitivos.
Equilíbrio de Nash.
Subjogo.
Jogos estáticos.
Modelo de Stackelberg.
38
QUESTÃO OBJETIVA
Em um jogo de Stackelberg, o líder se compromete a
produzir tanta saída que é do interesse do seguidor
produzir uma quantidade relativamente pequena de
produto. Considerando a informação apresentada, marque
a alternativa correta sobre um jogo repetido.
Em um jogo repetido, os jogadores repetem um jogo estático
no qual eles se movem simultaneamente dentro de um
período.
Em um jogo repetido, os jogadores repetem um jogo
sequencial no qual eles se movem simultaneamente dentro de
um período.
Em um jogo repetido, os jogadores repetem um subjogo no
qual eles se movem simultaneamente dentro de um período.
Em um jogo repetido, uma empresa não pode in�uenciar o
comportamento de seu rival ameaçando puni-lo.
Caso as empresas joguem o mesmo jogo inde�nidamente, elas
deverão achar mais difícil conspirar.
39
Em jogos dinâmicos, um jogador leva em consideração os movimentos anteriores dos
outros jogadores ao escolher um movimento. Em jogos de movimento sequencial, um
jogador se move antes do outro jogador. Economistas tipicamente estudam jogos
sequenciais de informações completas sobre pagamentos e informações perfeitas
sobre movimentos anteriores.
A solução mais conhecida de um jogo dinâmico é um equilíbrio de Nash perfeito no
subjogo em que as estratégias dos jogadores são um equilíbrio de Nash em cada
subjogo. Os jogadores podem usar estratégias mais complexas em jogos dinâmicos
do que em jogos estáticos. Além disso, é mais fácil para os jogadores maximizar o seu
pagamento conjunto em um jogo repetido do que em um jogo de período único.
Nesta aula, você teve a oportunidade de:
veri�car as características dos jogos dinâmicos e sequenciais;
entender o modelo de Stackelberg e a árvore de jogo;
analisar o equilíbrio de Nash em subjogo perfeito.
Fechamento
40
Indução Inversa
A indução inversa é usada para mostrar que apenas um re�namento do conceito de
equilíbrio de Nash, chamado de equilíbrio de Nash perfeito no subjogo, exclui
ameaças não credíveis. Jogos envolvendo ameaças para se processar invasores e
combater a entrada são usados para explorar a ideia de comprometimento.
Sempre que um jogador tem que se mover, a indução inversa deduz, para cada uma de
suas possíveis ações, as ações que os jogadores (incluindo ela mesma),
subsequentemente, tomarão racionalmente, bem como escolhe a ação que produzirá
o �nal que o jogador prefere. O jogo centopeia também é analisado e algumas
questões são levantadas sobre o escopo do método de indução inversa.
Ao �nal desta aula, você será capaz de:
conhecer de forma geral a indução inversa;
veri�car como se dá o processo de indução inversa;
conhecer o jogo da centopeia e sua relação com a indução inversa.
Aula 03
Introdução
41
Indução Inversa: De�nições
A indução inversa na teoria dos jogos é um processo iterativo de raciocínio inverso
no tempo, a partir do �nal de um problema ou situação, para se resolver jogos
extensos e de formato extensivos, bem como inferir uma sequência de ações ótimas.
Em cada estágio do jogo, a indução reversa determina a estratégia ideal do jogador
que fará o último movimento no jogo. Então, a ação ótima do penúltimo jogador em
movimento é determinada considerando-se a ação do último jogador como dada.
Esse processo continua para trás até que a melhor ação para cada ponto no tempo
tenha sido determinada. Efetivamente, um deles é determinar o equilíbrio de Nash de
cada subjogo do jogo original.
Segundo Bêrni e Fernandez (2014, p. 167):
SAIBA MAIS
Ela tem sido usada para resolver jogos desde que John von Neumann e Oskar
Morgenstern estabeleceram a teoria dos jogos como um assunto acadêmico
quando publicaram seu livro Teoria dos Jogos e Comportamento Econômico, em
1944.
42
Em termos metodológicos, indução é a forma de raciocínio que foi originalmente
defendida pela corrente do Indutivismo (ou Empirismo). Esta foi a perspectiva
�losó�ca padrão sobre como era obtido o conhecimento cientí�co durante todo o
período que se estendeu do século XVII até as primeiras décadas do século XX. Em
termos lógicos, trata-se de uma forma de inferência que propõe que, a partir de uma
lista �nita de observações de algum fato ou fenômeno feitas no passado e no
presente, se conclua que o fenômeno em pauta voltará a se repetir também no
futuro.
O procedimento de indução inversa funciona da seguinte maneira: começamos a
encontrar as ações ótimas dos jogadores que se movem nos subjogos de
comprimento 1 (os “últimos” subjogos); então, tomando essas ações como dadas,
encontramos as ações ótimas dos jogadores que se movem primeiro nos subjogos de
tamanho 2. Continuamos a trabalhar de volta para o começo do jogo, em cada estágio
k, descobrindo as ações ótimas dos jogadores que se movem no início dos subjogos
de comprimento k, dadas as ações ótimas.
Em cada estágio k desse procedimento, as ações ótimas dos jogadores que se movem
no início dos subjogos de longitude k são fáceis de determinar: elas são simplesmente
as ações que proporcionam aos jogadores os maiores retornos, dadas as ações
ótimas em todos os menores subjogos. Considere, por exemplo, o jogo na Figura 1.
Figura 1 - Jogo ilustrando o procedimento de indução inversa
Fonte: Elaborada pela autora.
43
Com base na Figura 1, temos o seguinte:
I. Em primeiro lugar, considere subjogos de comprimento 1. O jogo tem dois desses
subjogos; em ambos, o jogador 2 se move. No subjogo após o histórico C, a ação
ótima do jogador 2 é E, e no subjogo após o histórico D, sua ação ideal é H.
II. Agora, considere subjogos decomprimento 2. O jogo tem um subjogo desse tipo,
ou seja, um jogo inteiro, em que o jogador 1 se move. Dadas as ações ótimas nos
subjogos de duração 1, a escolha do jogador 1 no início do jogo lhe renderia um
pagamento de 2, enquanto a escolha de D renderia uma recompensa de 1. Assim, a
ação ótima do jogador 1 no início do jogo seria C.
O jogo não tem um subjogo de tamanho maior que 2, então, o procedimento de
indução reversa produz o par de estratégia (C, EH). Como outro exemplo, considere o
jogo na Figura 2. Em primeiro lugar, deduzimos que no subjogo de comprimento 1
após a história (C, E), o jogador 1 escolherá G; então, no início do subjogo de
comprimento 2, seguindo o histórico C, o jogador 2 escolherá E; então, no início de
todo o jogo, o jogador 1 escolherá D. Assim, o procedimento de indução inversa neste
jogo produzirá o par de estratégia (DG, E).
Figura 2 - Extenso jogo no qual o jogador 1 se move antes e depois do jogador 2
Fonte: Elaborada pela autora.
44
Em qualquer jogo no qual esse procedimento seleciona uma única ação para o
jogador que se move no início de cada subjogo, o per�l de estratégia selecionado é o
único equilíbrio perfeito para o subjogo do jogo.
Considere o exemplo, o jogo na Figura 3:
ATENÇÃO
O que acontece em um jogo no qual, no início de alguns subjogos, há mais de uma
ação ótima? Em tal jogo, uma extensão do procedimento de indução inversa
localizará todo o equilíbrio perfeito do subjogo. Essa extensão traçará de volta,
separadamente, as implicações para o comportamento nos subjogos mais longos
de cada combinação de ações ótimas nos subjogos mais curtos.
45
Observando a Figura 3, temos:
A. O jogo tem três subjogos de comprimento um, e em cada um deles, o jogador 2 se
move. Nos subjogos que seguem as histórias C e D, o jogador 2 é indiferente entre
suas duas ações. No subjogo que segue a história E, a ação ótima exclusiva do jogador
2 é K. Assim, há quatro combinações de ações ótimas do jogador 2 nos subjogos de
duração 1: FHK, FIK, GHK e GIK (em que o primeiro componente em cada caso é a
ação do jogador 2 após o histórico C, o segundo componente é sua ação após o
histórico D, e o terceiro componente é sua ação após o histórico E).
B. O jogo tem um único subjogo de comprimento dois, ou seja, o jogo inteiro, no qual
o jogador 1 se move primeiro. Consideramos agora a ação ótima do jogador 1 neste
jogo para cada combinação das ações ótimas do jogador 2 nos subjogos de duração 1,
logo:
Para as combinações FHK e FIK das ações ótimas do jogador 2, a ação ótima do
jogador 1 no início do jogo é C.
Para a combinação GHK de ações ótimas do jogador 2, as ações C, D e E são
todas ótimas para o jogador 1.
Figura 3 - Jogo em que o primeiro movimento em alguns subjogos tem múltiplas ações
ótimas
Fonte: Elaborada pela autora.
46
Para a combinação GIK de ações ótimas do jogador, a ação ótima do jogador 1
no início do jogo é D.
Assim, os pares de estratégias isolados pelo procedimento são (C, FHK), (C, FIK), (C,
GHK), (D, GHK), (E, GHK) e (D, GIF). Quando você resolve um jogo de movimento
sequencial usando a indução inversa, você começa no �nal da árvore do jogo, e para
cada ponto de decisão (representado pelos quadrados sombreados), você encontra a
melhor decisão para o jogador naquele ponto. Você continua fazendo isso até chegar
ao começo do jogo. O processo de pensamento de indução reversa tem a propriedade
atraente que nos permite dividir um jogo potencialmente complicado em partes
gerenciáveis.
Vamos a mais um exemplo de indução inversa? Suponha que a Honda possa tomar
sua decisão de capacidade antes que a Toyota decida o que fazer (talvez porque
tenha acelerado o processo de tomada de decisão). Agora temos um jogo de
movimento sequencial no qual a Honda é a primeira a ser movida e a Toyota é a
segunda a ser movida. Para analisar esse jogo de movimento sequencial, usamos uma
árvore de jogos, que mostra as diferentes estratégias que cada jogador pode seguir
no jogo e a ordem em que essas estratégias são escolhidas.
A Figura 4 mostra a árvore de jogos do nosso jogo de expansão de capacidade. Em
qualquer árvore de jogo, a ordem dos movimentos �ui da esquerda para a direita,
porque a Honda se move primeiro e está na posição mais à esquerda. Para cada uma
das possíveis ações da Honda, a árvore mostra as possíveis decisões para a Toyota.
47
Para aplicar a indução inversa nesse exemplo, precisamos encontrar a decisão ideal
da Toyota para cada uma das três opções que a Honda pode dar: “não construir”,
“construir pequenas” e ‘construir" grande ‘(na Figura 4, as escolhas ideais da Toyota
estão em negrito):
Se a Honda escolher “não construir”, a escolha ideal da Toyota será “construir
pequena”.
Se a Honda escolher “construir pequenas”, a escolha ideal da Toyota será
“construir pequenas”.
Se a Honda escolher “construir grande”, a escolha ideal da Toyota será “não
construa”.
Assumimos que a Honda antecipa que a Toyota escolherá sua melhor resposta para
cada uma das três ações que a Honda puder tomar. Podemos em seguida, determinar
qual das três estratégias da Honda lhe dará o maior lucro, identi�cando o lucro que a
Honda obterá de cada opção que escolher, uma vez que a Toyota responderá de
forma otimizada:
Se a Honda escolher “não construir”, então, dada a reação ideal da Toyota, o
lucro da Honda será de US $ 15 milhões.
Se a Honda escolher “construir pequeno”, então, dada a reação ideal da Toyota, o
lucro da Honda será de US $ 16 milhões.
Se a Honda escolher “construir grande”, então, dada a reação ideal da Toyota, o
lucro da Honda será de US $ 18 milhões.
Dessa forma, a Honda obtém o maior lucro quando escolhe “construir grande”. Para o
equilíbrio de Nash, neste jogo, a Honda deve escolher “construir grande” e a Toyota
escolher “não construir”. Nesse equilíbrio, o lucro da Honda será de US $ 18 milhões,
e o lucro da Toyota será de US $ 9 milhões.
Figura 4 - Árvore de jogos para o jogo de expansão de capacidade de movimento
sequencial entre a Toyota e a Honda *Recompensas em milhões de dólares
Fonte: Besanko e Braeutigam (2014, p. 595).
48
Por que o comportamento da Honda é tão diferente quando pode se mover primeiro?
Porque no jogo sequencial, os problemas de decisão da empresa estão ligados no
tempo: a Toyota pode ver o que a Honda fez, e a Honda conta com uma resposta
racional da Toyota para qualquer ação que escolher. Isso permite que a Honda force a
Toyota a um canto. Ao se comprometer com uma expansão de grande capacidade, a
Honda coloca a Toyota em uma posição em que o melhor que pode fazer não é
construir. Em contraste, no jogo de movimento simultâneo, a Toyota não pode
observar a decisão da Honda de antemão e, portanto, a Honda não pode forçar a mão
da Toyota. Por causa disso, a escolha de “construir grande” pela Honda não é tão
convincente quanto no jogo de movimento sequencial.
ATENÇÃO
Observe que o equilíbrio de Nash do jogo de movimento sequencial difere
signi�cativamente daquele do jogo de movimento simultâneo (ambas as
empresas escolhem “construir pequeno”). De fato, no jogo de movimento
sequencial, a estratégia de equilíbrio da Honda (“construir grande”) seria
dominada se a Toyota e a Honda �zessem suas escolhas de capacidade
simultaneamente.
49
No jogo da centopeia, dois jogadores alternadamente obtêm uma chance maior de
ganhar um pote crescente de dinheiro ou passar o pote para o outro jogador. Os
pagamentos são arranjados de modo que se o pote (que é usado para o jogo) for
passado para o oponente e ele receber o pote na próxima rodada, um dos jogadores
receberá um pouco menos do que se alguém tivesse pegado o pote nessa rodada. O
jogo termina assim que um jogador leva o dinheiro, sendo que um receberá a maior
parte e o outro jogador receberá a parte menor.
Jogo da Centopeia
O jogo da centopeia ou centipede game (por causa da maneira como eles são
representados diagramaticamente, Figura 5) é um jogo de forma extensa na teoria
dos jogos cujos dois jogadores, alternadamente, têm a chance de ganhara maior
SAIBA MAIS
No entanto, os resultados inferidos da indução inversa muitas vezes não
conseguem prever o jogo humano real (BESANKO; BRAEUTIGAM, 2014).
Estudos experimentais mostraram que o comportamento “racional” (como
previsto pela teoria dos jogos) raramente é exibido na vida real. Os jogadores
irracionais podem, na verdade, acabar obtendo maiores recompensas do que o
previsto pela indução inversa, como ilustrado no jogo de centopeia.
50
parte de um estoque de dinheiro aumentando-o lentamente. É organizado de modo
que, se um jogador passar o esconderijo para o seu oponente, que receberá o
esconderijo, tal jogador receberá uma quantia menor do que se ele tivesse pegado o
pote.
O jogo termina assim que um jogador leva o esconderijo, recebendo a maior porção,
enquanto o outro jogador recebe a porção menor. O jogo tem um número total pré-
de�nido de rodadas, que são conhecidas por cada jogador antecipadamente.
Figura 5 - Jogo da centopeia
Fonte: Carmichael (2005, p. 102).
51
Os principais pontos-chave do jogo da centopeia são: é um jogo no qual dois
jogadores se alternam para receber uma parte de uma soma cada vez maior de
dinheiro; é uma abordagem inovadora para o con�ito entre interesse próprio e
benefício mútuo; e apenas uma porcentagem muito pequena de indivíduos escolheu
passar o estoque para aumentar a quantidade de estoque.
Como exemplo, considere a seguinte versão do jogo centopeia envolvendo dois
jogadores, Pedro e Carlos. O jogo começa com um pagamento total de R$ 2. Pedro
vai primeiro e tem que decidir entre “pegar” ou “passar’ o pagamento. Se ele ganhar,
receberá R$ 2 e Carlos receberá R$ 0, mas se ele passar, a decisão de “pegar ou
passar” deverá ser feita por Carlos.
O pagamento agora aumentará de R$ 2 para R$ 4; se Carlos receber R$ 3, Pedro
receberá $ 1, mas se ele passar, Pedro decidirá se vai tirar ou passar, e se ele passar, o
SAIBA MAIS
Embora não tão conhecido quanto o famoso Dilema do Prisioneiro, o jogo da
centopeia também destaca o con�ito entre o interesse próprio e o benefício
mútuo com o qual as pessoas têm de lidar. Foi introduzido pela primeira vez pelo
psicólogo Robert Rosenthal, em 1982. O jogo da centopeia é assim chamado
porque sua versão original consistia em uma sequência de 100 movimentos.
52
pagamento aumentará de R$ 2 para R$ 6; se Pedro pegar, receberá R$ 4, enquanto
Carlos receberá R$ 2.
Se Pedro e Carlos receberem, o pagamento aumentará de R$ 2 a R$ 8, e Pedro
receberá R$ 3, enquanto Carlos receberá R$ 5. O jogo continuará nesse sentido por
um total de 100 rodadas. Se ambos os jogadores escolherem passar, cada um
receberá uma recompensa de R$ 50 no �nal do jogo. Note que o dinheiro é
contribuído por um terceiro e não por algum dos jogadores.
Em estudos experimentais, no entanto, apenas uma porcentagem muito pequena de
indivíduos escolheu assumir o primeiro movimento. Essa discrepância poderia ter
várias explicações. Uma razão é que algumas pessoas são altruístas e preferem
cooperar com o outro jogador, sempre passando em vez de derrubar o pote.
Outra razão é que as pessoas podem simplesmente ser incapazes de fazer o
raciocínio dedutivo necessário para fazer a escolha racional prevista pelo equilíbrio
de Nash. O fato de poucas pessoas pegarem o estoque na primeira jogada não é
ATENÇÃO
O que a teoria dos jogos prevê? Usando a indução inversa, a teoria dos jogos
prevê que Pedro (ou o primeiro jogador) escolherá dar o primeiro passo e ambos
os jogadores receberão um pagamento de R$ 1.
53
muito surpreendente, dado o pequeno tamanho da recompensa inicial quando
comparado com os pagamentos crescentes à medida que o jogo avança.
54
QUESTÃO OBJETIVA
É usada para escolher entre vários equilíbrios de Nash,
veri�cando se as jogadas dos jogadores são as melhores
respostas entre si em cada nó de decisão. Marque a
alternativa correta sobre a que o fragmento de texto se
refere.
Jogo da centopeia.
Ameaças.
Indução inversa.
Dilema do prisioneiro.
Árvore de jogo.
55
QUESTÃO OBJETIVA
Tendo por base o jogo da centopeia, que representa um
exemplo clássico de uma situação estratégica em que a
previsão de equilíbrio está em desacordo com o
comportamento humano, marque a alternativa correta.
Assim que um jogador leva, o jogo termina com ele recebendo
a menor parte da pilha enquanto o outro jogador recebe a
parte maior.
É um jogo de forma extensa no qual dois jogadores
alternadamente têm a chance de pegar a maior parte de uma
pilha de dinheiro em crescimento contínuo.
Passar estritamente aumenta o pagamento de um jogador se
o oponente �zer o próximo movimento.
Se o oponente também passar, os dois jogadores são
confrontados com a mesma situação de escolha, com papéis
invertidos e menores pagamentos.
O jogo tem um número in�nito de movimentos, que são
conhecidos antecipadamente para ambos os jogadores.
56
Fechamento
Um procedimento para se resolver um jogo de movimento sequencial é a indução
inversa, que tem seu início no �nal da árvore do jogo, encontrando a melhor decisão
para o jogador em cada ponto de decisão. É fácil aplicar a indução inversa com a
suposição de que ambos os jogadores se preocupam apenas em obter o máximo de
dinheiro possível. Se João oferecer a Maria uma quantia positiva, ela dirá que sim,
porque qualquer coisa é melhor que nada. O máximo que João oferecerá, portanto,
será um centavo. Em um equilíbrio perfeito no subjogo, João, portanto, pegará o pote.
Vimos que o jogo centopeia é um jogo para dois jogadores que alternam a escolha
entre terminar o jogo (“pegar’) ou passar para o outro jogador (“passar”). A
recompensa em se receber o nó de decisão atual é maior do que a recebida pelo
outro jogador, porém, menor do que a recompensa que ele poderia receber se o
outro jogador também passasse. O jogador que faz a escolha �nal recebe um
pagamento melhor do que o que passa.
Nesta aula, você teve a oportunidade de:
conhecer o conceito de indução inversa;
veri�car como se dá a indução inversa nos jogos;
Analisar o jogo da centopeia.
57
Ameaças Críveis e Não Críveis
Na realidade, alguns compromissos e ameaças são credíveis, outros não. Aqui, o
princípio para julgar a credibilidade do compromisso e da ameaça é que, dadas as
condições que podem levar ao comprometimento e à ameaça, se é mais vantajoso
levar a cabo as promessas da pessoa que emitiu o compromisso ou ameaça, então, o
compromisso ou ameaça é credível.
Por outro lado, se é desvantajoso para a pessoa que emitiu o compromisso ou ameaça
cumprir as promessas, então, o compromisso ou ameaça não é credível. Isso porque
acreditamos que uma pessoa racional, quando confrontada com escolhas de
comportamento, só escolherá aquela que é mais bené�ca para si mesma. Não é
possível julgar a credibilidade de compromisso e ameaça de uma pessoa irracional.
Ao �nal desta aula, você será capaz de:
analisar credibilidade e ameaças;
conhecer o que são ameaças críveis e não críveis;
veri�car como as ameaças se dão nos jogos.
Aula 04
Introdução
58
Movimento Estratégico e o
Compromisso
As empresas (os players) podem realizar vários movimentos estratégicos diferentes
para gerar vantagem competitiva. O objetivo é criar uma diferença clara que seja
importante para seus clientes, que seja algo que seus concorrentes não possam
igualar.
Pode-se criar vantagem competitiva desenvolvendo uma estratégia de liderança em
fatores como custo, qualidade, inovação e experiência do cliente. Nesse contexto,
temos o movimento estratégico.
59
As principais características de um movimento estratégico (Figura 1) envolvem o
compromisso do jogador, signi�cando que ele pode restringir suas próprias escolhas
e que o compromisso tem que ser crível, ou seja,, uma vez empregado, deve ser do
interesse do jogador seguir com o movimento.
Movimentos credíveis também devem ser observáveis para os outros jogadores. Por
exemplo, a Empresa 1 terá de conter seu comportamento de modo que convença a
Empresa 2 de que a Empresa 1 não tem outra alternativa.
ATENÇÃOUm movimento estratégico na teoria dos jogos é uma ação tomada por um
jogador fora das ações de�nidas do jogo a �m de se obter uma vantagem
estratégica e aumentar o retorno de uma pessoa. Movimentos estratégicos
podem ser movimentos incondicionais ou regras de resposta.
60
Segundo Pindyck e Rubinfeld (2018), os movimentos estratégicos não são avisos ou
garantias. Avisos e garantias são apenas declarações do interesse de um jogador em
vez de um compromisso real do jogador. Os primeiros movimentos devem ser
observáveis e irreversíveis para serem verdadeiros primeiros golpes, e eles devem
ser críveis se quiserem ter o efeito desejado na alteração do resultado de equilíbrio
do jogo.
Um jogador pode usar ameaças e promete alterar as expectativas dos outros
jogadores sobre suas ações futuras, e assim induzi-los a tomar ações favoráveis a ele
ou impedi-los de fazer movimentos que o prejudiquem. Para ter sucesso, as ameaças
e promessas devem ser con�áveis. Isso é problemático porque, quando chega a hora,
é geralmente caro fazer uma ameaça ou cumprir uma promessa.
Figura 1 - Movimento estratégico
Fonte: Strelok / 123RF.
61
O comprometimento é o primeiro passo incondicional usado para se aproveitar a
vantagem de ser o primeiro quando existe um. Tal movimento geralmente implica o
comprometimento com uma estratégia que não teria sido uma estratégia de
equilíbrio na versão original do jogo, podendo existir, então, um incentivo para se
renegar o comprometimento mais tarde.
ATENÇÃO
A teoria dos jogos estuda várias maneiras de aumentar a credibilidade. O
princípio geral é que pode ser do interesse do jogador reduzir sua própria
liberdade de ação futura. Ao fazer isso, ele remove sua própria tentação de
renegar uma promessa ou perdoar as transgressões dos outros.
62
Ameaças e Credibilidade
Jogos estratégicos são diferenciados da tomada de decisão individual pela presença
de interações signi�cativas entre os jogadores. Os jogos podem ser classi�cados de
acordo com uma variedade de categorias, incluindo o tempo de jogo, os interesses
comuns ou con�itantes dos jogadores, o número de vezes que uma interação ocorre,
a quantidade de informação disponível para os jogadores, o tipo de regras e a
viabilidade de uma ação coordenada.
Racionalidade ou comportamento consistente é assumido por todos os jogadores,
que também devem estar cientes de todas as regras relevantes de conduta. O
equilíbrio surge quando todos os jogadores usam estratégias que são melhores
respostas às estratégias dos outros; algumas classes de jogos permitem aprender
com a experiência e estudar movimentos dinâmicos em direção ao equilíbrio.
SAIBA MAIS
Os jogadores têm estratégias que levam a diferentes resultados com diferentes
recompensas associadas. Os payoffs incorporam tudo o que é importante para um
jogador sobre um jogo e são calculados usando médias probabilísticas ou valores
esperados se os resultados forem aleatórios ou envolver algum risco.
63
Na teoria dos jogos, os jogadores podem obter uma vantagem estratégica por meio
da regra de resposta. Uma regra de resposta de�ne a(s) ação(ões) como resposta à(s)
outra(s) ação(ões). As regras de resposta são predominantes em nossas vidas. Um
gerente dizendo a um funcionário que ele receberá um aumento se exceder seu plano
de vendas para o ano é um exemplo simples de uma regra de resposta.
A regra de resposta pode ser de�nida de duas maneiras: ameaças e recompensas.
Ameaças e promessas são essencialmente as mesmas; ambas são mensagens que os
jogadores podem enviar uns aos outros para afetar o outro jogador na escolha de
uma determinada ação. Com uma ameaça, a falta de cooperação resulta em algum
tipo de compensação negativa. Com uma recompensa (Figura 2) ou promessa, a
cooperação resulta em algum tipo de recompensa positiva.
Os primeiros movimentos condicionais, como ameaças e promessas, são regras de
resposta concebidas para impedir as ações dos rivais e preservar o status quo ou para
obrigar as ações dos rivais e alterar o status quo. Ameaças carregam a possibilidade
de danos mútuos, mas não custam nada se funcionam; ameaças que criam apenas o
risco de um resultado ruim são conhecidas como atos de arrogância.
As promessas são caras apenas para o fabricante e somente se forem bem-sucedidas.
As ameaças podem ser arbitrariamente grandes, embora o tamanho excessivo
Figura 2 - Analogia à recompensa
Fonte: Iqoncept / 123RF.
64
comprometa a credibilidade, mas as promessas geralmente são su�cientemente
grandes para serem efetivas.
Credibilidade deve ser estabelecida para qualquer movimento estratégico. Há uma
série de princípios gerais a considerar para tornar os movimentos credíveis e vários
dispositivos especí�cos que podem ser usados para se adquirir credibilidade. Estes
geralmente funcionam reduzindo a própria liberdade futura de escolha ou alterando
os próprios resultados de ações futuras.
A reputação corporativa pode ser uma fonte adicional de vantagem competitiva por
meio de compra, encaminhamento, boca a boca positivo e benefício da dúvida em
crise; ou seja, não é, em geral, in�uenciada somente por produtos e serviços.
Empresas líderes comunicam e agem de uma maneira valorizada por seus
stakeholders, bem como estão criando uma abordagem equilibrada e são
ATENÇÃO
Dispositivos especí�cos desse tipo incluem o estabelecimento de uma reputação,
usando o trabalho em equipe, demonstrando aparente irracionalidade,
queimando pontes e fazendo contratos, embora a aquisição de credibilidade seja
frequentemente especí�ca do contexto. Dispositivos semelhantes existem para
combater movimentos estratégicos feitos por jogadores rivais.
65
recompensadas pela con�ança e pelos negócios em produtos, mercados e culturas.
Todas as empresas têm uma reputação, seja boa ou ruim.
Ameaças não Críveis
Uma ameaça não credível (Figura 3) ou vazia é um termo usado na teoria dos jogos e
na economia para descrever uma ameaça em um jogo sequencial que um jogador
racional, na verdade, não executaria, porque não seria de seu interesse fazê-lo
(PINDYCK; RUBINFELD, 2018).
Por exemplo, a Empresa 1 fabrica uma máquina multifunções e a Empresa B, uma
máquina com uma função. As duas empresas podem cobrar um preço elevado e ter
altos lucros. Ainda que a Empresa 2 pratique um preço mais baixo e a Empresa 1
pratique um preço alto, muitos indivíduos ainda comprarão a máquina da Empresa 1.
Figura 3 - Ilustração para ameaça vazia
Fonte: Elnur Amikishiyev / 123RF.
66
Porém, se a Empresa 1 praticar um preço baixo, os lucros de ambas serão diminuídos
expressivamente. A Empresa 1 tem preferência pela situação em que as duas
pratiquem o preço alto. Para a Empresa 2, praticar um preço baixo é uma estratégia
predominante. A Empresa 1 poderia ameaçar a Empresa 2 por praticar um preço
baixo caso ela quisesse praticar um preço baixo. Essa ameaça não seria credível, pois,
mesmo quando a Empresa 2 praticar um preço menor, a Empresa 1 terá muito a
perder praticando um preço menor.
Considerando o seguinte exemplo: quando um sindicato exige um aumento salarial
para os trabalhadores de uma empresa, a ameaça frequentemente usada é: “Se não
obtivermos um aumento salarial, entraremos em greve”. Para a empresa, essa é uma
ameaça não credível. Embora a empresa sofra uma perda de greve, os trabalhadores
também sofrerão.
ATENÇÃO
Uma ameaça não credível é feita na esperança de que se acredite, e, portanto, a
ação indesejável ameaçadora não precise ser realizada. Para que uma ameaça
seja credível dentro de um equilíbrio, sempre que um nó for alcançado onde uma
ameaça deve ser cumprida, ela será satisfeita. O Equilíbrio de Nash que depende
de ameaças não credíveis pode ser eliminado por meio da indução inversa; os
equilíbrios restantes são chamados de equilíbrio de Nash perfeito no subjogo.
67
A condição de que a empresa “não dará um aumento salarial aos trabalhadores” fará
com que os trabalhadores escolham o comportamento “sem greve” que é mais
bené�co para eles. Deve-se salientar que “não-credível”aqui não signi�ca que
“de�nitivamente não vai acontecer”. Por exemplo, se o sindicato acredita que a
empresa �nalmente vai encontrá-lo demais e terá que dar aos trabalhadores um
aumento salarial no �nal, então, o sindicato escolherá “greve” (Figura 4).
Portanto, a análise da invasão, por exemplo, mostra como o conceito de um subjogo
perfeito equilíbrio de Nash exclui resultados apoiados por ameaças vazias. Existem
outras situações de ameaças vazias (BÊRNI; FERNANDEZ, 2014) que podem ser
modeladas como jogos. Por exemplo, a ameaça de um funcionário se demitir de seu
emprego se não receber um aumento é provável que seja um vazio em uma recessão
ou quando não há outros empregadores procurando suas habilidades particulares na
localidade.
Da mesma forma, a ameaça de greve de um sindicato pode não ser crível se o
sindicato tiver apenas fundos de greve limitados. A ameaça de uma esposa deixar o
marido (ou vice-versa) também pode estar vazia se ela (ou ele) não tiver mais para
onde ir. No cenário internacional, a ameaça de invadir um país pode não ser crível se
os tomadores de decisão da força invasora estiverem divididos.
68
Ameaças Críveis
Durante um jogo, uma maneira de tornar o compromisso ou a ameaça de alguém
credível é mudar o ambiente que acionará a condição, de modo que a execução do
compromisso ou ameaça se torne uma estratégia vantajosa. Em tal situação, quando
a condição é desencadeada, a outra parte, ao assumir que o oponente neste jogo é
racional, acredita que a promessa, de�nitivamente, será realizada (SUN; SUN, 2018).
Por outro lado, se ele coloca seu carro como garantia para o credor (supondo que o
valor de mercado do carro seja maior do que a quantia que deseja tomar
emprestada), sua promessa de devolver o dinheiro é um compromisso crível. É
SAIBA MAIS
Por exemplo, se alguém quer tomar dinheiro de outra pessoa, não uma grande
soma, e não pagar de volta, ele não será penalizado legalmente. Se ele
simplesmente disser: “De�nitivamente eu pagarei de volta. Por favor, acredite
em mim”, então, esse será um compromisso não-credível, porque em tal situação,
é mais vantajoso não devolver o dinheiro (não levando em conta a perda de
reputação e o efeito adverso que ele terá em seu negócio).
69
credível, porque se ele inadimplir, o credor manterá a garantia e ele sofrerá uma
perda maior.
Ao prometer garantias para um empréstimo, pagar um depósito pela encomenda de
bens, etc., as pessoas estão de fato transformando compromissos não-críveis em
compromissos con�áveis. O antigo idioma chinês na história para “quebrar os
caldeirões e afundar o barco” (na verdade, queimar as pontes) é, de fato, tornar
inevitável a realização da ameaça, levando-se em consideração todas as escolhas que
uma vez foram feitas. Estudar a credibilidade de um compromisso e como aumentar
sua credibilidade (Figura 4) tem um signi�cado relevante em setores como contratos
comerciais.
Normalmente, você se bene�cia de escolhas. Geralmente pensamos que quanto mais
opções tivermos, mais poderemos lucrar. A existência de algumas escolhas, no
entanto, aumenta a di�culdade de se emitir ameaças credíveis. Consequentemente, a
eliminação de opções pode aumentar seu retorno.
Figura 4 - Credibilidade
Fonte: Jakub Jirsak / 123RF.
70
QUESTÃO OBJETIVA
São ações que um jogador realiza em um estágio inicial de
um jogo que alteram o comportamento do jogador e o
comportamento dos outros jogadores de maneira
favorável ao primeiro jogador.
Depois de analisar o fragmento de texto apresentado,
marque a alternativa correta sobre a que ele se refere.
Ameaças críveis.
Compromisso.
Movimento estratégico.
Ameaças não críveis.
Reputação.
71
QUESTÃO OBJETIVA
Considerando que nas ameaças não credíveis a execução
do compromisso ou ameaça não é vantajosa ou até
prejudicial para a parte que emite os compromissos,
marque a alternativa correta.
É intimidadora.
É feita na esperança de que se acredite e que, portanto, a ação
indesejável ameaçadora precisará ser executada.
Para que uma ameaça seja não credível dentro de um
equilíbrio, sempre que um nó for alcançado, uma ameaça
deverá ser cumprida, e assim ela será satisfeita.
Aqueles equilíbrios de Nash que dependem de ameaças
credíveis podem ser eliminados.
Podem ser paradas se a aceitarmos.
72
Fechamento
Exploramos estrutura de movimento estratégico das empresas e o processo de
ameaças (credíveis e não credíveis), credibilidade e compromisso. O movimento
estratégico na teoria dos jogos é uma ação tomada por um jogador fora das ações
de�nidas do jogo, a �m de se obter uma vantagem estratégica e aumentar o retorno
de uma pessoa.
Os primeiros movimentos como ameaças e promessas são regras de resposta
concebidas para se impedir as ações dos rivais. Ameaças criam apenas o risco de um
resultado ruim; elas são conhecidas como atos de arrogância. Credibilidade deve ser
estabelecida para qualquer movimento estratégico, o que nos leva à reputação
corporativa, que pode ser uma fonte adicional de vantagem competitiva.
As ameaças vazias consistem em uma ameaça, ou seja, um jogo sequencial que um
jogador racional na verdade não executaria, porque não seria de seu interesse fazê-
lo. A ameaça credível é um anúncio de que uma empresa usará uma estratégia
prejudicial a seu rival e que o rival acredita que a estratégia da empresa é racional, no
sentido de que é do interesse da empresa usá-la.
Nesta aula, você teve a oportunidade de:
entender movimentos estratégicos;
veri�car o que são ameaças, credibilidade e compromisso;
analisar as ameaças críveis e são críveis sob contexto de exemplos.
73
Leilões
Até este ponto, examinamos jogos em que os jogadores têm informações completas
sobre as funções de pagamento. Agora, vamos nos voltar para um jogo importante, o
leilão, no qual os jogadores criam estratégias de lance sem conhecer as funções de
pagamento dos outros jogadores.
Um leilão é uma venda em que um bem ou serviço é vendido ao maior lance. Uma
quantidade substancial de troca ocorre por meio de leilões. Os contratos do governo
são normalmente concedidos usando-se leilões de aquisição. Nos últimos anos, os
governos leiloaram partes das ondas de rádio para estações de rádio, telefones
celulares e acesso à Internet sem �o, bem como usaram leilões para montar
mercados de eletricidade e transporte.
Ao �nal desta aula, você será capaz de:
entender o conceito de leilão;
conhecer os diferentes tipos existentes;
como se dá a informação em leilões.
Aula 05
Introdução
74
Leilões
Os leilões são frequentemente usados para produtos diferenciados, especialmente
itens exclusivos, como arte, antiguidades e os direitos de extrair petróleo de um
pedaço de terra. Um leilão é um processo de vendas em que compradores em
potencial fazem lances (Figura 1) competitivos em ativos ou serviços, seja em
formato aberto ou fechado. O ativo ou serviço em questão será vendido para a parte
que �zer o lance mais alto em um leilão aberto e, normalmente, para o maior lance em
um leilão fechado (PINDYCK; RUBINFELD, 2018).
Em um leilão aberto, as partes se reúnem em um local físico ou em uma troca online
para fazer uma oferta por um ativo. Uma parte interessada conhece os valores dos
lances concorrentes e continua suas decisões de lances até que seja declarada
vencedora do leilão (ou seja, tenha enviado o último lance mais alto abaixo do limite
de tempo do leilão) ou desista do leilão.
Figura 1 - Lance em um leilão
Fonte: Happymay / 123RF.
75
Às vezes, em uma situação em que uma divisão de uma empresa ou de toda a
empresa está à venda, o preço não é a única consideração. O vendedor, por exemplo,
pode querer preservar o máximo de empregos possível para seus funcionários. Se um
licitante não apresentar o preço mais alto, mas puder oferecer os melhores termos de
continuidade para os funcionários, o vendedor poderá selecionar esse licitante.
Segundo Perloff (2014), os leilões oferecem um método exclusivo para se vender
itens com base em concorrentes que concorrem entre si para fazer um lance