Buscar

Aula 1_Noções e Aplicações de Teoria dos Jogos

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 51 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

DESCRIÇÃO
Apresentação da Teoria dos Jogos, ferramenta de análise de situações de interação estratégica.
PROPÓSITO
A Teoria dos Jogos é usada para fazer previsões sobre o resultado de interações estratégicas
nos mais diversos setores e, por isso, é amplamente usada na iniciativa privada, no setor público
e na academia.
PREPARAÇÃO
Ter lápis e papel para fazer anotações.
OBJETIVOS
MÓDULO 1
Identificar o que é um jogo
MÓDULO 2
Reconhecer os jogos estáticos
MÓDULO 3
Reconhecer os jogos dinâmicos
INTRODUÇÃO
Na vida lidamos, frequentemente, com situações nas quais reconhecemos que as nossas
decisões afetam outras pessoas e vice-versa. No caso de um jogo de xadrez, sabemos que o
nosso movimento afeta as opções disponíveis para o oponente. Semelhantemente, o oponente
entende que seu movimento impacta as escolhas que podemos fazer. É claro que um jogo de
xadrez tem objetivo recreativo. Porém, situações parecidas também surgem em contextos
profissionais, nos quais tomadores de decisão reconhecem a interdependência mútua de suas
escolhas.
Pense no caso de um tomador de decisão que seja o dono de uma
firma!
Esse tomador de decisão sabe que tem apenas uma competidora e está escolhendo o momento
mais adequado para lançar um novo produto. O dono da firma sabe que sua escolha irá afetar a
concorrente. Ademais, a competidora entende que sua resposta terá impacto sobre a firma, cujo
dono está decidindo quando deve lançar seu novo produto.
Os parágrafos acima tratam de situações em que há interação estratégica. Isso porque uma
situação de interação estratégica é justamente aquela em que tomadores de decisão – como
indivíduos ou organizações – entendem a interdependência recíproca de suas escolhas. Isso é
exatamente o que ocorre nos dois exemplos mencionados anteriormente.
As situações em que há interação estratégica podem ser chamadas de “jogos”. Por isso, o
ramo da matemática que estuda as situações de interação estratégica é conhecido como
Teoria dos Jogos. Trata-se de um ramo matemático muito importante para diversas áreas, visto
que fornece ferramentas analíticas que ajudam os mais diferentes tomadores de decisão a fazer
suas escolhas.
Nossa explicação sobre a Teoria dos Jogos será estruturada em três módulos. No primeiro,
explicaremos o que é um jogo. No segundo, apresentaremos os jogos estáticos. Finalmente, no
terceiro, analisaremos os jogos dinâmicos.
MÓDULO 1MÓDULO 1
 Identificar o que é um jogo
O QUE É UM JOGO?
Jogos são definidos como situações em que há interação estratégica entre um conjunto de
tomadores de decisão. Vamos agora aprender mais a respeito deles, dividindo este módulo em
3 seções, que são:
ELEMENTOS BÁSICOS DE UM JOGO.

QUANTIDADE DE INFORMAÇÃO DISPONÍVEL.

ATIVIDADES PARA VERIFICAR O APRENDIZADO.
ELEMENTOS BÁSICOS DE UM JOGO
Um jogo é composto pelos seguintes elementos básicos:
 
Foto: Shutterstock.com
JOGADORES
 
Foto: Shutterstock.com
AÇÕES
 
Foto: Shutterstock.com
RECOMPENSAS
 
Foto: Shutterstock.com
ESTRATÉGIAS
Explicaremos todos esses elementos em detalhes e, para facilitar o
aprendizado, utilizaremos o chamado jogo do “galinha”, a fim de
ilustrar a aplicação dos conceitos.
No jogo do “galinha”, existem apenas dois tomadores de decisão, cujos nomes são:
 
Foto: Shutterstock.com
ROBERTO E CARLOS
Ambos dirigem seus carros em alta velocidade, um em direção ao outro. O objetivo do jogo é
não ser o primeiro a desviar o carro. Isso porque aquele que desvia seu carro primeiro perde o
jogo e recebe o rótulo de covarde. Daí o nome do jogo do “galinha”. Ademais, para simplificar,
assumiremos que neste jogo cada motorista possui apenas duas opções: desviar ou não desviar.
Agora estamos prontos para aprender sobre os elementos de um jogo.
 ATENÇÃO
Tenha em mente o jogo do “galinha”, pois será utilizado na aplicação dos conceitos ensinados a
seguir.
JOGADORES
Os jogadores são os tomadores de decisão do jogo. Eles participam de uma situação de
interação estratégica e possuem total autonomia para fazer suas escolhas.
Na prática, esses jogadores podem ser...
 
Imagem: Shutterstock.com
INDIVÍDUOS
 
Imagem: Shutterstock.com
EMPRESAS
 
Imagem: Shutterstock.com
PAÍSES
Porém, no jogo, todos esses diferentes tomadores de decisão são classificados como
jogadores.
 ATENÇÃO
Antes de seguir adiante, vale ressaltar que vamos estudar aqui apenas jogos nos quais existe um
número finito J de jogadores. Essa opção simplifica a análise sem prejuízo da compreensão dos
conceitos.
Ademais, nesse caso podemos representar cada jogador por j, onde sabemos que temos desde
o primeiro jogador, para o qual vale j = 1, até o último jogador, para o qual observamos que j = J.
Não se preocupe muito com os detalhes de notação; são apenas uma ferramenta de apoio.
Agora que já sabemos o que são jogadores, voltemos ao jogo do “galinha”. Quem seriam os
jogadores desse jogo? Para responder a essa pergunta, basta lembrar que os jogadores são
os tomadores de decisão do jogo. Logo, no jogo do “galinha”, os jogadores são Roberto e
Carlos, visto que eles são os únicos tomadores de decisão desse exemplo.
AÇÕES
Ação é um movimento que o jogador pode fazer quando é
chamado a tomar uma decisão.
De maneira mais formal, pode-se definir a primeira ação disponível para o jogador j como sendo 
, a segunda, como sendo , e assim sucessivamente até a última, como sendo . Ademais,
podemos definir também o conjunto de ações do jogador j. Na verdade, o conjunto de ações do
jogador j compreende todas as ações que estão disponíveis para ele. Formalmente, iremos
representar o conjunto de ações do jogador j, como sendo .
Agora que já sabemos o que é uma ação e que entendemos o conceito de conjunto de ações,
vamos analisar novamente o jogo do “galinha”, para aplicar esses aprendizados em um exemplo
prático. No jogo do “galinha”, existem apenas duas ações disponíveis para cada jogador j, que
são: e . Dessa forma, podemos escrever o conjunto de ações
do primeiro jogador, Roberto, que vamos representar por , como sendo 
. Analogamente, podemos escrever o conjunto de ações do
segundo jogador, Carlos, que vamos representar por , como sendo 
.
RECOMPENSAS
A recompensa é o “prêmio” que o jogador obtém ao final do jogo.
Tal recompensa depende da escolha feita pelo jogador e das decisões dos demais participantes
do jogo. Ela pode ser subjetiva, aumentando o grau de satisfação do jogador, ou pode ter uma
natureza mais concreta, garantindo ao jogador o recebimento de determinada quantia, por
exemplo.
VOLTEMOS AGORA AO JOGO DO “GALINHA”.
Nesse caso, não há recompensa em dinheiro, visto que os jogadores não fazem nenhuma
aposta. Portanto, trata-se necessariamente de um jogo em que a recompensa é de cunho mais
subjetivo. Assim, nesse exemplo, a recompensa de determinado jogador, ao final do jogo, pode
ser interpretada como o grau de satisfação dele.
a1j a
2
j a
A
j
Aj ={a1j ; a2j ; … ; aAj }
a1j = desviar a
2
j = não desviar
j = 1
A1 ={desviar;  não desviar}
j = 2
A2 ={desviar;  não desviar}
Vamos agora ordenar a recompensa de Roberto, seu nível de satisfação, com base nos possíveis
resultados do jogo (iremos analisar o caso do Roberto; a ordenação do Carlos será idêntica,
embora invertida). Certamente, o resultado do jogo que gera maior recompensa para Roberto é
aquele em que seu oponente desvia, mas ele não desvia. Nesse caso, Roberto vence o jogo e
seu oponente recebe o rótulo de covarde. Já o resultado que gera a segunda maior recompensa
para Roberto é aquele em que ele desvia e seu oponente também desvia. Nesse caso, ninguém
vence o jogo. Roberto não vence, mas também não recebe o rótulo de covarde.
O resultado no qual Roberto obtém a terceira maior recompensa é aquele em que ele desvia e
seu oponente não desvia. Nessas circunstâncias Roberto perde o jogo e recebe a alcunha de
covarde. No entanto, esse cenário é, para Roberto, melhor do que aquele em que nem ele nem
seu oponente desvia, uma vezque, nesta situação, ocorre uma batida, que pode ter
consequências graves para ambos os jogadores.
 ATENÇÃO
Vale ressaltar que fizemos uma apresentação mais informal do conceito de recompensa. Isso
porque não utilizamos matemática para apresentar uma definição formal do que entendemos
pelo termo recompensa. Por isso, daremos uma definição mais efetiva adiante.
ESTRATÉGIAS
Uma estratégia é um plano de contingência, ou seja, uma regra
que especifica a decisão que o jogador tomará em cada
circunstância em que ele terá que jogar.
Para entender o conceito de estratégia em teoria dos jogos, precisamos começar com a
seguinte pergunta: em quais situações o jogador deve tomar uma decisão? Essas situações são
chamadas de contingências no jargão de teoria dos jogos.
Uma estratégia de determinado jogador nada mais é do que um plano de ação. Esse plano de
ação deixa claro o que o jogador pretende fazer em cada situação com a qual ele pode se
deparar ao longo do jogo.
Formalmente, podemos definir a primeira estratégia do jogador j como sendo , a segunda
como sendo , e assim sucessivamente até a última, como sendo . Ademais, todas as
estratégias que estão disponíveis para determinado jogador podem ser agregadas para formar o
seu conjunto de estratégias. Mais precisamente, é possível representar o conjunto de estratégias
do jogador j como sendo .
VOLTEMOS AGORA AO JOGO DO “GALINHA”.
Nesse caso, ambos os jogadores tomam sua decisão ao mesmo tempo, uma única vez. Em
contextos como esse, não há diferença entre os conceitos de ação e estratégia, afinal, uma
estratégia precisa especificar apenas uma ação na única contingência em que o jogador toma
uma decisão.
Podemos definir, nesse exemplo, o seguinte: e ,
em que temos (Roberto) ou (Carlos). Além disso, nessa situação, como temos que
ação é igual à estratégia, então o conjunto de ações também será idêntico ao conjunto de
estratégias. Podemos definir que: , onde novamente 
 (Roberto) ou (Carlos).
Vale ressaltar que, mais adiante, veremos exemplos de jogos em que os jogadores não tomam
suas decisões simultaneamente. Nesses casos, haverá diferença entre ação e estratégia. Logo,
também haverá diferença entre o conjunto de ações e o conjunto de estratégias.
s1j
s2j s
S
j
Sj ={s1j ; s2j ; … ; ssj}
s1j = a
1
j = desviar s
2
j = a
2
j = não desviar
j = 1 j = 2
Sj = Aj ={desviar;  não desviar}
j = 1 j = 2
 SAIBA MAIS
Vamos ilustrar a diferença entre ação e estratégia.
Pense em um exemplo simples: Roberto e Carlos jogam o jogo do “galinha” duas vezes.
Portanto, precisam definir duas ações: Uma na primeira vez que jogam, e mais uma na segunda
rodada. Uma estratégia pode ser, por exemplo: “jogar ‘desviar’ em ambas as rodadas”. Outra
estratégia pode ser: “jogar ‘não desviar’ na primeira rodada”; “jogar ‘desviar’ na segunda”. Outro
exemplo: “jogar ‘não desviar’ na primeira rodada”; caso ocorra batida na primeira rodada, “jogar
‘desviar’ na segunda”; caso não ocorra batida na primeira rodada, “jogar ‘não desviar’ na
segunda”. Como você pode ver, passa a haver um grande número de estratégias, que deixam de
ser uma escolha única de ação a tomar.
Vamos agora aprender sobre outro conceito importante. Trata-se
do conceito de combinação de estratégias.
Informalmente, podemos dizer que uma combinação de estratégias é um conjunto que contém
uma estratégia do primeiro jogador ( ), uma estratégia do segundo jogador ( ), e assim
sucessivamente até ser incluída uma estratégia do último jogador ( ). Note que, para cada
jogador, a estratégia que efetivamente vai aparecer na combinação de estratégias pode ser
qualquer uma de todas as opções disponíveis dentro do seu conjunto de estratégias. Assim,
podemos definir formalmente determinada combinação de estratégias como sendo 
, onde o primeiro jogador optou por implementar a estratégia , o
segundo jogador optou pela estratégia , e assim sucessivamente até o último jogador que
decidiu fazer .
VOLTEMOS AO JOGO DO “GALINHA” PARA FIXAR
IDEIAS.
Nesse jogo, existem quatro combinações de estratégia possíveis. Na primeira (desviar; desviar),
Roberto, o primeiro jogador, opta por desviar e Carlos, o segundo jogador, faz o mesmo. Na
segunda (não desviar; não desviar), Roberto e Carlos decidem não desviar. Na terceira (desviar;
não desviar), Roberto escolhe desviar, mas Carlos opta por não desviar. Na quarta (não desviar;
desviar), Roberto decide não desviar, porém Carlos escolhe desviar.
Agora estamos preparados para voltar a explicar o conceito de recompensa, porém utilizando
uma linguagem mais formal. Podemos definir para o jogador j a sua função de recompensa como
sendo: . Essa função de recompensa denota a recompensa que o jogador j
j = 1 j = 2
j = J
S = (s1; s2;  … ;  sJ) s1
s2
sJ
Uj(s1; s2;  … ;  sJ)
recebe quando o primeiro jogador opta pela estratégia , o segundo jogador escolhe a
estratégia e assim sucessivamente até que o último jogador se decide pela estratégia .
Note então que a função de recompensa do jogador j atribui um número para cada combinação
de estratégias. Quanto maior o número gerado pela função de recompensa do jogador j, mais
satisfeito ele está com a combinação de estratégias escolhida.
A notação deve ser interpretada como uma representação da função-recompensa, mas a
letra ‘U’ não é particularmente importante. Usaremos abaixo e para os nossos jogadores,
e a ideia é exatamente a mesma.
VOLTEMOS AO EXEMPLO DO JOGO DO “GALINHA”
PARA APLICAR, NA PRÁTICA, ESSE CONCEITO DE
FUNÇÃO DE RECOMPENSA.
Vamos focar no caso de Roberto (a situação de Carlos será análoga, porém invertida). Foi
discutido acima que Roberto ordena seu grau de satisfação da seguinte maneira no jogo do
“galinha”: (i) em primeiro lugar, aparece o caso em que ele sai vitorioso (não desviar; desviar); (ii)
em segundo lugar, está a situação em que ninguém vence (desviar; desviar); (iii) em terceiro
lugar, fica o caso em que ele perde (desviar; não desviar); (iv) na última posição, aparece a
situação em que há uma batida (não desviar; não desviar).
Podemos utilizar o conceito de função de recompensa para traduzir a ordenação acima, da
satisfação de Roberto, em números. Mais precisamente, podemos definir uma função de
recompensa para o jogador 1, Roberto, como sendo , onde é a estratégia do
próprio Roberto e é a estratégia de Carlos. Ademais, precisamos que essa função de
recompensa seja capaz de produzir quatro números, um para cada combinação de
estratégia possível do jogo do “galinha”, respeitando a ordenação do grau de satisfação de
Roberto.
Assim, vamos definir, primeiro, que a recompensa obtida por Roberto, no caso em que sai
vitorioso, é igual a 2. Logo, vale que . Segundo, na situação em
que ninguém vence, a recompensa de Roberto é 1. Então, vale que .
Terceiro, no caso em que Roberto perde, a sua recompensa é igual a -1. Assim, vale que 
. Finalmente, na situação em que há um acidente, a
recompensa de Roberto é -2. Então, vale que . Note
que os valores dessa função de recompensa respeitam a ordenação do grau de satisfação de
Roberto.
s1
s2 sJ
Uj
F1 G2
F1(s1; s2) s1
s2
F1(s1; s2)
F1(não desviar;  desviar)= 2
F1(desviar;  desviar)= 1
F1(desviar;  não desviar)= −1
F1(não desviar;  não desviar)= −2
Antes de seguir adiante, vale tratar de dois aspectos relevantes
acerca das funções de recompensa.
Primeiro...
Cada jogador tem a sua própria função de recompensa. Isso quer dizer que cada jogador
vai ordenar seu grau de satisfação de acordo com o seu próprio interesse. Podemos voltar ao
jogo do “galinha” para entender essa questão. Vimos que a função de recompensa de Roberto
era tal que . Logo, Roberto atribuía maior grau de satisfação,
igual a 2, à situação em que ele saía vitorioso por não desviar quando Carlos desvia. Se
adotássemos a mesma função de recompensa para Carlos, ele também teria que atribuir maior
grau de satisfação ao caso em que Roberto saísse vitorioso. Porém, isso não faz sentido, já que
Carlos tem maior grau desatisfação quando ele mesmo vence!
Por isso, é necessário definir outra função de recompensa para Carlos, que tenha ordenação
inversa a . Uma opção é definir a função de recompensa de Carlos como sendo 
, onde é a estratégia de Roberto e é a estratégia do próprio Carlos (preste
atenção: continua sendo a estratégia de Carlos!). É possível assumir ainda o seguinte:

 Atenção! Para visualização completa da equação utilize a rolagem horizontal
 Atenção! Para visualização completa da equação utilize a rolagem horizontal

F1(não desviar;  desviar)= 2
F1(s1; s2)
G2(s1; s2) s1 s2
s2
G2(desviar;  não desviar)= 2
G2(desviar;  desviar)= 1

 Atenção! Para visualização completa da equação utilize a rolagem horizontal
 Atenção! Para visualização completa da equação utilize a rolagem horizontal

Note que essa função de recompensa respeita a ordenação do grau de satisfação de
Carlos.
Segundo...
Os números gerados pelas funções de recompensa podem ser analisados de forma
ordinal, porém não devem ser interpretados através de uma ótica cardinal. Assim, os
números produzidos pelas funções de recompensa servem para ordenar o grau de satisfação
dos jogadores. Porém, esses números não devem ser utilizados para inferir importância relativa
das diferentes alternativas.
No jogo do “galinha”, a recompensa que Roberto obtém com a combinação das estratégias (não
desviar; desviar) é igual a 2. Já a recompensa que Roberto obtém com a combinação de
estratégias (desviar; desviar) é igual a 1. A forma correta de comparar esses números é levando
em consideração apenas seu aspecto ordinal. Assim, podemos entender que Roberto prefere
(não desviar; desviar) a (desviar; desviar) visto que 2 > 1. Porém, nessa comparação, seria
errado fazer qualquer inferência de natureza cardinal. Portanto, seria incorreto dizer que Roberto
tem grau de satisfação duas vezes maior com (não desviar; desviar) do que com (desviar;
desviar), só porque 2 é o dobro de 1.
G2(não desviar;  desviar)= −1
G2(não desviar;  não desviar)= −2
G2(s1; s2)
QUANTIDADE DE INFORMAÇÃO DISPONÍVEL
A quantidade de informação disponível para os jogadores é um aspecto extremamente relevante
de um jogo. Aqui vamos discutir apenas os jogos de informação completa. Esses assumem que a
estrutura do jogo – as estratégias disponíveis para os jogadores e as recompensas que eles
podem receber – é de conhecimento comum.
Mas o que significa dizer que a estrutura do jogo é de
conhecimento comum?
Isso quer dizer que todos os jogadores conhecem a estrutura do jogo. Ou seja, cada jogador
conhece as estratégias e as recompensas de todos.
 ATENÇÃO
Apesar de explicarmos aqui apenas os jogos de informação completa, vale ressaltar que existem
ferramentas, em Teoria dos Jogos, para estudar contextos em que a estrutura do jogo não é de
conhecimento comum. Porém, esses jogos são mais complexos e estão fora do escopo de nosso
conteúdo.
 MODELOS SÃO ÚTEIS!
VERIFICANDO O APRENDIZADO
1. CONSIDERE O JOGO DE “PAR OU ÍMPAR” EM QUE EXISTEM APENAS
DOIS TOMADORES DE DECISÃO, QUE SÃO JOÃO E BRUNO. CADA
TOMADOR DE DECISÃO ESCOLHE SE VAI COLOCAR PAR OU ÍMPAR.
(PARA SIMPLIFICAR, VAMOS ABSTRAIR DO NÚMERO EXATO QUE CADA
UM ESCOLHE, DADO QUE A INFORMAÇÃO RELEVANTE É SE O NÚMERO
É PAR OU ÍMPAR). AMBOS REVELAM SUAS ESCOLHAS
SIMULTANEAMENTE. SE AS ESCOLHAS DOS DOIS FOREM IGUAIS (DOIS
NÚMEROS PARES OU DOIS NÚMEROS ÍMPARES), ENTÃO A SOMA
TOTAL É PAR E JOÃO VENCE (ESTAMOS ASSUMINDO QUE JOÃO
ESCOLHEU PAR). PORÉM, SE AS ESCOLHAS DOS DOIS FOREM
DIFERENTES (UM NÚMERO PAR E UM NÚMERO ÍMPAR), ENTÃO A SOMA
TOTAL É ÍMPAR E BRUNO VENCE (ESTAMOS ASSUMINDO QUE BRUNO
ESCOLHEU ÍMPAR). TENDO ESSE JOGO DE “PAR OU ÍMPAR” EM
MENTE, RESPONDA ÀS PERGUNTAS A SEGUIR. QUEM SÃO OS
JOGADORES? QUAL É O CONJUNTO DE AÇÕES DE CADA JOGADOR?
A) Os jogadores são João e Bruno. O conjunto de ações de João é AJoão = {desviar; não
desviar}. Semelhantemente, o conjunto de ações de Bruno é ABruno = {desviar; não desviar}.
Explicaremos o que são modelos no contexto de teoria dos jogos e quais modelos são úteis.
Assista!
B) Os jogadores são Roberto e Carlos. O conjunto de ações de Roberto é ARoberto={par; ímpar}.
Semelhantemente, o conjunto de ações de Carlos é ACarlos={par; ímpar}.
C) Os jogadores são João e Bruno. O conjunto de ações de João é AJoão={par; ímpar}.
Semelhantemente, o conjunto de ações de Bruno é ABruno={par; ímpar}.
D) Os jogadores são João e Bruno. O conjunto de ações de João é AJoão={par; ímpar}. Porém, o
conjunto de ações de Bruno é ABruno={desviar; não desviar}.
E) Os jogadores são Roberto e Carlos. O conjunto de ações de Roberto é ARoberto={desviar; não
desviar}. Semelhantemente, o conjunto de ações de Carlos é ACarlos={desviar; não desviar}.
2. CONSIDERE NOVAMENTE O JOGO DE “PAR OU ÍMPAR”. NESSE
JOGO, EXISTEM APENAS DOIS TOMADORES DE DECISÃO, QUE SÃO
JOÃO E BRUNO. CADA TOMADOR DE DECISÃO ESCOLHE SE VAI
COLOCAR PAR OU ÍMPAR. (PARA SIMPLIFICAR, VAMOS ABSTRAIR DO
NÚMERO EXATO QUE CADA UM ESCOLHE, DADO QUE A INFORMAÇÃO
RELEVANTE É SE O NÚMERO É PAR OU ÍMPAR). AMBOS REVELAM
SUAS ESCOLHAS SIMULTANEAMENTE. SE AS ESCOLHAS DOS DOIS
FORAM IGUAIS (DOIS NÚMEROS PARES OU DOIS NÚMEROS ÍMPARES),
ENTÃO A SOMA TOTAL É PAR E JOÃO VENCE (ESTAMOS ASSUMINDO
QUE JOÃO ESCOLHEU PAR). PORÉM, SE AS ESCOLHAS DOS DOIS
FOREM DIFERENTES (UM NÚMERO PAR E UM NÚMERO ÍMPAR), ENTÃO
A SOMA TOTAL É ÍMPAR E BRUNO VENCE (ESTAMOS ASSUMINDO QUE
BRUNO ESCOLHEU ÍMPAR). TENDO ESSE JOGO DE “PAR OU ÍMPAR” EM
MENTE, RESPONDA À PERGUNTA A SEGUIR. QUAIS SÃO TODAS AS
COMBINAÇÕES DE ESTRATÉGIA POSSÍVEIS DESSE JOGO?
A) Possibilidades: (desviar;não desviar); (não desviar;desviar); (desviar;desviar) e (não
desviar;não desviar).
B) Possibilidades: (par;ímpar); (ímpar;par); (par;par) e (ímpar;ímpar).
C) Possibilidades: (desviar;desviar); (não desviar;não desviar); (par;par) e (ímpar;ímpar).
D) Possibilidades: (par;ímpar); (par;ímpar); (ímpar;par) e (ímpar;par).
E) Possibilidades: (par;par); (par;par); (ímpar;ímpar) e (ímpar;ímpar).
GABARITO
1. Considere o jogo de “par ou ímpar” em que existem apenas dois tomadores de decisão, que
são João e Bruno. Cada tomador de decisão escolhe se vai colocar par ou ímpar. (Para
simplificar, vamos abstrair do número exato que cada um escolhe, dado que a informação
relevante é se o número é par ou ímpar). Ambos revelam suas escolhas simultaneamente. Se
as escolhas dos dois forem iguais (dois números pares ou dois números ímpares), então a
soma total é par e João vence (estamos assumindo que João escolheu par). Porém, se as
escolhas dos dois forem diferentes (um número par e um número ímpar), então a soma total é
ímpar e Bruno vence (estamos assumindo que Bruno escolheu ímpar). Tendo esse jogo de
“par ou ímpar” em mente, responda às perguntas a seguir. Quem são os jogadores? Qual é o
conjunto de ações de cada jogador?
A alternativa "C " está correta.
 
Como definido acima, os jogadores são os tomadores de decisão do jogo. No jogo de “par ou
ímpar”, existem apenas dois tomadores de decisão, que são: João e Bruno. Desse modo, há
apenas dois jogadores. Ademais, o conjunto de ações de um jogador contém todas as ações
possíveis de serem realizadas por ele. Por um lado, João pode realizar apenas duas ações, que
são colocar par ou optar por ímpar. Logo, o conjunto de ações de João é AJoão={par; ímpar}. Por
outro lado, Bruno também pode realizar apenas duas ações, que são colocar par ou escolher
ímpar. Portanto, o conjunto de ações de Bruno é ABruno={par; ímpar}.
2. Considere novamente o jogo de “par ou ímpar”. Nesse jogo, existem apenas dois
tomadores de decisão, que são João e Bruno. Cada tomador de decisão escolhe se vai
colocar par ou ímpar. (Para simplificar, vamos abstrair do número exato que cada um escolhe,
dado que a informação relevante é se o número é par ou ímpar). Ambos revelam suas
escolhas simultaneamente. Se as escolhas dos dois foram iguais (dois números pares ou dois
números ímpares), então a soma total é par e João vence (estamosassumindo que João
escolheu par). Porém, se as escolhas dos dois forem diferentes (um número par e um número
ímpar), então a soma total é ímpar e Bruno vence (estamos assumindo que Bruno escolheu
ímpar). Tendo esse jogo de “par ou ímpar” em mente, responda à pergunta a seguir. Quais
são todas as combinações de estratégia possíveis desse jogo?
A alternativa "B " está correta.
 
Uma combinação de estratégias é um conjunto que compreende uma estratégia de cada
jogador. Lembre-se de que estamos em um jogo em que os jogadores decidem
simultaneamente. Já sabemos que nos casos em que jogadores tomam decisões simultâneas
não há diferença entre ações e estratégias. Portanto, uma combinação de estratégias possível é
João escolher par quando Bruno opta por ímpar, que pode ser representada por (par;ímpar).
Outra possibilidade é João escolher par quando Bruno também opta por par, que forma a
combinação de estratégias (par;par). Existe ainda uma terceira possibilidade que seria João
escolher ímpar quando Bruno escolhe par, que gera a combinação de estratégias (ímpar;par).
Por último, ambos podem escolher ímpar: (ímpar;ímpar).
MÓDULO 2MÓDULO 2
 Reconhecer os jogos estáticos
JOGOS ESTÁTICOS
Agora vamos aprender sobre os jogos estáticos. Esses são jogos
em que cada jogador toma sua decisão uma única vez e sem saber
o que os demais jogadores escolheram.
O fato de os jogadores fazerem suas escolhas uma única vez sugere que não há passagem de
tempo nesses jogos. Isso porque, com o passar do tempo, certamente haveria necessidade de
os jogadores tomarem decisões inúmeras vezes. Daí o fato de esses jogos serem conhecidos
como estáticos.
Os jogos estáticos são também conhecidos como jogos simultâneos. Esse nome advém do fato
de que, nesses jogos, cada jogador não conhece as escolhas dos demais ao tomar sua decisão.
Logo, é como se cada jogador tivesse que fazer sua escolha ao mesmo tempo que os demais.
Caso contrário, se algum jogador pudesse observar as decisões dos demais, antes de fazer sua
escolha, então o jogo não seria simultâneo.
Antes de seguir adiante, vale lembrar que nos jogos simultâneos não há diferença entre ações e
estratégias. Portanto, também não há diferença entre conjuntos de ação e conjuntos de
estratégia.
Este módulo será dividido em 3 seções:
FORMA MAIS ADEQUADA PARA REPRESENTAR UM
JOGO ESTÁTICO.

MÉTODOS PARA SOLUCIONAR UM JOGO ESTÁTICO.

ATIVIDADES PARA VERIFICAR O APRENDIZADO.
FORMA MAIS ADEQUADA PARA REPRESENTAR UM
JOGO ESTÁTICO
Como representar um jogo estático?
A maneira mais adequada para representar um jogo estático é por meio da chamada forma
estratégica, também conhecida como forma normal. Vamos agora explicar como podemos
utilizar a forma estratégica, ou normal, para representar um jogo estático. Para facilitar o
entendimento vamos utilizar o exemplo do jogo conhecido como “caça ao cervo”.
Na “caça ao cervo”, existem dois jogadores, que são:
 
Foto: Shutterstock.com
O CAÇADOR A
 
Foto: Shutterstock.com
O CAÇADOR B
 
Foto: Shutterstock.com
Ambos os caçadores podem se unir para caçar um cervo, animal grande que pode servir de
alimento para eles e suas famílias por 3 dias.
 
Foto: Shutterstock.com
Porém, o caçador que decidir caçar sozinho uma lebre, abandonando a caça ao cervo, garante 1
dia de comida para ele e sua família.
Ademais, se um jogador tenta caçar um cervo sozinho, sem ajuda do colega que foi caçar lebre,
então o que permanece caçando o cervo fica sem comida para ele e sua família (é difícil caçar
um cervo sozinho!).
A ideia é que quando ambos estão em seus postos para capturar um cervo, pode passar uma
lebre perto de um deles. Aquele que vê a lebre abandona seu posto e a captura, porém
prejudica o outro que permanece tentando caçar um cervo, mas não consegue por estar
trabalhando sozinho.
O quadro abaixo mostra como podemos representar a “caça ao cervo”. Inicialmente, é possível
notar que a forma estratégica, ou normal, é representada a partir de uma tabela. As estratégias
do Caçador A aparecem listadas nas linhas e são as seguintes: “Caçar cervo” e “Caçar lebre”. Já
as estratégias do Caçador B podem ser encontradas nas colunas e são as seguintes: “Caçar
cervo” e “Caçar lebre”.
Caçador A
Caçador B
Caçar cervo Caçar lebre
Caçar cervo 3,3 0,1
Caçar lebre 1,0 1,1
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Quadro: Jogo da “caça ao cervo” 
Elaborado por: Bruno Ottoni Eloy Vaz
As recompensas podem ser vistas nos números que aparecem nas células do quadro acima. O
primeiro número de cada célula, que aparece antes da vírgula, representa a recompensa do
Caçador A. Já o segundo número de cada célula, que aparece depois da vírgula, representa a
recompensa do Caçador B.
O número 1, que aparece antes da vírgula quando a combinação de estratégias é (Caçar lebre;
Caçar cervo), representa a recompensa que o Caçador A obtém quando ele opta por capturar
uma lebre e, sem avisar, deixa o Caçador B sozinho na caça a um cervo. O leitor deve se lembrar
de que aquele caçador que abandona a caçada a um cervo ainda consegue capturar uma lebre
que garante 1 dia de comida para ele e sua família. Logo, o número 1 representa exatamente o
dia de comida que o Caçador A consegue obter quando ele abandona a caçada ao cervo e, sem
avisar, opta por capturar uma lebre.
Já o número 0, que aparece depois da vírgula quando a combinação de estratégias é (Caçar
lebre; Caçar cervo), representa a recompensa que o Caçador B obtém quando ele opta por
capturar o cervo, mas é abandonado pelo Caçador A. O leitor deve se lembrar de que o caçador
que permanece tentando caçar o cervo, após ter sido abandonado, fica sem comida para ele e
sua família. Então, esse número 0 representa exatamente os dias de comida que o Caçador B
consegue obter quando trabalha sozinho na tentativa de caçar o cervo
Quando os dois caçadores decidem capturar o cervo, a combinação de estratégias é (Caçar
cervo; Caçar cervo). Nesse caso, ambos caçadores são recompensados com 3 dias de comida
para eles e suas respectivas famílias. Se os dois optam por caçar a lebre, a combinação de
estratégias é (Caçar lebre; Caçar lebre). Os caçadores capturam as lebres e garantem 1 dia de
comida para eles e suas respectivas famílias.
Em resumo, a forma estratégica organiza o jogo no formato de uma tabela que apresenta todas
as combinações de estratégia possíveis e as recompensas associadas a elas.
MÉTODOS PARA SOLUCIONAR UM JOGO ESTÁTICO
Agora vamos estudar como os jogadores tomam suas decisões em
um jogo estático.
Iremos apresentar dois métodos que podem ser utilizados para determinar que combinação de
estratégias será escolhida pelos jogadores em um jogo estático. Chamaremos essa combinação
de estratégias de solução, ou equilíbrio, do jogo estático. Vejamos então quais são os dois
métodos que podem ser utilizados para encontrar a solução, ou equilíbrio, de um jogo estático.
Os dois métodos são:
Eliminação Iterada de Estratégias Estritamente Dominadas (EIEED)
Equilíbrio de Nash (EN).
ELIMINAÇÃO ITERADA DE ESTRATÉGIAS
ESTRITAMENTE DOMINADAS (EIEED)
Vamos analisar agora o chamado método da Eliminação Iterada de
Estratégias Estritamente Dominadas (EIEED).
Para facilitar o aprendizado, iremos fazer uso do exemplo do jogo da “competição entre duas
empresas”. Neste exemplo, existem dois jogadores: Empresa A e Empresa B. O primeiro
jogador, Empresa A, está decidindo se abre ou não uma nova fábrica. O segundo jogador,
Empresa B, está decidindo se fecha ou não uma fábrica antiga. Os lucros de cada empresa são
fornecidos no quadro abaixo, que representa esse jogo na forma estratégica. Esses lucros estão
em milhões de reais e representam as recompensas dos jogadores.
Empresa A
Empresa B
Fecha uma fábrica
antiga
Não fecha uma fábrica
antiga
Abre uma nova fábrica 10,4 7,1
Não abre uma nova
fábrica
2,4 2,1
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Quadro :Jogo da “competição entre duas empresas” 
Elaborado por: Bruno Ottoni Eloy Vaz
Para começar, podemos analisar os lucros da Empresa A. Caso a Empresa B opte por fechar uma
fábrica antiga, não abrir uma fábrica nova irá gerar lucros no valor de 2 milhões, porém abrir uma
fábrica nova produzirá lucros bem maiores, visto que resultará em um ganho de 10 milhões para
a Empresa A. Semelhantemente, caso a Empresa B decida não fechar uma fábrica antiga, abrir
uma fábrica nova resultará em lucros muito maiores (7 milhões) do que não abrir (2 milhões).
A discussão acima deixa claro que é sempre melhor para a
Empresa A abrir uma nova fábrica.
Formalmente, é possível dizer que, no caso da Empresa A, a estratégia {Abre uma nova fábrica}
domina estritamente a estratégia {Não abre uma nova fábrica}. Dito de outro modo, a Empresa A
possui uma estratégia estritamente dominante que é {Abre uma nova fábrica}. Vale ressaltar que
a estratégia {Abre uma nova fábrica} é chamada de estritamente dominante porque todas as
recompensas associadas a ela são estritamente maiores do que as recompensas da estratégia
{Não abre uma nova fábrica}, qualquer que seja a escolha do outro jogador!
Também é possível dizer que, para a Empresa A, a estratégia {Não abre uma nova fábrica} é
estritamente dominada pela estratégia {Abre uma nova fábrica}. Dito de outra maneira, a
Empresa A possui uma estratégia estritamente dominada que é {Não abre uma nova fábrica}.
Novamente, chamamos a estratégia {Não abre uma nova fábrica} de estritamente dominada,
porque todas as recompensas associadas a ela são estritamente menores do que as obtidas
com a estratégia {Abre uma nova fábrica}, qualquer que seja a escolha do outro jogador.
Agora o leitor já está pronto para aprender a encontrar a solução de um jogo utilizando o
método de Eliminação Iterada de Estratégias Estritamente Dominadas (EIEED). Nesse
procedimento, basta eliminar, em rodadas sucessivas, as estratégias que são estritamente
dominadas. Isso deve ser feito porque nenhum jogador terá interesse em escolher estratégias
que são estritamente dominadas. Caso, ao final do processo de EIEED, reste apenas uma
combinação de estratégias como alternativa, então ela será a solução do jogo.
Essa combinação de estratégias é normalmente chamada de
Equilíbrio por Eliminação Iterada de Estratégias Estritamente
Dominadas, ou ainda Equilíbrio em Estratégias Estritamente
Dominantes.
 ATENÇÃO
Você encontrará pequenas diferenças no conceito de “Equilíbrio em Estratégias Estritamente
Dominantes” em alguns textos de teoria dos jogos. Com essas diferenças, um jogo pode ter um
equilíbrio por eliminação iterada de estratégias estritamente dominadas, mas não ter equilíbrio
em estratégias estritamente dominantes. Nos jogos que veremos neste tema, não há diferença,
mas fique atento quando encontrar essa nomenclatura em outros textos!
VOLTEMOS AO JOGO DA “COMPETIÇÃO ENTRE DUAS
EMPRESAS”.
Vejamos se existe nele um Equilíbrio em Estratégias Dominantes. Já discutimos acima que,
nesse jogo, a Empresa A não terá interesse em escolher a estratégia {Não abre uma nova
fábrica}, visto que ela é estritamente dominada. Então, para a Empresa B, só faz sentido
comparar as recompensas dos casos em que a Empresa A opta pela estratégia {Abre uma nova
fábrica}. Note que a Empresa B faz isso porque ela sabe que a Empresa A não terá interesse em
escolher a estratégia {Não abre uma nova fábrica}. A Empresa B sabe disso justamente porque
o jogo que estamos analisando é de informação completa e, portanto, a estrutura do jogo é de
conhecimento comum.
Voltando então ao exemplo, já vimos que a Empresa B só vai querer comparar as recompensas
das opções em que a Empresa A escolhe a estratégia {Abre uma nova fábrica}. Quando a
Empresa A opta pela estratégia {Abre uma nova fábrica}, então a Empresa B terá lucro maior se
fechar uma fábrica antiga (4 milhões) do que se não a fechar (1 milhão). Assim, a estratégia {Não
fecha uma fábrica antiga} é estritamente dominada e pode ser eliminada. Isso ocorre porque a
Empresa B sabe que vai auferir uma recompensa estritamente maior se optar pela estratégia
{Fecha uma fábrica antiga}.
Note, então, que somente uma combinação de estratégias sobrevive a EIEED. Após o
encerramento do processo de EIEED, a combinação de estratégias que resiste é (Abre uma
nova fábrica;Fecha uma fábrica antiga). Isso quer dizer que essa combinação de estratégias é o
Equilíbrio em Estratégias Estritamente Dominantes do jogo da “competição entre duas
empresas”.
Infelizmente, em muitos jogos, não irá restar apenas uma combinação de estratégias após a
conclusão do processo de EIEED. Assim, nesses jogos, não vai existir um Equilíbrio em
Estratégias Estritamente Dominantes. No entanto, em alguns deles, o conceito de Equilíbrio de
Nash pode ajudar a encontrar uma solução. Veremos o conceito de Equilíbrio de Nash a seguir.
EQUILÍBRIO DE NASH (EN)
Podemos dizer que um Equilíbrio de Nash, nome do matemático e
Prêmio Nobel que desenvolveu esta teoria, é uma combinação de
estratégias que representa a melhor resposta para todos os
jogadores.
A melhor resposta de dado jogador é a estratégia que produz a maior recompensa para ele
quando para dada combinação de estratégias escolhidas pelos demais jogadores. Em outras
palavras, o jogador não tem incentivo individual a desviar da melhor resposta: não há como
aumentar sua recompensa mudando individualmente seu comportamento. O Equilíbrio de Nash
é simplesmente uma combinação de estratégias (uma para cada jogador) em que cada um está
jogando a melhor resposta.
Para facilitar a compreensão do conceito de Equilíbrio de Nash, vamos analisar o exemplo do
jogo da “prevenção à entrada no mercado nacional”. Esse jogo pode ser visto no quadro abaixo
representado na sua forma estratégica.
Nele, existem dois jogadores, que são:
MONOPOLISTA NACIONAL

MULTINACIONAL
O primeiro jogador, a Monopolista Nacional, escolhe se aumenta ou não sua escala de produção.
O segundo jogador, a Multinacional, decide se não entra no mercado nacional, se entra em
pequena ou em larga escala. As recompensas desse jogo representam o lucro, em milhões de
reais, dos jogadores. Por enquanto, vamos ignorar o fato de que algumas recompensas do
quadro estão sublinhadas. Isso será explicado mais adiante.
Monopolista
Nacional
Multinacional
Não entra
Entra em
pequena escala
Entra em larga
escala
Aumenta escala 6,4 4,2 2,0
Não aumenta
escala
4,2 6,4 0,6
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Quadro 3: Jogo da “prevenção à entrada no mercado nacional” 
Elaborado por: Bruno Ottoni Eloy Vaz
Uma breve análise do jogo da “prevenção à entrada no mercado nacional” mostra que não há
Equilíbrio em Estratégias Estritamente Dominantes. Isso acontece porque não existe nenhuma
estratégia, nesse jogo, que seja estritamente dominada. Para a Monopolista Nacional, a
estratégia {Não aumenta escala} é estritamente pior quando a Multinacional opta pela estratégia
{Não entra}. Porém, quando a Multinacional escolhe a estratégia {Entra em pequena escala}, a
estratégia estritamente pior da Monopolista Nacional passa a ser {Aumenta escala}.
Analogamente, não existem estratégias estritamente dominadas para a Multinacional.
Logo, vimos que o método da EIEED não permite encontrar uma solução para o jogo da
“prevenção à entrada no mercado nacional”. Mas será que existe outra solução para esse jogo?
A resposta a essa pergunta é sim! O jogo em questão possui um Equilíbrio de Nash. Isso ocorre
porque existe uma única combinação de estratégias que é a melhor resposta para ambos os
jogadores simultaneamente. Vejamos que combinação de estratégias é essa.
Vamos começar descobrindo quais são as melhores respostas da
Multinacional.
Primeiro, podemos notar que a melhor resposta da Multinacional, quando a Monopolista
Nacional escolhe a estratégia {Aumenta escala}, consiste em optar pela estratégia {Não entra}.
Isso ocorre porquea estratégia {Não entra} é aquela que oferece a maior recompensa para a
Multinacional quando a Monopolista Nacional opta pela estratégia {Aumenta escala}. Veja que,
quando a Monopolista Nacional escolhe a estratégia {Aumenta escala}, as recompensas da
Multinacional são: 4 milhões de reais, caso opte por {Não entra}; 2 milhões de reais, se escolher
{Entra em pequena escala}; e 0 reais, na situação em que decide fazer {Entra em larga escala}.
Como a maior recompensa, de 4 milhões de reais, é obtida quando a Multinacional opta por
{Não entra}, então essa é a melhor resposta dela. Para não esquecermos dessa melhor resposta,
fizemos o seguinte no quadro acima: Sublinhamos a recompensa de 4 milhões de reais que a
Multinacional recebe quando joga {Não entra} em reação à escolha da Monopolista Nacional de
fazer {Aumenta escala}. Continuaremos sublinhando recompensas à medida que formos
identificando outras melhores respostas.
Segundo, é possível ver que a melhor resposta da Multinacional, quando a Monopolista Nacional
escolhe a estratégia {Não aumenta escala}, é selecionar a estratégia {Entra em larga escala}.
Isso ocorre porque a estratégia {Entra em larga escala} é a que oferece maior recompensa para
a Multinacional quando a monopolista Nacional decide jogar a estratégia {Não aumenta escala}.
Note que, para não esquecermos, também sublinhamos a recompensa de 6 milhões de reais
que a Multinacional recebe quando joga {Entra em larga escala} como melhor resposta a {Não
aumenta escala}.
Vejamos agora as melhores respostas da Monopolista Nacional.
Primeiro, podemos verificar que a melhor resposta da Monopolista Nacional, quando a
Multinacional opta por {Não entra}, é fazer {Aumenta escala}. Segundo, é possível notar que a
melhor resposta da Monopolista Nacional, quando a Multinacional decide usar a estratégia
{Entra em pequena escala}, é jogar {Não aumenta escala}. Finalmente, vemos que a melhor
resposta da Monopolista Nacional, quando a Multinacional escolhe fazer {Entra em larga
escala}, é implementar a estratégia {Aumenta escala}. Veja que todas as recompensas
associadas às melhores respostas da Monopolista Nacional também foram sublinhadas.
A discussão feita até aqui deixa claro que existe apenas uma combinação de estratégias que
representa a melhor resposta para os dois jogadores. Mais precisamente, a única combinação
de estratégias que consiste na melhor resposta para ambos os jogadores é (Aumenta
escala;Não entra).
Por um lado, realmente {Aumenta escala} é a melhor resposta da Monopolista Nacional quando
a Multinacional opta por {Não entra}.
Por outro lado, fica claro que {Não entra} é a melhor resposta da Multinacional quando a
Monopolista Nacional escolhe {Aumenta escala}.
Consequentemente, a combinação de estratégias (Aumenta escala;Não entra) é um Equilíbrio
de Nash e representa uma solução do jogo de “prevenção à entrada no mercado nacional”.
Adicionalmente, é possível ver que essa combinação de estratégias é a única que representa a
melhor resposta para ambos os jogadores, porque somente nela as duas recompensas
aparecem sublinhadas.
 UMA APLICAÇÃO DO EQUILÍBRIO DE
NASH
Neste vídeo, ensinaremos como encontrar os Equilíbrios de Nash do jogo do “galinha”. Assista!
VERIFICANDO O APRENDIZADO
1. CONSIDERE O JOGO CHAMADO DE “DILEMA DOS PRISIONEIROS”,
QUE APARECE REPRESENTADO NA SUA FORMA ESTRATÉGICA NO
QUADRO ABAIXO. NESSE JOGO, DOIS LADRÕES SÃO PRESOS E
INTERROGADOS PELOS POLICIAIS. QUANDO ELES COOPERAM ENTRE
SI E NÃO CONFESSAM, OS LADRÕES TÊM PENAS MENORES.
ENTRETANTO, SE UM DOS LADRÕES DESVIA E CONFESSA,
ENTREGANDO O SEU COMPANHEIRO, ELE É RECOMPENSADO COM
UMA PENA AINDA MENOR, TAMBÉM CONHECIDA COMO “DELAÇÃO
PREMIADA”, ENQUANTO O OUTRO PRISIONEIRO É PENALIZADO PELA
FALTA DE COOPERAÇÃO COM UMA PENA MAIOR. SE OS DOIS
CONFESSAM, ELES NÃO SÃO RECOMPENSADOS PELA DELAÇÃO E
PEGAM PENAS MAIORES DO QUE A COOPERAÇÃO MÚTUA (NENHUM
DOS DOIS CONFESSA). ESSE JOGO POSSUI EQUILÍBRIO EM
ESTRATÉGIAS ESTRITAMENTE DOMINANTES? QUAL? 
 
QUADRO 4: JOGO DO “DILEMA DOS PRISIONEIROS”
LADRÃO A
LADRÃO B
CONFESSA NÃO CONFESSA
CONFESSA -2,-2 0,-4
NÃO CONFESSA -4,0 -1,-1
 ATENÇÃO! PARA VISUALIZAÇÃO COMPLETA DA TABELA UTILIZE A
ROLAGEM HORIZONTAL
QUADRO: JOGO DO “DILEMA DOS PRISIONEIROS” 
ELABORADO POR: BRUNO OTTONI ELOY VAZ
A) Sim. A combinação de estratégias de equilíbrio é (Confessa;Confessa).
B) Sim. A combinação de estratégias de equilíbrio é (Não Confessa;Não Confessa).
C) Não
D) Sim. A combinação de estratégias de equilíbrio é (Não Confessa;Confessa).
E) Sim. A combinação de estratégias de equilíbrio é (Confessa;Não Confessa).
2. CONSIDERE NOVAMENTE O JOGO CHAMADO DE “DILEMA DOS
PRISIONEIROS”, QUE APARECE REPRESENTADO NA SUA FORMA
ESTRATÉGICA NO QUADRO ABAIXO. ESSE JOGO POSSUI EQUILÍBRIO
DE NASH? QUAL? 
 
LADRÃO A
LADRÃO B
CONFESSA NÃO CONFESSA
CONFESSA -2,-2 0,-4
NÃO CONFESSA -4,0 -1,-1
 ATENÇÃO! PARA VISUALIZAÇÃO COMPLETA DA TABELA UTILIZE A
ROLAGEM HORIZONTAL
QUADRO: JOGO DO “DILEMA DOS PRISIONEIROS” 
ELABORADO POR: BRUNO OTTONI ELOY VAZ
A) Sim, o jogo do “dilema dos prisioneiros” possui um Equilíbrio de Nash. A combinação de
estratégias de equilíbrio é (Não Confessa;Não Confessa).
B) Sim, o jogo do “dilema dos prisioneiros” possui um Equilíbrio de Nash. A combinação de
estratégias de equilíbrio é (Confessa;Não Confessa).
C) Sim, o jogo do “dilema dos prisioneiros” possui um Equilíbrio de Nash. A combinação de
estratégias de equilíbrio é (Não Confessa;Confessa).
D) Não, o jogo do “dilema dos prisioneiros” não possui um Equilíbrio de Nash.
E) Sim, o jogo do “dilema dos prisioneiros” possui um Equilíbrio de Nash. A combinação de
estratégias de equilíbrio é (Confessa;Confessa).
GABARITO
1. Considere o jogo chamado de “dilema dos prisioneiros”, que aparece representado na sua
forma estratégica no quadro abaixo. Nesse jogo, dois ladrões são presos e interrogados pelos
policiais. Quando eles cooperam entre si e não confessam, os ladrões têm penas menores.
Entretanto, se um dos ladrões desvia e confessa, entregando o seu companheiro, ele é
recompensado com uma pena ainda menor, também conhecida como “delação premiada”,
enquanto o outro prisioneiro é penalizado pela falta de cooperação com uma pena maior. Se
os dois confessam, eles não são recompensados pela delação e pegam penas maiores do que
a cooperação mútua (nenhum dos dois confessa). Esse jogo possui Equilíbrio em Estratégias
Estritamente Dominantes? Qual? 
 
Quadro 4: Jogo do “dilema dos prisioneiros”
Ladrão A
Ladrão B
Confessa Não Confessa
Confessa -2,-2 0,-4
Não Confessa -4,0 -1,-1
 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Quadro: Jogo do “dilema dos prisioneiros” 
Elaborado por: Bruno Ottoni Eloy Vaz
A alternativa "A " está correta.
 
Vamos aplicar o método de EIEED. Comecemos com o Ladrão 1. Será que esse jogador possui
alguma estratégia estritamente dominada? Sim, é fácil ver que a estratégia {Não Confessa} é
estritamente dominada para esse jogador. Isso ocorre porque, independentemente do que faça
o Ladrão 2, optar por {Não Confessa} sempre vai produzir uma recompensa menor para o
Ladrão 1 do que escolher {Confessa}. Primeiro, quando o Ladrão 2 joga {Confessa}, a
recompensa do Ladrão 1 é estritamente menor se ele escolhe {Não Confessa} (já que -2>-4).
Segundo, se o Ladrão 2 decide fazer {Não Confessa}, a recompensa do Ladrão 1 é estritamente
menor se ele opta por {Não Confessa} (porque 0>-1). Então, o Ladrão 1 nunca vai ter interesse
em fazer {Não Confessa}, visto que se trata de uma estratégia estritamente dominada.
Eliminando essa estratégia e fazendo raciocínio análogo, é possível ver que, para o Ladrão 2, a
estratégia {Não Confessa} também é estritamente dominada. Consequentemente, após o fim da
EIEED, resta apenas uma combinação de estratégias que é (Confessa;Confessa). Por definição,
sabemos que o Equilíbrio em Estratégias Estritamente Dominantes é justamente a combinação
de estratégias que resisteao processo de EIEED. Logo, o equilíbrio em questão é
(Confessa;Confessa). Observe que, nesse equilíbrio, os ladrões passam mais tempo na cadeia do
que se tivessem escolhido não confessar!
2. Considere novamente o jogo chamado de “dilema dos prisioneiros”, que aparece
representado na sua forma estratégica no quadro abaixo. Esse jogo possui Equilíbrio de
Nash? Qual? 
 
Ladrão A
Ladrão B
Confessa Não Confessa
Confessa -2,-2 0,-4
Não Confessa -4,0 -1,-1

 Atenção! Para visualização completa da tabela utilize a rolagem horizontal
Quadro: Jogo do “dilema dos prisioneiros” 
Elaborado por: Bruno Ottoni Eloy Vaz
A alternativa "E " está correta.
 
Para encontrar o Equilíbrio de Nash, precisamos verificar se existe uma combinação de
estratégias que seja a melhor resposta de todos os jogadores. Vejamos quais são as melhores
respostas do Ladrão 1. Primeiro, se o Ladrão 2 joga {Confessa}, então a melhor resposta do
Ladrão 1 é fazer {Confessa}. Segundo, se o Ladrão 2 escolhe {Não Confessa}, então a melhor
resposta do Ladrão 1 é optar por {Confessa}. Desse modo, a melhor resposta do Ladrão 1 é
sempre jogar {Confessa}, independentemente do que faz o Ladrão 2. Uma abordagem análoga
permite verificar que o mesmo vale para o Ladrão 2. Ou seja, a melhor resposta do Ladrão 2 é
sempre escolher {Confessa}, independentemente do que faça o Ladrão 1. Veja que todas as
recompensas associadas às melhores respostas que encontramos aqui aparecem sublinhadas
no quadro acima. Fizemos esse procedimento porque ele ajuda na identificação do Equilíbrio de
Nash. Dito isso, é possível verificar que (Confessa;Confessa) é uma combinação de estratégias
que representa a melhor resposta para os dois jogadores simultaneamente. Por um lado, a
melhor resposta do Ladrão 1, quando o Ladrão 2 opta por {Confessa}, é fazer {Confessa}. Por
outro lado, a melhor resposta do Ladrão 2, quando o Ladrão 1 escolhe {Confessa}, é decidir
jogar {Confessa}. Ademais, é possível ver também que essa combinação de estratégias é a
única que representa a melhor resposta para os dois jogadores. Isso fica claro pelo fato de que,
só na combinação de estratégias (Confessa;Confessa), ambas as recompensas aparecem
sublinhadas. Logo, temos realmente que a única combinação de estratégias que representa a
melhor resposta dos dois jogadores é (Confessa;Confessa). Então, por definição, temos que a
combinação de estratégias (Confessa;Confessa) é o único Equilíbrio de Nash desse jogo.
MÓDULO 3MÓDULO 3
 Reconhecer os jogos dinâmicos
JOGOS DINÂMICOS
Agora vamos aprender sobre os jogos dinâmicos.
Esses são jogos em que muitas vezes os jogadores tomam suas decisões já tendo observado
aquilo que foi escolhido por outros jogadores no passado. Portanto, geralmente existe uma
ordem na qual os jogadores tomam suas decisões e, por isso, os jogos dinâmicos acabam
também sendo chamados de jogos sequenciais.
Antes de seguir adiante, vale ressaltar que nos jogos dinâmicos, geralmente, existe diferença
entre ações e estratégias. Porém, vamos estudar aqui apenas exemplos em que não existe essa
diferença. Faremos isso para simplificar a discussão.
Este módulo será dividido em 3 seções, que são:
 
Imagem: Shutterstock.com
Forma mais adequada para representar um jogo dinâmico.
 
Imagem: Shutterstock.com
Método para solucionar um jogo dinâmico.
 
Imagem: Shutterstock.com
Atividades para verificar o aprendizado.
FORMA MAIS ADEQUADA PARA REPRESENTAR UM
JOGO DINÂMICO
A maneira mais adequada para representar um jogo dinâmico é por meio da forma estendida.
Iremos agora descrever como podemos utilizar a forma estendida, para representar um jogo
dinâmico. Porém, para facilitar o entendimento, vamos utilizar o exemplo do chamado jogo da
“entrada”.
No jogo da “entrada” existem dois jogadores, que são as empresas:
 
Foto: Shutterstock.com
DOMINANTE
 
Foto: Shutterstock.com
DESAFIANTE
A empresa Desafiante está pensando se deve ou não começar a operar em um mercado que é
controlado pela Dominante. Vamos assumir que a Desafiante possui apenas duas estratégias,
que são: {Entra} ou {Não Entra}. Iremos supor ainda que, se a Desafiante optar por {Entra},
então a Dominante pode escolher entre duas estratégias alternativas, que são: {Luta} ou
{Acomoda}. Porém, se a Desafiante escolher {Não Entra}, então o Dominante não precisa fazer
nada porque mantém o controle total do mercado. As recompensas desse jogo serão
apresentadas mais adiante.
O leitor pode não estar familiarizado com os termos {Luta} e {Acomoda}, que são
frequentemente encontrados no jargão da Teoria dos Jogos. Portanto, antes de seguir em frente,
vale a pena explicar esses termos. Em geral, uma empresa que opta por {Luta} procura baixar
seu preço e aumentar sua produção para tentar impedir que uma concorrente consiga ganhar
mercado. Já uma empresa que escolhe {Acomoda} tem o objetivo contrário de “ceder” parte do
mercado à sua concorrente via aumento de preço e diminuição da produção.
Um aspecto importante do jogo da “entrada” é que nele a
empresa Dominante escolhe sua estratégia já tendo observado
a decisão da Desafiante.
Não apenas a Dominante decide depois, como também, ao tomar sua decisão, ela já conhece a
escolha da Desafiante. Portanto, nesse exemplo, realmente temos um jogo dinâmico ou
sequencial.
A figura abaixo mostra como podemos representar o jogo da “entrada” na forma estendida. Para
isso, vejamos os elementos constituintes da forma estendida: Inicialmente, é possível notar que
utilizamos a chamada árvore de jogos, composta por ramos e nós, para representar a forma
estendida.
Um nó é uma etapa do jogo em que determinado jogador precisa tomar uma decisão. O nó
inicial é o primeiro do jogo, e os nós terminais são aqueles em que o jogo se encerra.
Associadas a esses nós terminais aparecem as recompensas dos jogadores, expressas em
números, na ordem em que os tomadores de decisão entram no jogo. Os demais nós são
chamados de intermediários.
Alternativamente, as escolhas disponíveis para o jogador, em cada nó, são representadas
através dos ramos da árvore. Na verdade, cada ramo ilustra uma estratégia disponível para o
jogador. Ademais, todos os ramos de dado nó compreendem o conjunto de estratégias passíveis
de serem realizadas pelo jogador naquele momento do jogo. Os ramos que chegam aos nós
terminais do jogo costumam ser representados por meio de flechas para indicar a direção na
qual o jogo se desdobra.
 
Imagem: Bruno Ottoni
 Jogo da “entrada”
Agora que já aprendemos quais são as partes constituintes de um
jogo representado na forma estendida, voltemos ao jogo da
“entrada” que aparece na figura acima.
Nele, as flechas associadas aos nós terminais indicam que o jogo avança da esquerda para a
direita. Portanto, o nó inicial é aquele em que aparece a Desafiante. Isso quer dizer que a
Desafiante é o jogador que realiza o primeiro movimento do jogo. Dois ramos saem do nó inicial,
indicando que existem duas estratégias disponíveis para a Desafiante, que são: {Entra} ou {Não
Entra}.
Primeiro, se a Desafiante opta por {Entra}, então é a vez da Dominante fazer sua escolha. Isso
ocorre porque o ramo associado à estratégia {Entra} chega a um nó em que consta o nome da
Dominante. Então, a Dominante joga depois da Desafiante ter escolhido {Entra}. Ademais,
quando a Dominante escolhe, ela já sabe o que fez a Desafiante.
A Dominante, quando é chamada a jogar, pode escolher entre duas estratégias, que são: {Luta}
ou {Acomoda}. Caso a Dominante escolha {Luta}, o jogo chega a um nó terminal. Portanto, o
jogo acaba e os jogadores recebem as recompensas que constam ao lado do nó terminal
associado à ação {Luta}. Por um lado, a Desafiante tem prejuízo de 1 milhão de reais, já que ela
entra primeiro no jogo e o número que aparece em primeiro lugar nas recompensas é igual a -1.
Por outro lado, a Dominante tem lucro de 2 milhões de reais, já que entra em segundo no jogo e
o número que aparece em segundo lugar nas recompensasé igual a 2.
Outra opção é que a Dominante, na sua vez de jogar, escolha
{Acomoda}.
Nesse caso, o jogo acaba e os jogadores recebem suas recompensas (que aparecem próximas
ao nó terminal associado à estratégia {Acomoda}). A Desafiante tem lucro de 3 milhões de reais
e a Dominante aufere um ganho de 7 milhões de reais. Finalmente, se a Desafiante escolhe {Não
Entra}, então a Dominante nem chega a jogar. Nesse caso, o jogo termina e os jogadores
recebem as recompensas associadas a esse resultado, que são: 0 reais para a Desafiante e 10
milhões de reais para a Dominante.
MÉTODO PARA SOLUCIONAR UM JOGO DINÂMICO
Agora vamos apresentar um método que pode ser utilizado para encontrar a solução de um jogo
dinâmico: o método da indução retroativa.
Para facilitar o aprendizado, usaremos novamente como exemplo o
jogo da “entrada”. Esse jogo aparece representado mais uma vez
na figura abaixo.
 
Imagem: Bruno Ottoni
 Jogo da “entrada”
Para aplicar o método da indução retroativa, basta analisar o jogo de trás para a frente
identificando as estratégias que cada jogador prefere adotar em cada etapa do jogo.
A solução do jogo, por indução retroativa, será dada pela combinação de estratégias que
contém a decisão que cada jogador toma quando é chamado a jogar.
Vamos então analisar o jogo da “entrada” de trás para a frente. Para isso, iremos começar
olhando para a decisão do último jogador a fazer sua escolha, que é a empresa Dominante. Essa
empresa só joga quando a Desafiante opta por {Entra}. Quando isso acontece, a Dominante
deve escolher se {Luta} ou {Acomoda}. Caso a Dominante escolha {Luta}, ela tem lucro de 2
milhões de reais. Porém, se a Dominante decide jogar {Acomoda}, então ela tem um lucro de 7
milhões de reais, que é bem mais do que ela ganha quando escolhe {Luta}.
A discussão acima deixa claro que, quando a Dominante é chamada a jogar, ela tem interesse
em fazer {Acomoda}, pois essa opção gera lucro maior do que escolher {Luta}. Dado que esse é
um jogo de informação completa, então a Desafiante sabe que, caso ela opte por {Entra}, a
Dominante não terá interesse em escolher {Luta}. Na verdade, a Desafiante tem total
conhecimento de que, caso ela jogue {Entra}, a Dominante irá preferir fazer {Acomoda}.
É possível ver que um aviso da Dominante dizendo que sua escolha seria por {Luta}, caso viesse
a ter que jogar, necessariamente seria percebido pela Desafiante como uma ameaça sem
sentido. Isso porque a Desafiante sabe que a Dominante, se viesse a jogar, não teria incentivo
para agir de acordo com sua ameaça de escolher {Luta}, pois fazer isso resultaria em um lucro
menor para ela. No jargão da Teoria dos Jogos, é comum dizer – sobre um aviso como esse por
parte da Dominante afirmando que optaria por {Luta} – que essa ameaça não é crível. Isto é, não
se deve acreditar em uma ameaça como essa.
Agora que já sabemos a estratégia que será escolhida pela
Dominante, caso ela venha a jogar, resta determinar qual será a
decisão da Desafiante.
Por um lado, a Desafiante sabe que se optar por {Entra}, então a Dominante jogará {Acomoda}.
Nesse caso, a Desafiante terá lucro de 3 milhões de reais. Por outro lado, a Desafiante sabe que
se escolher {Não Entra}, então o jogo terminará e ela terá lucro de 0 reais. Logo, a Desafiante
prefere entrar para ter um lucro positivo, pois sabe que a Dominante não vai lutar. A partir dessa
análise, fica claro que a solução do jogo da “entrada”, por indução retroativa, é dada pela
seguinte combinação de estratégias: (Entra;Acomoda).
VERIFICANDO O APRENDIZADO
 UMA APLICAÇÃO DA INDUÇÃO
RETROATIVA
Neste vídeo, ensinaremos como encontrar a solução de um jogo a partir da aplicação do método
de indução retroativa. Assista!
1. QUAL É A FORMA MAIS INDICADA PARA REPRESENTAR UM JOGO
DINÂMICO OU SEQUENCIAL?
A) Forma estratégica
B) Forma normal
C) Forma estendida
D) Forma longa
E) Forma comprida
2. PARA APLICAR O MÉTODO DA INDUÇÃO RETROATIVA BASTA:
A) Analisar o jogo de trás para a frente.
B) Analisar o jogo de frente para trás.
C) Representar o jogo na forma normal.
D) Representar o jogo na forma estratégica.
E) Começar olhando para o jogador que joga primeiro.
GABARITO
1. Qual é a forma mais indicada para representar um jogo dinâmico ou sequencial?
A alternativa "C " está correta.
 
A forma mais indicada para representar um jogo dinâmico, ou sequencial, é a chamada forma
estendida. Essa forma ordena no tempo as decisões que cada jogador executa em cada nó da
representação do jogo. A forma estratégica, também chamada de forma normal, é a mais
indicada para representar um jogo estático ou simultâneo. Não existem os conceitos forma longa
e forma comprida.
2. Para aplicar o método da indução retroativa basta:
A alternativa "A " está correta.
 
Para aplicar o método da indução retroativa, basta analisar o jogo de trás para a frente. Isso
significa que começamos analisando as escolhas do último jogador a decidir. Baseada nessa
análise, avaliamos as decisões do penúltimo jogador considerando as decisões que o último
jogador deverá tomar. Repetimos esse processo até analisar a decisão do primeiro jogador
levando em consideração todas as análises das jogadas posteriores.
CONCLUSÃOCONCLUSÃO
CONSIDERAÇÕES FINAIS
Vimos que a Teoria dos Jogos é um ramo da matemática que estuda situações de interação
estratégica, e que essas situações de interação estratégica aparecem em diversas áreas. Por
isso, a Teoria dos Jogos é muito utilizada no setor público, nas empresas privadas e na
academia.
Começamos introduzindo os jogos estáticos. Vimos que a maneira mais adequada para
representar esses jogos é por meio da forma estratégica ou normal. Além disso, aprendemos
dois métodos que podem ser utilizados para solucionar tais jogos, que são: a Eliminação Iterada
de Estratégias Estritamente Dominadas e o Equilíbrio de Nash.
Finalmente, estudamos os jogos dinâmicos. Vimos que a maneira mais adequada para
representar esses jogos é por meio da forma estendida. Ademais, aprendemos como utilizar a
Indução Retroativa, um método que permite encontrar as soluções desses jogos.
AVALIAÇÃO DO TEMA:
REFERÊNCIAS
AVILA, B. D. de; FERNANDES, B. P. M. Teoria dos jogos: crenças, desejos, escolhas. São Paulo:
Saraiva, 2014.
BIERMAN, H. S.; FERNANDEZ, L. F. Teoria dos jogos. São Paulo: Pearson Prentice Hall, 2011.
FIANI, R. Teoria dos jogos: para cursos de administração e economia. Elsevier Brasil, 2015.
NASAR, S. Uma mente brilhante. Rio de Janeiro: Editora Record, 2002.
EXPLORE+
Assista ao filme Uma mente brilhante, de 2001, para conhecer a vida do matemático John
Nash.
CONTEUDISTA
Bruno Ottoni

Continue navegando