Buscar

2021 Teoria dos Jogos

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

DEFINIÇÃO
Modelagem matemática de interação estratégica. Representações de um jogo. Conceitos de
equilíbrio. Aplicações.
PROPÓSITO
Apresentar os conceitos básicos de teoria básica dos jogos, e caracterizar jogos de informação
completa.
OBJETIVOS
MÓDULO 1
Descrever conceitos básicos de Teoria dos Jogos
MÓDULO 2
Resolver jogos estáticos de informação completa
INTRODUÇÃO
A microeconomia pode ser entendida como o estudo das escolhas e decisões dos agentes.
Frequentemente tratamos, em modelos tradicionais, sob a perspectiva de agentes únicos que
escolhem, de acordo com suas preferências, em cenários em que o ambiente externo é dado.
A teoria dos jogos, por sua vez, estuda situações em que dois ou mais agentes tomam
decisões e interagem estrategicamente — ou seja, os jogadores tomam suas decisões
levando em conta o que os outros estão fazendo.
 
Golden Sikorka/Shutterstock.com
Pense em um jogo de par ou ímpar, ou em uma disputa comercial entre países: a decisão de
cada parte depende do que se imagina que o outro jogador fará! Usando ferramentas de
cálculo diferencial, microeconomia e um pouco de probabilidade, vamos desenvolver o
instrumental para resolver diversos tipos de interação estratégica.
Inicialmente objeto de estudo de matemáticos, a teoria dos jogos está presente como método
em Relações Internacionais, Psicologia, Direito e diversas outras ciências que dependem de
interações humanas.
Em 1944, adentrou, definitivamente, o campo da Economia, com a publicação do livro The
Theory of Games and Economic Behaviour, de von Neumann e Morgenstern, dois dos
principais matemáticos de sua geração.
Como corpo teórico, rendeu dois prêmios Nobel, o de John Nash, John Harsanyi e Reinhard
Selten (1994), e o de Robert Aumann e Thomas Schelling (2005). Os economistas que o
utilizam como método direto para a análise de diversos temas, também foram premiados; são
eles: James Mirrlees e William Vickrey (1996), Leonid Hurwicz, Eric Maskin e Roger Myerson
(2007), Alvin Roth e Lloyd Shapley (2012), e Jean Tirole (2014), Oliver Hart e Beng Holmström
(2016).
Além disso, vale ressaltar que é um campo teórico no qual economistas e matemáticos
brasileiros, como Marilda Sotomayor, se destacam.
MÓDULO 1
 Descrever conceitos básicos de Teoria dos Jogos
O QUE É UM JOGO?
Economia, Sociologia, Psicologia e Ciência Política são campos que se dedicam a estudar o
comportamento humano em diferentes dimensões da vida social. Porém, em muitos casos,
eles tratam os indivíduos de maneira isolada, seja por conveniência analítica ou por
desconsiderar algo importante.
 
totojang1977/Shutterstock.com
Sendo assim, pesquisadores dessas áreas assumem que é razoável imaginar que o
comportamento de um indivíduo não tem efeito significativo sobre o comportamento dos outros.
Em alguns casos, dependendo da pergunta em questão, essa hipótese pode ser inadequada.
 EXEMPLO
Por exemplo, o valor que o feirante da sua rua cobra pelo quilo da batata não terá impacto no
preço da batata de todas as feiras do Brasil. De maneira similar, a probabilidade de o meu voto
ser decisivo em uma eleição é próxima de zero.
Se estamos interessados no preço da batata no Brasil ou no resultado de uma eleição
presidencial, é razoável considerar que a ação de um indivíduo tem pouco impacto sobre
os demais.
Porém, imagine agora que queremos entender o impacto do preço da batata cobrado pelo
feirante José sobre o preço cobrado pela feirante Susana, na mesma feira. Se José cobrar um
preço menor que Susana, todo mundo comprará dele, fazendo com que Susana seja forçada a
reduzir seu preço.
Precisamos estudar esse tipo de comportamento estratégico, no qual a ação de um indivíduo
impacta sobre a ação do outro. É sobre isso que trata a teoria dos jogos.
Em um jogo, os agentes envolvidos sabem que suas ações terão impacto direto sobre os
demais, e precisam antecipar eventuais reações. O conceito de jogo, como estudado nessa
teoria, assume que os agentes atuam de maneira racional.
O que isso significa? Que esse agente possui objetivos (ou preferências) bem definidos e
procura agir da melhor maneira para atingi-los.
A racionalidade também implica que eles conhecem as estratégias disponíveis para os outros
agentes, e que possuem preferências completas (comparando todas as opções possíveis entre
si) e transitivas (seus ordenamentos de preferências não entram em contradição).
As regras do jogo também são de conhecimento geral, assim como o impacto da ação de cada
indivíduo sobre a ação dos outros, e o próprio fato de todos serem racionais.
Fixadas essas “regras” da teoria dos jogos, vamos, agora, defini-la.
DEFINIÇÃO
A teoria dos jogos é o estudo sistemático de interações estratégicas entre indivíduos racionais.
Os jogos podem ser de vários tipos. Em especial, podem diferir quanto ao tipo de ações que os
jogadores tomam e da informação que possuem.
DIFERENÇAS QUANTO À ORDEM DAS AÇÕES
Podem ser:
JOGOS SIMULTÂNEOS OU ESTÁTICOS
As decisões de cada jogador são “simultâneas”, no sentido de que nenhum agente observa a
ação de outro antes de jogar. Pense, por exemplo, no jogo de par ou ímpar. Esses jogos, em
geral, são representados na forma normal (ou estratégica), como veremos mais adiante;
JOGOS SEQUENCIAIS OU DINÂMICOS
Há uma ordem na tomada de decisões, em que a ação tomada por um jogador influencia a
tomada de decisão futura do outro jogador. Se uma firma define o preço do seu produto e, após
observar essa ação, as concorrentes tomam suas decisões, temos um jogo sequencial - que
em geral são representados na forma extensiva, que também veremos.
DIFERENÇAS QUANTO À ESTRUTURA DE
INFORMAÇÃO
Em relação à estrutura de informação, os jogos são divididos da seguinte forma:
AÇÕES
Informação perfeita: os agentes observam todas as ações que ocorreram anteriormente
no jogo;
Informação imperfeita: pelo menos um agente não observa os movimentos prévios de
algum outro agente.
PAYOFFS
Informação completa: os agentes conhecem os payoffs de todos os jogadores, para
todas as combinações possíveis de estratégias;
javascript:void(0)
Informação incompleta: pelo menos um agente não conhece o payoff de algum outro
jogador em, ao menos, uma combinação de estratégias.
PAYOFFS
Pense em payoff como o valor que um jogador atribui a determinado resultado do jogo.
A partir de agora, mostraremos alguns exemplos desses tipos de jogos.
Exemplo 1 (Jogo do investimento)
Suponha que Alice possui duas opções para investir R$100,00. Ela pode fazê-lo em títulos, que
têm um retorno certo de 10%, ou no crowdfunding (popularmente conhecido como “vaquinha”)
do novo produto de uma amiga.
Se a vaquinha arrecadar R$200,00 no total, essa amiga consegue lançar o produto e garante
um retorno de 20% para Alice, ou seja, ao fim do ano ela terá R$120,00. Se o investimento
total for de menos que R$200,00, o retorno é 0%, e ela fica com os mesmos R$100,00 ao fim
do ano.
Além de Alice, temos Bruno, que também está pensando neste investimento. Não há mais
ninguém interessado em investir no produto. Alice e Bruno não se conhecem pessoalmente e
não conseguem se comunicar, porque são muito tímidos.
Assim, eles têm que tomar uma decisão de investimento sem saber como o outro vai agir.
Podemos resumir a situação na tabela a seguir:
Bruno
Títulos Crowdfunding
Alice
Títulos 110, 110 110, 100
Crowdfunding 100, 110 120, 120
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
O primeiro número em cada célula representa o retorno do investimento de Alice; o segundo
representa o retorno de Bruno. Assumimos que os dois sabem da situação representada na
tabela (isto é, eles sabem as regras do jogo).
Fica óbvia, aqui, a interação estratégica. Ambos gostariam de obter o maior retorno possível,
os R$120,00 do crowdfunding, mas a ação de um depende da do outro, e eles não podem se
coordenar.
Neste caso, Bruno e Alice possuem palpites (probabilidades) sobre qual ação o outro vai
realizar, sabemque o outro jogador é racional (ou seja, busca o maior retorno possível), e que
sabe as mesmas coisas.
Não vamos resolver esse jogo agora. Esse exemplo serve apenas para ilustrar o tipo de
problema abordado pela teoria dos jogos lida — interações estratégicas, ou seja, aquelas em
que as ações dos jogadores são interdependentes. Esse é um jogo na forma estratégica com
informação completa.
Observe que a forma estratégica apresenta, com clareza, três elementos:
Os jogadores: Alice e Bruno;
As estratégias de cada jogador: nesse caso, o conjunto de estratégias de Alice é igual ao
conjunto de estratégias de Bruno, e possui dois elementos: títulos e crowdfunding;
Payoffs: termo genérico para o valor que cada jogador obtém para cada possível
combinação de estratégias — pode ser o lucro de uma firma ou a utilidade de um
consumidor.
A representação do jogo precisa indicar os payoffs de cada jogador para cada combinação
possível de estratégias. Em nosso exemplo, sabemos que o payoff de Alice é igual a 120 se
ambos entrarem no crowdfunding, mas é igual a 100 se ela entrar e Bruno não.
Exemplo 2 (Dilema dos prisioneiros)
Esse é o exemplo mais clássico de teoria dos jogos. Dois suspeitos são presos e colocados em
celas separadas antes do julgamento. O promotor, que tem um palpite de que ambos são
culpados, mas não tem provas, oferece um acordo.
Se ambos confessam, são condenados a cinco anos de cadeia. Se um confessa e o outro não,
o primeiro é solto por cooperar e o parceiro é condenado a 6 anos de cadeia. Finalmente, se
nenhum confessa, ambos ficam apenas um ano na cadeia por algum crime menor. Podemos
representar esse jogo pela tabela a seguir:
Prisioneiro 2
Confessa (C) Não confessa (NC)
Prisioneiro 1
Confessa (C) -5, -5 0, -6
Não confessa (NC) -6, 0 -1, -1
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Observe que o payoff é igual ao número de anos na cadeia, mas com “sinal de menos”: isso
significa que o objetivo dos prisioneiros é minimizar o tempo na cadeia. Mais uma vez, temos
interdependência estratégica entre as ações dos jogadores. Eles não conseguem coordenar
suas ações.
Note ainda que não é claro que, ao escolher individualmente, eles tomarão a decisão que,
como grupo, reduz as penas dos dois (isto é: ambos não confessam, o que minimiza o tempo
agregado na cadeia).
O dilema dos prisioneiros é um exemplo claro de que a previsão encontrada em equilíbrio
geral, de que o comportamento descentralizado do mercado gera alocações eficientes, não
ocorre necessariamente quando há interação estratégica.
O dilema dos prisioneiros, assim como vários jogos que parecem apenas descrever situações
fantasiosas, é capaz de trazer situações importantes, como corridas armamentistas e
competições de preço. Este é um tipo de jogo na forma estratégica com informação completa.
Exemplo 3 (Jogo do investimento com informação incompleta)
Vamos agora supor, no nosso exemplo dos amigos decidindo onde investir seu dinheiro, que
Alice não tem certeza sobre as preferências de Bruno. Assim, Alice pensa que Bruno talvez
goste de riscos exagerados, mas isso não é uma certeza.
Formalmente, Alice pensa que Bruno tem uma probabilidade de ser um grande fã de
vaquinhas, e prefere entrar no crowdfunding, independentemente do resultado — podemos
dizer que o payoff de Bruno, ao entrar no crowdfunding, é sempre igual a 120.
Alice não sabe com que tipo de jogador está lidando. Ela enxerga dois cenários possíveis,
representados a seguir:
Bruno – perfil normal (probabilidade 1-p)
Títulos Crowdfunding
Alice
Títulos 110, 110 110, 100
Crowdfunding 100, 110 120, 120
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Bruno – perfil arriscado (probabilidade p)
Títulos Crowdfunding
Alice
Títulos 110, 110 110, 120
Crowdfunding 100, 110 120, 120
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Se Alice tivesse certeza de que Bruno tem um perfil arriscado, a escolha óbvia seria investir no
crowdfunding, porque ela estaria convencida de que ele também optaria por esse investimento
arriscado.
Não vamos resolver o jogo inteiro aqui, mas ele é chamado de bayesiano, em que as ações
são simultâneas, contudo, há informação incompleta.
Observe, por último, que os payoffs do jogador não são meramente monetários, mas podem
capturar a utilidade de um indivíduo de várias formas.
Bruno pode preferir entrar no crowdfunding independentemente do retorno financeiro, porque
deseja ajudar uma pessoa a levantar os recursos necessários para o seu projeto, por exemplo.
Exemplo 4 (Jogo da entrada no mercado)
Em todos os exemplos listados, assumimos ação simultânea (ou seja, os jogadores tomam as
decisões ao mesmo tempo ou sem saber como o outro jogador está decidindo). Esses são
considerados jogos na forma normal ou estratégica.
Vamos, agora, ver um jogo sequencial, onde os jogadores agem em turnos. Um exemplo
simples é o jogo da entrada em mercados.
Vamos supor que haja dois refrigerantes: Doda-Dola e Colly Guaraná. Doda-dola é um
monopolista no mercado de refrigerantes e Colly Guaraná deve decidir se vai entrar nesse
mercado.
A situação pode ser descrita na figura a seguir, chamada árvore de jogo:
 
Neste jogo, após observar a decisão de entrada da empresa Colly Guaraná, a Doda-Dola
decide se entrará em luta comercial com ela (por exemplo: cortes de preço ou campanhas
publicitárias) ou irá simplesmente se acomodar com a entrada da nova concorrente.
Os payoffs, isto é, os retornos de cada jogador em cada sequência possível desse jogo estão
representados em cada fim possível dessa árvore: a primeira entrada é o payoff da Colly
Guaraná, o segundo é o payoff da Doda-Dola. Esse é um exemplo de jogo sequêncial com
informação completa.
A partir da descrição e dos exemplos, é possível saber o primeiro passo na resolução de teoria
dos jogos: reconhecer o tipo de problema que temos em mãos. Nas etapas seguintes,
exploraremos cada um desses cenários e como encontrar e qualificar equilíbrios (quando
existirem) nesses jogos.
REPRESENTAÇÃO DE UM JOGO NA
FORMA NORMAL: FORMALIZAÇÃO
A forma normal de um jogo deve descrever os seguintes elementos:

Quem são os N jogadores. Podemos nos referir genericamente a um jogador i=1, ..., N. Por
exemplo: João e José;
O conjunto de estratégias que cada jogador i pode escolher. Se um elemento pertence ao
conjunto , é uma estratégia possível para o jogador i. João pode, por exemplo, escolher a
estratégia “jogar um número par entre 1 e 10” ou “jogar um número ímpar entre 1 e 10”.
O conjunto é o cartesiano: um elemento do conjunto S é um perfil de
estratégias, ou seja, indica uma estratégia para cada jogador. No exemplo do par ou ímpar,
um elemento de S é “João joga par, José joga ímpar”.

Si si
Si
S = S1 × … × SN

Payoffs: são funções : . A cada perfil de estratégias, associamos um payoff para o
jogador i, ou seja, um número real que representa o valor que ele obtém para cada perfil de
estratégias.
É fundamental perceber que o payoff de cada jogador depende da escolha de todos os outros:
na nossa notação, isso é representado como . Por exemplo, se João joga par e
José joga ímpar, a função payoff diz que João ganha um ponto.
Vamos voltar ao Dilema dos prisioneiros, apresentado anteriormente, para ilustrar esses
pontos:
Prisioneiro 2
Confessa (C) Não confessa (NC)
Prisioneiro 1
Confessa (C) -5, -5 0, -6
Não confessa (NC) -6, 0 -1, -1
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Neste caso, cada jogador possui apenas duas decisões possíveis: confessar ou não confessar.
O conjunto de estratégias de cada jogador é:
S1 = {C,NC}
S2 = {C,NC}
Temos, então, quatro combinações possíveis de estratégias, que nos permitem formar o
conjunto S = S1 × S2 = {(C, C); (C, NC); (NC, C); (NC, NC)}.
Cada um desses pares de estratégia está associado a um payoff para cada jogador:
u1 (C,C) = -5
u2 (C,C) = -5
ui :  S→ R
ui(s1, . . . ,  sn)
u1 (C,NC) = 0
u2 (C,NC) = -6
E assim por diante.
A representação normal de um jogo G é, de forma geral:
Temos todos os jogadores (1 a N), os espaços de estratégia de cada um (S1 a SN) e suas
funções payoff (u1 a uN).
Para concluir, vamos discutir um pouco mais as hipóteses que estão por trás dos modelos de
teoria dos jogos.
Neste vídeo, analisaremos uma abordagem sobre hipóteses dos modelos de Teoria dos Jogos.
G = {S1, . . .  ,  Sn;  u1, . . . ,  un}
VERIFICANDO O APRENDIZADO
1) QUAL DAS ALTERNATIVAS A SEGUIR REPRESENTA UM CONJUNTO DE POSSÍVEIS
ESTRUTURAS PARA UM JOGO?
A) Leis, acordos prévios, o número de operadores de um leilão.
B) Organização de um leilão, leis, determinações de um juiz.
C) Regras de um jogo de tabuleiro, desenho do mercado cambial, vontade dos agentes de
comer um pedaço de bolo.
D) Jogo de sorte, no qual jogadores vencem ou perdem esperando resultados aleatórios.
2) QUAL DAS ALTERNATIVAS ABAIXO É VERDADEIRA?
A) Um jogador busca sempre maximizar seu bem-estar individual.
B) É possível que um jogador entre em um jogo sem conhecer a sua estrutura.
C) Em um jogo estático, os dois jogadores sabem, necessariamente, qual será a decisão do
rival.
D) Em um jogo estático, os dois jogadores esperam que o outro vá jogar primeiro.
GABARITO
1) Qual das alternativas a seguir representa um conjunto de possíveis estruturas para
um jogo?
A alternativa "B " está correta.
O número de operadores de um leilão não altera, necessariamente, as regras de um leilão,
mas pode mudar a distribuição de payoffs dos jogadores.
2) Qual das alternativas abaixo é verdadeira?
A alternativa "A " está correta.
Apesar de o jogo ter um resultado incerto, cabe ao jogador buscar uma estratégia que
maximize a sua expectativa de lucro.
MÓDULO 2
 Resolver jogos estáticos de informação completa
ESTRATÉGIAS ESTRITAMENTE
DOMINADAS
Vamos revisitar o dilema dos prisioneiros:
Prisioneiro 2
Confessa (C) Não confessa (NC)
Prisioneiro 1
Confessa (C) -5, -5 0, -6
Não confessa (NC) -6, 0 -1, -1
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Voltemos à hipótese de que os agentes são racionais e da estratégia que gera o maior payoff.
Vamos nos colocar no lugar do prisioneiro 1. Se pensamos que o prisioneiro 2 vai confessar, o
que devemos fazer? Podemos, também, confessar e ficar com payoff -5; ou podemos não
confessar e ficar com payoff -6. Escolhemos, então, confessar, pois é melhor ficar cinco anos
na cadeia do que seis.
E o que devemos fazer se pensarmos que o prisioneiro 2 não irá confessar? Podemos
confessar e ficar com payoff zero, ou não confessar e ficar com payoff -1. Novamente,
escolhemos confessar.
Ou seja: em qualquer conjectura do prisioneiro 1 a respeito da estratégia do prisioneiro 2, a
melhor estratégia que ele pode escolher é a de confessar!
Dizemos, então, que “não confessar” é uma estratégia estritamente dominada por
“confessar”. De maneira geral, dizemos que X domina estritamente Y se, para quaisquer
estratégias escolhidas pelos demais jogadores, X sempre gera um payoff estritamente maior
que Y.
Nosso objetivo é fazer uma previsão sobre o resultado do jogo. Para tanto, podemos
desenvolver uma hipótese simples: agentes racionais não jogam estratégias estritamente
dominadas. Afinal, não há conjectura possível sobre a escolha dos demais que permita
concluir que uma estratégia estritamente dominada dê o maior payoff.
Observe que se um jogador A tiver uma estratégia estritamente dominada, não deverá jogá-la
independentemente do que os demais agentes farão. O jogador A não precisa sequer saber
se os demais jogadores são racionais: eles podem escolher estratégias aleatoriamente, mas
isso não faz diferença — o jogador A não deverá jogar a estratégia estritamente dominada.
Uma estratégia s'i é estritamente dominada por s"i para o jogador i se, para qualquer
combinação de estratégias que os demais jogadores
possam escolher, vale a desigualdade estrita:
 Atenção! Para visualizaçãocompleta da equação utilize a rolagem horizontal
No dilema dos prisioneiros, essa hipótese já nos permite fazer uma previsão única sobre o
resultado do jogo: os dois prisioneiros confessarão! Ou seja, existe uma única estratégia que
s−i = (s1, . . . ,  si−1,   si+1, . . . , sn)
ui(s1, . . . ,  si−1,  s'i,  si+1, . . . sn) <  (s1, . . . ,  si−1,  s "i,  si+1, . . . sn)
javascript:void(0)
domina estritamente todas as outras.
S(-I)=(S1,...,S(I-1),S(I+1),...,SN)
Atenção para esta notação, que voltaremos a usar: é o vetor de estratégias dos demais
jogadores, ou seja, à exceção do jogador i.
 ATENÇÃO
É importante notar que esse resultado não é o ideal do ponto de vista conjunto dos prisioneiros:
para minimizar a soma de tempo na cadeia, ambos deveriam evitar uma confissão.
Formalmente, dizemos que o resultado do jogo não é eficiente de Pareto.
De forma geral, não conseguimos fazer uma previsão única sobre o resultado de um jogo
apenas eliminando estratégias estritamente dominadas. Contudo, podemos nos basear nesse
princípio de forma iterativa. Vamos ver um exemplo.
Jogador 2
C D E
Jogador 1
A 2,0 2,4 0,2
B 0,6 0,1 4,0
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Note que, para o jogador 1, não há estratégia estritamente dominada, pois A ≻1 B (lê-se “A é
estritamente melhor que B para o jogador 1”) se o jogador 2 jogar C ou D, mas se jogar E,
temos B ≻1 A. Portanto, parece que não temos muito a fazer.
Porém, para o jogador 2, D ≻2 E, porque 4 > 2 e 1 > 0: ou seja, D gera um payoff maior que E
para o jogador 2, independentemente do que o jogador 1 faça. Logo, E é uma estratégia
estritamente dominada, e o jogador 2, que é racional, não irá jogá-la.
Sabemos que o jogador 1 é racional. Vamos supor que, além disso, ele sabe que o jogador 2
também é racional e, sendo assim, não jogará a estratégia estritamente dominada E. Dessa
forma, o jogador 1 “elimina” a estratégia E do jogador 2, e passa a enxergar o jogo da seguinte
forma:
Jogador 2
C D
Jogador 1
A 2,0 2,4
B 0,6 0,1
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Agora, para o jogador 1 não faz sentido jogar a estratégia B, pois A ≻1 B se o jogador 2
escolhe C ou D. B passou a ser estritamente dominada!
Vamos seguir o raciocínio e supor que o jogador 2 sabe que o jogador 1 é racional e, portanto,
não jogará B. Isso é suficiente? Ainda não! Precisamos fazer uma hipótese adicional: o
jogador 2 sabe que o 1 sabe que ele é racional! Isso é necessário para que o jogador 2
saiba que o 1 considera B estritamente dominada.
Com essa hipótese, o jogador 2 elimina a estratégia B do jogador 1, passando a enxergar o
jogo da seguinte forma:
Jogador 2
C D
Jogador 1 A 2,0 2,4
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
O jogador 2 escolhe, então, a estratégia D. Nossa previsão para o resultado do jogo é: o
jogador 1 joga A e o jogador 2 joga D.
Observe que, para cada rodada de eliminação de estratégias estritamente dominadas,
precisamos elaborar uma hipótese adicional: “Um jogador sabe que o outro sabe que um
jogador sabe que o outro jogador sabe... que todos são racionais”.
Em geral, estudamos jogos supondo que essa hipótese é sempre respeitada, e damos a ela o
nome de “conhecimento comum” (você encontrará, com frequência, o termo original em inglês
“common knowledge”).
Na prática, supomos conhecimento comum sobre toda a estrutura do jogo e não apenas para a
racionalidade dos jogadores.
O processo que usamos para resolver o último jogo tem um nome: eliminação iterada de
estratégias estritamente dominadas (e.i.e.e.d.). A cada rodada, baseados na hipótese de
conhecimento comum, buscamos eliminar estratégias que se tornaram estritamente dominadas
após a rodada anterior de eliminações.
À medida que se avança no processo de eliminação de e.e.d., torna-se mais provável haver
estratégias adicionais a serem cortadas: quanto menoré o número de estratégias dos
oponentes, mais provável que uma dada estratégia (minha) possa ser eliminada.
É importante salientar que nem sempre haverá estratégias estritamente dominadas. Um
exemplo é o jogo a seguir:
L C R
T 0, 8 8, 0 10, 6
M 8, 0 0, 8 10, 6
B 6, 10 6, 10 12, 12
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Vamos buscar outros conceitos para solucionar esse tipo de jogo.
ESTRATÉGIAS RACIONALIZÁVEIS
O que faria você escolher determinada estratégia em um jogo? Uma resposta intuitiva para
essa questão é: “Trata-se da melhor resposta para o que eu espero que o outro jogador faça”.
Vamos começar a usar esse conceito.
Dizemos que uma estratégia é racionalizável para o jogador i se existe alguma combinação
de estratégias dos demais jogadores, tal que gera o maior payoff para i quando os
demais jogam . Ou seja, existe alguma conjectura de i sobre as escolhas dos demais
jogadores que justifique . Dizemos, então, que é a melhor resposta para .
Um jogador racional nunca optará por estratégias não racionalizáveis: é impossível justificá-las
como a melhor resposta. Assim como fizemos na seção anterior, podemos realizar um
procedimento iterativo de eliminação de estratégias não racionalizáveis. (Quando temos
apenas dois jogadores, não faz diferença: a eliminação iterada de estratégias estritamente
dominadas, ou não racionalizáveis, chega ao mesmo resultado.)
Na prática, porém, esse exercício não é relevante. Usamos o conceito de estratégia
racionalizável para construir previsões gerais sobre o resultado de um jogo. Para tanto, vamos
procurar uma coincidência (ou interseção) de “melhores respostas”. Esse é o conceito de
equilíbrio de Nash, que vamos ver agora.
EQUILÍBRIO DE NASH
s*
i
s−i s
*
i
s−i
s*
i
s*
i
s−i
Considere uma interação estratégica entre João e Paulo. João pensa: “Se Paulo jogar X, eu
deveria jogar Y”. E Paulo pensa: “Se João jogar Y, eu deveria jogar X”.
O que podemos dizer sobre o par de estratégias (X, Y)? Nenhum dos jogadores, João ou
Paulo, tem incentivo individual a mudar de estratégia, uma vez que estamos nesse
ponto. X é a melhor resposta para Y, e Y é a melhor resposta para X! Se um perfil de
estratégias tem essa característica, podemos usá-lo como previsão para o resultado do jogo.
 
venimo/Shutterstock.com
Esse será o nosso conceito de equilíbrio, que formalizaremos com o nome de “equilíbrio de
Nash”. O mais importante é entender a ideia: o equilíbrio de Nash é uma situação da qual
nenhum jogador gostaria de desviar individualmente. Assim, dizemos que não há incentivo
unilateral ao desvio.
As estratégias constituem um equilíbrio de Nash se, para cada jogador i, a
estratégia é a melhor resposta para as estratégias dos demais jogadores.
Ou seja, a estratégia do equilíbrio de Nash maximiza o payoff do jogador quando os
demais estão jogando o equilíbrio de Nash! Isso é a mesma coisa que dizer que não há
incentivo unilateral ao desvio.
Voltando ao jogo anterior, vamos marcar em negrito o maior payoff que um jogador pode obter
para cada possível escolha do outro jogador. Por exemplo, se o jogador 2 joga L, o maior
payoff que o jogador 1 pode obter é 8, jogando M.
(s*1,  . . . ,  s
*
n)
s*
i
s*−i
s*
i
J1/J2 L C R
T 0, 8 8, 0 10, 6
M 8, 0 0, 8 10, 6
B 6, 10 6, 10 12, 12
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Observe o par de estratégias (B, R). Para o jogador 1, B gera o maior payoff (12) quando o
jogador 2 escolhe R; para este, R gera o maior payoff (também 12) quando o jogador 1 joga B.
Ou seja: B é a melhor resposta para R, e R é a melhor resposta para B. Esse é o equilíbrio de
Nash do jogo.
Por que essa é uma boa previsão para o resultado do jogo? Exatamente porque, nesse ponto,
nenhum jogador tem interesse em desviar e fazer algo diferente.
Considere, por exemplo, o par de estratégias (M, L). O jogador 1 não tem incentivo a desviar
(M gera o maior payoff quando o jogador 2 escolhe L), mas o jogador 2 prefere trocar e jogar C
quando o jogador 1 escolhe M. Mas se o jogador 2 escolhe C, o 1 prefere trocar para T, o que
não parece ser uma boa previsão.
 ATENÇÃO
É importante notar que um jogo pode ter mais de um equilíbrio de Nash. Considere o jogo de
coordenação a seguir. Os jogadores 1 e 2 escolhem se vão à ópera ou a uma luta.
Os jogadores gostariam de se encontrar, mas o jogador 1 prefere que o encontro seja na ópera
e o 2 prefere que seja na luta (esse jogo é tipicamente chamado de “Guerra dos Sexos” —
você encontrará esse nome, apesar de ser datado!). Se não se encontrarem, porém, ambos
ficam com payoff zero.
Jogador 2
Opera Luta
Jogador 1
Opera 4, 2 0, 0
Luta 0, 0 2, 4
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Existem dois equilíbrios de Nash: ambos vão à ópera ou ambos vão à luta. Por quê? Se
partimos da situação em que ambos vão à ópera, ninguém tem incentivo individual a ir sozinho
à luta. Se ambos vão à luta, ninguém tem incentivo unilateral a ir sozinho à ópera.
Vamos recuperar nossa notação para definir formalmente o equilíbrio de Nash. Considere a
representação normal de um jogo (ou seja, descrevemos
jogadores, espaços de estratégias e funções payoff).
As estratégias constituem um equilíbrio de Nash se constitui a melhor
resposta em relação às estratégias dos demais n-1 jogadores.
Ou seja, para qualquer jogador i e para qualquer estratégia alternativa , deve valer a
desigualdade:
 Atenção! Para visualizaçãocompleta da equação utilize a rolagem horizontal
Podemos expressar isso de outra forma. A estratégia resolve o problema de maximização
de payoff do jogador i:
 Atenção! Para visualizaçãocompleta da equação utilize a rolagem horizontal
Tente colocar esse problema de maximização em palavras. A pergunta que o jogador i se faz é:
dado que os demais jogadores estão jogando as estratégias do equilíbrio de Nash, qual é a
minha melhor resposta? Se para todos os jogadores a resposta for, de fato, , esse é o
equilíbrio de Nash.
Já encontramos equilíbrios de Nash anteriormente. No dilema dos prisioneiros, a escolha de
ambos por confessar é um equilíbrio de Nash: certamente, não há incentivo unilateral ao
desvio, já que a alternativa (não confessar) é estritamente dominada.
G = S1, . . .  ,  Sn;  u1, . . . ,  un)
(s*1,  . . . ,  s
*
n) s*i
s*−i
Si
ui(s*1 , . . . , s
*
i−1, s
*
i
, s*
i+1. . . , s
*
n) ≥ ui(s*1 , . . . , s
*
i−1, si, s
*
i+1. . . , s
*
n)
s*
i
maxsi∈Siui(s
*
1 , . . . , s
*
i−1, si, s
*
i+1. . . , s
*
n)
s*
i
Podemos generalizar a observação que fizemos nesse exemplo: um equilíbrio de Nash nem
sempre será a melhor solução do ponto de vista conjunto dos jogadores. Afinal, estamos
apenas checando se há incentivo unilateral ao desvio e não incentivo agregado ao desvio, pois
o tomador de decisão é o indivíduo!
O TOMADOR DE DECISÃO É O INDIVÍDUO
Esta hipótese nem sempre se verifica. Fique atento: às vezes, um grupo de pessoas,
como uma família, pode tomar uma decisão conjunta. Portanto, atenção às hipóteses do
modelo para saber quando aplicá-lo.
Vamos observar mais um exemplo. No jogo a seguir, há uma briga de animais por um mesmo
pedaço de comida. Cada um deles pode adotar duas estratégias: se comportar
agressivamente, como um gavião; ou de forma passiva, como uma pomba.
 
Mark Sheridan-Johnson/Shutterstock.com
Se ambos se comportarem como pombas, a comida é dividida igualmente. Se um for agressivo
e o outro, passivo, o primeiro terá um pedaço maior. No entanto, se ambos forem agressivos, a
comida acabará se perdendo no meio da briga, de modo que ambos ficarão com fome.
javascript:void(0)
O jogo pode, portanto, ser representado da seguinte forma:
Animal 2
Pomba Gavião
Animal 1
Pomba 3, 3 1, 5
Gavião 5, 1 0, 0
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
Temos, novamente, dois equilíbrios de Nash, mas agora eles envolvem estratégias distintas
para cadajogador: se um joga “pomba”, o outro deve escolher “gavião”; se um joga “gavião”, o
outro escolherá “pomba”, o que mostra a coincidência de melhores respostas.
Pense em casos concretos: você modelaria uma disputa comercial entre os EUA e a China
como o jogo “pomba e gavião” ou como o exemplo de escolha entre “luta e ópera”? E se a
disputa fosse entre os EUA e o México?
O conceito de equilíbrio de Nash busca auxiliar nas previsões sobre o resultado do jogo. Há
diversos conceitos de solução em teoria dos jogos, adequados a diferentes contextos, mas
quase sempre eles são refinamentos de Nash: ou seja, é sempre mantido o requerimento de
ausência de incentivo unilateral ao desvio.
ESTRATÉGIAS MISTAS
Até aqui, estudamos situações em que os jogadores escolhem uma ou outra estratégia. As que
vimos são chamadas de “estratégias puras”. É possível, porém, que um jogador aleatorize sua
escolha.
Pense em uma disputa de pênaltis no futebol: o cobrador, certamente, quer deixar o goleiro em
dúvida sobre o lado em que irá bater.
Vamos olhar para um caso simples: um jogo de par ou ímpar. O jogador 1 ganha se der ímpar,
e o 2, se der par. Uma vitória vale um ponto.
Jogador 2
Par Ímpar
Jogador 1
Par -1, 1 1, -1
Ímpar 1, -1 -1, 1
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
É fácil perceber que, pela definição formal do equilíbrio de Nash, aqui, ele não existe — ao
menos, não em estratégias puras. Em qualquer combinação de estratégias (par e ímpar, par e
par, ímpar e par, ímpar e ímpar), algum jogador sai perdendo e gostaria de desviar.
No entanto, existe um equilíbrio de Nash de estratégias mistas. Em vez de escolher uma
estratégia pura (par ou ímpar), cada jogador escolherá uma distribuição de probabilidade, ou
seja, uma probabilidade para jogar par, e outra para jogar ímpar.
Assista a este vídeo, que apresenta um jogo envolvendo estratégia mista.
Vimos que nem sempre um jogo tem equilíbrio em estratégias puras, mas o que podemos dizer
sobre estratégias mistas?
John Nash, matemático americano, ganhou o prêmio Nobel de Economia, em 1994, por
mostrar que há condições que garantem a existência de equilíbrio, ao menos em estratégias
mistas. Se o número de jogadores é finito, assim como a quantidade de estratégias mistas
disponível para cada um deles, há, ao menos, um equilíbrio.
 
Money Shaman—EPA/REX/Shutterstock.com
 John Nash
APLICAÇÃO: DUOPÓLIO DE COURNOT
Vamos examinar, agora, um exemplo de competição entre firmas que produzem um bem
homogêneo. Elas escolhem, simultaneamente, as quantidades q1 e q2 que irão produzir. A
quantidade total no mercado será simplesmente a soma das quantidades produzidas pelas
firmas 1 e 2:
A demanda é dada pela função . Ou seja, quanto maior a quantidade total,
menor o preço. As firmas têm a mesma função custo . Ou seja, temos um custo
marginal constante c, e não há custo fixo.
O payoff de cada firma i é, simplesmente, o lucro , ou seja, a diferença entre receita e custo.
Vamos começar examinando a firma 1:
 Atenção! Para visualizaçãocompleta da equação utilize a rolagem horizontal
Vemos, então, que o lucro da firma 1 depende da escolha da firma 2, pois o preço de mercado
depende da produção agregada.
A firma 1 vai escolher q1 para maximizar seu lucro. Para resolver essa maximização, vamos
derivar e igualar a zero em relação a q1 — ou seja, vamos montar a condição de primeira
ordem:
É possível notar, então, que a escolha ótima da firma 1 (dada pela condição de primeira ordem)
depende da quantidade produzida pela firma 2. Ou seja, há interação estratégica. Podemos
reorganizar essa equação para obter:
Essa é a melhor resposta da firma 1 a qualquer quantidade que a firma 2 decida produzir.
Resolvendo o mesmo problema para a firma 2, obtemos:
Para obter a coincidência (a interseção) de melhores respostas, basta resolvermos esse
sistema de duas equações e duas variáveis. Por exemplo, podemos substituir o valor de q2 da
última equação dentro da penúltima, obtendo:
 Atenção! Para visualizaçãocompleta da equação utilize a rolagem horizontal
Resolvendo essa equação para q1, obtemos:
Analogamente:
Q = q1 + q2
P(Q) = a − Q
Ci(qi) = cqi
πi
π1(q1, q2)= P × q1 − c × q1 =(a − Q)q1 − c × q1 =(a − q1 − q2)q1 − c × q1
a − 2q1 − q2 − c = 0
q1 = (a − q2 − c)12
q2 = (a − q1 − c)12
q1 = (a −( (a − q1 − c))−c)12
1
2
q*1 =
(a−c)
3
O par ( ) é o equilíbrio de Nash do duopólio de Cournot.
Este resultado traz intuições interessantes sobre o funcionamento de um equilíbrio de Nash. Se
uma única firma operasse nesse mercado, ela escolheria a quantidade ótima de monopólio:
Essa quantidade gera o maior lucro possível nesse mercado. Porém, as firmas em Cournot vão
produzir:
 Atenção! Para visualizaçãocompleta da equação utilize a rolagem horizontal
A princípio, poderíamos pensar que cada firma vai produzir metade da quantidade de
monopólio, de forma a maximizar o lucro agregado. Porém, nesse ponto, as firmas teriam
incentivo unilateral ao desvio.
Novamente, vemos que o equilíbrio de Nash não maximiza necessariamente o payoff
agregado, mas apenas verifica a existência de incentivos unilaterais ao desvio.
Basta maximizar o lucro do monopolista:
VERIFICANDO O APRENDIZADO
1) ENCONTRE OS EQUILÍBRIOS DE NASH (EN) DE ESTRATÉGIA PURA O JOGO A
SEGUIR. VERIFIQUE SE O EQUILÍBRIO DE NASH É SOCIALMENTE ÓTIMO (EFICIENTE
DE PARETO) E IDENTIFIQUE O TIPO DO JOGO.
JOGADOR 2
CONFESSA NÃO CONFESSA
q*2 =
(a−c)
3
q*1 , q
*
2
qm =
(a−c)
2
Q = q*1 + q
*
2 = 2 × >
(a−c)
3
(a−c)
2
(a − Q) × Q − c × Q
javascript:void(0)
(A) (B)
JOGADOR
1
CONFESSA (A) -2, -2 -12, 0
NÃO CONFESSA
(B)
0, -12 -8, -2
 ATENÇÃO! PARA VISUALIZAÇÃOCOMPLETA DA TABELA UTILIZE A ROLAGEM
HORIZONTAL
A) EN = (B, B), ineficiente.
B) EN = (A, A), eficiente.
C) EN = (B, B), eficiente.
D) EN = (A, B), ineficiente.
2) ENCONTRE OS EQUILÍBRIOS DE NASH EM ESTRATÉGIAS MISTAS NO JOGO A
SEGUIR:
JOGADOR 2
ÓPERA LUTA
JOGADOR 1
ÓPERA 4, 2 0, 0
LUTA 0, 0 2, 4
 ATENÇÃO! PARA VISUALIZAÇÃOCOMPLETA DA TABELA UTILIZE A ROLAGEM
HORIZONTAL
A) (1/2, 1/2) e (1/3, 2/3).
B) (2/3, 1/3) e (1/3, 2/3).
C) (1/4, 3/4) e (3/4, 1/4).
D) (1/6, 5/6) e (3/5, 2/5).
GABARITO
1) Encontre os equilíbrios de Nash (EN) de estratégia pura o jogo a seguir. Verifique se o
equilíbrio de Nash é socialmente ótimo (eficiente de Pareto) e identifique o tipo do jogo.
Jogador 2
Confessa (A) Não confessa (B)
Jogador 1
Confessa (A) -2, -2 -12, 0
Não confessa (B) 0, -12 -8, -2
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
A alternativa "A " está correta.
Na combinação de estratégias (B, B), nenhum jogador pode obter um payoff maior ao desviar
individualmente. Esse ponto é ineficiente: mudando para (A, A), o jogador 1 melhoraria, e o
jogador 2 não pioraria — ou seja, seria uma melhora de Pareto.
2) Encontre os equilíbrios de Nash em estratégias mistas no jogo a seguir:
Jogador 2
Ópera Luta
Jogador 1
Ópera 4, 2 0, 0
Luta 0, 0 2, 4
 Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal
A alternativa "B " está correta.
Suponha que o jogador 1 joga opera com probabilidade p e luta com probabilidade 1-p. O
jogador 2 joga ópera com probabilidade q e luta com probabilidade 1-q. O payoff esperado do
jogador 1 ao jogar ópera é 4q+0(1-q). Ao jogar, seu payoff é 0q+ 2(1-q). Igualando os payoffs
esperados, fazemos 4q=2(1-q), e, portanto, q=1/3. Repetindo o raciocínio para o jogador 1,
encontramos p=2/3.
CONCLUSÃO
CONSIDERAÇÕES FINAIS
Este tema demonstrou os principais conceitos envolvidos com a formalização e aplicação de
jogos estáticos de informação completa. O objetivo, aqui, foi de prover o ferramental suficiente
para que vocês possam compreender como dois ou mais agentes — frente a uma decisão em
que devem escolher simultaneamente — se comportam.
Além disso, visamos o desenvolvimento da capacidade crítica de modelar comportamentos de
agentes de forma básica.
REFERÊNCIASACEMOGLU, D. Political economy lecture notes. 2003.
GIBBONS, R. Game Theory for Applied Economists. Nova Jersey: Princeton University
Press, 1992.
EXPLORE+
Leia mais sobre Teoria dos Jogos em matéria da revista Superinteressante, chamada: Entenda
de uma vez o que é a Teoria dos Jogos.
Visite a seção de Social Science no Exploratorium, museu de ciências na Califórnia, e explore
os vários experimentos em Teoria dos Jogos.
CONTEUDISTA
Daniel Duque
 CURRÍCULO LATTES
javascript:void(0);

Continue navegando