TEORIA DOS JOGOS

•

UNIMONTE

Amanda Tenório

21/05/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Pesquisa Operacional I

18.010 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

FERNANDO MORI – prof.fmori@gmail.com

TEORIA DOS JOGOS
FERNANDO MORI
Fernando Mori
Prof.fmori@gmail.com
Resumo
Breve introdução à teoria dos jogos para o curso de engenharia de produção
Teoria dos Jogos | Fernando Mori

TEORIA DOS JOGOS
Introdução

A Teoria dos Jogos foi desenvolvida com a finalidade de analisar situações
competitivas que envolvessem interesses conflitantes. Nessas situações, existem duas ou
mais pessoas com objetivos diferentes, sendo que a ação de cada uma influência, mas não
determina completamente o resultado do jogo. Além disso, admite-se que cada jogador
sabe os objetivos de seu oponente. A Teoria dos Jogos fornece um resultado para este
jogo, admitindo que cada um dos jogadores deseja maximizar seus ganhos.
A maioria dos jogos recreativos, como jogo da velha, damas, xadrez e outros, podem ser
analisados como jogos de estratégia. Os jogos de azar, como roleta e dados não são jogos de
estratégia, uma vez que uma pessoa ao jogar fica na dependência da sorte e não de análises
racionais.
Existem várias situações como não são exatamente jogos e que podem ser analisadas pela
teoria dos jogos. Chamamos de jogos a situações que envolvam interações entre agentes
racionais que se comportam estrategicamente.
A seguir são dadas definições importantes para o entendimento da teoria dos jogos:
- um jogo é um modelo formal de uma situação de interação estratégica ;
- interações são as ações de cada jogador, que afetam todos os participantes;
- jogador é qualquer indivíduo, ou grupo de indivíduos, com capacidade de decisão e que
se utiliza da racionalidade para agir.
- racionalidade é o uso dos meios mais adequados aos objetivos que se pretendem
alcançar.
- comportamento estratégico é o fato de cada jogador, ao tomar sua própria decisão, leva
em consideração o fato de que os jogadores interagem entre si, e que, portanto, sua
decisão terá consequências sobre os demais jogadores, assim como as decisões do
demais jogadores terão consequências sobre ele.

Teoria dos Jogos | Fernando Mori

Exemplo: Jogo de Votação da Diretoria

Imagine que a diretoria de uma empresa hipotética vai se reunir para definir, por meio de
votação, os planos da empresa para o ano seguinte.

Vamos supor que há apenas três decisões possíveis:
- investir na construção de uma nova fábrica (Investir)
- ampliar a fábrica já existente (Ampliar)
- aplicar os recursos no sistema financeiro (Aplicar)

Vamos supor também que, para facilitar a decisão, os diretores decidem votar em dois turnos:
- Turno I: votam se Investem ou Ampliam
- Turno II: decidem entre a escolha vitoriosa do Turno I e Aplicar

A ordem de preferências dos diretores são as seguintes:
Diretor 1 Diretor 2 Diretor 3
Investir Aplicar Ampliar
Aplicar Investir Investir
Ampliar Ampliar Aplicar

Caso não haja interação estratégica, o resultado da votação será o seguinte:
1o. Turno: Investir ou Ampliar
Diretor 1: Investir
Diretor 2: Investir
Diretor 3: Ampliar
Escolha Vencedora: Investir

2o. Turno: Investir ou Aplicar
Diretor 1: Investir
Diretor 2: Aplicar
Diretor 3: Investir
Escolha Vencedora: Investir

Teoria dos Jogos | Fernando Mori

Caso o Diretor 2 resolvesse agir estrategicamente, conhecendo as preferências dos outros 2:
1o. Turno: Investir ou Ampliar
Diretor 1: Investir
Diretor 2: Ampliar
Diretor 3: Ampliar
Escolha Vencedora: Ampliar

2o. Turno: Ampliar ou Aplicar
Diretor 1: Aplicar
Diretor 2: Aplicar
Diretor 3: Ampliar
Escolha Vencedora: Aplicar (que era a preferência inicial do Diretor 2)

Teoria dos Jogos | Fernando Mori

ESTRATÉGIAS
Estratégia é uma descrição completa de como uma pessoa deverá agir sob quaisquer
circunstâncias possíveis.
Quando não há dúvida sobre como o jogador deve agir dizemos tratar-se de uma estratégia
pura e quando as decisões se baseiam em probabilidades estamos diante de uma estratégia
mista.
Descrição de um jogo
Considere o jogo descrito a seguir:
Temos uma mesa com quatro quadrados 1,2 3 e 4.

Dois jogadores participam do jogo: Jogador I tem o movimento de abertura em que ele escolhe
um dos quadrados. Em vezes sucessivas cada um dos jogadores vai escolhendo cada um dos
quadrados segundo as regras:
1) Um quadrado é escolhido se não foi escolhido anteriormente por outro jogador.
2) O quadrado 4 não pode ser escolhido se o 2 ou o 3 foi escolhido anteriormente.
3) O jogo termina quando o quadrado 1 for escolhido. O jogador que escolher o
quadrado 1 perde o jogo.
Uma descrição gráfica deste jogo é:

Cada círculo é uma decisão do jogador. Este jogo está na forma extensiva.
1
4 3
2
Teoria dos Jogos | Fernando Mori

Jogos com movimentos probabilísticos
No jogo anterior, a transição de um estado peara outro foi feita por ações tomadas pelos
jogadores. Tal modelo é apropriado para jogos de xadrez por exemplo, mas para jogos de
cartas isso não ocorre. É possível pensarmos em situações em que as transições de um estado
para outro dependem de outros fatores tais como, o tempo, as oscilações de índices de
mercado, etc..
Exemplo: Considere um jogo em que o jogador I tem a opção de escolher entre a ação a, que
leva ao fim do jogo com prêmio (0,0) e a ação b que leva a um movimento probabilístico em A.
Em A temos uma loteria (moeda) com probabilidade ½ de cara ou coroa levando ao estado B.
No estado B o jogador II escolhe entre a ação f levando ao fim do jogo com prêmio (2,0) e a
ação levando ao estado D o qual é um movimento aleatório. No estado C o jogador escolhe
entre a ação g levando ao fim do jogo com prêmio (1,1) e a ação h levando ao vértice com
movimento aleatório E.

Se tivermos estratégias para o jogo, escolhidas pelos jogadores I e II tais que:

( ) ( )
( )
I I
II
S R b S C h
S B f
= =
=

Os seguintes resultados podem ocorrer:

1
(2,0) com probabilidade
2
1 1 1
(0,2) com probabilidade .
2 4 8
1 1 1
( 1,1) com probabilidade
2 2 4
1 1 1
(1,1) com probabilidade
4 2 8
R A B
R A C E
R A C E
R A C E
→ → →
→ → → → =
→ → → → − =
→ → → → =

Teoria dos Jogos | Fernando Mori

Jogos com informação imperfeita
Uma das propriedades mais importantes dos jogos é que em cada estágio do jogo cada jogador
tem conhecimento perfeito do desenvolvimento do jogo anterior a este estágio. Ele conhece
exatamente as ações executadas pelos outros jogadores e se existem movimentos
probabilísticos quais resultados possíveis de ocorrer.
Um jogo deste tipo é chamado de jogo com informação perfeita.
Podemos ter jogos em que a informação não é perfeita como no exemplo:
Exemplo: Considere o jogo em que cada jogador escolhe o lado de uma moeda (cara ou coroa)
da seguinte forma: cada jogador coloca em um envelope um pedaço de papel no qual a
escolha foi escrita. O envelope é fechado e entregue a um juiz. Se ambos escolherem o mesmo
lado da moeda, o jogador II paga 1 real ao jogador I. Se eles escolherem lados opostos das
moedas, o jogador I paga um real ao jogador II.

Quando o jogador II faz a escolha entre h e t ele não sabe se o jogo está no vértice A ou vértice
B pois ele não conhece a escolha do jogador I.
Este é um jogo com informação imperfeita.
Os vértices A e B formam um conjunto de informações do jogador II.

Teoria dos Jogos | Fernando Mori

Jogos na forma estratégica.
Exemplo: Considere o jogo pedra, papel, tesoura em que cada um dos jogadores escolhe uma
ação a partir de 3 alternativas: pedra, papel e tesoura. A ação é selecionada pelos jogadores
simultaneamente com a dominação circular entre as três alternativas:pedra esmaga tesoura,
que corta papel, que embrulha pedra.
O jogo na forma extensiva fica:

Atribuindo o prêmio do jogador como sendo 1 para ganhar e -1 para perder e 0 para empate
temos o jogo na forma estratégica dado abaixo:

Jogador II

Jogador I

Em cada célula da figura o numero a esquerda representa o prêmio do jogador I e o do lado
direito o prêmio do jogador II.

pedra papel tesoura
pedra (0,0) (1,-1) (1,-1)
papel (1,-1) (0,0) (-1,1)
tesoura (-1,1) (-1,1) (0,0)
Teoria dos Jogos | Fernando Mori

Dominação
Uma primeira busca da solução do jogo: eliminando estratégias estritamente dominadas
Em alguns casos, os jogadores têm uma ou mais opções de estratégia que proporcionam
resultados melhores do que alguma outra estratégia, não importando o que os demais
jogadores façam.

Exemplo 1: Considere a seguinte situação de interação estratégica.
A empresa de sabão em pó Limpo tem de decidir se lança, ou não, uma marca biodegradável
para competir com o produto biodegradável de sua concorrente, a empresa Bonito. Esta última,
por sua vez, tem de decidir se aumenta, ou não, os gastos de propaganda com o seu produto.
Os lucros de cada empresa estão apresentados de forma estratégica a seguir, em milhões de
reais.

Bonito
Limpo Aumentar os gastos com
publicidade
Não aumentar os gastos com
publicidade
Lançar o produto
biodegradável
5,5 7,3
Não lançar o produto
biodegradável
2,4 2,7

Observar que não importa o que a empresa Bonito decida, é sempre melhor para a empresa
Limpo lançar seu produto biodegradável.

Utilizando os termos empregados pela Teoria dos Jogos, no caso do jogador Limpo, a estratégia
{Lançar o Produto Biodegradável} domina a estratégia {Não lançar o produto biodegradável}.

Podemos dizer que o jogador Limpo possui uma estratégia estritamente dominante sobre outra
dominada.

Note que todas as recompensas da estratégia {Lançar o produto biodegradável} são
estritamente maiores do que as recompensas da estratégia (não lançar o produto
biodegradável}. Nesse caso diz-se que a primeira estratégia é estritamente dominante em
relação à outra.

Teoria dos Jogos | Fernando Mori

Mas, além de estratégias estritamente dominantes, também podemos ter casos em que uma
estratégia é melhor do que a outra em pelo menos uma situação, sendo no restante das vezes
apenas tão boa quanto esta outra.

Veja o exemplo anterior ligeiramente reformulado:

Bonito
Limpo Aumentar os gastos com
publicidade
Não aumentar os gastos com
publicidade
Lançar o produto
biodegradável
2,5 7,3
Não lançar o produto
biodegradável
2,4 2,7

Aqui, para a empresa Limpo, a estratégia {Lançar o produto biodegradável} é fracamente
dominante em relação à estratégia {Não lançar o produto biodegradável}.
Eliminação Iterativa de Estratégias Estritamente Dominadas
O método mais simples para se determinar o resultado de um jogo simultâneo é a chamada
eliminação iterativa de estratégias estritamente dominadas.
Situação Hipotética:
Duas, empresas, X e Y, competem no mercado automobilístico. A empresa Y já tem seu carro
utilitário, que é um sucesso, enquanto a empresa X ainda não oferece nenhum modelo
utilitário.

A empresa X tem 3 opções:
- importar o utilitário de sua matriz estrangeira;
- produzir o utilitário nacionalmente;
- permanecer fora do segmento de utilitários.

A empresa Y pode responder às escolhas de X de três formas:
- mantendo o preço de seu modelo;
- diminuindo o preço de seu modelo;
- lançando uma nova versão dos eu modelo.

Vamos supor que as empresas tomam suas decisões ao mesmo tempo, no momento de finalizar
seu planejamento anual, sem conhecer as decisões uma da outra.

Teoria dos Jogos | Fernando Mori

Como são empresas experientes no mercado e que já competiram entre si em outras
oportunidades, conhecem o comportamento dos consumidores e fazem uma estimativa
bastante razoável dos seus lucros e dos lucros da rival em cada situação.

Empresa Y
Empresa X Lançar Nova Versão Manter Preço Reduzir Preço
Lançar Modelo
Próprio
1,4 4,1 1,3
Importar da Matriz 2,2 2,1 2,3
Não Competir com a
Empresa Y
1,1 0,6 1,0

Como se pode observar, a Empresa Y não possui estratégia estritamente dominante.

Para a Empresa X, a estratégia {Não Competir com a Empresa Y} sempre resulta em uma
recompensa pior do que {Importar da Matriz}, independentemente da escolha que a Empresa Y
faça, ou seja, {Não Competir com a Empresa Y} é estritamente dominada por {Importar da
Matriz}.

Portanto Eliminação Iterativa da 1a. Estratégia Estritamente Dominada.

Empresa Y
Empresa X Lançar Nova Versão Manter Preço Reduzir Preço
Lançar Modelo
Próprio
1,4 4,1 1,3
Importar da Matriz 2,2 2,1 2,3
Não Competir com a
Empresa Y
1,1 0,6 1,0

Estratégia Estritamente Dominada
(recompensa sempre pior que as
demais estratégias)
Teoria dos Jogos | Fernando Mori

Exemplo: Considere um jogo de 2 jogadores no qual o jogador I escolhe uma linha e o jogador
II escolhe coluna.
Jogador II

Jogador I

Se o jogador I joga T o prêmio do jogador II usando a estratégia M é 2, comparando com
somente 1 sob a estratégia R.
Se o jogador I joga B, o prêmio do jogador II sob a estratégia M é 1 comparado com 0 sob a
estratégia R.
Vemos que independente da estratégia do jogador I, a estratégia M sempre fornece um
prêmio maior ao jogador II que a estratégia R.

Hipótese: Um jogador racional não irá escolher uma estratégia que seja totalmente dominada.
No jogo em questão dizemos que a estratégia R é estritamente dominada pela estratégia M.
Assim eliminamos a estratégia R.
Jogador II
Jogador I

A estratégia B é estritamente dominada pela estratégia T para o jogador I.
Assim eliminamos a estratégia B:

Jogador II
Jogador I

O jogador II escolhe M com prêmio 2.

L M R
T (1,0) (1,2) (0,1)
B (0,3) (0,1) (2,0)
L M
T (1,0) (1,2)
B (0,3) (0,1)
L M
T (1,0) (1,2)
Teoria dos Jogos | Fernando Mori

Exemplo: Dilema do prisioneiro
Duas pessoas que cometeram um crime sério são presas. Na falta de evidencias que
incriminem estas pessoas, a polícia pode obter indiciamento convencendo um (ou ambos)
prisioneiros a confessar o crime. Os policiais dão a cada um dos prisioneiros, ambos em celas
separadas e sem comunicação as seguintes escolhas:
1) Se você confessar e seu amigo recusar a confessar você será solto.
2) Se você recusar a confessar e seu amigo confessar, você recebe a pena máxima (10
anos) pelo crime.
3) Se ambos recusarem confessar, serão acusados com um ano de prisão cada.
4) Se ambos confessarem, a pena será reduzida para 6 anos de prisão cada.
A situação é um jogo estratégico com duas estratégias confessar (C ) o crime e não confessar
(NC) o crime. Os prêmios da tabela estão em anos de prisão.

Jogador II

Jogador I

Lembrando do conceito de utilidade já visto anteriormente, podemos representar o problema
em termos de utilidade para o tomador de decisão:
U(solto) = 5 , U(um ano de prisão) = 4 , U(6 anos de prisão) = 1 , U(10 anos de prisão) = 0.
Em termos da utilidade nossa tabela de prêmios fica:

Jogador II

Jogador ISe o jogador I começar então ele escolhe a estratégia C que domina a estratégia NC. Em
seguida o jogador II escolhe C que domina NC.
Se o jogador II começa então ele escolhe a estratégia C que domina NC, em seguida o jogador I
escolhe C que domina sobre NC. A melhor estratégia é que ambos confessem C e C com
prêmio (1,1).
O que torna o jogo interessante é que se ambos os jogadores escolhem estratégia C, o prêmio
que eles recebem é (4,4), o que é preferível para ambos. O par de estratégias (NC,C) é instável
porque cada jogador pode desviar e ganhar um prêmio maior que 0.

C NC
C (6,6) (0,10)
NC (10,0) (1,1)
C NC
C (1,1) (5,0)
NC (0,5) (4,4)
Teoria dos Jogos | Fernando Mori

Exemplo: Podemos ter casos em que não existem estratégias estritamente dominadas, mas
estratégias fracamente dominadas.
Considere o jogo com a matriz de prêmios:

Jogador II

Jogador I

Não existe estratégia dominada neste jogo.
No entanto a estratégia B garante um prêmio maior para I em relação e estratégia T, em
especial se o jogador II escolher a estratégia L, B é estritamente melhor que T.
Neste caso dizemos que B domina fracamente a estratégia T.

Quando estratégias estritamente dominadas estão envolvidas em um processo de eliminação
iterada, o resultado é independente da ordem em que as estratégias são eliminadas. Na
eliminação iterada de estratégias fracamente dominadas o resultado pode ser sensível a
ordem de eliminação.
Exemplo:
Jogador II

Jogador I

Consideremos três procedimentos de eliminação de estratégias dominadas conforme dadas a
seguir:
1) Jogador I elimina T, jogador II elimina R, jogador I elimina B e jogador II elimina C. O
resultado será M,L com prêmio (2,2) .
2) Jogador I elimina B, jogador II elimina L, jogador I elimina T e jogador II elimina C. O
resultado será M,R com prêmio (3,2).

Como não existem estratégias estritamente dominantes, a ordem de eliminação de
estratégias fracamente dominadas leva a resultados distintos para o jogo.

L R
T (1,2) (2,3)
B (2,2) (2,0)
L C R
T (1,2) (2,3) (0,3)
M (2,2) (2,1) (3,2)
B (2,1) (0,0) (1,0)
Teoria dos Jogos | Fernando Mori

ESTABILIDADE: Equilíbrio de Nash

A dominância é um conceito importante que nos leva diretamente ao conceito de estabilidade
em um jogo, ou seu equilíbrio de Nash.
Um jogador que conhece as estratégias usadas por outros jogadores está em efeito jogando
um jogo no qual ele deve escolher uma estratégia. Se este jogador for racional ele irá escolher
a melhor resposta possível a estratégia usada por outros jogadores.
O Equilíbrio de Nash representa uma situação em que, em um jogo envolvendo dois ou mais
jogadores, nenhum jogador tem a ganhar mudando sua estratégia unilateralmente.
Para melhor compreender esta definição, suponha que há um jogo com n participantes. No
decorrer deste jogo, cada um dos n participantes seleciona sua estrategia ótima, ou seja, aquela
que lhe traz o maior benefício. Então, se cada jogador chegar à conclusão que ele não tem como
melhorar sua estratégia dadas as estratégias escolhidas pelos seus n-1 adversários (estratégias
dos adversários não podem ser alteradas), então as estratégias escolhidas pelos participantes
deste jogo definem um "equilíbrio de Nash".
Dois jogadores A e B estão em um Equilíbrio de Nash se a estratégia adotada por A é a melhor
dada à estratégia adotada por B e a estratégia adotada por B é a estratégia ótima dada a adotada
por A. Ou seja, nenhum dos jogadores pode aumentar seu ganho alterando, de forma unilateral,
sua estratégia.
Exemplo: Equilíbrio de Nash no Dilema dos Prisioneiros
Prisioneiro 1
Prisioneiro 2
Coopera Trai
Coopera -1 . -1 -6 , 0
Trai 0 , -6 -3 , -3

O dilema dos prisioneiros possui somente um par de ações configurando um equilíbrio de Nash:
(trai, trai) é um equilíbrio de Nash, pois dado que o jogador 2 escolheu trair a melhor
escolha para o jogador 1 é trair, já que essa alternativa oferece um pagamento maior
que cooperar. Além disso, dado que o jogador 1 escolheu trair, o jogador 2 não possui
nenhuma escolha melhor que trair também.
(coopera, coopera) não é um equilíbrio de Nash, pois se o jogador 1 escolher cooperar
o pagamento que o jogador 2 receberá ao escolher trair é maior que escolher cooperar.
(coopera, trai) não é um equilíbrio de Nash, pois dado que o jogador 2 escolhe trair, o
jogador 1 teria um pagamento maior escolhendo trair também.
(trai, coopera) não é um equilíbrio de Nash, pois dado que o jogador 1 escolhe trair, o
jogador 2 teria um pagamento maior escolhendo trair também.
http://pt.wikipedia.org/wiki/John_Forbes_Nash
Teoria dos Jogos | Fernando Mori

Prisioneiro 1
Prisioneiro 2
Coopera Trai
Coopera -1 . -1 -6 , 0 -3,5
Trai 0 , -6 -3 , -3 -1,5
-3,5 -1,5

Aplicado na Teoria dos Jogos, o Equilíbrio de Nash (ou Equilíbrio Cooperativo) representa uma
situação em que nenhum jogador pode melhorar a sua situação dada a estratégia seguida pelo
jogador adversário. Um par de estratégias EA e EB, em que EA é a estratégia seguida pelo jogador
A e EB é a estratégia seguida pelo jogador B diz-se um Equilíbrio de Nash se não for possível a
nenhum dos jogadores melhorar a sua situação dada a estratégia do outro jogador.

Definição matemática para o Equilíbrio de Nash:
Deixe (S, f) ser um jogo com n participantes, onde Si é o conjunto de estratégias possíveis para o
participante i, S=S1 X S2 … X Sn é o conjunto de estratégias que especificam todas as ações em
um jogo (somente uma estratégia por participante) e f=(f1(x), …, fn(x)) é a função do premio.
Deixe x − i ser o conjunto de estratégias de todos os jogadores com exceção do jogador i. Quando
cada jogador i {1, …, n} seleciona sua estratégia xi resultando no conjunto de estratégias x =
(x1, …, xn) então o jogador i obtém o payoff fi(x). Note que o premio depende da estratégia
selecionada pelo jogador i e também pelas estratégias escolhidas pelos seus adversários. Um
conjunto de estratégias x* S é um equilíbrio de Nash caso nenhuma alteração unilateral da
estratégia é rentável para este jogador, ou seja:

http://www.notapositiva.com/dicionario_economia/teoriadojogos.htm
http://pt.wikipedia.org/wiki/Payoff
Teoria dos Jogos | Fernando Mori

Exemplo 1:

Jogador II

Jogador I

Se o jogador II sabe que o jogador I escolherá T, ele escolherá L que é sua melhor resposta
a T.
Se o jogador I sabe que o jogador II escolherá L, então ele escolherá M, que é sua melhor
resposta a L.
Se o jogador II sabe que o jogador I escolherá M, ele escolherá C que é sua melhor
resposta a M.
Se o jogador I sabe que o jogador II escolherá C, ele escolherá T que é sua melhor resposta
a C.
Se o jogador II sabe que o jogador I escolherá B, então ele escolhe R que é sua melhor
resposta a B.
Se o jogador I sabe que o jogador II escolhe R, ele escolherá B que é sua melhor resposta a
R.O par de estratégias B,R satisfaz uma propriedade de estabilidade: cada estratégia neste
par é a resposta a outra estratégia.
Supondo que os jogadores escolhem B,R nenhum deles tem um desvio lucrativo, ou seja
nenhum deles tem uma estratégia que garante um prêmio maior que B,R.
Esta propriedade de estabilidade é chamada de equilíbrio de Nash.

L C R
T (0,6) (6,0) (4,3)
M (6,0) (0,6) (4,3)
B (3,3) (3,3) (5,5)
Teoria dos Jogos | Fernando Mori

Exemplo 2: Batalha dos sexos
Umcasal está tentando planejar o que fazer no fim de semana. As alternativas são ir a um
concerto (C ) ou assistir a uma partida de futebol (F) . O homem prefere o futebol, e a
mulher o concerto, mas ambos querem ficar juntos. A matriz de prêmios para este jogo é:

Mulher
Homem

Temos dois pontos de equilíbrio F,F com prêmio (2,1) e C,C com prêmio (1,2).
O homem prefere F,F e a mulher prefere C,C.
Exemplo: Temos duas firmas que estão decidindo no mesmo instante entre duas
estratégias que são fazer propaganda ou não fazer propaganda, com a matriz de prêmios
dada abaixo:

Firma B
Firma A

Determine o equilíbrio de Nash se houver.
1) A escolhe F e B escolhe F.
2) B escolhe F e A escolhe F.
São estratégias dominantes e portanto o equilíbrio de Nash ocorre em F,F com prêmio
(10,5).

F C
F (2,1) (0,0)
C (0,0) (1,2)
Fazer Não fazer
Fazer (10,5) (15,0)
Não fazer (6,8) (10,2)
Teoria dos Jogos | Fernando Mori

Exemplo 3: Suponha que duas operadoras do setor de turismo estão decidindo
simultaneamente qual pacote de turismo (C ou D) irão lançar de acordo com a obtenção
de lucros. Determine se houver o equilíbrio de Nash.
Operadora B
Operadora A

Não existe equilíbrio de Nash para este jogo.

Exemplo 4: Considerando a matriz abaixo com seus ganhos, se (A,E) é um equilíbrio de
Nash, que relações devem ser satisfeitas?
Operadora 2
Operadora 1

Para a operadora 1 : a > e , c > g.
Para a operadora 2: b > d, f > h.

C D
C (2,3) (3,2)
D (4,2) (1,5)
esquerda direita
alto (a,b) (c,d)
baixo (e,f) (g,h)
Teoria dos Jogos | Fernando Mori

Exemplo 5: Supondo o seguinte jogo entre dois jogadores cada qual com três estratégias
possíveis (A,B,C) com seus respectivos prêmios.
Jogador2

Jogador 1

a). Determine as estratégias dominantes e dominadas.
b). Os equilíbrios de Nash.

a) Não existe estratégia estritamente dominante para nenhum jogador.
Para o jogador 1 a estratégia B1 é dominada por A1 e C1 mas C1 não domina A1.
Para o jogador 2 a estratégia B2 é estritamente dominada por A2 e C2 porem C2 não
domina A2.
b) Os equilíbrios de Nash: Se o jogador I começa então ele elimina B1, o jogador II elimina
B2. A seguir o jogador I pode escolher A1 ou C1 pois nenhuma domina a outra. Se ele
escolher A1 então o jogador II escolhe A2 e a solução é o ponto (4,1). Se ele escolher C1
então o jogador II escolhe C2 e o ponto (1.5,3) é solução.
Se o jogador II começa então ele elimina B2, o jogador I elimina B1, o jogador II pode
escolher A2 ou C2. Se ele escolhe A2 então o jogador I escolhe A1 e o ponto (4,1) é solução
do jogo. Se ele escolhe C2, então o jogador I escolhe C1 e a solução é (1.5,3).
Os pontos (4,1) e (1.5,3) são equilíbrios de Nash.

A2 B2 C2
A1 (4,1) (9,0) (1,0.5)
B1 (2,3) (7,2) (0.5,2.5)
C1 (3,2) (8,1.5) (1.5,3)
Teoria dos Jogos | Fernando Mori

Exemplo 6: De acordo com o jogo abaixo, onde duas firmas estão decidindo, no mesmo
instante, entre duas estratégias, que são Fazer Propaganda ou Não Fazer Propaganda,
determine:
Firma B
Fazer Não Fazer
Firma A Fazer 10 ; 5 15 ; 0
Não Fazer 6 ; 8 10 ; 2

a) o equilíbrio de Nash e o equilíbrio com estratégias dominantes, apontando quais são as
estratégias dominantes e dominadas para cada uma das firmas;
b) os novos equilíbrios de Nash e com estratégia dominante; se os ganhos para cada firma,
quando não fizerem propaganda fossem (20;10) em vez de (10;2). Qual a conclusão que se
obtêm em relação ao Equilíbrio de Nash?
a) o equilíbrio com estratégias dominantes e o de Nash é: (10; 5); as estratégias dominantes
para ambas firmas são Fazer Propaganda, e as dominadas para ambas são Não Fazer; b) os
equilíbrios de Nash serão: (10; 5) e (20; 10); mas não existirá estratégia dominante para
nenhuma firma; c) todo equilíbrio com estratégias dominantes é um equilíbrio de Nash, mas
nem todo equilíbrio de Nash é um equilíbrio com estratégias dominantes.

Teoria dos Jogos | Fernando Mori

Exemplo 7: Supondo que um mercado está sendo disputado por duas firmas (F1 e F2), sendo
F1 a firma que está operando no mercado e F2 a entrante em potencial. As estratégias para cada
firma são as seguintes: para F1 cobrar preço alto, sendo os lucros do mercado iguais a $100, ou
cobrar preço baixo, com lucros de mercado iguais a $40; e para F2 entrar no mercado ou não
entrar. Sabendo ainda que para entrar no mercado a F2 tem que investir $40 na construção de
uma fabrica e que ambas dividirão os lucros do mercado, determine:
a) a representação desse jogo na forma normal e encontre o equilíbrio de Nash;
b) a representação desse jogo na forma extensiva e encontre sua solução;
c) se a estratégia da F1 de cobrar preço baixo, para desencorajar a entrada de F2l pode interferir
na decisão dela.

a) A representação do jogo é :

a) os equilíbrios de Nash é: (50;10); b) o equilíbrio de Nash será: (50;10); c) a F1 não consegue
interferir na decisão da F2, e o equilíbrio permanece o mesmo.

Entrar Não entrar
Preço alto (50,10) (100,0)
Preço baixo (20,-20) (40,0)
Teoria dos Jogos | Fernando Mori

Exemplo 8: Suponha dois vendedores que veem, simultaneamente, entrar um cliente em
uma loja. Ambos estão perto do cliente. Se um deles aborda o cliente, ele marca um ponto na
sua avaliação com o gerente da loja, o que pode lhe render uma promoção ao fim do mês,
enquanto o outro que não abordou perde um ponto, pois não mostrou iniciativa, e muito
provavelmente perde a promoção. E nenhum dos dois aborda o cliente, nenhum deles marca
ponto com o cliente. Mas, se os dois abordam o cliente, ele fica irritado e vai embora, e, cada
um dos dois perde um ponto com o gerente. Modele esse jogo, na foram estratégicas, supondo
que nenhum dos dois tem tempo de perceber o que o outro irá fazer.

Resolução:
Jogo Simultâneo
V 2
V1 Aborda Não Aborda
Aborda -1,-1 1,-1
Não Aborda -1,1 0,0

Teoria dos Jogos | Fernando Mori

Exemplo 9: Determine o equilíbrio a partir da forma estratégica dos jogadores A
(linhas) e B (colunas) a seguir, utilizando a eliminação iterativa de estratégias
estritamente dominadas.
B(1) B(2) B(3) B(4)
A(1) 3,0 1,1 5,4 0,2
A(2) 1,1 3,2 6,0 2,-1
A(3) 0,2 4,4 7,2 3,0

Resolução:

B(1) B(2) B(3) B(4)
A(1) 3,0 1,1 5,4 0,2
A(2) 1,1 3,2 6,0 2,-1
A(3) 0,2 4,4 7,2 3,0

2) B(2) x B(1)
1) B(3) x B(4)
5) B(2) x B(3)
Resposta: Combinação de Estratégias A(3) com B(2)

Teoria dos Jogos | Fernando Mori

CLASSIFICAÇÃO DOS JOGOS
Jogos de soma zero e jogos de soma não-zero
Os jogos de soma zero são aqueles em que os interesses dos participantes são
diametralmente opostos. O ganho de um jogador necessariamente corresponde a uma perda
de igual magnitude de outro jogador. Dessa forma não há a criação de riqueza, apenas a
transferência de riqueza de um jogador para outro.Quando o que um jogador perde pode não ser necessariamente o que o outro jogador ganha,
ou seja, quando ambos podem ganhar ou ambos perder, temos um jogo de soma não zero.
Os jogos de soma zero podem ser analisados mais facilmente, pois o objetivo de cada jogador
é claramente obter o máximo de recompensa e, portanto, prejudicar ao máximo o oponente. Já
nos jogos de soma não zero existem possibilidades que devem ser conhecidas anteriormente,
como a intenção em cooperar.
A matriz de um jogo de soma zero apresenta números opostos em cada célula e por isso
podemos indicar apenas as recompensas do jogador das linhas, já as recompensas do jogador
das colunas são as mesmas com os sinais trocados.

jogador 2
jogador 1
estratégia c estratégia d
estratégia a 3,-3 1,-1
estratégia b -2,2 -2,2

jogador 2
jogador 1
estratégia c estratégia d
estratégia a 3 1
estratégia b -2 -2

Teoria dos Jogos | Fernando Mori

2 – Jogos simultâneos e jogos sequenciais
Jogos simultâneos são aqueles em que as escolhas das estratégias acontecem ao mesmo
tempo, ou se eles não se movem simultaneamente, ao menos os jogadores desconhecem
previamente as ações de seus adversários.
Jogos sequenciais são aqueles que se desenvolvem em etapas sucessivas, assim os jogadores
tomam suas decisões baseados nas decisões anteriores dos adversários.

3 – Jogos cooperativos e jogos não-cooperativos
Os jogos cooperativos são aqueles em que a comunicação prévia é permitida entre os
jogadores, antes de decidirem as estratégias que irão ser adotadas, sendo que dessa forma os
jogadores podem combinar estratégias e dessa forma dizemos que estão cooperando.
Na situação oposta, ou seja, quando os jogadores não têm oportunidade para estabelecer
estratégias comuns, visando o bem geral, são chamados de jogos não-cooperativos.

4 – Jogos de informação perfeita e jogos de informação imperfeita
Um jogo é de informação perfeita quando todos os jogadores conhecem todas as
informações importantes antes de tomarem suas decisões. Se algum jogador, em algum
momento do jogo, tem de tomar uma decisão sem conhecer alguma informação importante, o
jogo é de informação imperfeita.

5 – Jogos simétricos e jogos assimétricos
Um jogo é simétrico quando a posição do jogador não é importante, nenhum jogador possui
vantagem por ocupar determinada posição no jogo. Caso contrário o jogo é assimétrico.

Teoria dos Jogos | Fernando Mori

6 – Jogos repetitivos
São aqueles em que se realizam em etapas sucessivas em que as opções de estratégias não
mudam, de forma que em cada etapa cada jogador deve decidir se mantêm ou altera suas
opções

MÉTODOS DE SOLUÇÕES DE JOGOS

1 – Estratégia dominante
Se uma das estratégias de um jogador for sempre melhor que as demais, independente das
estratégias adotadas pelos oponentes, será escolhida pelo jogador.
2 – Minimax e Maximin
Bastante útil na solução de jogos estritamente competitivos. Um dos jogadores tenta impor
a maior perda possível ao outro (o mínimo dos máximos disponíveis ao adversário) e este tenta
se defender garantindo a menor perda possível ( o máximo dos mínimos de que dispõe).
Neste critério, o jogador 1 deve escolher uma estratégia cujo prêmio mínimo seja o maior, ao
passo que o jogador 2 deve escolher aquela cujo prêmio máximo para o jogador 1 fosse o menor
possível. Esta é a estratégia do mínimo máximo para o jogador 1 e estratégia 2 é a estratégia do
máximo mínimo para o jogador 2
Quando um jogador possuir informações de que seu opositor tentará lhe infligir o maior
prejuízo possível talvez seja conveniente analisar a situação escolhendo o máximo entre os
mínimos disponíveis.
Quando um jogador pretende infligir o maior prejuízo possível a seu adversário pode
escolher o mínimo entre as maiores recompensas que o outro possui.

Teoria dos Jogos | Fernando Mori

Exemplo 1: Resolva o jogo usando a estratégia maxmin.

Como A pensa que B será o mais desagradável possível e por isso se escolher M, B escolherá Q,
que é o pior para A. Se escolher N ou P, B escolherá R. Dentre os piores resultados de que dispõe
o jogador A escolherá a estratégia M, que corresponde a recompensa 4, que é o máximo dos
mínimos (maxmin).
Como B pensa que A será o mais desagradável possível e por isso se escolher Q, A escolherá
P, que é o pior para B. Se escolher R, A escolherá N. Então B prefere escolher Q, que corresponde
a recompensa de 4, que é o máximo dos mínimos (maxmin)
Quando se opta pelo maxmin diz-se que os jogadores estão utilizando o “nível de segurança”
que significa que estão agindo com precaução, mas isso sugere muito pessimismo na análise.
Vamos utilizar esta estratégia em um jogo de soma zero, onde é mais útil, por ser
estritamente competitivo. A matriz a seguir contém apenas as recompensas do jogador das
linhas.
A solução pode ser encontrada escolhendo o maior entre os menores resultados das linhas
(jogada do jogador das linhas) e o menor entre os maiores resultados das colunas (jogada do
jogador das colunas).

jogador B
jogador A
Q R
M 4,5 5,9
N 3,6 2,3
P 2,4 1,10
Teoria dos Jogos | Fernando Mori

Exemplo 2: Resolva o jogo entre as empresas pela estratégia maxmin

Dessa forma a empresa A escolherá a estratégia A2 enquanto que a empresa B escolherá a
estratégia B2.

Exemplo 3:
O conceito de equilíbrio não descreve sempre o comportamento esperado dos jogadores
racionais, mesmo em casos em que um ponto de equilíbrio existe e é único:
Jogador 2

Jogador 1

Um equilíbrio de Nash neste jogo é (B,R) com prêmio (3,3).
empresa B
empresa A
B1 B2 B3 B4 Min Linha
A1 10 0 11 -1 -1
A2 8 7 8 10 7
A3 0 6 -7 7 -7
Max Coluna 10 7 11 10
L R
T (2,1) (2,-20)
M (3,0) (-10,1)
B (-100,2) (3,3)
Teoria dos Jogos | Fernando Mori

Este é um resultado provável, mas podemos imaginar o jogador hesitando para escolher B, se o
jogador 2 escolher L? Se o resultado (B,L) for catastrófico para o jogador I ele pode escolher a
estratégia T, garantindo um prêmio de somente 2 (comparando com o prêmio de equilíbrio de
3), mas também evitando que ele possa ter -100 ao invés.
Se o jogador II estiver consciente desta hesitação, e acreditar que existe chance do jogador I
escolher T para se proteger, ele também irá hesitar em escolher R ( e se arriscando a um prêmio
de -20) e irá escolher L ao invés disso. Isto aumenta a chance do jogador I escolher T.
O jogo com a estratégia maxmin e valores de segurança fica:

Temos assim que o (2,0) é o pior caso possível.

O valor maxmin do jogador I é 2 e a estratégia que garante este valor é L. Se os 2 jogadores
escolherem suas estratégias maxmin, o resultado é (T,L) com prêmio (2,1) no qual o prêmio do
jogador II é 1 que é maior do que seu valor maxmin.
Um jogador pode ter várias estratégias maxmin.

L R Min1
T (2,1) (2,-20) 2
M (3,0) (-10,1) -10
B (-100,2) (3,3) -100
Min2 0 -20 (2,0)
Teoria dos Jogos | Fernando Mori

Exemplo 4:
Considere o jogo
Jogador 2

Jogador 1

L R Min1
T (3,1) (0,4) 0
B (2,3) (1,1) 1
Min2 1 1 (1,1)
Teoria dos Jogos | Fernando Mori

Exemplo 5:
Duas empresas A e B, fabricantes de computadores estão planejando comercializar sistemas
de rede para processamento de informações administrativas. Cada empresa pode desenvolver
tanto um sistema rápido e de alta qualidade (A) como um sistema mais lento e de baixaqualidade (B). Determine, de posse dos lucros resultantes de cada uma das estratégias, são
aqueles que se encontram na seguinte matriz de prêmios:
Firma B
A B
Firma A A 30 ;30 50 ;35
B 40 ; 60 20 ;20

a) Se ambas firmas tomarem decisões simultaneamente e usarem estratégias de maximin
qual será o resultado?
b) Suponha que as duas empresas estejam procurando maximizar os lucros, mas que a
empresa A tenha iniciado antes o planejamento e tenha condições de se comprometer
em primeiro lugar. Qual será a solução mais provável? Qual seria o resultado se a
empresa B tivesse iniciado seu planejamento primeiro do que a empresa A.
c) Considere agora o jogo em duas etapas, no qual, em primeiro lugar, cada uma das
empresas terá que decidir qual valor que estará disposta a investir para acelerar seu
planejamento e, em segundo, cada uma terá que anunciar qual produto (A ou B)
produzirá. Qual das empresas investiria mais para acelerar seu planejamento? Quanto
ela deveria investir? Será que a outra deve fazer algum investimento para acelerar seu
planejamento? Explique.

Teoria dos Jogos | Fernando Mori

Método da eliminação iterativa de estratégias estritamente dominadas
Uma estratégia é dita estritamente dominada quando não possui nenhuma recompensa
maior que as correspondentes de outra estratégia.
O jogador sendo racional não escolherá uma estratégia dominada e portanto na análise do
jogo podemos elimina-la. Este tipo de análise possibilita a resolução de um certo número de
jogos.

jogador B
jogador A
estratégia 3 estratégia 4
estratégia 1 2,3 3,1
estratégia 2 1,5 2,1

Equilíbrio de Nash
É uma situação em que nenhum jogador poderia melhorar sua posição escolhendo uma
estratégia alternativa disponível, sem que isso implique que a melhor escolha feita
particularmente por cada pessoa levará a um resultado ótimo.
Estando numa posição de equilíbrio de Nash nenhum jogador tem incentivo para mudar de
estratégia, de forma que a situação é estável
jogador B
jogador A
esquerda direita
alto 2,3 0,1
baixo 1,2 3,0

A opção alto/esquerda corresponde a um equilíbrio de Nash pois o jogador A não tem
incentivo a mudar de estratégia ( o que corresponde a trocar 2 por 1 ) e nem o jogador B ( o que
corresponde a trocar 3 por 1).
Teoria dos Jogos | Fernando Mori

Observe que este jogo não poderia ser resolvido por eliminação de estratégias dominadas
Jogos de Soma Zero

O equilíbrio de Nash e o max min são dois conceitos diferentes que refletem diferentes
aspectos do comportamento: o primeiro é uma expressão de estabilidade e o segundo é uma
noção de segurança. Apesar das raízes diferentes dos 2 conceitos existem casos em que ambos
levam aos mesmos resultados. Um caso especial é no caso de jogos de 2 jogadores de soma
zero.
Exemplo:
Jogador 2

Jogador 1

L C R Min1
T (3,-3) (-5,5) (-2,2) -5
M (1,-1) (4,-4) (1,-1) 1
B (6,-6) (-3,3) (-5,5) -5
Min2 -6 -4 -1 (1,-1)
Teoria dos Jogos | Fernando Mori

Exemplo 6: Duas empresas AF1 e AF2 competem pelas vendas de duas linhas de produtos
igualmente lucrativas. Em ambos os casos o volume o volume de vendas de AF2 é o triplo do
volume de AF1. Devido a melhorias tecnológicas, os dois fabricantes podem realizar melhorias
substanciais as duas linhas de produtos, mas eles não estão certos de qual desenvolvimento e
estratégia de comercialização eles deverão adotar.
Se as melhorias aos dois produtos forem feitas ao mesmo tempo, nenhum fabricante terá o
produto pronto para a venda em menos de 12 meses. Uma alternativa é executar um
programa intensivo para primeiro desenvolver um dos produtos e tentar comercializá-lo antes
que o competidor o faça. Se este for o caso, AF2 pode ter o produto pronto para a venda em 9
meses, enquanto AF1 precisa de 10 meses (devido a contratos anteriores). Cada um deles
pode ter o segundo produto pronto após outro período de 9 meses.
Para cada linha de produto, se ambos os fabricantes comercializam o modelo melhorado,
estima-se que AF1 aumenta sua porcentagem de vendas futuras deste produto em 8% do total
(de 25% para 33%). Da mesma forma AF1 pode aumentar sua venda total em 20, 30 e 40% do
total se comercializar o produto 2,6 e 8 meses antes de AF2 o fazer. Além disso AF1 pode
perder 4, 10,12 e 14% do total se AF2 conseguir comercializar o produto 1,3,7 e 10 meses
antes, respectivamente. Formule este problema como um jogo de soma zero com 2 jogadores
e estabeleça a estratégia que as empresas devem adotar de acordo com o critério MinMax.

AF2

AF1

Melhoria
Simultânea
Prod1-12meses
Prod2- 12 meses
Programa
Intensivo
Prod1- 9 meses
Prod2-18 meses
Programa
Intensivo
Prod1- 18 meses
Prod2-9 meses

Melhoria
Simultânea
Prod1-12meses
Prod2- 12 meses

Programa
Intensivo
Prod1- 10 meses
Prod2-19 meses

Programa
intensivo
Prod1-19 meses
Prod2- 10 meses

Teoria dos Jogos | Fernando Mori

Exemplo 7: Duas empresas comercializam produtos dividindo o mercado. Cada empresa
atualmente detém 50% do mercado. Como recentemente os produtos passaram por
modificações, ambas empresas pretendem lançar uma campanha de propaganda. Se nenhuma
delas anunciar, a parcela de mercado entre elas permanece a mesma. Se uma lançar uma
campanha mais poderosa que a outra, esta última perde uma porcentagem de seus clientes.
Pesquisas de mercado indicam que é possível alcançar 50% dos potenciais consumidores pela
TV, 30% por revistas e 20% pelo rádio.
a)Construa a matriz de prêmios deste jogo e analise a estratégia Maxmin.
b)Obtenha o valor do jogo se cada empresa operar com estratégia pura.

Teoria dos Jogos | Fernando Mori

Exercícios Resolvidos
Resolva os jogos a seguir:
1 –
jogador B
jogador A
par ímpar
par 2,3 0,1
ímpar 1,2 3,0

Usando a estratégia maxmin e supondo que A escolha primeiro, A escolherá impar e B escolherá
par.
Se B escolher primeiro, então ele escolhe par e A escolhe impar.
2 –

jogador B
jogador A
esquerda centro direita
alto 2,1 1,3 2,3
médio superior 4,1 3,2 3,2
médio inferior 5,0 4,1 1,4
baixo 2,2 3,4 2,3

Teoria dos Jogos | Fernando Mori

3 –

Jog B
jogador A
B1 B2 B3 B4
A1 3,3 2,2 4,3 3,4
A2 2,0 1,3 0,2 2,0
A3 3,4 4,2 2,2 0,3
A4 4,3 2,1 3,1 4,2

4 – Duas lojas concorrentes, loja A e loja B estão analisando estratégias de preços, e tem a
seguinte matriz de prêmios. Decida qual estratégia deve ser adotado pelos lojistas usando o
critério maxmin, o critério cooperativo e verifique se existe equilíbrio de Nash.

B
A
descontar 20% manter o preço aumentar 10% aumentar 20%
descontar 10% 3,0 1,1 5,4 0,2
manter o preço 1,1 3,2 6,0 2,0
aumentar 10% 0,2 4,4 7,2 3,0

Teoria dos Jogos | Fernando Mori

5 –
D
C
investe em propaganda reduz os preços não reage tenta acordo
reduz os preços 3,2 3,2 0,3 0,4
tenta acordo 2,0 0,1 3,0 1,1

6 –

bonito
limpo
aumentar gastos com
publicidade
não aumentar gasto com
publicidade
lançar o produto
biodegradável
5,5 7,3
não lançar o produto
biodegradável
2,4 2,7

7 –
Teoria dos Jogos | Fernando Mori39

carro novo
novo auto
lançar nova versão manter o preço reduzir o preço
lançar modelo
próprio
1,4 4,1 1,3
importar da matriz 2,2 2,1 2,3
não competir 1,1 0,6 1,0

8 –

comboio japonês
forças aliadas
rota sul rota norte
busca na rota sul 3, – 3 1, – 1
busca na rota norte 2, – 2 2, – 2

Teoria dos Jogos | Fernando Mori

9 – Duas empresas operam no mercado de chocolate, podendo optar entre produzir um
chocolate de alta qualidade (A) ou um de baixa qualidade (B). Os lucros resultantes de cada
estratégia encontram-se apresentados na matriz de prêmios:
Empresa 2

Empresa 1

a) Quais resultados (se houver) são equilíbrios de Nash?
b) Se os administradores de ambas as empresas forem pessoas conservadoras e
empregarem a estratégia maxmin, qual será o resultado?
c) Qual é o resultado cooperativo?
d) Qual das duas empresas seria mais beneficiada em decorrência de um resultado
cooperativo? Quanto esta empresa estaria disposta a oferecer a outra para persuadi-la
e entrar em conluio.
Resposta:

10 – Duas importantes emissoras estão concorrendo entre si para obter índices de audiência no
horário entre 20 e 21 horas e entre 21 e 22 horas em uma determinada noite da semana. Cada
uma delas, preparando-se para a disputa, conta com dois programas para preencher este
horário. Eles poderão veicular seu programa principal no primeiro horário (20-21h) ou no
segundo horário (21-22h). As possíveis combinações de decisões levam aos seguintes resultados
em termos de pontos de audiência:

Emissora 2

Emissora 1

baixa alta
baixa -20,-30 900,600
alta 100,800 50,50
Primeiro horário Segundo horário
Primeiro horário 18,18 23,20
Segundo horário 4,23 16,16
Teoria dos Jogos | Fernando Mori

a) Encontre o equilíbrio de Nash supondo que ambas emissoras tomem suas decisões
simultaneamente.
b) Se as duas empresas forem avessas ao risco e decidirem empregar uma estratégia
maxmin, qual será o equilíbrio resultante?
c) Qual será o resultado se a emissora 1 fizer sua escolha antes da sua concorrente? E se a
emissora 2 fizer sua escolha antes?
d) Suponha que os administradores das duas empresas se reúnam para coordenar suas
programações e a emissora 1 prometa apresentar seu programa principal no primeiro
horário. Essa promessa é crível? Qual é o resultado mais provável?

Teoria dos Jogos | Fernando Mori

JOGOS COM MAIS DE UM EQUILÍBRIO DE NASH

Considere que duas empresas de tecnologia são concorrentes no mercado de programas para
computador. A empresa Alfa possui um programa anti-vírus e a empresa Beta não possui. A
empresa Beta está decidindo se desenvolve ou não um anti-vírus e a empresa Alfa está
decidindo se investe em outra versão ou não. Consideremos que a matriz de recompensas seja
a seguinte:
JOGO DO PADRÃO TECNOLÓGICO

Beta
Alfa
desenvolve não desenvolve
investe 2, 1 – 1,– 2
não investe 0,– 1 1, 2

Existem dois equilíbrios de Nash: investe/desenvolve e não investe/não desenvolve. Nesse
caso qual das duas situações irá se concretizar? A resposta não pode ser encontrada apenas com
estes dados, vai depender da situação real em as empresas se encontram. Acomodar pode ser
uma boa opção pois não há custos, mas esta opção incentiva possíveis concorrentes a entrarem
no mercado, pois dá a impressão de que as empresas ou não possuem condições de investir ou
que seus administradores são acomodados, sem visão. Quando a concorrência é muito acirrada,
como tem sido atualmente, o mais provável é que ambas empresas invistam, ou seja, a solução
ficaria sendo investe/desenvolve. Esta situação faz com que as empresas acabem investindo
mais do que o necessário em alguns setores, como por exemplo em ativos específicos
(máquinas, equipamentos de produção mas que não são facilmente utilizáveis em outros
empreendimentos e por isso possuem valor de revenda baixo).

Vamos ver outro jogo com dois equilíbrios de Nash. Imagine duas empresas, que dominam o
mercado, decidindo se adotam campanhas publicitárias agressivas.

Teoria dos Jogos | Fernando Mori

JOGO DA CAMPANHA PUBLICITÁRIA

Ambev
Schin

adota campanha agressiva
não adota campanha
agressiva
adota campanha agressiva – 5, – 5 2, – 2
não adota campanha
agressiva
– 2, 2 0, 0

Há dois equilíbrios de Nash: “adota/não adota” e “não adota/adota”. Ou seja, a melhor
resposta diante do concorrente que investe em campanha agressiva é não responder e a melhor
resposta diante do concorrente que não investe em campanha agressiva é investir. O problema
é saber qual das empresas irá ceder a iniciativa da campanha agressiva para a outra e dada o
risco de se perder espaço no mercado, inclusive pela entrada de outras concorrentes, corre-se
o risco de que as duas empresas decidam adotar campanhas agressivas maximizando seus
prejuízos.
Nestes dois exemplos não se pode exigir que o equilíbrio de Nash corresponda realmente à
solução da situação.

Teoria dos Jogos | Fernando Mori

Estratégias Mistas

1) Considere o jogo de 2 jogadores conforme a matriz de prêmios dada a seguir:
Jogador II
Jogador I

O nível de segurança do jogador I é 2, se ele jogar B ele garante um prêmio de pelo menos
2. A segurança do jogador II é 3, se ele jogar R ele garante um prêmio de no máximo 3. Não
existem estratégias ótimas.
Pode um jogador garantir um prêmio melhor?
Supor que o jogador I jogue uma moeda de parâmetro ¼ (cara ¼ e coroa ¾ ). Supor que I
joga T se o resultado for cara e B se o resultado for coroa. Esta é uma estratégia mista.
Os prêmios agora deixam de ser determinísticos e passam a ser probabilísticos. Se esses
prêmios forem utilidades de um jogador, então a função utilidade do jogador I a partir
desta loteria é
1 3 5
(4) (2)
4 4 2
+ = .
Se o jogador II joga R o resultado da loteria é
1 3
(1), (3)
4 4
 
 
 
.Neste caso o prêmio será:
1 3 5
(1) (3)
4 4 2
+ = .

Se II joga L então
1 3
(4), (2)
4 4
 
 
 

Se II joga R então
1 3
(1), (2)
4 4
 
 
 

O prêmio (=utilidade) do jogador de uma loteria é o valor esperado do prêmio para aquela
loteria. Com esta definição do prêmio, o jogador I pode garantir não importa o que
aconteça seu prêmio esperado será pelo menos 5/2, ao invés de um prêmio de 2 se ele
não basear sua estratégia no sorteio da moeda.
L R min
T 4 1 1
B 2 3 2
max 4 3
Teoria dos Jogos | Fernando Mori

2) Considere o jogo de par ou ímpar:
Dois jogadores (linha e coluna) escolhem simultaneamente dois números de dedos (1 ou
2). Se a soma dos dedos dos jogadores é ímpar então o jogador linha ganha 1 de coluna. Se
a soma dos dedos for par então o jogador da coluna ganha 1 de linha.

Jogador colunas
Jogador linhas
1 dedo 2 dedos
1 dedo 1 1
2 dedos 1 1
− +
+ −

Se tivermos a probabilidade de um jogador escolher uma estratégia?

3) Considere o jogo a seguir e encontre o equilíbrio em estratégias mistas.

Jogador II

Jogador I

4) Uma moeda é jogada e o resultado é mostrado apenas ao jogador I. Ele deveentão
decidir se aposta ou passa. Se ele decidir passar então ele paga $1,00 ao jogador II e o
jogo termina. Se ele decidir apostar então o jogador II (que não conhece o resultado da
moeda) pode passar ou pagar a aposta. Se o jogador II decidir passar então ele paga
$1,00 ao jogador I e o jogo termina. Se ele decidir pagar a aposta então o jogador I
deve mostrar o resultado do sorteio. Se o resultado for cara então o jogador II paga ao
jogador I a quantia de $2,00, se o resultado for coroa então o jogador I paga ao
jogador II a quantia de $2,00.

L M R
T 2 5 -1
B 1 -2 5
Teoria dos Jogos | Fernando Mori

As estratégias do jogador I são:
Cara Coroa
P P Passa em cara, passa em coroa
A P Aposta em cara, passa em coroa
P A Passa em cara, aposta em coroa
A A Aposta em cara, aposta em coroa

Podemos resumir as estratégias mistas da seguinte forma:
As principais características de um jogo são:
1) Dois ou mais tomadores de decisão estão envolvidos.
2) As consequências (resultados) dependem das ações tomadas por todos os tomadores
de decisão.
3) Os objetivos não coincidem.
Existe uma característica importante em um jogo: todos os jogadores devem tomar uma
decisão sem saber o que os outros estão decidindo. Toda vez que um movimento é
realizado o resultado é que o jogador perde ou ganha. O jogo pode ser repetido ao
gerarmos movimentos sucessivos. Um jogo tem características similares a um problema de
decisão, mas a natureza e seus estados aleatórios são transformados em um outro jogador
que toma decisões sempre pensando no que o oponente está decidindo.
Um jogo de dois componentes pode ser representado na forma tabular 2 x 2. No caso de n
jogadores seria uma matriz n x n.

Jogador B
Jogador A ( ) ( )
( ) ( )
1 2
1 11, 11 12 12
2 21 21 22 22
,
, ,
b b
a a b a b
a a b a b
 
 
 
 
 

O jogador A pode escolher entre as alternativas
1a e 2a enquanto o jogador B pode
escolher entre
1b e 2b . Dependendo da escolha feita o resultado será uma das células da
matriz. Se o jogador A escolhe a estratégia
ia e o jogador B decide a estratégia jb o
resultado será o pagamento ija para o jogador A e o pagamento ijb para o jogador B.
Teoria dos Jogos | Fernando Mori

Se o jogo for de soma zero (um jogador ganha e o outro perde) é representado por:
Jogador B
Jogador A ( ) ( )
( ) ( )
1 2
1 11, 11 12 12
2 21 21 22 22
,
, ,
b b
a a a a a
a a a a a
 
 
− − 
 
− − 

Neste caso a tabela é simplificada supondo que os valores contidos nas células implicam
em ganho para o jogador das linhas (jogador A) e perdas para o jogador das colunas
(jogador B).
Jogador B
Jogador A
1 2
1 11 12
2 21 22
b b
a a a
a a a
 
 
 
  

Se o jogo tem um ponto de equilíbrio ele pode ser resolvido pelo método minmax: cada
jogador escolhe uma alternativa que fornece a melhor alternativa entre os possíveis
resultados:
Jogador B
Jogador A
 
 
   
1 2
1 11 12 11 12
2 21 22 21 22
11 21 12 22
max ,
max ,
max , max ,
b b
a a a a a
a a a a a
a a a a
 
 
 
 
 
 

O jogador A escolhe     11 12 21 22max min , ;min ,a a a a .
O jogador B escolhe     11 21 12 22min max , ;max ,a a a a .

Se os dois jogadores escolhem o mesmo valor e vem da mesma célula, então temos um
jogo de estratégia pura de soma zero, ou seja, existe um ponto de equilíbrio em que
nenhum jogador tem interesse em deixar. Portanto o jogador mante sua decisão mesmo
quando conhece qual decisão o oponente irá tomar. Se vários movimentos são feitos e os
jogadores não modificam suas decisões então o valor do jogo (o pagamento médio por
movimento) permanece constante e igual ao valor da célula selecionada.
Teoria dos Jogos | Fernando Mori

Se o valor escolhido for diferente o jogo não tem ponto de equilíbrio porque o jogador tem
interesse em mudar sus decisão ao tomar conhecimento da decisão de seu oponente.
Neste caso eles devem adotar a estratégia mista definida como um conjunto de
probabilidades de escolha para cada alternativa. Este conjunto pode ser resolvido
algebricamente se a matriz for 2 x 2. No caso 3 x 3 já temos um modelo de programação
linear.
Considerando o caso 2 x 2:

Jogador B
Jogador A
1 2
1 11 12
2 21 22 1
1
b b
a a a p
a a a p
q q
 
 
 
 −
 
− 

Onde p é a probabilidade com a qual o jogador A deve escolher a alternativa
1a e q é a
probabilidade do jogador B escolher a alternativa
1b .
Se ambos os jogadores selecionam essas alternativas com essas probabilidades em
momentos sucessivos, o valor do jogo (pagamento médio por movimento) é a soma dos
valores de cada célula multiplicada pela probabilidade.
( ) ( ) ( )( )11 21 12 22. . 1 . . . 1 1 1V a p q a p q a p q a p q= + − + − + − −
Para determinar sua estratégia o jogador A considera que a probabilidade p é tal que ela
lhe assegura que o jogador obtenha um valor do jogo que não mude não importa o que
seu oponente faça. Para resolver isso uma equação é obtida que iguala o valor do jogo não
importando a escolha do oponente. Assim se o jogador B escolhe
1b o valor do jogo para o
jogador A será ( )11 21. 1V a p a p= + − , se o jogador B escolher 2b o valor do jogo para o
jogador A será ( )12 22. . 1V a p a p= + − . Queremos que haja estabilidade, ou seja não
importando a escolha de B deveremos ter para o jogador A o mesmo prêmio:
( )11 21 12 221 (1 )V a p a p a p a p= + − = + −
Resolvendo essa equação podemos encontrar o valor de p.
O jogador B considera o mesmo para as escolhas de A que podem ser
1 2,a a :
( ) ( )11 12 21 221 1V a q a q a q a q= + − = + −
Resolvendo essa equação encontramos o valor de q.
Teoria dos Jogos | Fernando Mori

Se a dimensão do jogo for maior que 2 x 2 o problema se transforma em um problema de
programação linear.
Considerando um jogo 3 x 3:

Jogador B
Jogador A
1 2 3
1 11 12 13 1
2 21 22 23 2
3 31 32 33 3
1 2 3
b b b
a a a a p
a a a a p
a a a a p
q q q
 
 
 
 
 
 
  

O jogador A pode construir um modelo de PL aplicando os mesmos conceitos que no caso
2 x 2, ou seja o jogador A deseja jogar com um conjunto de probabilidades de forma que o
valor do jogo seja mentido, não importando o conjunto de probabilidades do jogador B.
Os seguintes passos devem ser seguidos:

1) Eliminar valores negativos na matriz somando um valor K em todas as células.
2) Escreva as desigualdades e alternativas para o jogador A não importando a escolha do
jogador B.

11 1 21 2 31 3
12 1 22 2 32 3
13 1 23 2 33 3
a p a p a p V
a p a p a p V
a p a p a p V
+ + 

+ + 
 + + 

3) Dividir as desigualdades por V:

31 2
11 21 31
31 2
12 22 32
31 2
13 23 33
pp p V
a a a
V V V V
pp p V
a a a
V V V V
pp p V
a a a
V V V V

+ + 


+ + 


+ + 


4) Mude a variável: i i
p
x
V
=

Teoria dos Jogos | Fernando Mori

11 1 21 2 31 3
12 1 22 2 32 3
13 1 23 2 33 3
1
1
1
a x a x a x
a x a x a x
a x a x a x
+ + 

+ + 
 + + 

5) Construímos a função objetivo usando a condição de soma de probabilidades:

1 2 3
1 2 3
1
1
p p p
x x x
V
+ + =
+ + =

Como o jogador A quer maximizar seu prêmio, ele deve então minimizaro inverso:

1 2 3
1
min
z
V
z x x x
=
= + +

6) Formule o problema de PL:

1 2 3
11 1 21 2 31 3
12 1 22 2 32 3
13 1 23 2 33 3
1 2 3
min
1
1
1
0, 0, 0
z x x x
a x a x a x
a x a x a x
a x a x a x
x x x
= + +

+ + 


+ + 
 + + 

   

7) Resolva o problema de PL encontrando os valores de  1 2 3, ,x x x .
8) Obtenha as probabilidades  1 2 3, ,p p p .

1 2 3
i
i
x
p
x x x
=
+ +

9) Obtenha o valor do jogo (subtraído o valor somado nas células):

1 2 3
1
V K
x x x
= −
+ +

O jogador B realiza calculo idêntico para  1 2 3, ,q q q e neste caso ele deve minimizar o
valor do jogo.

Exemplos:

Teoria dos Jogos | Fernando Mori

1) Dois jogadores escolhem independentemente um número 1, 2 ou 3. Se os
números forem os mesmos o jogador 1 paga ao jogador 2 esta quantia. Se não for
o mesmo número então o jogador 2 paga ao jogador 1 uma quantia igual a que o
jogador 1 escolhe. Determine o valor do jogo e as estratégias ótimas que ambos
jogadores devem seguir.

Matriz de prêmios

Jogador 2
Jogador 1
1 2 3
1 1 1 1
2 2 2 2
3 3 3 3
 
 
−
 
 −
 
− 

Não existe dominância neste jogo, sendo, portanto, um jogo de estratégia mista.

1
2
3
0,0641
0,1026
0,1154
y
y
y
=
=
=

Como temos 1 2 3
1
0,2821 3,5448
0,5448
y y y u
u
V u K
+ + = = → =
= − =

As probabilidades para o jogador 2 será:

1 1
2 2
3 3
. (0,0641).(3,5448) 0,23
. (0,1026).(3,5448) 0,36
. (0,1154).(3,5448) 0,41
p y u
p y u
p y u
= = =
= = =
= = =

A estratégia ótima para o jogador 2 será as seguintes probabilidades:
 0,23(1);0,36(2);0,41(3)
Prêmio esperado por jogada (perda): 0,5448V = .

2) Duas pessoas estão nos lados opostos de uma construção. Ambas estão
interessadas em se encontrar de forma que elas caminham em direção a um dos
cantos.
Teoria dos Jogos | Fernando Mori

B
Os jogadores têm 3 possibilidades: mover para a direita (R), mover para a esquerda (L) ou
permanecer no mesmo lugar.
Consideremos que os jogadores se encontram se os seus movimentos os levam ao mesmo
canto ou em cantos contíguos. Qual a melhor estratégia de forma a maximizar as
probabilidades de se encontrarem?

Jogador B
Jogador A
1
2
3
1 2 3
0 1 1
1 0 1
1 1 0
R L O
R p
L p
O p
q q q

3) As equipes UA e DU estão estabelecendo suas estratégias para o campeonato
nacional de basquete. Avaliando as forças de seus bancos de reservas cada um dos
treinadores estabelece quatro estratégias para a troca dos jogadores durante o
jogo. A capacidade da equipe em converter lances de 2 pontos, 3 pontos e lances
livres é um fator determinante para o placar final do jogo. A matriz seguinte
fornece o número liquido de pontos que a equipe UA marcará por posse de bola
como função de diferentes estratégias disponíveis para cada equipe. Resolva o
jogo e determine a estratégia para o campeonato.

1 2 3 4
1 3 2 1 2
2 2 3 3 0
3 1 2 2 2
4 1 2 4 1
DU DU DU DU
UA
UA
UA
UA
−
−
− −
− −

Vamos usar K = 3 para eliminar os negativos.
Teoria dos Jogos | Fernando Mori

1
2
3
4
1 2 3 4
1 6 1 4 5
2 5 6 0 3
3 2 5 1 5
4 2 1 7 4
DU DU DU DU
UA p
UA p
UA p
UA p

Teoria dos Jogos | Fernando Mori

Exemplo: Jogo de Votação da Diretoria
ESTRATÉGIAS
Eliminação Iterativa de Estratégias Estritamente Dominadas
CLASSIFICAÇÃO DOS JOGOS
MÉTODOS DE SOLUÇÕES DE JOGOS
1 – Estratégia dominante
2 – Minimax e Maximin
Método da eliminação iterativa de estratégias estritamente dominadas
Equilíbrio de Nash
Jogos de Soma Zero
Exercícios Resolvidos
JOGOS COM MAIS DE UM EQUILÍBRIO DE NASH
JOGO DO PADRÃO TECNOLÓGICO
JOGO DA CAMPANHA PUBLICITÁRIA