Buscar

IND1035_JOGOS_AULA_04

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 42 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

TEORIA 
DOS JOGOS 
 
IND1035 
 
Aula 4 
Prof. Fabrício Mello 
fabriciomrs@puc-rio.br 
Slide 2 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Estados estacionários estocásticos 
• Em muitos jogos, o melhor que um jogador 
pode fazer é tornar-se imprevisível para o 
adversário. Isso significa alterar as suas 
jogadas aleatoriamente. 
• Por ex., no jogo de pôquer (assim como em 
vários jogos da vida) o bom jogador blefa de 
vez em quando: ele sinaliza por suas apostas 
que tem uma mão mais forte do que de fato 
tem. Se ele nunca blefa, os adversários terão 
vantagem sobre ele. Se ele blefar sempre, 
também estará em desvantagem. Ele deve 
blefar de maneira imprevisível, mas calculada. 
Slide 3 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Estados estacionários estocásticos 
• O equilíbrio de Nash corresponde a um estado 
estacionário da situação idealizada em que, 
para cada jogador do jogo, existe uma 
população de indivíduos, e sempre que o jogo é 
jogado, um indivíduo é sorteado dela. 
• Num estado estacionário, o comportamento de 
cada jogador é o mesmo sempre em cada jogo. 
Nenhum jogador deseja mudar a sua ação, 
conhecendo, com base na experiência, o 
comportamento dos outros jogadores. 
• Nesta aula, estenderemos essa noção de 
estado estacionário, para lidarmos com jogos 
em que os jogadores devem alterar suas ações. 
Slide 4 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Estados estacionários estocásticos 
• Lembre do jogo das moedas, estudado antes: 
– Cada jogador escolhe se mostra ao outro a cara (K) ou 
a coroa (C) de uma moeda que tem em sua mão. 
– Se os dois mostram a mesma face das moedas, o 
jogador 1 ganha R$ 1,00 do jogador 2. Se as faces 
reveladas forem diferentes, o pagamento se inverte. 
• Como vimos, este jogo não tem um equilíbrio de 
Nash em que a ação de cada jogador é a mesma 
sempre que o jogo é jogado. 
$1,-$1 -$1,$1 
-$1,$1 $1,-$1 
K 
Jogador 2 
C 
K 
C 
Jogador 1 
Slide 5 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Estados estacionários estocásticos 
• Suponha que o jogador 2 sempre jogue da 
mesma forma (repetindo "K" ou repetindo "C"). 
O jogador 1 aprenderia com a experiência e 
imitaria o outro, garantindo o ganho de $1, 
com perda idêntica para o jogador 2. 
• Suponha agora que o jogador 2 varie as suas 
jogadas aleatoriamente, mas segundo 
probabilidades conhecidas por todos: "K" em 
90% das jogadas e "C" em 10% delas. O 
melhor que o jogador 1 pode fazer é imitar a 
jogada mais frequente ("K"), levando o seu 
ganho esperado para $0,80. (Por quê?) 
Slide 6 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Estados estacionários estocásticos 
• Naturalmente, o jogador 2 não ficará satisfeito 
com as duas situações anteriores. Qualquer 
jogada determinística, ou qualquer estratégia 
probabilística em que uma das ações seja mais 
provável do que a outra, dá uma vantagem ao 
jogador 1, em prejuízo do jogador 2. 
• Mas suponha, finalmente, que o jogador 2 passe 
a jogar "K" e "C" com a mesma probabilidade. 
Neste caso, seja qual for a jogada do jogador 1, 
inclusive misturas probabilísticas de jogadas, o 
seu ganho esperado é o mesmo: $0,5. 
• O ganho esperado do jogador 2 também: $0,5. 
Slide 7 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Estados estacionários estocásticos 
• No jogo das moedas, se os dois jogadores estão 
sorteando as suas ações, a cada jogada, com 
probabilidades uniformes (½), o ganho esperado 
deles é idêntico. 
• Se um deles desviar-se dessa estratégia, 
passando a jogar "K" e "C" com probabilidades 
diferentes, imediatamente dará uma vantagem 
ao outro jogador, em detrimento próprio. Não 
há incentivo para os jogadores deixarem essa 
estratégia, num estado estacionário. 
• Reencontramos, assim, o mesmo conceito do 
equilíbrio de Nash, mas com estratégias mistas. 
Slide 8 
Preferências vNM 
• Admitir que jogadores possam sortear suas 
jogadas cria um problema: como especificar 
as preferências dos jogadores sobre loterias 
que envolvem os perfis de ações. 
• As funções de ganho ordinais que usamos até 
agora especificam as preferências dos 
jogadores entre perfis determinísticos. 
• Por isso, para expandirmos a TdJ para que 
possamos analisar jogos em que as ações são 
probabilísticas, um pré-requisito é criar uma 
nova função de ganho, mais poderosa em sua 
capacidade descritiva. 
IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Slide 9 
Preferências vNM 
• A primeira análise sistemática desse tipo de 
representação abrangente de preferências 
deve-se a von Neumann e Morgenstern (vNM). 
• vNM elencaram quatro axiomas sobre as 
preferências de um agente racional entre 
loterias e demonstraram que, na validade 
desses axiomas, as preferências do agente 
podem ser representadas pelo valor esperado 
de uma função de ganho não ordinal aplicada 
sobre os perfis determinísticos. 
• A seguir, formalizamos os axiomas e o 
teorema relevante de vNM. 
IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Slide 10 
Axiomas das Preferências vNM 
• Para loterias 𝐿,𝑀,𝑁 e 
probabilidade 𝑝 ∈ [0,1]: 
1. Completude 
𝐿 ≺ 𝑀, 𝑀 ≺ 𝐿 ou 𝐿~𝑀. 
2. Transitividade 
Se 𝐿 ≼ 𝑀 e 𝑀 ≼ 𝑁 então 𝐿 ≼ 𝑁. 
3. Continuidade 
Se 𝐿 ≺ 𝑀 ≺ 𝑁 então: 
∃𝑝 tal que 𝑝𝐿 + 1 − 𝑝 𝑁 = 𝑀. 
4. Independência 
Se 𝐿 ≺ 𝑀 então, para qualquer 𝑁, 
𝑝𝐿 + 1 − 𝑝 𝑁 ≺ 𝑝𝑀 + 1 − 𝑝 𝑁. 
IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Slide 11 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Preferências vNM 
Teorema da existência da 
função de ganho de Bernoulli 
 
Suponha que as preferências de um agente 
sobre loterias atendem aos quatro axiomas 
de racionalidade vNM. Então, existe uma 
função de ganho 𝑢 que designa um número 
real 𝑢(𝑎𝑖) a cada perfil de ação determinístico 
𝑎𝑖, tal que as preferências do agente sobre 
loterias envolvendo os perfis de ações são 
bem representadas pelo valor esperado de 𝑢. 
A função 𝑢 que representa preferências vNM será 
denominada função de ganho de Bernoulli. 
Slide 12 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Preferências vNM: Exemplo 
• Suponha que existam três resultados possíveis, 
numa situação decisória: $0, $1 e $5. 
• Para um TD (naturalmente): $0 ≺ $1 ≺ $5. 
• Definam-se as loterias: 
𝐿: 𝑃 $0 = 50% e 𝑃 $5 = 50%. 
𝑀:𝑃 $1 = 75% e 𝑃 $5 = 25%. 
• Suponha que, para o TD, 𝐿 ≻ 𝑀. Essa 
preferência é consistente com preferências 
representadas por uma função de ganho em 
que 𝑢 0 = 0, 𝑢 1 = 1 e 𝑢 5 = 4, pois: 
 
1
2
× 0 +
1
2
× 4 >
3
4
× 1 +
1
4
× 4 
Slide 13 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Jogos Estratégicos: Definição Expandida 
• DEFINIÇÃO: Um jogo estratégico 
(com preferências vNM) consiste em: 
 Um conjunto de jogadores. 
 Para cada jogador, um conjunto de ações. 
 Para cada jogador, preferências sobre 
loterias envolvendo perfis de ações, 
preferências essas que podem ser 
representadas pelo valor esperado de 
alguma função de ganho ("de Bernoulli"). 
• Se um jogo admite jogadas aleatórias, 
vamos supor preferências vNM. 
Slide 14 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Teste 
• Considere os dois jogos abaixo, que representam 
o dilema dos prisioneiros, se os ganhos nas 
matrizes forem ordinais (por quê?). 
• Considere a possibilidade de que o jogador 2 
selecione sua ação aleatoriamente, com mesma 
probabilidade para Q e F, e verifique que as 
matrizes representam jogos estratégicos 
diferentes se os ganhos são vNM. 
3,3 0,4 
4,0 1,1 
Q F 
Q 
F 
2,2 0,3 
3,0 1,1 
F 
Q 
F 
Q 
Slide 15 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Estratégias Mistas 
DEFINIÇÃO: Uma estratégia mista de um 
jogador em um jogo estratégico consistenuma distribuição de probabilidades sobre as 
ações disponíveis para o jogador. 
• Representaremos por 𝛼 um perfil de estratégias 
mistas. Assim, 𝛼𝑖(𝑎𝑖) representa a probabilidade 
com a qual o jogador 𝑖 escolhe a ação 𝑎𝑖, na 
sua estratégia mista 𝛼𝑖. 
• Neste contexto em que estratégias mistas são 
admitidas, quando um jogador escolhe uma 
ação deterministicamente dizemos que ele está 
utilizando uma estratégia pura. 
Slide 16 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Exemplo 
• Suponha que, no jogo das moedas, o jogador 1 
jogue "K" com probabilidade 1/3 e "C" com 
probabilidade 2/3. O jogador 2 sempre joga "K". 
• Então, escrevemos: 
𝛼1 𝐾 = 1 3 ; 𝛼1 𝐶 = 2 3 ; 𝛼2 𝐾 = 1; e 𝛼1 𝐶 = 0. 
• Notação abreviada: 𝛼1 = (1 3 , 2 3) e 𝛼2 = (1,0). 
• Neste exemplo, o jogador 2 está utilizando uma 
estratégia pura. 
Slide 17 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Equilíbrio de Nash com preferências vNM 
DEFINIÇÃO: Um perfil de estratégias mistas 𝛼∗ em um jogo 
estratégico com preferências vNM é um equilíbrio de 
Nash (com estratégias mistas) se, para cada jogador 𝑖 
e cada estratégia mista 𝛼𝑖 do jogador 𝑖, o ganho esperado 
de 𝛼∗ para o jogador 𝑖 é pelo menos tão grande quanto o 
ganho esperado de (𝛼𝑖 , 𝛼−𝑖
∗ ) para o jogador 𝑖, segundo uma 
função de ganho cujo valor esperado representa as 
preferências do jogador 𝑖 sobre loterias. 
ALTERNATIVAMENTE: Um perfil de estratégias mistas 𝛼∗ 
em um jogo estratégico com preferências vNM é um 
equilíbrio de Nash se, para cada jogador 𝑖 e cada 
estratégia mista 𝛼𝑖 do jogador 𝑖: 𝑢𝑖 (𝛼
∗) ≥ 𝑢𝑖 (𝛼𝑖 , 𝛼−𝑖
∗ ). 
Obs.: Na definição alternativa, 𝑢𝑖 𝛼 é o ganho esperado do 
perfil de estratégias mistas 𝛼, para o jogador 𝑖. 
Slide 18 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Função de Melhor Resposta 
com preferências vNM 
 
 
 
 
 
 
 
 
• Isto é: qualquer estratégia mista em 𝐵𝑖(𝛼−𝑖) leva 
a um ganho esperado pelo menos tão grande 
para o jogador 𝑖 quanto qualquer outra, se os 
outros jogadores jogam segundo 𝛼−𝑖. 
DEFINIÇÃO: Seja 𝛼−𝑖 o conjunto das estratégias 
mistas dos jogadores que não são o jogador 𝑖. 
Seja Α𝑖 o conjunto de estratégias mistas do 
jogador 𝑖. A função de melhor resposta com 
preferências vNM do jogador 𝑖 é: 
 
𝐵𝑖 𝛼−𝑖 = 𝛼𝑖 ∈ Α𝑖: 𝑢 𝑖 𝛼𝑖 , 𝛼−𝑖 ≥ 𝑢 𝑖 𝛼𝑖
′, 𝛼−𝑖 ∀ 𝛼𝑖
′ ∈ Α𝑖 
 
Slide 19 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Como já fizemos, redefinimos o equilíbrio de 
Nash em termos da função de melhor resposta: 
 
DEFINIÇÃO: Um perfil de estratégias mistas 𝛼∗ 
em um jogo estratégico com preferências vNM é 
um equilíbrio de Nash com estratégias 
mistas se e apenas se a estratégia mista de 
cada jogador é uma melhor resposta para as 
estratégias mistas dos outros jogadores. Ou 
seja, para todo jogador 𝑖, vale: 
 
𝛼𝑖
∗ ∈ 𝐵𝑖(𝛼−𝑖
∗ ) 
Função de Melhor Resposta 
com preferências vNM 
Slide 20 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Analisamos agora jogos com dois jogadores, cada um 
dispondo de duas ações, com estratégias mistas. 
• Suponha que o jogador 1 dispõe das ações T e B, e segue 
a estratégia mista (𝑝, 1 − 𝑝). 
• Suponha, similarmente, que o jogador 2 dispõe das ações 
L e R, e segue a estratégia mista (𝑞, 1 − 𝑞). 
• Sendo as jogadas independentes, a tabela abaixo contém 
a distribuição de probabilidade conjunta das ações. 
• Cada célula contém a probabilidade de ocorrência do 
perfil de ações correspondente. 
 
Jogos de 2 jogadores, 2 ações, 
e estratégias mistas 
pq p(1 – q) 
(1 – p)q (1 – p)(1 – q) 
L (q) R (1 - q) 
T (p) 
B (1 - p) 
Slide 21 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Ganho esperado do perfil de estratégias mistas (𝛼1, 𝛼2) 
para o jogador 1: 
 
𝑢 1 = 𝑝𝑞 ∙ 𝑢1 𝑇, 𝐿 + 𝑝 1 − 𝑞 ∙ 𝑢1 𝑇, 𝑅 
+ 1 − 𝑝 𝑞 ∙ 𝑢1 𝐵, 𝐿 + 1 − 𝑝 1 − 𝑞 ∙ 𝑢1 𝐵, 𝑅 
 
• Ou, rearranjando os termos: 
 
𝑢 1 = 𝑝 𝑞 ∙ 𝑢1 𝑇, 𝐿 + 1 − 𝑞 ∙ 𝑢1 (𝑇, 𝑅)
+ 1 − 𝑝 𝑞 ∙ 𝑢1 𝐵, 𝐿 + 1 − 𝑞 ∙ 𝑢1 𝐵, 𝑅 
 
• Observe que os termos entre colchetes são os ganhos 
esperados para o jogador 1 das suas estratégias puras. 
Jogos de 2 jogadores, 2 ações, 
e estratégias mistas 
Slide 22 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Definindo os ganhos esperados das estratégias puras do 
jogador 1 como: 
 
𝐸1 𝑇, 𝛼2 = 𝑞 ∙ 𝑢1 𝑇, 𝐿 + 1 − 𝑞 ∙ 𝑢1 𝑇, 𝑅 
 
𝐸1 𝐵, 𝛼2 = 𝑞 ∙ 𝑢1 𝐵, 𝐿 + 1 − 𝑞 ∙ 𝑢1 𝐵, 𝑅 
 
podemos rescrever a expressão do ganho esperado do 
jogador 1 como uma média ponderada dos ganhos das 
suas estratégias puras: 
 
𝑢 1 = 𝑝𝐸1 𝑇, 𝛼2 + 1 − 𝑝 𝐸1 𝐵, 𝛼2 
 
• O ganho esperado do jogador 1 é uma função linear de 𝑝. 
Jogos de 2 jogadores, 2 ações, 
e estratégias mistas 
Slide 23 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Caso 1: 𝐸1 𝑇, 𝛼2 > 𝐸1(𝐵, 𝛼2) 
Jogos de 2 jogadores, 2 ações, 
e estratégias mistas 
𝐸1(𝑇, 𝛼2) 
𝐸1(𝐵, 𝛼2) 
𝑢 1 
0 1 𝑝 
𝑝𝐸1 𝑇, 𝛼2 + 
1 − 𝑝 𝐸1(𝐵, 𝛼2) 
Slide 24 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Caso 2: 𝐸1 𝑇, 𝛼2 < 𝐸1(𝐵, 𝛼2) 
Jogos de 2 jogadores, 2 ações, 
e estratégias mistas 
𝐸1(𝑇, 𝛼2) 
𝐸1(𝐵, 𝛼2) 
𝑢 1 
0 1 𝑝 
𝑝𝐸1 𝑇, 𝛼2 + 
1 − 𝑝 𝐸1(𝐵, 𝛼2) 
Slide 25 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Os gráficos anteriores mostram que o jogador 1 
maximiza o seu ganho esperado jogando uma 
estratégia pura (i.e., fazendo 𝑝 = 0 ou 𝑝 = 1) se 
𝐸1(𝑇, 𝛼2) ≠ 𝐸2(𝐵, 𝛼2): 
– Se 𝐸1 𝑇, 𝛼2 > 𝐸1(𝐵, 𝛼2): O jogador 1 deve adotar a 
estratégia pura (1,0). 
– Se 𝐸1 𝑇, 𝛼2 < 𝐸1(𝐵, 𝛼2): O jogador 1 deve adotar a 
estratégia pura (0,1). 
• Entretanto, se 𝐸1 𝑇, 𝛼2 = 𝐸2(𝐵, 𝛼2), então todas 
as estratégias mistas do jogador 1 são melhores 
respostas (levam ao mesmo ganho esperado). 
• A análise é similar para o jogador 2. 
Jogos de 2 jogadores, 2 ações, 
e estratégias mistas 
Slide 26 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Voltemos ao jogo das moedas: 
 
 
 
 
 
• O jogador 1 usa a estratégia mista (𝑝, 1 − 𝑝) e o jogador 2 
usa a estratégia mista (𝑞, 1 − 𝑞). 
• Suas funções de ganho de Bernoulli correspondem aos 
ganhos financeiros (neutralidade ao risco). 
• Ganhos esperados das estratégias puras do jogador 1: 
 
𝐸1 𝐾, 𝛼2 = 𝑞 ∙ 1 + 1 − 𝑞 ∙ −1 = 2𝑞 − 1 
𝐸1 𝐶, 𝛼2 = 𝑞 ∙ −1 + 1 − 𝑞 ∙ 1 = 1 − 2𝑞 
Exemplo: O Jogo das Moedas 
$1,-$1 -$1,$1 
-$1,$1 $1,-$1 
K 
Jogador 2 
C 
K 
C 
Jogador 1 
Slide 27 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• A função de melhor resposta do jogador 1 é: 
 
𝐵1 𝑞 = 
0 se 𝑞 < 1 2 
𝑝: 0 ≤ 𝑝 ≤ 1 se 𝑞 = 1 2 
1 se 𝑞 > 1 2 
 
 
• A do jogador 2 é simétrica: 
 
𝐵2 𝑝 = 
1 se 𝑝 < 1 2 
𝑞: 0 ≤ 𝑞 ≤ 1 se 𝑝 = 1 2 
0 se 𝑝 > 1 2 
 
 
 
Exemplo: O Jogo das Moedas 
Slide 28 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Exemplo: O Jogo das Moedas 
0 1 𝑝 → 
1 
↑ 
𝑞 
𝐵1 
𝐵2 
Equilíbrio 
de Nash 
1 2 
1 2 
Slide 29 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Voltemos agora ao jogo da batalha dos sexos: 
 
 
 
 
 
 
• Ele usa a estratégia mista (𝑝, 1 − 𝑝) 
• Ela usa a estratégia mista (𝑞, 1 − 𝑞). 
• O casal tem preferências vNM e as funções de 
ganho que preenchem a tabela são de Bernoulli. 
Exemplo: Batalha dos Sexos 
2,1 0,0 
0,0 1,2 
B 
Ela 
S 
B 
S 
Ele 
Slide 30 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Ganhos esperados das estratégias 
puras do homem: 
 
𝐸1 𝐵, 𝛼2 = 𝑞 ∙ 2 + 1 − 𝑞 ∙ 0 = 2𝑞 
𝐸1 𝑆, 𝛼2 = 𝑞 ∙ 0 + 1 − 𝑞 ∙ 1 = 1 − 𝑞 
 
• Ganhos esperados das estratégias 
puras da mulher: 
 
𝐸2 𝐵, 𝛼1 = 𝑝 ∙ 1 + 1 − 𝑝 ∙ 0 = 𝑝 
𝐸2 𝑆, 𝛼1 =𝑝 ∙ 0 + 1 − 𝑝 ∙ 2 = 1 − 2𝑝 
Exemplo: Batalha dos Sexos 
Slide 31 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• A função de melhor resposta do homem é: 
 
𝐵1 𝑞 = 
0 se 𝑞 < 1 3 
𝑝: 0 ≤ 𝑝 ≤ 1 se 𝑞 = 1 3 
1 se 𝑞 > 1 3 
 
 
• A função de melhor resposta da mulher é: 
 
𝐵2 𝑝 = 
0 se 𝑝 < 2 3 
𝑞: 0 ≤ 𝑞 ≤ 1 se 𝑝 = 2 3 
1 se 𝑝 > 2 3 
 
 
 
Exemplo: Batalha dos Sexos 
Slide 32 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Exemplo: Batalha dos Sexos 
0 1 𝑝 → 
1 
↑ 
𝑞 
𝐵1 
𝐵2 
1 3 
2 3 
 = 
Equilíbrios 
de Nash 
Observe que o jogo 
tem três equilíbrios. Os 
dois equilíbrios com 
estratégias puras já 
eram conhecidos. O 
terceiro equilíbrio surge 
quando se admitem 
estratégias mistas. 
Slide 33 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Duas pessoas precisam realizar uma certa tarefa mas 
só conseguirão se, e apenas se, ambas trabalharem. 
• É melhor para as duas que a tarefa seja cumprida. 
• O pior cenário para alguém é esforçar-se enquanto o 
parceiro fica ocioso. Neste caso, quem se esforçou 
perde tempo/energia, e a tarefa não é cumprida. 
• As preferências vNM dos jogadores são representadas 
pelo valor esperado da função de ganho de Bernoulli 
dada na tabela abaixo, onde 𝑐 < 1 representa o esforço 
individual como uma fração da recompensa pela 
entrega da tarefa. 
Exemplo: Jogo da Coordenação 
0,0 0,-c 
-c,0 1-c,1-c 
Trabalho Ócio 
Trabalho 
Ócio 
Slide 34 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
• Ganhos esperados das estratégias puras do jogador 1 
(e por simetria, idem para o jogador 2): 
 
𝐸1 Ócio, 𝛼2 = 𝑞 ∙ 0 + 1 − 𝑞 ∙ 0 = 0 
𝐸1 Trabalho, 𝛼2 = 𝑞 ∙ −𝑐 + 1 − 𝑞 ∙ 1 − 𝑐 = 1 − 𝑐 − 𝑞 
 
• Função de melhor resposta dos dois jogadores: 
 
𝐵𝑖 𝑞 = 
0 se 𝑞 < 1 − 𝑐
𝑝: 0 ≤ 𝑝 ≤ 1 se 𝑞 = 1 − 𝑐
1 se 𝑞 > 1 − 𝑐
 
 
• Observe que o jogo tem três equilíbrios, de forma 
similar à batalha dos sexos. 
Exemplo: Jogo da Coordenação 
Slide 35 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Exemplo: Jogo da Coordenação 
0 1 𝑝 → 
1 
↑ 
𝑞 
𝐵1 
𝐵2 
1 − 𝑐 
 = 
Equilíbrios 
de Nash 
Interpretação possível: Se 
o percentual de tempo em 
que meu parceiro fica 
ocioso é inferior ao ganho 
líquido com a entrega da 
tarefa, é melhor eu sempre 
trabalhar. Se o percentual 
de tempo em que ele fica 
ocioso é maior do que o 
ganho líquido com a 
entrega, é melhor eu nunca 
trabalhar. No caso limítrofe, 
é indiferente o que faço. 
1 − 𝑐 
Slide 36 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Teste 
• Encontre todos os equilíbrios de Nash dos dois 
jogos abaixo, admitindo estratégias mistas. 
• Siga os passos dos exemplos anteriores, 
escrevendo os ganhos esperados das estratégias 
puras e deduzindo a partir deles as funções de 
melhor resposta. 
0,1 0,2 
2,2 0,1 
L R 
T 
B 
6,0 0,6 
3,2 6,0 
R 
T 
B 
L 
Slide 37 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
PROPOSIÇÃO: Um perfil de estratégias mistas 𝛼∗ em um jogo 
estratégico com preferências vNM no qual cada jogador dispõe 
de um número finito de ações é um equilíbrio de Nash com 
estratégias mistas se e apenas se, para cada jogador 𝑖, 
 
• o ganho esperado, dado 𝛼−𝑖
∗ , de cada ação para a qual 𝛼𝑖
∗ 
designa uma probabilidade não nula é o mesmo; e 
 
• o ganho esperado, dado 𝛼−𝑖
∗ , de cada ação para a qual 𝛼𝑖
∗ 
designa uma probabilidade nula é no máximo igual ao 
ganho esperado de qualquer ação para a qual 𝛼𝑖
∗ designa 
uma probabilidade não nula. 
 
No equilíbrio, o ganho esperado de qualquer jogador é igual ao 
ganho esperado de qualquer ação que ele eventualmente usa. 
Caracterização do equilíbrio de Nash 
com estratégias mistas 
Slide 38 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Exemplo 
• No jogo abaixo, os asteriscos representam ganhos 
quaisquer. O jogador 1 joga nas linhas. 
• Pela proposição do slide anterior, as estratégias 
mistas 𝛼1 = (3 4,0, 1 4) e 𝛼2 = (0, 1 3, 2 3) constituem 
um equilíbrio de Nash. Verifique, calculando o 
ganho esperado das estratégias puras. 
*,2 3,3 1,1 
*,* 0,* 2,* 
*,4 5,1 0,7 
R 
T 
M 
L C 
B 
Slide 39 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
PROPOSIÇÃO 
Todo jogo estratégico com preferências 
vNM no qual cada jogador tem um 
número finito de ações tem equilíbrio(s) 
de Nash com estratégias mistas 
Existência de equilíbrios 
em jogos finitos 
• A finitude do jogo é uma condição suficiente mas 
não necessária para a existência de um equilíbrio. 
• No equilíbrio, é possível que um ou mais (ou todos) 
jogadores designem probabilidade 1 para uma das 
suas ações disponíveis. 
Slide 40 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Dominância com preferências vNM 
• Estendemos agora a definição de dominância 
para admitir estratégias mistas. 
 DEFINIÇÃO: Em um jogo estratégico com 
preferências vNM, a estratégia mista 𝛼𝑖 do 
jogador 𝑖 domina estritamente a sua ação 
𝑎𝑖
′ se 
𝑢 𝑖 𝛼𝑖 , 𝑎−𝑖 > 𝑢𝑖 𝑎𝑖
′, 𝑎−𝑖 
 
para cada lista 𝑎−𝑖 de ações dos outros 
jogadores, onde 𝑢𝑖 é uma função de ganho 
de Bernoulli e 𝑢 𝑖 representa o seu valor 
esperado. Dizemos, neste caso, que a 
jogada 𝑎𝑖
′ é estritamente dominada. 
Slide 41 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Exemplo 
• No jogo ao lado, apenas os 
ganhos (vNM) do jogador que 
joga nas linhas são mostrados. 
• Nenhuma ação é dominada por 
uma estratégia pura. 
• Entretanto, a ação T é 
estritamente dominada pela 
estratégia mista (0, 1 2, 1 2 ). 
1 1 
4 0 
0 3 
T 
M 
L 
B 
R 
Slide 42 IND1035 
fabriciomrs@puc-rio.br 
Aula 4 
Dominância fraca com preferências vNM 
DEFINIÇÃO: Em um jogo estratégico com 
preferências vNM, a estratégia mista 𝛼𝑖 do jogador 𝑖 
domina fracamente a sua ação 𝑎𝑖
′ se 
 
𝑢 𝑖 𝛼𝑖 , 𝑎−𝑖 ≥ 𝑢𝑖 𝑎𝑖
′, 𝑎−𝑖 
 
para cada lista 𝑎−𝑖 de ações dos outros jogadores e 
 
𝑢 𝑖 𝛼𝑖 , 𝑎−𝑖 > 𝑢𝑖 𝑎𝑖
′, 𝑎−𝑖 
 
para alguma lista 𝑎−𝑖 de ações dos outros jogadores, 
onde 𝑢𝑖 é uma função de ganho de Bernoulli e 𝑢 𝑖 
representa o seu valor esperado. Dizemos então que 
𝑎𝑖
′ é fracamente dominada.

Outros materiais

Outros materiais