Teoria dos Jogos: Soma não constante

•

UFF

1

0

1

0

Marcus Paulo Cazoni

03/11/2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 6 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Pesquisa Operacional 2

1.560 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Universidade Federal Fluminense 
Profª. Lídia 1 
DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO – VEP 
PESQUISA OPERACIONAL II 
PROFª. LÍDIA 
 
 Dominância 
 
Em termos da Teoria dos Jogos, dizemos que dois jogadores possuem uma estratégia 
dominante quando todas menos uma estratégia é estritamente dominada, e o jogo é 
resolúvel por dominância estrita iterada. O jogo termina em uma solução que é um 
equilíbrio de estratégia dominante. Estes conceitos serão definidos a seguir. 
 
 
 
Considere o jogo: 
 
 
Neste jogo, para o jogador g2, a estratégia s21 é estritamente dominada pela estratégia 
s24, assim, a primeira coluna da matriz pode ser eliminada. 
 
 
 
Agora, nesta matriz reduzida, para o jogador g1, as estratégias s11 e s14 são estritamente 
dominadas pelas estratégias s12 e s13, respectivamente. Portanto, as linhas 1 e 4 podem 
 Universidade Federal Fluminense 
Profª. Lídia 2 
ser eliminadas. Além disso, a estratégia s23 do jogador g2 é estritamente dominada pela 
estratégia s22. Assim, a coluna 2 também pode ser eliminada. Obtemos então uma matriz 
reduzida 2 × 2. 
 
 
Finalmente, a estratégia s24 do jogador g2 é estritamente dominada pela estratégia s22 e, 
na matriz 2 × 1 resultante, a estratégia s13 do jogador g1 é estritamente dominada pela 
estratégia s12. Vemos então que o resultado do jogo é (3, 2), isto é, o jogador g1 escolhe 
a estratégia s12 e o jogador g2 escolhe a estratégia s22. 
 
 
O Equilíbrio de Nash 
 
 
 
É uma jogada para a qual uma estratégia é a melhor resposta à outra, 
Ou, 
Cada estratégia é a melhor resposta possível às estratégias dos demais jogadores e isso é 
verdade para todos os jogadores. 
 
Num Jogo estável, temos um Equilíbrio de Nash determinístico (Estratégias puras). 
Nestes tipos de jogos, os jogadores repetem as estratégias. Neste caso, os dois jogadores 
“concordam” com a solução: minimax = maximin = Equilíbrio de Nash, ponto de sela. 
 
No caso de Jogos instáveis, um jogador muda a estratégia como resposta à estratégia do 
outro. Eles não têm Equilíbrio de Nash se for jogado uma só vez. O jogo é resolvido em 
termos de probabilidades. 
O jogo tem que ser jogado várias vezes para se obter um Equilíbrio de Nash em 
estratégias mistas, isto é, com alternância aleatória de estratégias, segundo uma 
determinada distribuição de probabilidade. 
 
 
Jogos de Soma Não Constante 
 
 
 Universidade Federal Fluminense 
Profª. Lídia 3 
Exemplo 1.1: O dilema do prisioneiro 
 
Ele foi formulado por Albert W. Tucker, em 1950, em um seminário para psicólogos na 
Universidade de Stanford, para ilustrar a dificuldade de se analisar certos tipos de jogos. 
A situação é a seguinte: dois ladrões, Al e Bob, são capturados e acusados de um 
mesmo crime. Presos em selas separadas e sem poder se comunicar entre si, o delegado 
de plantão faz a seguinte proposta: cada um pode escolher entre confessar ou negar o 
crime. Se nenhum deles confessar, ambos serão submetidos a uma pena de 1 ano. Se os 
dois confessarem, então ambos terão pena de 5 anos. Mas se um confessar e o outro 
negar, então o que confessou será libertado e o outro será condenado a 10 anos de 
prisão. 
 
 
 
Matriz de ganhos em que cada célula contém os ganhos de Al e Bob para as estratégias 
correspondentes. 
Observe que não importa o que Al escolher: a melhor resposta de Bob será sempre 
Confessar, assim Confessar é a estratégia dominante para Bob. 
Da mesma forma, não importa o que Bob escolher: a melhor resposta de Al será sempre 
Confessar. 
Então o único Equilíbrio de Nash para este jogo é (Confessar, Confessar), muito embora 
(Negar, Negar) traga melhores recompensas para os dois jogadores. 
O único Equilíbrio de Nash é ineficiente. 
O Dilema dos prisioneiros: Jogo que exemplifica o fato de que resultados Pareto-
preferíveis não necessariamente vão ocorrer. 
Decisão pessimista. 
 
 
Exemplo 1.2: A batalha dos sexos 
 
Um homem e a sua mulher desejam sair para passear. O homem prefere assistir a um 
jogo de futebol enquanto que sua mulher prefere ir ao cinema. Se eles forem juntos para 
o futebol, então o homem tem satisfação maior do que a mulher. Por outro lado, se eles 
forem juntos ao cinema, então a mulher tem satisfação maior do que o homem. 
Finalmente, se eles saírem sozinhos, então ambos ficam igualmente insatisfeitos. Esta 
situação também pode ser modelada como um jogo estratégico. 
 
 
 Universidade Federal Fluminense 
Profª. Lídia 4 
(a) No dilema do prisioneiro (Exemplo 1.1), o perfil de estratégia (Confessar, 
Confessar) é um Equilíbrio de Nash. De fato: se um prisioneiro confessar e o outro não, 
aquele que não confessou fica preso na cadeia 10 anos, ao invés de 5 anos, se tivesse 
confessado. Além desse perfil, não existem outros Equilíbrios de Nash. 
(b) Na batalha dos sexos (Exemplo 1.2), os perfis de estratégia (Futebol, Futebol) e 
(Cinema, Cinema) são os únicos Equilíbrios de Nash do jogo. 
(c) No Exemplo 1, o único Equilíbrio de Nash do jogo é o perfil de estratégia (s12, s22). 
(d) Existem jogos que não possuem Equilíbrios de Nash em estratégias puras. 
 
Este é o caso do jogo de combinar moedas (matching pennies). Nesse jogo, dois 
jogadores exibem, ao mesmo tempo, a moeda que cada um esconde em sua mão. Se 
ambas as moedas apresentam cara ou coroa, o segundo jogador dá sua moeda para o 
primeiro. Se uma das moedas apresenta cara, enquanto a outra apresenta coroa, é a vez 
do primeiro jogador dar sua moeda para o segundo. Esse jogo se encontra representado 
por sua matriz de ganhos dada a seguir. 
 
 
 
 
Outro exemplo: 
 
A e B são dois jogadores de tênis. O jogador A tem duas estratégias: “Alto” e “Baixo”. 
Já o jogador B tem duas estratégias: “Esquerda” e “Direita”. A tabela que mostra as 
recompensas, para cada jogador, de cada uma das quatro possíveis combinações 
estratégicas, é a matriz de ganhos (payoffs) a seguir. 
 
Jogador B
Jogador A
E D
A
B
(3,9)
(0,0)
(1,8)
(2,1)
Jogador B
Jogador A
E D
A
B
(3,9)
(0,0)
(1,8)
(2,1)
E D
A
B
(3,9)
(0,0)
(1,8)
(2,1)
E D
A
B
(3,9)
(0,0)
(1,8)
(2,1)
 
 
Os ganhos do jogador A são apresentados à esquerda das vírgulas, os ganhos do jogador 
B são apresentados à direita das vírgulas. Se A jogar Alto e B jogar Direita, então o 
ganho de A é 1 e o ganho de B é 8. 
Se o jogador B jogar Direita, então a melhor resposta do jogador A é Baixo, porque isto 
melhora o ganho de A de 1 para 2. Logo, (A,D) não ocorreria. 
 
Se o jogador B jogar Direita, então a melhor resposta do jogador A é Baixo. Se o 
jogador A jogar Baixo, então a melhor resposta do jogador B é Direita. Logo, (B,D) é 
uma jogada provável. 
 
 Universidade Federal Fluminense 
Profª. Lídia 5 
Neste exemplo, tem-se dois Equilíbrios de Nash: (A,E) e (B,D). Mas qual de fato 
ocorrerá? Note que (A,E) é preferível a (B,D) para os dois jogadores. Deverá então 
ocorrer apenas (A,E)? 
 
Voltando ao exemplo do jogo de tênis: o resultado do jogo é de estratégia pura. Assim, 
(A,E) e (B,D) são Equilíbrios de Nash com estratégias puras. 
 
 
Outro exemplo 
 
(1,2) (0,4)
(0,5) (3,2)
A
B
E D
Jogador A
(1,2) (0,4)
(0,5) (3,2)
A
B
E D
Jogador A
 
 
(A,E) é um Equilíbrio de Nash? Não. 
(A,D) é um Equilíbrio de Nash? Não. 
(B,E) é um Equilíbrio de Nash? Não. 
(B,D) é um Equilíbrio de Nash? Não. 
Este jogo não tem Equilíbrio de Nash com estratégias puras, mas tem com estratégias 
mistas. 
 
Em vez de jogar puramente Alto ou Baixo, o jogador A pode escolher jogar Alto com 
probabilidade pA ou jogar Baixo com probabilidade 1- pA. Ou seja, ele pode selecionar 
uma distribuição de probabilidade (pA, 1- pA). Como A está misturando as estratégias 
puras Alto e Baixo, a distribuição de probabilidade(pA, 1- pA) é a sua estratégia mista. 
 
Similarmente, o jogador B escolhe jogar Esquerda com probabilidade pE ou jogar 
Direita com probabilidade 1- pE. Ou seja, ele escolhe a distribuição de probabilidade 
(pE,1- pE). Como ele está misturando as estratégias puras Esquerda e Direita, a 
distribuição de probabilidade (pE,1- pE) é a sua estratégia mista. 
 
(1,2) (0,4)
(0,5) (3,2)
Jogador B
Jogador A
E,pipipipiE D,1−−−−pipipipiE
A,pipipipiA
B,1−−−−pipipipiA
(1,2) (0,4)
(0,5) (3,2)
Jogador B
Jogador A
E,pipipipiE D,1−−−−pipipipiE
A,pipipipiA
B,1−−−−pipipipiA
 
 
Se B jogar Esquerda, seu ganho esperado é 2 pA+ 5(1- pA). 
 
5
16
5
10
5
6
5
25
5
32 =+=�
�
�
�
�
�
×+�
�
�
�
�
�
× 
 
Se B jogar Direita, seu ganho esperado é 4 pA + 2(1- pA). 
 
 Universidade Federal Fluminense 
Profª. Lídia 6 
5
16
5
4
5
12
5
22
5
34 =+=�
�
�
�
�
�
×+�
�
�
�
�
�
× 
 
Se 2 pA+ 5(1- pA) > 4 pA + 2(1- pA), então B jogará apenas Esquerda. Mas não existe 
Equilíbrio de Nash com B jogando apenas Esquerda. 
Se 2 pA+ 5(1- pA) < 4 pA + 2(1- pA), então B jogará apenas Direita. Mas não existe 
Equilíbrio de Nash com B jogando apenas Direita. 
Então, somente existirá Equilíbrio de Nash quando B for indiferente entre jogar 
Esquerda ou Direita, o que ocorre quando 2 pA+ 5(1- pA) = 4 pA + 2(1- pA) então pA = 
3/5. 
Para A: Se A jogar Alto, seu ganho esperado é 1 pE + 0(1- pE) = pE. 
Se A jogar Baixo, seu ganho esperado é 0 pE + 3(1 - pE) = 3(1 - pE). 
Para existir Equilíbrio de Nash, A precisa ser indiferente entre jogar Alto ou Baixo, ou 
seja, pE = 3(1 - pE). Então pE = ¾. 
Logo, para este jogo, o Equilíbrio de Nash é A adotar a estratégia mista (3/5, 2/5) e B 
adotar a estratégia mista (3/4, 1/4). 
Os ganhos serão (1,2) com probabilidade 3 5 3 4 9 20× = e (0,4) com probabilidade 
3 5 1 4 3 20× = , e (0,5) com probabilidade 2 5 3 4 6 20× = e (3,2) com probabilidade 
2 5 1 4 2 20× = . 
 
Para A, o payoff esperado do Equilíbrio de Nash é: 
 
9 3 6 2 31 0 0 3 .
20 20 20 20 4
× + × + × + × = 
 
Este também pode ser calculado substituindo pE = ¾ em 3(1 - pE). Nesse caso, também 
poderia ser percebido sem esforço que o payoff de A era igual ao valor da probabilidade 
pE. 
 
Para B, o payoff esperado do equilíbrio de Nash é 
 
9 3 6 2 162 4 5 2 .
20 20 20 20 5
× + × + × + × = 
 
Este também pode ser calculado substituindo pA = 3/5 em 2 pA+ 5(1- pA) ou em 4 pA + 
2(1- pA). 
 
Nos dois exemplos, os jogadores escolhem suas estratégias simultaneamente. Estes são 
chamados jogos simultâneos. Mas há jogos em que um jogador joga antes do outro. 
Estes são os jogos seqüenciais. O jogador que joga primeiro é o líder e o jogador que 
joga depois é o seguidor.