Baixe o app para aproveitar ainda mais
Prévia do material em texto
TEORIA DOS JOGOS IND1035 Aula 4 Prof. Fabrício Mello fabriciomrs@puc-rio.br Slide 2 IND1035 fabriciomrs@puc-rio.br Aula 4 Estados estacionários estocásticos • Em muitos jogos, o melhor que um jogador pode fazer é tornar-se imprevisível para o adversário. Isso significa alterar as suas jogadas aleatoriamente. • Por ex., no jogo de pôquer (assim como em vários jogos da vida) o bom jogador blefa de vez em quando: ele sinaliza por suas apostas que tem uma mão mais forte do que de fato tem. Se ele nunca blefa, os adversários terão vantagem sobre ele. Se ele blefar sempre, também estará em desvantagem. Ele deve blefar de maneira imprevisível, mas calculada. Slide 3 IND1035 fabriciomrs@puc-rio.br Aula 4 Estados estacionários estocásticos • O equilíbrio de Nash corresponde a um estado estacionário da situação idealizada em que, para cada jogador do jogo, existe uma população de indivíduos, e sempre que o jogo é jogado, um indivíduo é sorteado dela. • Num estado estacionário, o comportamento de cada jogador é o mesmo sempre em cada jogo. Nenhum jogador deseja mudar a sua ação, conhecendo, com base na experiência, o comportamento dos outros jogadores. • Nesta aula, estenderemos essa noção de estado estacionário, para lidarmos com jogos em que os jogadores devem alterar suas ações. Slide 4 IND1035 fabriciomrs@puc-rio.br Aula 4 Estados estacionários estocásticos • Lembre do jogo das moedas, estudado antes: – Cada jogador escolhe se mostra ao outro a cara (K) ou a coroa (C) de uma moeda que tem em sua mão. – Se os dois mostram a mesma face das moedas, o jogador 1 ganha R$ 1,00 do jogador 2. Se as faces reveladas forem diferentes, o pagamento se inverte. • Como vimos, este jogo não tem um equilíbrio de Nash em que a ação de cada jogador é a mesma sempre que o jogo é jogado. $1,-$1 -$1,$1 -$1,$1 $1,-$1 K Jogador 2 C K C Jogador 1 Slide 5 IND1035 fabriciomrs@puc-rio.br Aula 4 Estados estacionários estocásticos • Suponha que o jogador 2 sempre jogue da mesma forma (repetindo "K" ou repetindo "C"). O jogador 1 aprenderia com a experiência e imitaria o outro, garantindo o ganho de $1, com perda idêntica para o jogador 2. • Suponha agora que o jogador 2 varie as suas jogadas aleatoriamente, mas segundo probabilidades conhecidas por todos: "K" em 90% das jogadas e "C" em 10% delas. O melhor que o jogador 1 pode fazer é imitar a jogada mais frequente ("K"), levando o seu ganho esperado para $0,80. (Por quê?) Slide 6 IND1035 fabriciomrs@puc-rio.br Aula 4 Estados estacionários estocásticos • Naturalmente, o jogador 2 não ficará satisfeito com as duas situações anteriores. Qualquer jogada determinística, ou qualquer estratégia probabilística em que uma das ações seja mais provável do que a outra, dá uma vantagem ao jogador 1, em prejuízo do jogador 2. • Mas suponha, finalmente, que o jogador 2 passe a jogar "K" e "C" com a mesma probabilidade. Neste caso, seja qual for a jogada do jogador 1, inclusive misturas probabilísticas de jogadas, o seu ganho esperado é o mesmo: $0,5. • O ganho esperado do jogador 2 também: $0,5. Slide 7 IND1035 fabriciomrs@puc-rio.br Aula 4 Estados estacionários estocásticos • No jogo das moedas, se os dois jogadores estão sorteando as suas ações, a cada jogada, com probabilidades uniformes (½), o ganho esperado deles é idêntico. • Se um deles desviar-se dessa estratégia, passando a jogar "K" e "C" com probabilidades diferentes, imediatamente dará uma vantagem ao outro jogador, em detrimento próprio. Não há incentivo para os jogadores deixarem essa estratégia, num estado estacionário. • Reencontramos, assim, o mesmo conceito do equilíbrio de Nash, mas com estratégias mistas. Slide 8 Preferências vNM • Admitir que jogadores possam sortear suas jogadas cria um problema: como especificar as preferências dos jogadores sobre loterias que envolvem os perfis de ações. • As funções de ganho ordinais que usamos até agora especificam as preferências dos jogadores entre perfis determinísticos. • Por isso, para expandirmos a TdJ para que possamos analisar jogos em que as ações são probabilísticas, um pré-requisito é criar uma nova função de ganho, mais poderosa em sua capacidade descritiva. IND1035 fabriciomrs@puc-rio.br Aula 4 Slide 9 Preferências vNM • A primeira análise sistemática desse tipo de representação abrangente de preferências deve-se a von Neumann e Morgenstern (vNM). • vNM elencaram quatro axiomas sobre as preferências de um agente racional entre loterias e demonstraram que, na validade desses axiomas, as preferências do agente podem ser representadas pelo valor esperado de uma função de ganho não ordinal aplicada sobre os perfis determinísticos. • A seguir, formalizamos os axiomas e o teorema relevante de vNM. IND1035 fabriciomrs@puc-rio.br Aula 4 Slide 10 Axiomas das Preferências vNM • Para loterias 𝐿,𝑀,𝑁 e probabilidade 𝑝 ∈ [0,1]: 1. Completude 𝐿 ≺ 𝑀, 𝑀 ≺ 𝐿 ou 𝐿~𝑀. 2. Transitividade Se 𝐿 ≼ 𝑀 e 𝑀 ≼ 𝑁 então 𝐿 ≼ 𝑁. 3. Continuidade Se 𝐿 ≺ 𝑀 ≺ 𝑁 então: ∃𝑝 tal que 𝑝𝐿 + 1 − 𝑝 𝑁 = 𝑀. 4. Independência Se 𝐿 ≺ 𝑀 então, para qualquer 𝑁, 𝑝𝐿 + 1 − 𝑝 𝑁 ≺ 𝑝𝑀 + 1 − 𝑝 𝑁. IND1035 fabriciomrs@puc-rio.br Aula 4 Slide 11 IND1035 fabriciomrs@puc-rio.br Aula 4 Preferências vNM Teorema da existência da função de ganho de Bernoulli Suponha que as preferências de um agente sobre loterias atendem aos quatro axiomas de racionalidade vNM. Então, existe uma função de ganho 𝑢 que designa um número real 𝑢(𝑎𝑖) a cada perfil de ação determinístico 𝑎𝑖, tal que as preferências do agente sobre loterias envolvendo os perfis de ações são bem representadas pelo valor esperado de 𝑢. A função 𝑢 que representa preferências vNM será denominada função de ganho de Bernoulli. Slide 12 IND1035 fabriciomrs@puc-rio.br Aula 4 Preferências vNM: Exemplo • Suponha que existam três resultados possíveis, numa situação decisória: $0, $1 e $5. • Para um TD (naturalmente): $0 ≺ $1 ≺ $5. • Definam-se as loterias: 𝐿: 𝑃 $0 = 50% e 𝑃 $5 = 50%. 𝑀:𝑃 $1 = 75% e 𝑃 $5 = 25%. • Suponha que, para o TD, 𝐿 ≻ 𝑀. Essa preferência é consistente com preferências representadas por uma função de ganho em que 𝑢 0 = 0, 𝑢 1 = 1 e 𝑢 5 = 4, pois: 1 2 × 0 + 1 2 × 4 > 3 4 × 1 + 1 4 × 4 Slide 13 IND1035 fabriciomrs@puc-rio.br Aula 4 Jogos Estratégicos: Definição Expandida • DEFINIÇÃO: Um jogo estratégico (com preferências vNM) consiste em: Um conjunto de jogadores. Para cada jogador, um conjunto de ações. Para cada jogador, preferências sobre loterias envolvendo perfis de ações, preferências essas que podem ser representadas pelo valor esperado de alguma função de ganho ("de Bernoulli"). • Se um jogo admite jogadas aleatórias, vamos supor preferências vNM. Slide 14 IND1035 fabriciomrs@puc-rio.br Aula 4 Teste • Considere os dois jogos abaixo, que representam o dilema dos prisioneiros, se os ganhos nas matrizes forem ordinais (por quê?). • Considere a possibilidade de que o jogador 2 selecione sua ação aleatoriamente, com mesma probabilidade para Q e F, e verifique que as matrizes representam jogos estratégicos diferentes se os ganhos são vNM. 3,3 0,4 4,0 1,1 Q F Q F 2,2 0,3 3,0 1,1 F Q F Q Slide 15 IND1035 fabriciomrs@puc-rio.br Aula 4 Estratégias Mistas DEFINIÇÃO: Uma estratégia mista de um jogador em um jogo estratégico consistenuma distribuição de probabilidades sobre as ações disponíveis para o jogador. • Representaremos por 𝛼 um perfil de estratégias mistas. Assim, 𝛼𝑖(𝑎𝑖) representa a probabilidade com a qual o jogador 𝑖 escolhe a ação 𝑎𝑖, na sua estratégia mista 𝛼𝑖. • Neste contexto em que estratégias mistas são admitidas, quando um jogador escolhe uma ação deterministicamente dizemos que ele está utilizando uma estratégia pura. Slide 16 IND1035 fabriciomrs@puc-rio.br Aula 4 Exemplo • Suponha que, no jogo das moedas, o jogador 1 jogue "K" com probabilidade 1/3 e "C" com probabilidade 2/3. O jogador 2 sempre joga "K". • Então, escrevemos: 𝛼1 𝐾 = 1 3 ; 𝛼1 𝐶 = 2 3 ; 𝛼2 𝐾 = 1; e 𝛼1 𝐶 = 0. • Notação abreviada: 𝛼1 = (1 3 , 2 3) e 𝛼2 = (1,0). • Neste exemplo, o jogador 2 está utilizando uma estratégia pura. Slide 17 IND1035 fabriciomrs@puc-rio.br Aula 4 Equilíbrio de Nash com preferências vNM DEFINIÇÃO: Um perfil de estratégias mistas 𝛼∗ em um jogo estratégico com preferências vNM é um equilíbrio de Nash (com estratégias mistas) se, para cada jogador 𝑖 e cada estratégia mista 𝛼𝑖 do jogador 𝑖, o ganho esperado de 𝛼∗ para o jogador 𝑖 é pelo menos tão grande quanto o ganho esperado de (𝛼𝑖 , 𝛼−𝑖 ∗ ) para o jogador 𝑖, segundo uma função de ganho cujo valor esperado representa as preferências do jogador 𝑖 sobre loterias. ALTERNATIVAMENTE: Um perfil de estratégias mistas 𝛼∗ em um jogo estratégico com preferências vNM é um equilíbrio de Nash se, para cada jogador 𝑖 e cada estratégia mista 𝛼𝑖 do jogador 𝑖: 𝑢𝑖 (𝛼 ∗) ≥ 𝑢𝑖 (𝛼𝑖 , 𝛼−𝑖 ∗ ). Obs.: Na definição alternativa, 𝑢𝑖 𝛼 é o ganho esperado do perfil de estratégias mistas 𝛼, para o jogador 𝑖. Slide 18 IND1035 fabriciomrs@puc-rio.br Aula 4 Função de Melhor Resposta com preferências vNM • Isto é: qualquer estratégia mista em 𝐵𝑖(𝛼−𝑖) leva a um ganho esperado pelo menos tão grande para o jogador 𝑖 quanto qualquer outra, se os outros jogadores jogam segundo 𝛼−𝑖. DEFINIÇÃO: Seja 𝛼−𝑖 o conjunto das estratégias mistas dos jogadores que não são o jogador 𝑖. Seja Α𝑖 o conjunto de estratégias mistas do jogador 𝑖. A função de melhor resposta com preferências vNM do jogador 𝑖 é: 𝐵𝑖 𝛼−𝑖 = 𝛼𝑖 ∈ Α𝑖: 𝑢 𝑖 𝛼𝑖 , 𝛼−𝑖 ≥ 𝑢 𝑖 𝛼𝑖 ′, 𝛼−𝑖 ∀ 𝛼𝑖 ′ ∈ Α𝑖 Slide 19 IND1035 fabriciomrs@puc-rio.br Aula 4 • Como já fizemos, redefinimos o equilíbrio de Nash em termos da função de melhor resposta: DEFINIÇÃO: Um perfil de estratégias mistas 𝛼∗ em um jogo estratégico com preferências vNM é um equilíbrio de Nash com estratégias mistas se e apenas se a estratégia mista de cada jogador é uma melhor resposta para as estratégias mistas dos outros jogadores. Ou seja, para todo jogador 𝑖, vale: 𝛼𝑖 ∗ ∈ 𝐵𝑖(𝛼−𝑖 ∗ ) Função de Melhor Resposta com preferências vNM Slide 20 IND1035 fabriciomrs@puc-rio.br Aula 4 • Analisamos agora jogos com dois jogadores, cada um dispondo de duas ações, com estratégias mistas. • Suponha que o jogador 1 dispõe das ações T e B, e segue a estratégia mista (𝑝, 1 − 𝑝). • Suponha, similarmente, que o jogador 2 dispõe das ações L e R, e segue a estratégia mista (𝑞, 1 − 𝑞). • Sendo as jogadas independentes, a tabela abaixo contém a distribuição de probabilidade conjunta das ações. • Cada célula contém a probabilidade de ocorrência do perfil de ações correspondente. Jogos de 2 jogadores, 2 ações, e estratégias mistas pq p(1 – q) (1 – p)q (1 – p)(1 – q) L (q) R (1 - q) T (p) B (1 - p) Slide 21 IND1035 fabriciomrs@puc-rio.br Aula 4 • Ganho esperado do perfil de estratégias mistas (𝛼1, 𝛼2) para o jogador 1: 𝑢 1 = 𝑝𝑞 ∙ 𝑢1 𝑇, 𝐿 + 𝑝 1 − 𝑞 ∙ 𝑢1 𝑇, 𝑅 + 1 − 𝑝 𝑞 ∙ 𝑢1 𝐵, 𝐿 + 1 − 𝑝 1 − 𝑞 ∙ 𝑢1 𝐵, 𝑅 • Ou, rearranjando os termos: 𝑢 1 = 𝑝 𝑞 ∙ 𝑢1 𝑇, 𝐿 + 1 − 𝑞 ∙ 𝑢1 (𝑇, 𝑅) + 1 − 𝑝 𝑞 ∙ 𝑢1 𝐵, 𝐿 + 1 − 𝑞 ∙ 𝑢1 𝐵, 𝑅 • Observe que os termos entre colchetes são os ganhos esperados para o jogador 1 das suas estratégias puras. Jogos de 2 jogadores, 2 ações, e estratégias mistas Slide 22 IND1035 fabriciomrs@puc-rio.br Aula 4 • Definindo os ganhos esperados das estratégias puras do jogador 1 como: 𝐸1 𝑇, 𝛼2 = 𝑞 ∙ 𝑢1 𝑇, 𝐿 + 1 − 𝑞 ∙ 𝑢1 𝑇, 𝑅 𝐸1 𝐵, 𝛼2 = 𝑞 ∙ 𝑢1 𝐵, 𝐿 + 1 − 𝑞 ∙ 𝑢1 𝐵, 𝑅 podemos rescrever a expressão do ganho esperado do jogador 1 como uma média ponderada dos ganhos das suas estratégias puras: 𝑢 1 = 𝑝𝐸1 𝑇, 𝛼2 + 1 − 𝑝 𝐸1 𝐵, 𝛼2 • O ganho esperado do jogador 1 é uma função linear de 𝑝. Jogos de 2 jogadores, 2 ações, e estratégias mistas Slide 23 IND1035 fabriciomrs@puc-rio.br Aula 4 • Caso 1: 𝐸1 𝑇, 𝛼2 > 𝐸1(𝐵, 𝛼2) Jogos de 2 jogadores, 2 ações, e estratégias mistas 𝐸1(𝑇, 𝛼2) 𝐸1(𝐵, 𝛼2) 𝑢 1 0 1 𝑝 𝑝𝐸1 𝑇, 𝛼2 + 1 − 𝑝 𝐸1(𝐵, 𝛼2) Slide 24 IND1035 fabriciomrs@puc-rio.br Aula 4 • Caso 2: 𝐸1 𝑇, 𝛼2 < 𝐸1(𝐵, 𝛼2) Jogos de 2 jogadores, 2 ações, e estratégias mistas 𝐸1(𝑇, 𝛼2) 𝐸1(𝐵, 𝛼2) 𝑢 1 0 1 𝑝 𝑝𝐸1 𝑇, 𝛼2 + 1 − 𝑝 𝐸1(𝐵, 𝛼2) Slide 25 IND1035 fabriciomrs@puc-rio.br Aula 4 • Os gráficos anteriores mostram que o jogador 1 maximiza o seu ganho esperado jogando uma estratégia pura (i.e., fazendo 𝑝 = 0 ou 𝑝 = 1) se 𝐸1(𝑇, 𝛼2) ≠ 𝐸2(𝐵, 𝛼2): – Se 𝐸1 𝑇, 𝛼2 > 𝐸1(𝐵, 𝛼2): O jogador 1 deve adotar a estratégia pura (1,0). – Se 𝐸1 𝑇, 𝛼2 < 𝐸1(𝐵, 𝛼2): O jogador 1 deve adotar a estratégia pura (0,1). • Entretanto, se 𝐸1 𝑇, 𝛼2 = 𝐸2(𝐵, 𝛼2), então todas as estratégias mistas do jogador 1 são melhores respostas (levam ao mesmo ganho esperado). • A análise é similar para o jogador 2. Jogos de 2 jogadores, 2 ações, e estratégias mistas Slide 26 IND1035 fabriciomrs@puc-rio.br Aula 4 • Voltemos ao jogo das moedas: • O jogador 1 usa a estratégia mista (𝑝, 1 − 𝑝) e o jogador 2 usa a estratégia mista (𝑞, 1 − 𝑞). • Suas funções de ganho de Bernoulli correspondem aos ganhos financeiros (neutralidade ao risco). • Ganhos esperados das estratégias puras do jogador 1: 𝐸1 𝐾, 𝛼2 = 𝑞 ∙ 1 + 1 − 𝑞 ∙ −1 = 2𝑞 − 1 𝐸1 𝐶, 𝛼2 = 𝑞 ∙ −1 + 1 − 𝑞 ∙ 1 = 1 − 2𝑞 Exemplo: O Jogo das Moedas $1,-$1 -$1,$1 -$1,$1 $1,-$1 K Jogador 2 C K C Jogador 1 Slide 27 IND1035 fabriciomrs@puc-rio.br Aula 4 • A função de melhor resposta do jogador 1 é: 𝐵1 𝑞 = 0 se 𝑞 < 1 2 𝑝: 0 ≤ 𝑝 ≤ 1 se 𝑞 = 1 2 1 se 𝑞 > 1 2 • A do jogador 2 é simétrica: 𝐵2 𝑝 = 1 se 𝑝 < 1 2 𝑞: 0 ≤ 𝑞 ≤ 1 se 𝑝 = 1 2 0 se 𝑝 > 1 2 Exemplo: O Jogo das Moedas Slide 28 IND1035 fabriciomrs@puc-rio.br Aula 4 Exemplo: O Jogo das Moedas 0 1 𝑝 → 1 ↑ 𝑞 𝐵1 𝐵2 Equilíbrio de Nash 1 2 1 2 Slide 29 IND1035 fabriciomrs@puc-rio.br Aula 4 • Voltemos agora ao jogo da batalha dos sexos: • Ele usa a estratégia mista (𝑝, 1 − 𝑝) • Ela usa a estratégia mista (𝑞, 1 − 𝑞). • O casal tem preferências vNM e as funções de ganho que preenchem a tabela são de Bernoulli. Exemplo: Batalha dos Sexos 2,1 0,0 0,0 1,2 B Ela S B S Ele Slide 30 IND1035 fabriciomrs@puc-rio.br Aula 4 • Ganhos esperados das estratégias puras do homem: 𝐸1 𝐵, 𝛼2 = 𝑞 ∙ 2 + 1 − 𝑞 ∙ 0 = 2𝑞 𝐸1 𝑆, 𝛼2 = 𝑞 ∙ 0 + 1 − 𝑞 ∙ 1 = 1 − 𝑞 • Ganhos esperados das estratégias puras da mulher: 𝐸2 𝐵, 𝛼1 = 𝑝 ∙ 1 + 1 − 𝑝 ∙ 0 = 𝑝 𝐸2 𝑆, 𝛼1 =𝑝 ∙ 0 + 1 − 𝑝 ∙ 2 = 1 − 2𝑝 Exemplo: Batalha dos Sexos Slide 31 IND1035 fabriciomrs@puc-rio.br Aula 4 • A função de melhor resposta do homem é: 𝐵1 𝑞 = 0 se 𝑞 < 1 3 𝑝: 0 ≤ 𝑝 ≤ 1 se 𝑞 = 1 3 1 se 𝑞 > 1 3 • A função de melhor resposta da mulher é: 𝐵2 𝑝 = 0 se 𝑝 < 2 3 𝑞: 0 ≤ 𝑞 ≤ 1 se 𝑝 = 2 3 1 se 𝑝 > 2 3 Exemplo: Batalha dos Sexos Slide 32 IND1035 fabriciomrs@puc-rio.br Aula 4 Exemplo: Batalha dos Sexos 0 1 𝑝 → 1 ↑ 𝑞 𝐵1 𝐵2 1 3 2 3 = Equilíbrios de Nash Observe que o jogo tem três equilíbrios. Os dois equilíbrios com estratégias puras já eram conhecidos. O terceiro equilíbrio surge quando se admitem estratégias mistas. Slide 33 IND1035 fabriciomrs@puc-rio.br Aula 4 • Duas pessoas precisam realizar uma certa tarefa mas só conseguirão se, e apenas se, ambas trabalharem. • É melhor para as duas que a tarefa seja cumprida. • O pior cenário para alguém é esforçar-se enquanto o parceiro fica ocioso. Neste caso, quem se esforçou perde tempo/energia, e a tarefa não é cumprida. • As preferências vNM dos jogadores são representadas pelo valor esperado da função de ganho de Bernoulli dada na tabela abaixo, onde 𝑐 < 1 representa o esforço individual como uma fração da recompensa pela entrega da tarefa. Exemplo: Jogo da Coordenação 0,0 0,-c -c,0 1-c,1-c Trabalho Ócio Trabalho Ócio Slide 34 IND1035 fabriciomrs@puc-rio.br Aula 4 • Ganhos esperados das estratégias puras do jogador 1 (e por simetria, idem para o jogador 2): 𝐸1 Ócio, 𝛼2 = 𝑞 ∙ 0 + 1 − 𝑞 ∙ 0 = 0 𝐸1 Trabalho, 𝛼2 = 𝑞 ∙ −𝑐 + 1 − 𝑞 ∙ 1 − 𝑐 = 1 − 𝑐 − 𝑞 • Função de melhor resposta dos dois jogadores: 𝐵𝑖 𝑞 = 0 se 𝑞 < 1 − 𝑐 𝑝: 0 ≤ 𝑝 ≤ 1 se 𝑞 = 1 − 𝑐 1 se 𝑞 > 1 − 𝑐 • Observe que o jogo tem três equilíbrios, de forma similar à batalha dos sexos. Exemplo: Jogo da Coordenação Slide 35 IND1035 fabriciomrs@puc-rio.br Aula 4 Exemplo: Jogo da Coordenação 0 1 𝑝 → 1 ↑ 𝑞 𝐵1 𝐵2 1 − 𝑐 = Equilíbrios de Nash Interpretação possível: Se o percentual de tempo em que meu parceiro fica ocioso é inferior ao ganho líquido com a entrega da tarefa, é melhor eu sempre trabalhar. Se o percentual de tempo em que ele fica ocioso é maior do que o ganho líquido com a entrega, é melhor eu nunca trabalhar. No caso limítrofe, é indiferente o que faço. 1 − 𝑐 Slide 36 IND1035 fabriciomrs@puc-rio.br Aula 4 Teste • Encontre todos os equilíbrios de Nash dos dois jogos abaixo, admitindo estratégias mistas. • Siga os passos dos exemplos anteriores, escrevendo os ganhos esperados das estratégias puras e deduzindo a partir deles as funções de melhor resposta. 0,1 0,2 2,2 0,1 L R T B 6,0 0,6 3,2 6,0 R T B L Slide 37 IND1035 fabriciomrs@puc-rio.br Aula 4 PROPOSIÇÃO: Um perfil de estratégias mistas 𝛼∗ em um jogo estratégico com preferências vNM no qual cada jogador dispõe de um número finito de ações é um equilíbrio de Nash com estratégias mistas se e apenas se, para cada jogador 𝑖, • o ganho esperado, dado 𝛼−𝑖 ∗ , de cada ação para a qual 𝛼𝑖 ∗ designa uma probabilidade não nula é o mesmo; e • o ganho esperado, dado 𝛼−𝑖 ∗ , de cada ação para a qual 𝛼𝑖 ∗ designa uma probabilidade nula é no máximo igual ao ganho esperado de qualquer ação para a qual 𝛼𝑖 ∗ designa uma probabilidade não nula. No equilíbrio, o ganho esperado de qualquer jogador é igual ao ganho esperado de qualquer ação que ele eventualmente usa. Caracterização do equilíbrio de Nash com estratégias mistas Slide 38 IND1035 fabriciomrs@puc-rio.br Aula 4 Exemplo • No jogo abaixo, os asteriscos representam ganhos quaisquer. O jogador 1 joga nas linhas. • Pela proposição do slide anterior, as estratégias mistas 𝛼1 = (3 4,0, 1 4) e 𝛼2 = (0, 1 3, 2 3) constituem um equilíbrio de Nash. Verifique, calculando o ganho esperado das estratégias puras. *,2 3,3 1,1 *,* 0,* 2,* *,4 5,1 0,7 R T M L C B Slide 39 IND1035 fabriciomrs@puc-rio.br Aula 4 PROPOSIÇÃO Todo jogo estratégico com preferências vNM no qual cada jogador tem um número finito de ações tem equilíbrio(s) de Nash com estratégias mistas Existência de equilíbrios em jogos finitos • A finitude do jogo é uma condição suficiente mas não necessária para a existência de um equilíbrio. • No equilíbrio, é possível que um ou mais (ou todos) jogadores designem probabilidade 1 para uma das suas ações disponíveis. Slide 40 IND1035 fabriciomrs@puc-rio.br Aula 4 Dominância com preferências vNM • Estendemos agora a definição de dominância para admitir estratégias mistas. DEFINIÇÃO: Em um jogo estratégico com preferências vNM, a estratégia mista 𝛼𝑖 do jogador 𝑖 domina estritamente a sua ação 𝑎𝑖 ′ se 𝑢 𝑖 𝛼𝑖 , 𝑎−𝑖 > 𝑢𝑖 𝑎𝑖 ′, 𝑎−𝑖 para cada lista 𝑎−𝑖 de ações dos outros jogadores, onde 𝑢𝑖 é uma função de ganho de Bernoulli e 𝑢 𝑖 representa o seu valor esperado. Dizemos, neste caso, que a jogada 𝑎𝑖 ′ é estritamente dominada. Slide 41 IND1035 fabriciomrs@puc-rio.br Aula 4 Exemplo • No jogo ao lado, apenas os ganhos (vNM) do jogador que joga nas linhas são mostrados. • Nenhuma ação é dominada por uma estratégia pura. • Entretanto, a ação T é estritamente dominada pela estratégia mista (0, 1 2, 1 2 ). 1 1 4 0 0 3 T M L B R Slide 42 IND1035 fabriciomrs@puc-rio.br Aula 4 Dominância fraca com preferências vNM DEFINIÇÃO: Em um jogo estratégico com preferências vNM, a estratégia mista 𝛼𝑖 do jogador 𝑖 domina fracamente a sua ação 𝑎𝑖 ′ se 𝑢 𝑖 𝛼𝑖 , 𝑎−𝑖 ≥ 𝑢𝑖 𝑎𝑖 ′, 𝑎−𝑖 para cada lista 𝑎−𝑖 de ações dos outros jogadores e 𝑢 𝑖 𝛼𝑖 , 𝑎−𝑖 > 𝑢𝑖 𝑎𝑖 ′, 𝑎−𝑖 para alguma lista 𝑎−𝑖 de ações dos outros jogadores, onde 𝑢𝑖 é uma função de ganho de Bernoulli e 𝑢 𝑖 representa o seu valor esperado. Dizemos então que 𝑎𝑖 ′ é fracamente dominada.
Compartilhar