Baixe o app para aproveitar ainda mais
Prévia do material em texto
Microeconomia 2 Notas de Aula MICROECONOMIA 2 – GRADUAÇÃO Departamento de Economia, Universidade de Braśılia Notas de Aula 5 – Teoria dos Jogos Prof. José Guilherme de Lara Resende 1 Introdução 1.1 Interdependência Estratégica A teoria dos jogos permite modelar comportamentos estratégicos dos agentes econômicos. É o instrumento adequado quando existe interdependência estratégica entre os agentes do modelo analisado. No modelo de consumo usual, o consumidor decide entre posśıveis cestas de bens, dados os preços e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a sua tecnologia de produção e dados os preços dos insumos e dos bens que vende. No modelo de equiĺıbrio geral competitivo, tanto os consumidores quanto as firmas tomam os preços como dados e não há interação estratégica entre os agentes econômicos. Porém, existem situações onde os resultados das ações de um agente dependem diretamente do comportamento de outros agentes. Nestes casos, assumimos que o payoff (bem-estar) do agente depende não só da sua ação, mas da ação de outros agentes. Modelos de oligopólio são um exemplo, em que o lucro de determinada firma depende do que suas rivais fazem. Um jogo então caracteriza qualquer situação desse tipo, em que cada participante deve levar em conta a estratégia dos outros jogadores envolvidos antes de escolher o melhor para si. O objetivo da teoria dos jogos é determinar o resultado de um jogo. Cada método de análise resulta em um conceito de solução particular, chamado equiĺıbrio. A maioria dos conceitos tem sua origem no conceito de equiĺıbrio de Nash e são, usualmente, equiĺıbrios de Nash que satisfazem certas propriedades. Por isso, são chamados refinamentos. Cada refinamento tenta solucionar alguma deficiência do conceito de equiĺıbrio de Nash particular a alguma situação ou modelo. 1.2 Noções Preliminares Definição (informal): Jogo. Um jogo refere-se a qualquer situação envolvendo dois ou mais agentes, chamados jogadores, onde exista interdependência estratégica. Vamos estudar jogos não-cooperativos : analisamos cada agente separadamente e não como um grupo. Essa definição não implica que um jogador não possa cooperar com o outro, ela é apenas de cunho metodológico, onde cada agente é visto como uma entidade separada, autônoma, e não há grupos de agentes se comportando como um único agente. José Guilherme de Lara Resende 1 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Para descrevermos um jogo é necessário conhecermos três objetos: • Os jogadores, • A regra do jogo, • O resultado do jogo (payoff dos jogadores). São feitas duas hipóteses básicas sobre os jogadores: 1. Os jogadores são racionais. As ações de um jogador são consistentes com o objetivo desejado: maximizar o seu payoff. 2. Os jogadores são inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e con- seguem fazer as mesmas inferências que realizamos sobre a situação em que se encontram. A segunda hipótese não é tão inócua quanto parece. Na teoria de equiĺıbrio geral os indiv́ıduos são racionais, mas não é necessário que sejam inteligentes no sentido acima: os agentes econômicos não precisam conhecer toda a estrutura de teoria de equiĺıbrio geral ao tomarem suas decisões. As duas formas mais comuns de se representar um jogo são: • Forma Estratégica: Representação em forma matricial. Esta forma é adequada para situações onde os jogadores se “movem” (decidem suas ações) simultaneamente (modelo estático). Também conhecida como forma normal. • Forma Extensiva: Representação em forma de árvore. Esta forma é adequada para situações onde exista uma ordem cronológica dos eventos do jogo (modelo dinâmico). Também conhecida como forma sequencial. Existe uma correspondência entre essas duas formas, que veremos mais a frente. Vimos que o prinćıpio básico de eficiência usado em economia é o critério de Pareto. Dizemos que o resultado A do jogo é Pareto-dominado pelo resultado B se nenhum agente ficar pior e pelo menos um ficar melhor em B do que em A. Definição: Um resultado de um jogo é Pareto ótimo (ou eficiente de Pareto) se não é Pareto- dominado por nenhum outro resultado posśıvel para o jogo. 1.3 Conhecimento Comum Uma hipótese usada em teoria dos jogos é a de conhecimento comum (“common knowledge”), que assume que a racionalidade dos jogadores e a estrutura do jogo são de conhecimento comum de todo jogador. Se considerarmos dois jogadores, um determinado fato é de conhecimento comum dos jogadores se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo racioćınio valendo para o jogador 2. José Guilherme de Lara Resende 2 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Essa hipótese é fundamental para a validade de certos procedimentos, tais como os procedi- mentos de eliminação de estratégias dominadas. Mais ainda, ela é importante para o conceito de equiĺıbrio de Nash (existem artigos que relaxam a hipótese de conhecimento comum, sob certas condições). Myerson argumenta que a hipótese de jogadores inteligentes implica supor que a estrutura do jogo é de conhecimento comum desses jogadores. A formalização matemática dessa hipótese é complicada. Aqui, vamos apenas assumir a sua validade. Vamos apenas ver um exemplo para entender a importância dessa hipótese. Myerson cita uma fábula que ilustra bem as implicações da hipótese. Em uma vila, existem 100 casais. Toda noite, os homens se juntam e cada um elogia a sua mulher, caso ela seja fiel, ou se lamenta caso ela tenha sido infiel. Se a mulher foi infiel, ela imediatamente conta a todos os homens da vila, exceto ao seu marido. Essas tradições são de conhecimento comum de todos os habitantes da vila. Suponha que todas as esposas foram infiéis. Logo, cada homem sabia da infidelidade de todas as esposas, exceto da sua, elogiada toda noite. Logo, todas as esposas eram elogiadas e nenhum homem se lamentava. Numa certa noite, um visitante revelou a todos que pelo menos uma esposa havia sido infiel. Qual foi o resultado dessa revelação? O resultado foi que todos os homens continuaram a elogiar as esposas por 99 noites. Na noite de número 100, todos se lamentaram. Tente entender porque a hipótese de conhecimento comum leva a esse resultado. Para isso, é necessário compreender o que a informação do visitante adicionou ao conhecimento dos homens da vila. O racioćınio fica mais fácil de compreender se considerarmos primeiro o caso em que apenas uma esposa traiu o marido. A informação nova que o visitante revelou foi informar a todos da vila que havia uma esposa infiel. Pelos costumes da vila, 99 homens sabiam que havia uma esposa infiel e apenas um homem, exatamente aquele cuja esposa havia sido infiel, não tinha conhecimento de nenhuma infidelidade na vila. Logo, ele imediatamente tomaria ciência de que a sua esposa é que fora infiel e se lamentaria na primeira noite depois da revelação do visitante, já que os costumes da vila são de conhecimento comum de todos os seus habitantes. Caso houvesse duas esposas infiéis, então 98 homens da vila saberiam que havia duas esposas infiéis e 2 homens teriam conhecimento de apenas um caso de infidelidade, já que não saberiam que a sua respectiva esposa havia sido infiel. Nesse caso, na primeira noite ninguém se lamentaria o que, dado os costumes da vila, significa que existe mais de uma esposa infiel. Logo, na segunda noite, após observarem que nenhum homem havia se lamentado na noite anterior, os 2 homens que têm conhecimento de apenas uma esposa infiel e por conhecerem os costumes da vila, se dariam conta de que foram tráıdos e se lamentariam.O racioćınio estende-se de modo análogo para o caso de 100 esposas infiéis: no centésimo dia, todos os maridos se dariam conta de que foram tráıdos e se lamentariam. José Guilherme de Lara Resende 3 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 2 Jogos na Forma Estratégica 2.1 Definições e Exemplos de Jogos Definição: Jogo na Forma Estratégica (ou Forma Normal). Um jogo na forma estratégica é uma coleção G = (Si, ui) I i=1, onde I é o número de jogadores, Si é o conjunto de estratégias dispońıveis ao jogador i, para todo i ∈ I, e ui : ∏I k=1 Sk → R é a função de payoff (a utilidade) do jogador i, que depende das estratégias de todos os jogadores. Dizemos que um jogo na forma normal é finito se o conjunto das estratégias Si é finito para todo i, i = 1, . . . , I. Observe que a interdependência estratégica entre os agentes aparece explicitamente na hipótese de que o payoff de cada jogador é descrita pela função ui : S1 × · · · × Si × · · · × SI → R, ou seja, ui depende não apenas da estratégia si escolhida por i, mas também das estratégias de todos os outros jogadores, s1, . . . , si−1, si+1, . . . , sI . Exemplo 1: “Cara ou Coroa”. Neste jogo com duas pessoas, cada jogador escolhe o lado de uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00 ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve este jogo. 1↓ / 2 → Cara Coroa Cara −1, 1 1,−1 Coroa 1,−1 −1, 1 Notação: Vamos usar a seguinte convenção, corriqueira e adotada em diversos livros, para todos os jogos representados na forma matricial: o primeiro elemento em cada célula da matriz é o payoff do jogador 1 (“jogador-linha”) e o segundo elemento da célula é o payoff do jogador 2 (“jogador- coluna”). Para o jogo do Exemplo 1, temos que: Jogadores: I = {1, 2}; Estratégias: S1 = S2 = {Cara, Coroa}; Payoffs: u1(Cara,Coroa) = u1(Coroa,Cara) = 1; u1(Cara,Cara) = u1(Coroa,Coroa) = −1; u2(s1, s2) = −u1(s1, s2), ∀(s1, s2) ∈ S1 × S2. No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo impreviśıvel. Logo, quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja escolher de modo aleatório ou de modo que o seu rival não saiba exatamente qual o lado da moeda será escolhido. Observe que esse é um jogo de soma zero: o ganho de um jogador é igual à perda do outro jogador. Para jogos de soma zero com dois jogadores, os conceitos de solução usados podem envolver os jogadores randomizarem suas estratégias. Esse tipo de jogo foi extensivamente estudado por von Neuman e Morgenstern, no livro “theory of games and economic behavior”, publicado em 1944 e um marco da teoria dos jogos. José Guilherme de Lara Resende 4 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Um tipo de jogo mais geral do que os de soma zero são os jogos de soma fixa (dos payoffs), também chamados jogos estritamente competitivos. Em um jogo de soma fixa, a soma dos payoffs para cada resultado do jogo tem sempre o mesmo valor. Se o valor for zero, então o jogo é de soma zero. Logo, jogos de soma zero são um tipo de jogos de soma fixa. Em um jogo de soma fixa, um jogador só aumenta o seu payoff se o payoff do outro jogador se reduzir pelo valor desse aumento. Então qualquer resultado deste jogo é Pareto eficiente, pois aumentar o payoff de um jogador necessariamente implica diminuir o payoff do outro jogador. Esse tipo de jogo é adequado para modelar situações em que se tem um “vencedor” e um “perdedor”. Por exemplo, podemos modelar um jogo de xadrez como um jogo de soma zero: se um jogador ganhar, ele obtém o payoff +1, enquanto o perdedor obtém o payoff −1. Se o jogo empatar, cada jogador obtém payoff 0. Evidentemente, muitos dos jogos analisados em economia não são de soma fixa (ou seja, podemos dizer que são de soma variável), como é o caso dos Exemplos 2 e 3 a seguir. Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e estão sendo interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles receberão uma pena de 3 anos na cadeia. Se ambos não confessarem o crime, a pena será de apenas dois anos, por falta de evidência. Porém, o promotor pode fazer uma acordo com um deles, dando uma pena de apenas um ano na prisão para quem confessar e, para quem não confessar, de cinco anos na prisão, por não ter colaborado com a justiça. A matriz abaixo descreve este jogo. L.A.↓ / Laelio → Confessar Não Confessar Confessar −3,−3 −1,−5 Não Confessar −5,−1 −2,−2 Exemplo 3: Problema de Coordenação. Suponha que duas pessoas estão viajando separada- mente para o Rio de Janeiro e combinaram de se encontrar para almoçar no dia seguinte. Porém esqueceram de marcar o restaurante e não estão conseguindo se comunicar. Eles costumam almoçar sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almoço no restaurante da barra é mais agradável do que o almoço no restaurante do centro. Porém, eles se desencontrarem é a pior situação posśıvel. A matriz abaixo descreve este jogo. 1↓ / 2 → Barra Centro Barra 3, 3 0, 0 Centro 0, 0 1, 1 Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo à tarde. Concordaram com duas opções: ir a um jogo de futebol ou fazer compras. Os dois preferem estar juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir às compras. A matriz abaixo descreve este jogo. Nelson↓ / Renata → Futebol Compras Futebol 2, 1 0, 0 Compras 0, 0 1, 2 José Guilherme de Lara Resende 5 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Os Exemplos 3 e 4 modelam problemas de coordenação: os dois jogadores devem escolher suas estratégias de modo que façam o mesmo programa. Veremos mais à frente que cada um desses dois jogos possui dois equiĺıbrios de Nash em estratégias puras, em que ambos os jogadores devem coordenar suas estratégias para alcançar um desses equiĺıbrios. Além disso, o Exemplo 4 envolve uma disputa de poder, em que o equiĺıbrio que o jogador 1, Nelson, prefere, (F, F ) (os dois irem juntos ao futebol), é diferente do equiĺıbrio que a jogadora 2, Renata, prefere, (C,C) (os dois irem juntos às compras). Ambos os jogadores preferem estar em uma situação de equiĺıbrio do que estar em uma situação de desequiĺıbrio, (F,C) ou (C,F ), ou seja, em que um escolhe um programa diferente do escolhido pelo outro. Temos então uma disputa de poder entre os jogadores, onde cada um tenta implementar o seu equiĺıbrio preferido. 2.2 Conceitos de Dominância e Estratégias Racionalizáveis Nas definições a seguir vamos denotar por si uma estratégia qualquer de um jogador i arbitrário e por Si o conjunto de todas as estratégias dispońıveis para o jogador i. Além disso, s−i denota um grupo de estratégias para os outros jogadores que não o jogador i (ou seja, s−i especifica uma estratégia para cada um dos rivais do jogador i) e S−i denota o conjunto de todas as estratégias dispońıveis para os outros jogadores que não o jogador i. Definição: Estratégia Estritamente Dominante. A estratégia ŝi é estritamente (ou forte- mente) dominante para o jogador i em um dado jogo se para toda estratégia si 6= ŝi, si ∈ Si, vale: ui(ŝi, s−i) > ui(si, s−i), para todo s−i ∈ S−i . Logo, uma estratégia ŝi é estritamente dominante para o jogador i se ela for a única estratégia que maximiza o payoff desse jogador, quaisquer que sejam as estratégias escolhidas pelos outros jogadores. Para o jogo dilema dos prisioneiros, é fácil verificar que Confessar é uma estratégia estritamente dominante para os dois prisioneiros. Ela é a estratégia que gera o maior payoff para cada prisioneiro, qualquer que seja a escolha do outro prisioneiro. Dizemos que (C,C) é um equiĺıbrioem estratégias estritamamente dominantes. Observe que o equiĺıbrio (C,C) é Pareto dominado pelo conjunto de estratégias (NC,NC), ou seja, cada jogador obtém um payoff maior em (NC,NC) do que em (C,C). Temos, então, um caso onde o comportamento individual maximizador dos agentes envolvidos resulta em um equiĺıbrio Pareto ineficiente. Logo, na presença de interdependência estratégica, a interação de jogadores cujo objetivo é maximizar o seu próprio bem-estar pode levar a situações Pareto-ineficientes. Estratégias estritamente dominantes não são comuns. É comum situações onde não existem estratégias dominantes para nenhum dos jogadores, como o Exemplo 5 a seguir ilustra. Exemplo 5: Observe que o jogo a seguir não possui nenhuma estratégia estritamente dominante: 1↓ / 2 → L M R U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5 José Guilherme de Lara Resende 6 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Apesar de estratégias estritamente dominantes serem raras, podemos usar um conceito similar, de estratégia estritamente dominada, para eliminarmos estratégias que nunca devem ser escolhidas por qualquer jogador. Definição: Estratégia Estritamente Dominada. Uma estratégia s̄i é estritamente (ou forte- mente) dominada para o jogador i quando existir uma outra estratégia ŝi ∈ Si tal que: ui(ŝi, s−i) > u1(s̄i, s−i), para todo s−i ∈ S−i . Dizemos que ŝi domina estritamente s̄i. Observe que uma estratégia estritamente dominante domina estritamente todas as outras es- tratégias do jogador. Logo, todas as outras estratégias são estritamente dominadas pela estratégia estritamente dominante. Vamos analisar o jogo descrito no Exemplo 5 acima, dado por: 1↓ / 2 → L M R U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5 Para o jogador 1, a estratégia D é estritamente dominada pela estratégia U . Essa é a única estratégia estritamente dominada no jogo acima para qualquer um dos dois jogadores. Se elimin- armos essa estratégia do jogo, usando o argumento de que o jogador 1 nunca a escolherá, já que U traz um payoff sempre maior do que D, para qualquer que seja a escolha do seu rival, obtemos então o seguinte jogo reduzido: 1↓ / 2 → L M R U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 Para esse jogo reduzido, a estratégia M domina estritamente R, para o jogador 2. Eliminando a estratégia R, obtemos: 1↓ / 2 → L M U 5, 2 4, 3 C 1, 4 3, 2 Já para este novo jogo reduzido, a estratégia U domina estritamente C, para o jogador 1. Eliminando C, obtemos: 1↓ / 2 → L M U 5, 2 4, 3 José Guilherme de Lara Resende 7 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Finalmente, a estratégia L é estritamente dominada por M , para o jogador 2, neste último subjogo. Por meio desse “procedimento de eliminação de estratégias estritamente dominadas (PEEED)”, obtivemos (U,M) (isto é, o jogador 1 escolhe U , o jogador 2 escolhe M) como solução do jogo. Dizemos que (U,M) é um equiĺıbrio obtido pela eliminação de estratégias estritamente dominadas (e que U e M são estratégias que sobrevivem ao PEEED). A ideia do procedimento é, portanto, simples. Ele usa implicitamente a hipótese de conhecimento comum da racionalidade e da estrutura do jogo para todos os jogadores, pois, para encontrarmos a solução (U,M), supomos implicitamente que o jogador 2 sabe que o jogador 1 é racional e nunca jogará a estratégia D. Como o jogador 1 sabe que o jogador 2 é racional e também que 2 sabe que ele é racional e nunca jogará D, então o jogador 1 infere que 2 nunca jogará R. A continuação desse racioćınio permite concluir que (U,M) é a solução do jogo. O problema com o PEEED é que ele também nem sempre leva a alguma solução. No Exemplo 5 abaixo, não existe nenhuma estratégia estritamente dominada e, portanto, não conseguimos eliminar nenhuma estratégia do jogo usando o PEEED. Logo, não conseguimos fazer qualquer predição mais acurada sobre qual deve ser o resultado deste jogo usando este procedimento (ou, pelo menos, o que não pode ser resultado). Exemplo 6: Considere o jogo: 1↓ / 2 → L R U 1, 1 0, 0 D 0, 0 0, 0 Para esse jogo, não existem nem estratégias estritamente dominantes nem estratégias estrita- mente dominadas. Podemos enfraquecer as definições de dominância estrita, relaxando a exigência de que o payoff seja sempre estritamente maior nas definições acima, de modo a obter o seguinte conceito. Definição: Estratégia Fracamente Dominante. Uma estratégia ŝi ∈ Si é fracamente domi- nante para o jogador i se para toda estratégia si 6= ŝi, si ∈ Si, valer que: ui(ŝi, s−i) ≥ ui(si, s−i), para todo si ∈ Si , com desigualdade estrita para pelo menos um s−i. Evidentemente, toda estratégia estritamente dominante é fracamente dominante, mas a volta não vale: no Exemplo 6 acima, as estratégias U de 1 e L de 2 são fracamente dominantes, mas não estritamente dominantes, já que para o jogador 1, quando 2 escolhe L, escolher U dá payoff estritamente maior do que escolher D. Porém se 2 escolhe R, então o payoff para 1 ao escolher U é igual (e não maior) ao payoff que ele obtém se escolher D. Note que racioćınio similar vale para o jogador 2, com relação a sua estratégia L. Dizemos que (U,L) é um equiĺıbrio formado por estratégias fracamente dominantes. Problema similar ao que ocorre com a noção de estratégias estritamente dominantes ocorre com o conceito de estratégias fracamente dominantes: pode ser que não exista solução para o jogo em estratégias fracamente dominantes, como o Exemplo 6 ilustra. José Guilherme de Lara Resende 8 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Exemplo 7: Considere o seguinte jogo: E D C (2, 1) (3, 0) M (4, 0) (2, 1) B (4, 4) (3, 4) É fácil observar que não existe estratégia fracamente dominante para ambos os jogadores (apenas B é fracamente dominante para o jogador 1). Vamos introduzir o seguinte conceito para analisar o jogo acima, um relaxamento da noção de estratégia estritamente dominada. Definição: Estratégia Fracamente Dominada. Uma estratégia s̄i é fracamente dominada para o jogador i quando existir uma outra estratégia ŝi ∈ Si tal que: ui(ŝi, s−i) ≥ ui(s̄i, s−i), para todo s−i ∈ S−i , com desigualdade estrita para pelo menos um s−i. Dizemos então que ŝi domina fracamente s̄i. Vamos aplicar um procedimento de eliminação de estratégias fracamente dominadas (PEEFD) ao jogo do exemplo 7 acima. Podemos fazê-lo de três modos distintos: 1. Se eliminarmos C e M simultaneamente para o jogador 1, obtemos que E e D dão o mesmo payoff para o jogador 2 e não podemos eliminar nenhuma dessas estratégias. Sobram então (B,E) e (B,D) como posśıveis resultados do jogo. 2. Se eliminarmos primeiro C para o jogador 1, a estratégia E do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando E, podemos eliminar M no jogo resultante, obtendo (B,D) (payoff (3,4)) como solução. 3. Se eliminarmos primeiro M para o jogador 1, a estratégia D do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando D, podemos eliminar C no jogo resultante, obtendo (B,E) (payoff (4,4)) como solução. Portanto, a ordem de eliminação das estratégias fracamente dominadas pode afetar a solução obtida. Esta é uma caracteŕıstica ruim deste procedimento, pois a solução do jogo pode mudar conforme a ordem de eliminação das estratégias. Este problema não ocorre quando eliminamos estratégias estritamente dominadas. O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jo- gadores e da estrutura do jogo. Porém, esses procedimentos não esgotam toda a força dessa hipótese. Usando a hipótese de conhecimento comum, podemos eliminar outras estratégias além das dominadas. Definição: Melhor Resposta. A estratégia ŝi é a melhor resposta do jogador i à estratégia ŝ−i dos outros jogadores se: ui(ŝi, ŝ−i) ≥ ui(si, ŝ−i), para todo si ∈ Si . José Guilherme deLara Resende 9 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Portanto, a estratégia ŝi é a melhor resposta do jogador i para a estratégia ŝ−i dos outros jo- gadores se ela for a ou uma das escolhas ótimas de i quando ele acreditar que os outros jogadores irão selecionar a estratégia ŝ−i. Um jogador não deve escolher uma estratégia que nunca é uma melhor resposta, pois neste caso não existe justificativa para o uso dessa estratégia. Observe que estratégias estritamente dominadas nunca são a melhor resposta. Podemos montar um procedi- mento de eliminação de estratégias que nunca são a melhor resposta, de modo similar ao PEEED. Para justificar o uso deste procedimento, devemos mais uma vez supor a validade da hipótese de conhecimento comum da racionalidade dos jogadores e da estrutura do jogo. Definição: Estratégias Racionalizáveis. As estratégias em Si do jogador i que sobrevivem ao procedimento de eliminação de estratégias que nunca são a melhor resposta são chamadas racionalizáveis. Uma estratégia racionalizável pode sempre ser “justificada”, ou seja, o jogador pode justificar a escolha dessa estratégia com uma conjectura razoável sobre o comportamento dos outros jogadores (nenhum rival escolherá uma estratégia não racionalizável). É posśıvel mostrar que as seguintes afirmações são verdadeiras: • A ordem de remoção das estratégias que nunca são a melhor resposta não altera o resultado obtido; • Cada jogador tem pelo menos uma estratégia racionalizável, podendo ter mais de uma; • O conjunto de estratégias racionalizáveis está contido no conjunto de estratégias que sobre- vivem ao PEEED; • Para jogos com dois jogadores, o conjunto de estratégias racionalizáveis é igual ao conjunto de estratégias que sobrevivem ao PEEED. Porém, o conceito de estratégia racionalizável nem sempre fornece uma solução. Para o Exemplo 3, a batalha dos sexos, todas as estratégias são racionalizáveis e, portanto, o conceito não informa nada sobre o que esperar como solução deste jogo. Queremos tornar as predições sobre o resultado de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir veremos o conceito de equiĺıbrio de Nash (EN), que, satisfeitas certas condições, sempre aponta pelo menos uma solução para qualquer jogo na forma estratégica. Esse é o mais importante conceito em teoria dos jogos. José Guilherme de Lara Resende 10 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 2.3 Equiĺıbrio de Nash O máximo que podemos desenvolver usando apenas a hipótese de conhecimento comum é o conceito de estratégias racionalizáveis, visto acima. Para obtermos qualquer outro conceito mais robusto, temos que adicionar alguma hipótese nova. Definição: Equiĺıbrio de Nash em Estratégias Puras. Um conjunto de estratégias s∗ = (s∗1, . . . , s ∗ I) é um equiĺıbrio de Nash (EN) (em estratégias puras) para um determinado jogo se para todo jogador i, i = 1, . . . , I, valer que: ui(s ∗ i , s ∗ −i) ≥ ui(si, s∗−i), para todo si ∈ Si . Dizemos que um EN é estrito se as desigualdades acima forem estritas. Logo, em um EN estrito, não existe, para nenhum dos jogadores, nenhuma outra estratégia diferente da de equiĺıbrio que resulte em um payoff igual ao de equiĺıbrio, dado que os outros jogadores estão selecionando as suas estratégias de equiĺıbrio. Em um equiĺıbrio de Nash, a estratégia de cada jogador é a melhor resposta para as estratégias que são de fato escolhidas pelos outros jogadores. Portanto, um EN requer que os jogadores estejam corretos sobre suas conjecturas a respeito das estratégias escolhidas pelos seus rivais. Dizemos que os jogadores possuem expectativas mutualmente corretas. O conceito de EN traz uma predição mais precisa a respeito do resultado de um jogo do que o conceito de racionabilidade. No Exemplo 3 acima, batalha dos sexos, todas as estratégias são racionalizáveis, mas apenas (F, F ) e (C,C) são EN em estratégias puras. Vamos mostrar que (F, F ) é um EN estrito. Se 1 escolher F , então 2 maximiza o seu payoff escolhendo F (e se escolhesse C obteria um payoff estritamente menor). Logo, escolher F é a melhor resposta de 2 para a escolha de F feita por 1. De modo similar, se 2 escolher F , então 1 maximiza o seu payoff escolhendo F (e se escolhesse C obteria um payoff estritamente menor). Logo, escolher F é a melhor resposta de 1 para a escolha de F feita por 2. Isso mostra que (F, F ) é um EN estrito. Usando um argumento similar, não é dif́ıcil observar que o jogo “Cara ou Coroa”, discutido no Exemplo 1 acima, não possui EN em estratégias puras. De modo geral, não podemos garantir a existência de EN em estratégias puras. Intuitivamente, qualquer solução do jogo “Cara ou Coroa” envolve ambos os jogadores escolhendo suas estratégias de modo impreviśıvel. Para formalizar essa possibilidade de randomização, vamos introduzir o conceito de estratégias mistas. Definição: Estratégias Mistas. Seja Si o conjunto de estratégias puras do jogador i. Uma estratégia mista do jogador i é uma distribuição de probabilidade sobre Si, ou seja, uma função σi : Si → [0, 1], que atribui uma probabilidade a cada estratégia pura do jogador i. Logo, temos que: 0 ≤ σi(si) ≤ 1 , ∀si e ∑ si∈Si σi(si) = 1 . O simplex de Si, representado por ∆Si, é o conjunto das estratégias mistas do jogador i. Este conjunto inclui também as estratégias puras do jogador (estratégias mistas degeneradas), já que se σ(s̄i) = 1 para alguma estratégia s̄i, então isso significa que s̄i é escolhida com probabilidade 1. José Guilherme de Lara Resende 11 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Se os jogadores randomizarem suas estratégias, então o resultado do jogo deixará de ser de- termińıstico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja σ = (σ1, σ2) uma coleção de estratégias mistas para os jogadores 1 e 2. A utilidade esperada do jogador 1 (similar para 2) para o conjunto de estratégias mistas σ é calculada como: u1(σ1, σ2) = ∑ s1∈S1,s2∈S2 [σ1(s1)× σ2(s2)]× u1(s1, s2) Considere o jogo Cara e Coroa descrito no Exemplo 1 e as estratégias mistas σ1 = (1/4◦Ca, 3/4◦ Co) e σ2 = (2/3 ◦ Ca, 1/3 ◦ Co) para os jogadores 1 e 2, respectivamente. A utilidade esperada do jogador 1 quando ele escolhe a estratégia σ1 e o jogador 2 escolhe a estratégia σ2 é: u1(σ1, σ2) = ∑ s1∈S1,s2∈S2 σ1(s1)× σ2(s2)× u1(s1, s2) = σ1(Ca)× σ2(Ca)× u1(Ca,Ca) + σ1(Ca)× σ2(Co)× u1(Ca,Co)+ + σ1(Co)× σ2(Ca)× u1(Co,Ca) + σ1(Co)× σ2(Co)× u1(Co,Co) = 1 4 × 2 3 × (−1) + 1 4 × 1 3 × (+1) + 3 4 × 2 3 × (+1) + 3 4 × 1 3 × (−1) = 1 6 Podemos estender imediatamente os conceitos de estratégias dominantes e dominadas, proced- imentos de eliminação e estratégias racionalizáveis, ao permitir que os jogadores possam escolher estratégias mistas, além de estratégias puras. Definição: Equiĺıbrio de Nash. Um conjunto de estratégias σ∗ = (σ∗1, . . . , σ ∗ I ) é um equiĺıbrio de Nash para um jogo na forma normal se para todo jogador i, i = 1, . . . , I, valer que: ui(σ ∗ i , σ ∗ −i) ≥ u1(σi, σ∗−i), para todo σi ∈ ∆Si . A definição acima de EN permite que os jogadores randomizem entre as estratégias puras. Logo, eles podem não somente escolher uma estratégia pura, mas também escolher uma estratégia que envolva várias estratégias puras, cada uma escolhida com determinada probabilidade. Observe que, em equiĺıbrio, a hipótese de expectativas mutualmente corretas implica que cada jogador conhece o modo em que os outros jogadores estão randomizando (as estratégias mistas escolhidas por seus rivais). Pela definição de EN com estratégias mistas, para cada conjunto de estratégias dos jogadores candidato a equiĺıbrio, devemos verificar se para cada jogador, a sua estratégia é de fato a melhor resposta para as estratégias dos outros jogadores que fazem parte do conjunto de estratégiascan- didatas a equiĺıbrio. Considerando que existem infinitas estratégias mistas, este procedimento de cerificação para determinar EN é inviável. Como fazemos então para encontrar todos os equiĺıbrios de Nash? O teorema abaixo fornece uma resposta. Teorema: Equivalência de Definições. As seguintes afirmativas são equivalentes: 1. (σ∗1, σ ∗ 2) ∈ ∆(S1)×∆(S2) é um equiĺıbrio de Nash; 2. Para todo jogador i, ui(σ ∗ 1, σ ∗ 2) = ui(si, σ ∗ −i), para todo si jogado com probabilidade positiva; e ui(σ ∗ 1, σ ∗ 2) ≥ ui(si, σ∗−i), para todo si que não é jogado com probabilidade positiva. José Guilherme de Lara Resende 12 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula O teorema fornece um algoritmo para encontrar equiĺıbrios de Nash em estratégias mistas. Ele diz que em um EN em estratégias mistas, duas estratégias puras de um jogador que podem ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar o mesmo payoff para esse jogador, que será igual ao payoff obtido no equiĺıbrio. Esse resultado é consequência de utilizarmos a utilidade esperada para calcularmos o payoff de um conjunto de estratégias mistas. Caso existissem duas estratégias puras que o jogador escolhesse com probabilidade positiva e em que uma delas gerasse um payoff maior do que o da outra, o jogador não deveria atribuir probabilidade positiva à estratégia que lhe dá o payoff mais baixo, pois isso reduziria o seu payoff de equiĺıbrio. Ou seja, dadas as estratégias escolhidas em equiĺıbrio pelos outros jogadores, esse jogador é indiferente entre qualquer estratégia pura que ele de fato possa vir a escolher (que tem probabilidade positiva), e estas estratégias puras lhe dão um payoff igual ou maior do que qualquer outra estratégia que ele não escolhe. Lembre-se que o que de fato determina as probabilidades de cada jogador é fazer (σ∗1, σ ∗ 2) um equiĺıbrio. Vamos usar o teorema acima para calcular o EN para o jogo “Cara ou Coroa” descrito no Exem- plo 1. Suponha que o jogador 1 decida proceder do seguinte modo: escolhe Ca com probabilidade α e, portanto, escolhe Co com probabilidade 1 − α. Similarmente, o jogador 2 escolhe Ca com probabilidade β e, portanto, escolhe Co com probabilidade 1 − β. Vamos representar na matriz abaixo essa situação. 1↓ / 2 → Cara (β) Coroa (1− β) Cara (α) −1, 1 1,−1 Coroa (1− α) 1,−1 −1, 1 Pelo teorema acima, essas randomizações são um EN se, e somente se: u1(Ca, σ2) = u1(Co, σ2) e u2(σ1, Ca) = u2(σ1, Co), onde σ1 e σ2 representam as estratégias mistas dos jogadores 1 e 2, respectivamente. Portanto: u1(Ca, σ2) = u1(Co, σ2) ⇒ −1× β + 1× (1− β) = 1× β − 1× (1− β) ⇒ β = 0,5 u2(σ1, Ca) = u2(σ1, Co) ⇒ 1× α− 1× (1− α) = −1× α + 1× (1− α) ⇒ α = 0,5 Logo, σ1 = (1/2 ◦ Ca; 1/2 ◦ Co) e σ2 = (1/2 ◦ Ca; 1/2 ◦ Co) é um EN em estratégias mistas. Observe que: u1(Ca, σ2) = u1(Co, σ2) = u1(σ1, σ2) = 0 u2(σ1, Ca) = u2(σ1, Co) = u2(σ1, σ2) = 0 , como esperado pelo teorema. José Guilherme de Lara Resende 13 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 2.4 Teorema de Existência e Outros Resultados Teorema de Existência de Equiĺıbrio de Nash. Todo jogo finito na forma normal possui pelo menos um equiĺıbrio de Nash, assumindo que os jogadores possam usar estratégias mistas. O Teorema de Existência garante que para todo jogo na forma estratégica finito existirá pelo menos um equiĺıbrio de Nash (EN). Logo o conceito de EN não é problemático no sentido que para qualquer jogo finito podemos garantir que existirá uma solução para ele, se usarmos o conceito de EN como solução para o problema de interdenpedência estratégica modelado no jogo. A relação entre equiĺıbrio de Nash e os conceitos de equiĺıbrio com estratégias dominantes é descrita pelos seguintes resultados: 1. Se existir equiĺıbrio em estratégias estritamente dominantes, ele será único e será o único EN do jogo. O mesmo vale para equiĺıbrios obtidos com o PEEED: se existir, será único e o único EN do jogo. 2. Se existir equiĺıbrio em estratégias fracamente dominantes, então ele será um EN. Neste caso, pode ocorrer que exista outro EN, formado por estratégias fracamente dominadas. O Exemplo 6 acima ilustra esse caso, em que (D,R) é um EN formado por estratégias fracamente dominadas. 3. Vimos no Exemplo 5 acima que o PEEFD pode levar a diferentes resultados, dependendo da ordem de eliminação adotada. De qualquer modo, se o PEEFD levar a algum resultado, ele será um EN. Exemplo 6 revisto: Considere novamente o seguinte jogo visto no Exemplo 6: 1↓ / 2 → L R U 1, 1 0, 0 D 0, 0 0, 0 Esse jogo possui dois EN, dados por (U,L) e (D,R). Não existe equiĺıbrio em estratégias estritamente mistas. O EN (U,L) é também equiĺıbrio em estratégias fracamente dominantes (e pode ser obtido usando o PEEFD). O EN (D,R) é um equiĺıbrio formado por estratégias fracamente dominadas e portanto não pode ser encontrado usando o PEEFD. O Exemplo 6 acima mostra que podem existir equiĺıbrios de Nash formados por estratégias fracamente dominadas. O resultado de um jogo ser desse tipo é algo estranho, pois envolve cada jogador escolher uma estratégia para a qual existe outra opção que dará sempre um payoff maior ou igual, independentemente do que os outros jogadores façam. Existe um refinamento do EN para jogos na forma normal, chamado refinamento da mão-trêmula (Selten, 1975; Myerson, 1978), que exclui a possibilidade desse tipo de equiĺıbrio ocorrer. O refinamento da mão-trêmula considera a possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estratégia a ser jogada. O EN então será chamado perfeito da mão-trêmula caso satisfaça a condição imposta pelo refinamento. No exemplo acima, apenas o EN (U,L) é perfeito da mão-trêmula. Refinamentos do conceito de EN são direcionados para eliminar EN que por algum motivo não são considerados razoáveis. Nesse caso, existirá algum ou alguns EN que satisfazem o refinamento e algum ou alguns que não o satisfazem. José Guilherme de Lara Resende 14 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 3 Jogos na Forma Extensiva 3.1 Introdução Sabemos que para descrevermos um jogo são necessários três objetos: 1) os jogadores; 2) a regra do jogo; e 3) o resultado (payoffs) do jogo. Um jogo na forma extensiva é a representação mais adequada para situações dinâmicas. Definição Informal de Jogo na Forma Extensiva. Representamos um jogo finito na forma extensiva (ou forma sequencial) em forma de árvore, onde em cada conjunto de informação um jogador escolhe uma ação que desenvolve o jogo. Todo jogo na forma extensiva satisfaz as seguintes propriedades: • Se inicia em um único nó de decisão, chamado nó inicial. Logo, todo nó do jogo que não é o nó inicial é um sucessor deste nó, no sentido que podemos descrever qualquer nó a partir do nó inicial mais uma série de ações tomadas (a história ocorrida do jogo até aquele nó); • Todo nó do jogo, com exceção do nó inicial (que não possui nenhum predecessor), tem um único nó predecessor imediato; • Nos nós finais do jogo, nenhum jogador faz qualquer escolha (nenhuma ação pode ser tomada) e nestes nós são especificados os payoffs do jogo para a forma de como o jogo foi jogado, descrita pela história do jogo narrada pelo nó final considerado. Definição: Jogo de Informação Perfeita. Um jogo é chamado de informação perfeita se cada jogador observa perfeitamente todas as ações escolhidas por todos os jogadores que se moveram antes dele. Em um jogo de informação perfeita, cada nó de decisão constitui um conjunto de informação por si só, já que todos os jogadores observam todas as decisões tomadas anteriormente a qualquer momento que for jogar. Se um jogo não for de informação perfeita, então existe pelo menos um ponto do jogo em que algum jogador não sabe o que foi escolhido no momento anterior. Neste caso, unimos os nósque fazem parte de um mesmo conjunto de informação por um retângulo pontilhado, como ilustra o jogo à direita na figura abaixo, indicando que existe (pelo menos) um conjunto de informação que contém mais de um nó de decisão de um jogador, o que significa que este jogador não sabe exatamente em que nó está do conjunto de informação (ou seja, ele não observa a tomada de decisão feita no nó predessor imediato). Jogo de Informação Perfeita t1 � � � � �� E @ @ @ @ @@ D t2 2 � � � � �� r A A A A AA l ( 1 3 ) ( 0 0 ) � � � � �� l A A A A AA r t ( 0 0 ) ( 3 1 )t t t t Jogo de Informação Imperfeita t1 � � � � �� E @ @ @ @ @@ D t 2 � � � � �� r A A A A AA l ( 1 3 ) ( 0 0 ) � � � � �� l A A A A AA r t ( 0 0 ) ( 3 1 )t t t t José Guilherme de Lara Resende 15 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula No jogo à esquerda da figura acima, o jogador 2 observa se 1 escolhe E ou D, ou seja, cada nó de decisão de 2 forma um conjunto de informação por si só. Já no jogo à direita da figura acima, o jogador 2 não observa se 1 escolhe E ou D, ou seja, os dois nós de decisão de 2 formam um único conjunto de informação. Evidentemente, os nós de decisão que pertencem a um mesmo conjunto de informação devem ser todos referentes ao mesmo jogador. Além disso, as ações que o jogador pode tomar em nós de decisão que estão no mesmo conjunto de informação devem ser iguais. Caso isso não ocorresse e existissem dois nós de decisão no mesmo conjunto de informação, com ações não exatamente iguais, então o jogador seria capaz de inferir em que nó está, ao realizar que as ações dispońıveis naquele nó são diferentes das ações do outro nó. Portanto, nós de decisão que pertencem a um mesmo conjunto de informação pertencem ao mesmo jogador e possuem exatamente as mesmas ações dispońıveis. Definição: Jogo de Memória Perfeita. Um jogo é de memória perfeita quando nenhum jogador esquece o que já sabia (inclusive ações que já foram tomadas durante o desenrolar do jogo). A árvore de jogo ilustrada na figura abaixo não apresenta memória perfeita. Neste exemplo, o jogador 1, na terceira rodada, após a sua escolha na primeira rodada e após a escolha do jogador 2 na segunda rodada, não se lembra de sua própria escolha feita na primeira rodada. t1�� ��� ��� ���� E HH HHH HHH HHHj D t2 � � � � �� a @ @ @ @ @@R b t � � � � ��� a A A A A AAU b t1 � � � � ��� A A A A AAU l r l r l r l r t � � � � �� @ @ @ @ @@Rt � � � � ��� A A A A AAU t � � � � ��� A A A A AAU Finalmente, existe uma outra definição, jogo de informação completa, que se refere a jogos em que os jogadores conhecem exatamente toda a estrutura do jogo, podendo ocorrer apenas que não observem alguma tomada de decisão (ou seja, um jogo de informação completa pode ser de informação imperfeita). Já em um jogo de informação incompleta, os jogadores podem não conhecer alguma informação relevante sobre o tipo dos seus rivais, tais como as preferências, as estratégias ou os payoffs dos outros jogadores. Um exemplo clássico de jogos de informação incompleta refere- se a leilões. Em um leilão, cada participante não sabe qual é a valoração exata que os outros participantes atribuem ao objeto leiloado. José Guilherme de Lara Resende 16 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 3.2 Relação entre Forma Extensiva e Forma Normal Um jogo representado na forma normal pode ser representado na forma extensiva sem am- biguidades? O contrário também é válido? Da forma extensiva para a forma normal sim, mas o contrário não é válido. A mesma forma normal pode representar mais de um jogo na forma extensiva. A figura abaixo mostra dois jogos diferentes que possuem a mesma representação na forma normal, que se resume a representação de um jogo do tipo “Cara ou Coroa” discutido no Exemplo 1. Nos dois jogos descritos na figura a seguir, o payoff na primeira linha é do jogador 1 e na segunda linha, do jogador 2. Jogador 1 escolhe primeiro t1 � � � � �� Ca @ @ @ @ @@ Co t 2 � � � � �� Co A A A A AA Ca ( −1 1 ) ( 1 −1 ) � � � � �� Ca A A A A AA Co t ( 1 −1 ) ( −1 1 )t t t t Jogador 2 escolhe primeiro t2 � � � � �� Ca @ @ @ @ @@ Co t 1 � � � � �� Co A A A A AA Ca ( −1 1 ) ( 1 −1 ) � � � � �� Ca A A A A AA Co t ( 1 −1 ) ( −1 1 )t t t t A forma normal é uma estrutura mais simples do que a forma extensiva. Ela envolve menos objetos matemáticos do que a forma extensiva, porque a estratégia do jogador pode condensar uma quantidade enorme de informação sobre a tomada de decisão do jogador. Logo, encontrar a representação na forma normal do jogo analisado pode tornar mais fácil a determinação dos EN de um jogo na forma sequencial. Para isso, temos que tornar claro em que consiste uma estratégia para um jogo na forma extensiva. A definição de estratégia para jogos simultâneos é simples e direta. No caso de jogos sequenciais, a definição de estratégia é mais elaborada, já que nesses jogos, um determinado jogador pode ter vários momentos de escolha de ações ao longo do jogo. Por exemplo, em xadrez, as jogadas dos dois jogadores se alternam ao longo da partida. Uma estratégia de um jogador para jogos sequenciais é uma regra que determina a escolha de ação em todos os conjuntos de informação desse jogador no jogo. Logo, uma estratégia para o jogador i é um plano contingente completo: uma regra de decisão que especifica como o jogador i jogará em toda e qualquer circunstância do jogo em que ele possa vir a jogar. Isso significa que uma estratégia define ações para todos os conjuntos de informação do jogo, mesmo que esses conjuntos de informação não sejam alcançados durante o jogo. José Guilherme de Lara Resende 17 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Exemplo 8. Suponha o seguinte jogo sequencial: t1 � � � � �� E @ @ @ @ @@ D t2 2 � � � � �� r A A A A AA l ( 6 4 ) ( 10 10 ) � � � � �� f A A A A AA g t ( 0 0 ) ( 14 8 ) Como o jogador 1 só possui um conjunto de informação, dado pelo nó de decisão inicial, onde as ações dispońıveis são E e D, então 1 possui apenas duas estratégias: E e D. Já o jogador 2 possui dois conjuntos de informação distintos : 1) o nó de decisão alcançado quando 1 escolhe E, que vamos denotar por x1, e onde 2 pode escolher as ações l ou r; e 2) o nó de decisão alcançado quando 1 escolhe D, que vamos denotar por x2, e onde 2 pode escolher as ações f ou g. Portanto, uma estratégia para o jogador 2 pode ser descrita como (l em x1, g em x2), ou de modo mais simples, (l, g). Essa estratégia significa que o jogador 2 escolhe l em x1 e g em x2. Fica claro então que uma estratégia define ações em todos os pontos do jogo. Isto pode parecer desnecessário à primeira vista, mas para computarmos os EN, é importante que a estratégia seja completa nesse sentido. Portanto, o conjunto das estratégias do jogador 2 é formado por (l, f), (l, g), (r, f), (r, g). Logo, o jogador 2 possui 22 = 4 estratégias (2 é o número de ações em cada conjunto de informação, e 2 também é o número de conjuntos de informação do jogador 2). Para determinarmos todos os equiĺıbrios de Nash em estratégias puras de um jogo na forma sequencial, o ideal é encontramos a representação do jogo na forma normal. O primeiro passo para isso é encontrar as estratégias de cada jogador. No Exemplo 8 acima, vimos que o jogador 2 possui 4 estratégias e o jogador 1 possui 2 es- tratégias. Obtemos então a seguinte matriz de dimensão 2 por 4 para a representação desse jogo na forma normal: 1↓ / 2 → (l, f) (l, g) (r, f) (r, g) E 6, 4 6, 4 10, 10 10, 10 D 0, 0 14, 8 0, 0 14, 8 Preenchemos os payoffs na matriz usando a representação em forma de árvore do jogo. Por exemplo, se 2 escolheu E e 2 escolheu (l, f), então o payoff resultante será(6, 4). Já se 1 escolher D e 2 escolher (l, f), então percebemos que a ação importante definida na estratégia de 2 quando 1 escolhe D é a segunda, no caso, f . Neste caso, obtemos o payoff (0, 0). Uma vez obtida a representação na forma normal do jogo, é fácil obter os EN em estratégias puras do jogo, que são três: (E; (r, f)), (D, (l, g)) e (D, (r, g)). José Guilherme de Lara Resende 18 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Veremos agora que alguns tipos de jogos possuem uma dinâmica de ações escolhidas em tempos diferentes de tal modo que representá-los na forma normal e dáı encontrarmos os EN pode não ser adequado, no sentido de que alguns destes EN não constituem solução razoável para a interação estratégica modelada. Mais especificamente, quando derivamos a forma normal associada a um jogo sequencial e encontrarmos os EN do jogo, alguns destes equiĺıbrios podem não ser cŕıveis, ou seja, baseados em ameaças de um dos jogadores que não será cumprida caso tivesse que de fato ser levada a cabo. O exemplo a seguir ilustra esse problema. Exemplo 9: Monopolista e Firma Entrante. Considere um mercado monopolista. O mo- nopolista mantém o mercado ameaçando firmas entrantes de uma guerra de preços. Desse modo, o monopólio mantém seu lucro. Porém, se alguma firma de fato entrar neste mercado, a melhor estratégia para o monopolista é formar um cartel e dividir o lucro de monopólio, já que a guerra de preços traria prejúızos não somente para a firma entrante, mas também para o incumbente. Essa situação estratégica é representada pelo seguinte jogo na forma extensiva. tEntrante � � � � �� Não Entra @ @ @ @ @@R Entra ( 0 20 ) t Monopolista ( −5 −5 ) ( 10 10 ) � � � � �� Briga @ @ @ @ @@R Acomoda A representação na forma normal do jogo sequencial acima é: Entrante/Monopolista Briga, se E entrar Acomoda, se E entrar Não entra 0,20 0,20 Entra -5,-5 10,10 Existem dois EN em estratégias puras para o jogo: 1. firma entrante (E) Entra; monopolista (M) Acomoda, se E entrar, e 2. firma entrante Não entra; monopolista Briga se E entrar. O segundo EN é baseado em uma ameaça vazia, não-cŕıvel : M faz uma ameaça, que se for levada a sério, não precisará ser cumprida, pois nesse caso E terá escolhido não entrar. Porém, se E decidir entrar no mercado, o melhor para M será se acomodar. O refinamento de perfeição em subjogos, que veremos a seguir, tenta eliminar EN baseados em ameaças não cŕıveis, por não serem uma solução razoável para a interação estratégica modelada. A noção de Equiĺıbrio de Nash Perfeito em Subjogos (ENPS) é desenvolvida tanto para jogos sequenciais de informação perfeita quanto de informação imperfeita. José Guilherme de Lara Resende 19 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 3.3 Equiĺıbrio de Nash Perfeito em Subjogos (ENPS) Jogos de Informação Perfeita Vamos analisar jogos de informação perfeita primeiro. O objetivo é desenvolver um conceito de equiĺıbrio que elimine equiĺıbrios baseados em estratégias não-cŕıveis, como no Exemplo 8 acima, onde o ideal seria obter (Entra,Ac se E entrou) como única solução da interação estratégica descrita. Portanto, queremos refinar o conceito de EN de modo que as soluções do jogo ainda sejam EN, mas eliminando os EN baseados em estratégias que envolvam ameaças não-cŕıveis. O Prinćıpio da Racionalidade Sequencial (PRS), que exige que a estratégia de um jogador qualquer deve especificar ações que são ótimas em cada ponto do jogo, é fundamental para obtermos esse refinamento. Esse prinćıpio é implementado em um jogo de informação perfeita pelo seguinte Algoritmo de Indução Reversa (“backward induction algorithm”): 1. Comece pelos nós de decisão finais da árvore (“nós penúltimos” – nós cujos sucessores são todos nós terminais); 2. Determine a escolha ótima dos jogadores que jogam nesses nós (problema de maximização individual, sem interação estratégica); 3. Redesenhe a árvore, substituindo os nós de decisão final por um nó terminal, com payoff definido pela escolha ótima no passo 2); 4. Repita passos 1), 2) e 3) para esse jogo reduzido, até chegar ao nó inicial do jogo. A solução de indução reversa para jogos com informação perfeita se resume a que todos os jogadores façam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na prática, o jogo é resolvido do fim para o começo. O conjunto de estratégias puras s = (s1, s2, . . . , sI) é um conjunto de estratégias de indução reversa para um jogo na forma extensiva se tiver sido obtido de acordo com o algoritmo de indução reversa. É posśıvel mostrar que todo conjunto de estratégias de indução reversa é um EN do jogo. Resultado: Existência de Equiĺıbrio. Todo jogo na forma extensiva finito de informação perfeita tem um EN em estratégias puras, que pode ser encontrado usando indução reversa. Se os payoffs de cada jogador forem diferentes nos nós terminais, para todos os jogadores, então existirá um único EN que pode ser encontrado usando indução reversa. Corolário. Todo jogo finito de informação perfeita tem (pelo menos) um EN em estratégias puras. Exemplo 8: Monopolista e Firma Entrante (continuação). No jogo Monopolista/Entrante, existem dois EN em estratégias puras, mas apenas um EN obtido usando o algoritmo de indução reversa. O algoritmo elimina exatamente o EN baseado na ameaça não-cŕıvel do monopolista abrir uma guerra de preços caso o entrante decida entrar. Esta ameaça não é cŕıvel pois uma vez que a firma entrante entrar no mercado, se o monopolista fizer uma guerra de preços, ele próprio se prejudicará sem obter nenhum ganho. Logo, todo conjunto de estratégias obtido usando o algoritmo de indução reversa acima é um EN do jogo. Mas nem todo EN do jogo pode ser obtido por indução reversa. Os EN que podem ser obtidos utilizando o algoritmo são chamados EN perfeitos em subjogos (ENPS), ou EN que satisfazem o critério de perfeição em subjogos. José Guilherme de Lara Resende 20 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Jogos de Informação Imperfeita O algoritmo de indução reversa acima só se aplica para jogos de informação perfeita. Porém a ideia de racionalidade sequencial pode ser usada também para jogos de informação incompleta, por meio de um algoritmo similar de indução reversa. A ideia central é definir subjogos do jogo principal (Selten, 1965, 1975). Cada subjogo pode ser visto como um jogo por si só. A propriedade de racionalidade sequencial exige que um EN seja EN para cada subjogo do jogo original. Definição: Subjogo. Um subjogo de um jogo Γ na forma extensiva é um subconjunto do jogo tal que: (i) Se inicia em um conjunto de informação que contém apenas um único nó de decisão, e contém todos os nós sucessores desse nó inicial; (ii) Se o nó de decisão y pertence ao subjogo, então todo nó z que pertence ao conjunto de informação de y também pertence ao subjogo. Todo jogo possui pelo menos um único subjogo, que seria o próprio jogo. Este é o caso do exemplo abaixo. Um subjogo estrito de um jogo é um subjogo que está contido de modo estrito no jogo, ou seja, é diferente (“menor”) que o jogo inteiro. u1 � � � � � � E @ @ @ @ @ @ D u 2 � � � � � � r A A A A A A l ( 1 3 ) ( 0 0 ) � � � � � � l A A A A A A r u ( 0 0 ) ( 3 1 )u u u u Definição: ENPS em Estratégias Puras. O conjunto de estratégias s = (s1, s2, . . . , sI) do jogo Γ é um equiĺıbrio de Nash perfeito em subjogos (ENPS) se s = (s1, s2, . . . , sI) induz um equiĺıbrio de Nash em todo subjogo de Γ. ENPS é um refinamento de EN: todo ENPS é um EN, já que o próprio jogo é um subjogo seu. O contrário não é válido: existem EN que não são perfeitos em subjogos. Teorema. Para todo jogo na forma extensiva finito de informação perfeita, o conjunto de es- tratégiasde indução reversa é igual ao conjunto de ENPS em estratégias puras. Logo, em jogos de informação perfeita, o conjunto de ENPS coincide com o conjunto de EN obtido usando o algoritmo de indução reversa visto acima. Porém, considerando jogos de informação imperfeita, nem todo jogo possui um ENPS em estratégias puras. O teorema a seguir garante a existência de ENPS para jogos de memória perfeita. José Guilherme de Lara Resende 21 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Teorema: Existência de ENPS (Selten). Todo jogo na forma extensiva finito com memória perfeita possui um ENPS. A hipótese de memória perfeita é necessária. Existem exemplos de jogos de memória imperfeita que não possuem ENPS. O seguinte algoritmo geral de indução reversa para jogos na forma extensiva, sejam de in- formação completa ou não, é válido para encontrar os ENPS: 1. Comece pelo término da árvore, determine os EN para todos os subjogos finais (subjogos que não possuem nenhum subjogo estrito); 2. Substitua cada subjogo pelo payoff de um de seus EN; 3. Repita os passos 1) e 2) para o jogo reduzido, continue até não restar nenhum subjogo; 4. Repita 1), 2) e 3) para todos os EN encontrados (no caso de algum subjogo ter mais de um EN). Para jogos de informação perfeita, esse algoritmo é igual ao algoritmo anterior. 3.4 Jogos Repetidos Em um jogo do tipo dilema dos prisioneiros, seria posśıvel obter cooperação se repet́ıssemos o jogo diversas vezes? Com a repetição, o número de estratégias de cada jogador aumenta. Nesse caso, é posśıvel criar estratégias em que um jogador puna o seu rival caso ele não coopere. Vamos então analisar novamente o Dilema dos Prisioneiros (Exemplo 2): 1↓ / 2 → Confessar Não Confessar Confessar −3,−3 −1,−5 Não Confessar −5,−1 −2,−2 Suponha que o jogador 1 adote a seguinte estratégia: na primeira interação ele joga NC (co- operar). Nos peŕıodos seguintes, se o outro jogador escolheu NC (cooperar) no peŕıodo anterior, ele coopera hoje. Caso contrário, o jogador 1 escolhe C (não cooperar) até o jogo terminar. Essa estratégia pode levar a algum tipo de cooperação? Mais especificamente, existe algum equiĺıbrio tal que os jogadores venham a adotar estratégias cooperativas? Para jogos do tipo dilema dos prisioneiros repetidos finitas vezes, a resposta é negativa. Para jogos repetidos indefinidamente ou sem data certa para terminarem, a resposta pode ser positiva . A noção de ENPS tem como consequência que se o dilema dos prisioneiros for repetido um número fixo (finito) de vezes, o único equiĺıbrio de Nash perfeito em subjogos será formado pelo EN do jogo em cada peŕıodo sendo jogado. Logo, não é posśıvel obter o resultado eficiente com a repetição finita do jogo. Isso implica que qualquer dependência histórica nas estratégias atuais é eliminada. Ou seja, tudo o que ocorreu antes é irrelevante para decidir o que fazer hoje. Para jogos que satisfaçam as condições da proposição, um ENPS não depende da história ocorrida no jogo em nenhum momento. José Guilherme de Lara Resende 22 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Por exemplo, uma consequência desse fato é que se o dilema dos prisioneiros for jogado repeti- damente, por um peŕıodo determinado, continua sempre tendo a mesma solução não cooperativa entre os jogadores, para cada rodada do jogo. Esse resultado segue da hipótese de racionalidade sequencial. Por indução reversa, na última rodada, é melhor não cooperar. Resolvendo de traz para diante, obtemos não-cooperação para todas as rodadas do jogo. Intuitivamente, esse resultado ocorre pelo fato de o jogo ter uma data de término conhecida pelos jogadores. Resolvendo o jogo por indução reversa, cada jogador percebe que o seu rival irá descumprir o acordo de cooperação na última vez que interagirem. Eles se adiantam a isso e não cooperam na última rodada. Sabendo disso, os jogadores também não irão cooperar na penúltima rodada do jogo. Usando esse argumento, obtemos que os jogadores não cooperam em nenhuma rodada do jogo. Esse argumento, consequência da definição de ENPS, leva a resultados considerados pouco razoáveis, como mostra o Exemplo 9 abaixo, em que o único ENPS consiste nos dois jogadores escolherem P sempre, o que resulta no payoff (1, 1). Exemplo 9: Jogo da Centopeia. Considere o seguinte jogo. sI C P( 1 1 ) sII C P( 0 3 ) I C P s ( 2 2 ) sII C P( 1 4 ) . . . . . . . . . . . . ...s sII C P( 97 100 )( 99 99 ) s sI C P II C P( 98 101 ) (100 100) Para o jogo da centopeia, o único ENPS consiste em todo jogador escolher P em todo momento do jogo. Portanto, o payoff de equiĺıbrio é 1 para cada jogador, e nenhuma cooperação é obtida. Porém, se o dilema dos prisioneiros for repetido infinitamente (ou se não tiver uma data fixa para terminar), pode-se mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido como equiĺıbrio, dependendo do quanto os jogadores descontem o futuro. As estratégias que levam a esse tipo de equiĺıbrio são chamadas estratégias gatilho (trigger ou Nash-reversion strategies). Um exemplo é a estratégia “olho-por-olho” (tit-for-tat), onde a estratégia de hoje do jogador é igual à estratégia usada pelo seu adversário ontem. Considere a seguinte estratégia para o i, i = 1, 2, chamada grim reaper (ou grim trigger): na primeira interação ele joga NC (cooperar). Nos peŕıodos seguintes, se o outro jogador escolher NC (cooperar) no peŕıodo anterior, ele coopera hoje. Caso contrário, o jogador i escolhe C (não cooperar) para sempre (note que a estratégia é extremamente punitiva: um desvio do rival e nunca mais a cooperação pode ser refeita). Suponha que a taxa de desconto intertemporal é 0 < δ < 1. Temos que o jogador 2 cooperará se: ∞∑ t=0 −2δt ≥ −1 + ∞∑ t=1 −3δt ⇒ −2 1− δ ≥ −1 + −3δ 1− δ Logo, se: δ ≥ 1 2 = 50% , então o resultado cooperativo ((NC,NC) todo peŕıodo) é obtido como equiĺıbrio (é um equiĺıbrio de Nash perfeito em subjogos). José Guilherme de Lara Resende 23 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Portanto, dependendo da taxa de desconto intertemporal e dos payoffs obtidos desviando do equiĺıbrio cooperativo e seguindo o equiĺıbrio cooperativo, podem existir equiĺıbrios em que os jogadores adotem estratégias que envolvem cooperação. Esse resultado é conhecido como “Folk Theorem”. Como a taxa de desconto intertemporal δ é determinada pela taxa de juros r do seguinte modo: δ = 1 1 + r , então uma vez determinada a taxa de desconto intertemporal, podemos também encontrar a taxa de juros associada. Para o exemplo acima, temos que r ≥ 1. Leitura Sugerida • Varian, caṕıtulos 28 (A Teoria dos Jogos) e 29 (Aplicações da Teoria dos Jogos). • Nicholson e Snyder, caṕıtulo 8 (Strategy and Game Theory). José Guilherme de Lara Resende 24 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula Exerćıcios 1. Determine, justificando sucintamente, para os Exemplos 1 a 7 desta nota de aula: a) As estratégias estritamente dominantes e as estratégias estritamente dominadas, quando existirem. b) As estratégias fracamente dominantes e as estratégias fracamente dominadas, quando existirem. c) As estratégias que nunca são melhor resposta e as estratégias racionalizáveis. d) Considere todo par de estratégias para cada um desses jogos e verifique quais são equiĺıbrios de Nash e quais não são, justificando pelo alguns desses pares para fim de aprendizagem (se você ainda estiver com dificuldades, continue escrevendo a justifica- tiva, até entender bem a lógica de se determinar um equiĺıbrio de Nash em estratégias puras). e) Determine os equiĺıbrios de Nash que possuem de fato uma randomização ocorrendo para os exemplos 3 (problema de coordenação) e 4 (batalha dos sexos). f) Procure determinar se existe algum EN com randomização para o jogo dilema dos pri- sioneiros. Quais sãoos valores para as probabilidades encontradas? O que isso significa? 2. Argumente, de maneira clara e concisa, porque a ordem de eliminação das estratégias não afeta o resultado do PEEED mas pode afetar o resultado do PEEFD. 3. Vimos a definição de dominância para estratégias puras. Estratégias mistas podem também dominar estratégias puras ou mesmo outras estratégias mistas. Considere o seguinte jogo e responda os itens a seguir. 1/2 L M R U 3,0 0,-3 0,-4 D 2,4 4,5 -1,8 a) Mostre que as estratégias puras L e R não dominam estritamente a estratégia pura M . b) Mostre que M é estritamente dominada pela estratégia mista em que 2 escolhe L e R com probabilidades iguais. 4. Calcule os EN dos seguintes jogos e verifique se existe alguma relação desses equiĺıbrios com equiĺıbrios obtidos por meio de algum argumento de dominância: a) 1/2 L R U 1,1 0,0 D 0,0 0,0 b) 1/2 L R U 1,1 0,1 D 1,0 -1,-1 José Guilherme de Lara Resende 25 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula c) 1/2 L l m M U 1,1 1,2 0,0 0,0 C 1,1 1,1 10,10 -10,-10 D 1,1 -10,-10 10,-10 1,-10 5. Paulo e Rafael querem dividir cem reais e decidem usar o seguinte jogo para isso. Paulo diz quanto gostaria que Rafael recebesse. Sem observar a escolha de Paulo, Rafael diz quanto seria uma oferta aceitável. As escolhas podem ser apenas em incrementos de R$ 25 (ou seja, R$ 0, R$ 25, R$ 50, R$ 75 e R$ 100). Se a oferta de Paulo é igual ou maior do que o que Rafael acha aceitável, então eles dividem o dinheiro seguindo a oferta de Paulo. Caso contrário, o dinheiro é jogado fora. A utilidade de cada jogador é dada pelo tanto de dinheiro que ele recebe. a) Represente esse jogo na forma normal (ou seja, escreva esse jogo na forma matricial). b) Quais são o(s) equiĺıbrio(s) de Nash em estratégias puras desse jogo? 6. Considere o seguinte jogo do tipo dilema dos prisioneiros representado pela matriz abaixo. D C D (R$1, R$1) (R$3, R$0) C (R$0, R$3) (R$2, R$2) a) Suponha que cada jogador deseja apenas obter o máximo de dinheiro posśıvel. Quais são os EN desse jogo? Suponha agora que os dois jogadores são altrúıstas, ou seja, cada um deles se importa com o bem-estar do rival. Em particular, se mi(s1, s2) é o payoff que o jogador i ganha e mj(s1, s2) é o payoff do jogador j, quando a estratégia jogada é (s1, s2), então a utilidade do jogador i é dada por ui(s1, s2) = mi(s1, s2) + αmj(s1, s2), onde α ≥ 0. b) Escreva o jogo em forma matricial para α = 1. Qual o EN agora? O jogo continua sendo do tipo dilema dos prisioneiros? c) Para quais valores de α o jogo permanece como dilema dos prisioneiros? Para os valores de α para os quais o jogo não é mais um dilema dos prisioneiros, encontre os EN. d) Existe algum valor de α para o qual qualquer combinação de estratégias puras será um equiĺıbrio? 7. Considere o jogo denotado por G(n, k) de adivinhar a média (“guessing the average”, Osborne e Rubinstein), onde k é a quantidade de participantes que simultanemente escolhe um número inteiro entre 1 e n (inclusive 1 e n). Um prêmio de R$60 é dividido igualmente entre os jogadores que escolheram o número mais perto da metade da média de todas as escolhas (ou seja, se a metade da média foi 3, e os número mais próximos foram 2 e 4, os participantes que escolheram esses valores dividem o prêmio. Já se a metade da média foi 3,3, todos os participantes que escolheram 3 levam o prêmio) a) Escreva a forma normal do jogo G(3, 2) e ache todos os EN. b) Argumente que para quaisquer n e k, todo mundo escolhendo 1 é um EN. c) Argumente que em qualquer EN o prêmio é dividido por todos os participantes. d) Argumente que o conjunto de estratégias descrito no item b) é o único EN. José Guilherme de Lara Resende 26 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 8. O exército de Patópolis deve decidir se ataca ou não o exército de Gansópolis, que está ocupando uma ilha que pertencia à Patópolis, situada entre as duas cidades. No caso de um ataque, o exército de Gansópolis pode lutar ou recuar de volta à sua cidade, por meio de uma ponte que liga a ilha à cidade. Cada cidade prefere ocupar a ilha a não ocupá-la, e uma guerra é o pior resultado posśıvel para ambas as cidades. Modele essa situação como um jogo na forma extensiva e mostre que o exército de Gansópolis pode melhorar seu payoff se queimar a ponte que liga a ilha à sua cidade, eliminando a opção de recuar. Explique esse resultado em termos intuitivos e relacione com o que foi visto em aula. 9. Considere o seguinte jogo na forma extensiva: t1E( 2 2 ) � � � � �� M @ @ @ @ @@ D t 2 � � � � �� r A A A A AA l ( 3 1 ) ( 1 0 ) � � � � �� l A A A A AA r t ( 0 0 ) ( 0 1 )t t t t a) Escreva o conjunto de estratégias desse jogo e encontre a forma estratégica associada. b) Encontre os EN em estratégias puras. c) Encontre os ENPS em estratégias puras. 10. (P4-2/18) Considere o jogo abaixo, em que o payoff na parte superior entre parênteses é do jogador 1 e o payoff na parte inferior é do jogador 2. Reponda aos itens abaixo.( 2 0 )v1 � � � � � � �� E @ @ @ @ @ @ @@R S - D v 2� � � � � � r @ @ @ @ @ @R l ? m ( 1 3 ) ( 1 2 ) ( 4 0 ) � � � � � � l @ @ @ @ @ @R r ? m v ( 4 0 ) ( 0 2 ) ( 3 3 ) a) Descreva os conjuntos de estratégias dos dois jogadores. b) Qual a representação desse jogo na forma normal? c) Existe alguma estratégia dominada (estritamente ou fracamente) para algum dos jo- gadores? d) Quais são os equiĺıbrios de Nash (EN) em estratégias puras desse jogo? e) Quais são os EN perfeitos em subjogos (em estratégias puras)? José Guilherme de Lara Resende 27 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 11. (P2-1/19) Considere o seguinte jogo na forma extensiva: rI ? L � ��� ��� ��� M H HHH HHH HHj R( 0 2 )rII r II � � � � �� a @ @ @ @ @@R b ( 1 1 ) ( −1 −1 ) ( −2 4 ) � � � � �� c @ @ @ @ @@R d r r Ir � � � � �� P @ @ @ @ @@R Q ( −1 3 ) ( −1 5 ) As ações do jogador I estão representadas por letras maiúsculas e as ações do jogador II por letras minúsculas. O payoff na parte superior em parênteses é do jogador I e o payoff na parte inferior é do jogador II. a) Qual o número de estratégias puras do jogador 1? E do jogador 2? b) Qual a representação desse jogo na forma normal? c) Existe alguma estratégia dominada (estritamente ou fracamente) para algum dos jo- gadores? d) Quais são os equiĺıbrios de Nash (EN) em estratégias puras desse jogo? e) Quais são os EN perfeito em subjogos (em estratégias puras)? 12. (P2-2/18) Considere o jogo na forma extensiva abaixo, em que o payoff descrito na parte de cima do vetor de payoffs é o da firma entrante e o payoff na parte de baixo desse vetor é o da firma monopolista. sEntrante � � � � ñE @ @ @ @R E 0 60 sMonopolista � � � � ñL @ @ @ @R Ls Entrante � � � �� GE A A A AU PE 8 30 15 15 � � � �� PE A A A AU GE s −3 0 −12 −6 a) Determine os conjuntos de todas as estratégias para os dois jogadores. b) Encontre os EN em estratégias puras do jogo. c) Encontre os ENPS do jogo. d) Considere o jogo acima, mas agora suponha que a firma Entrante observa se o Mo- nopolista escolheu ñL ou L. Descreva todas as estratégias que a firma Entrante possui agora. José Guilherme de Lara Resende 28 NA 5 – Teoria dos Jogos Microeconomia 2 Notas de Aula 13. (P4-1/19) Considere o seguinte jogo na forma extensiva: vJog. 1 � � � � � � �� A @ @ @ @ @ @ @@ B vJog. 2 Jog. 2 � � � � � � �� D A A A A A A AA F ( 2 0 ) � � � � � � �� D A A A A A A AA F ( 0 1 ) v Jog. 1v � � � �� A A A AA L ( 3 10 ) R ( 0 1 ) v � � � �� A A A AA L ( 3 0 ) R ( 1 1 ) onde o payoff na parte superior em parênteses é do jogador 1 e o payoff na parte inferior em parênteses é do jogador 2. a) Descreva as estratégias dos jogadores. b) Derive a forma normal do jogo e encontre todos os equiĺıbriosde Nash (EN) do jogo em estratégias puras. c) Encontre todos os equiĺıbrios de Nash perfeitos em subjogos (ENPS) em estratégias puras. José Guilherme de Lara Resende 29 NA 5 – Teoria dos Jogos
Compartilhar