Baixe o app para aproveitar ainda mais
Prévia do material em texto
Notas de Aula 7 - Teoria dos Jogos Microeconomia Curso Cećılia Menon 1 Introdução 1.1 Interdependência Estratégica 1.1.1 Teoria dos Jogos A teoria dos jogos permite modelar comportamentos estratégicos dos agentes econômicos. É o instrumento adequado quando existe interdependência estratégica entre os agentes do modelo analisado. No modelo de consumo usual, o consumidor decide entre posśıveis cestas de bens, dados os preços e a sua renda. No modelo da firma competitiva, a firma maximiza o seu lucro, dada a sua tecnologia de produção e dados os preços dos insumos e dos bens que vende. No modelo de equiĺıbrio geral competitivo, tanto os consumidores quanto as firmas são tomadores de preços: tomam os preços como dados e não há interdependência estratégica entre os agentes econômicos. Porém, existem situações onde as ações de um agente dependem das ações de outro agente diretamente. Nesses casos, assumimos que o payoff (utilidade) do agente depende não só da sua ação, mas da ação de outros agentes. Modelos de oligopólio são um exemplo, em que o lucro de determinada firma depende do comportamento de suas rivais. Em um jogo, cada jogador deve levar em conta a estratégia dos outros jogadores antes de escolher o melhor para si. Isso gera uma circularidade, caracteŕıstica fundamental da teoria dos jogos. O objetivo da teoria dos jogos é determinar o resultado de um jogo. Cada método de análise dá origem a um conceito de solução particular, chamado equiĺıbrio. A maioria dos conceitos tem sua origem no conceito de equiĺıbrio de Nash e são, usualmente, equiĺıbrios de Nash que satisfazem certas propriedades. Por isso, são chamados de refinamentos. Cada refinamento tenta solucionar alguma deficiência do conceito de equiĺıbrio de Nash particular a alguma situação ou modelo. 1.2 Noções Preliminares 1.2.1 Jogo Definição (informal): Jogo. Um jogo refere-se a qualquer situação envolvendo dois ou mais agentes, chamados jogadores, onde exista interdependência estratégica. Para descrevermos um jogo é necessário conhecermos três objetos: • Os jogadores, • A regra do jogo, • O resultado (payoff) do jogo. 1.2.2 Hipóteses sobre os Jogadores São feitas duas hipóteses básicas sobre os jogadores: 1. Os jogadores são racionais. As ações de um jogador são consistentes com o objetivo desejado: maxi- mizar o seu payoff ou a sua a utilidade. 1 2. Os jogadores são inteligentes. Os jogadores sabem tudo o que sabemos sobre o jogo e conseguem fazer as mesmas inferências que fazemos sobre a situação em que se encontram. A segunda hipótese não é tão inócua quanto parece. Na teoria de equiĺıbrio geral os indiv́ıduos são racionais, mas não é necessário que sejam inteligentes no sentido acima: os agentes econômicos não precisam conhecer toda a estrutura de teoria de equiĺıbrio geral ao tomarem suas decisões. 1.2.3 Formas de Representação Existem duas formas de representarmos um jogo: FORMA NORMAL: Representação em forma matricial. Esta forma é adequada para situações onde os jogadores se “movem” (decidem suas ações) simultaneamente. Modelo estático. Esta forma também é conhecida como forma estratégica. FORMA EXTENSIVA: Representação em forma de árvore. Esta forma é adequada para situações onde exista uma ordem cronológica dos eventos do jogo. Modelo dinâmico. Existe uma correspondência entre essas duas formas, que veremos mais a frente. 1.2.4 Jogos Não-Cooperativos Vamos estudar jogos não-cooperativos : analisamos cada agente separadamente e não como um grupo. Essa definição não implica que um jogador não possa cooperar com o outro, ela é apenas de cunho metodológico, onde cada agente é visto como uma entidade separada, autônoma, e não há grupos de agentes se comportando como um único agente. 1.3 Conhecimento Comum 1.3.1 Ideia Uma hipótese bastante usada em teoria dos jogos é a de conhecimento comum (“common knowledge”). Essa hipótese diz que a racionalidade dos jogadores e a estrutura do jogo é de conhecimento comum para todo jogador. Se considerarmos dois jogadores, um determinado fato é de conhecimento comum dos jogadores se o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 conhece o fato, se o jogador 1 sabe que o jogador 2 sabe que o jogador 1 sabe que o jogador 2 conhece o fato, e assim vai ad infinitum, o mesmo racioćınio valendo para o jogador 2. Essa hipótese é fundamental para a validade de certos procedimentos, tais como os procedimentos de elim- inação de estratégias dominadas. Mais ainda, ela é fundamental para o conceito de equiĺıbrio de Nash (existem artigos que relaxam a hipótese de conhecimento comum, sob certas condições). Myerson (1991) argumenta que a hipótese de jogadores inteligentes implica supor que a estrutura do jogo é de conhecimento comum desses jogadores. 2 2 Jogos na Forma Estratégica 2.1 Definições e Exemplos de Jogos 2.1.1 Jogo na Forma Estratégica Definição: Jogo na Forma Estratégica (ou Forma Normal). Um jogo na forma estratégica é uma coleção G = (Si, ui) I i=1, onde I é o número de jogadores, Si é o conjunto de estratégias dispońıveis ao jogador i, para todo i ∈ I, e ui : ∏I j=1 Sj → R é a função de payoff (a utilidade) do jogador i, que depende das estratégias de todos os jogadores. Dizemos que um jogo na forma normal é finito se o conjunto das estratégias Si é finito para todo i, i = 1, . . . , I. Na forma normal não nos preocupamos com cada ação do jogador, mas apenas com cada estratégia do jogador, o conjunto de todas as ações que podem ser tomadas no decorrer de uma partida do jogo, incluindo ações para qualquer situação de jogo. Para certos jogos, como veremos a frente, a estratégia do jogador pode condensar uma quantidade enorme de informação, descrevendo um número muito grande de ações a serem tomadas ao longo do jogo. Observe que a interdependência estratégica entre os agentes do modelo analisado aparece explicitamente na hipótese de que o payoff de cada jogador depende das estratégias de todos os outros jogadores: ui : S1 × S2 × · · · × Si × · · · × SI → R, ou seja, ui depende não apenas da estratégia si escolhida por i, mas também das estratégias de todos os outros jogadores, ui(s1, s2, . . . , si, . . . , sI). 2.1.2 Exemplos Exemplo 1: “Cara ou Coroa”. Neste jogo com duas pessoas, cada jogador escolhe o lado de uma moeda, sem que o outro jogador tome conhecimento de sua escolha. Os dois jogadores revelam simultaneamente o lado escolhido. Se os lados escolhidos forem iguais, o jogador 1 paga R$ 1,00 ao jogador 2. Se forem distintos, o jogador 2 paga R$ 1,00 ao jogador 1. A matriz abaixo descreve este jogo. 1↓ / 2 → Cara Coroa Cara −1, 1 1,−1 Coroa 1,−1 −1, 1 Notação: Vamos usar a seguinte convenção para todos os jogos representados na forma matricial: o primeiro elemento em cada célula da matriz é o payoff do jogador 1 (“jogador-linha”) e o segundo elemento da célula é o payoff do jogador 2 (“jogador-coluna”). No jogo “Cara ou Coroa”, fica claro que cada jogador deve agir de modo impreviśıvel. Logo, quando os jogadores decidem estrategicamente, pode ocorrer que a melhor forma de agir seja escolher de modo aleatório ou de modo que o seu rival não saiba exatamente o que ele escolherá. Para esse jogo, temos que: Jogadores: I = {1, 2}; Estratégias: S1 = S2 = {Cara, Coroa}; Payoffs: u1(Cara,Coroa) = u1(Coroa,Cara) = 1; u1(Cara,Cara) = u1(Coroa,Coroa) = −1; u2(s1, s2) = −u1(s1, s2), ∀(s1, s2) ∈ S1 × S2. Observe que esse é um jogo de soma zero: o ganho de um jogador é igual à perda do outro jogador. Para jogos de soma zero com dois jogadores, os conceitos de solução usados envolvem os jogadores randomizarem suas estratégias. Esse tipo de jogo foi extensivamente estudado von Neuman e Morgenstern, no livro “theory of games and economic behavior”,publicado em 1944 e considerado um dos marcos da teoria dos jogos. 3 Exemplo 2: Dilema dos Prisioneiros. Luiz Alberto e Laelio foram presos e estão sendo interrogados separadamente, acusados de um crime. Se ambos confessarem o crime, eles receberão uma pena de 3 anos na cadeia. Se ambos não confessarem o crime, a pena será de apenas dois anos, por falta de evidência. Porém, o promotor pode fazer uma acordo com um deles, dando uma pena de apenas um ano na prisão para quem confessar e, para quem não confessar, de cinco anos na prisão, por não ter colaborado com a justiça. A matriz abaixo descreve este jogo. L.A.↓ / Laelio → Confessar Não Confessar Confessar −3,−3 −1,−5 Não Confessar −5,−1 −2,−2 Exemplo 3: Problema de Coordenação. Suponha que duas pessoas estão viajando separadamente para o Rio de Janeiro e combinaram de se encontrar para almoçar no dia seguinte. Porém esqueceram de marcar o restaurante e não estão conseguindo se comunicar. Eles costumam almoçar sempre em dois restaurantes, um no centro da cidade e outro na Barra da Tijuca. O almoço no restaurante da barra é mais agradável do que o almoço no restaurante do centro. Porém, eles se desencontrarem é a pior situação posśıvel. A matriz abaixo descreve este jogo. 1↓ / 2 → Barra Centro Barra 3, 3 0, 0 Centro 0, 0 1, 1 Exemplo 4: Batalha dos Sexos. Nelson e Renata querem fazer um programa domingo à tarde. Con- cordaram com duas opções: ir ao jogo do Corintians ou fazer compras. Os dois preferem estar juntos a fazerem os passeios separados, mas Nelson prefere ir ao jogo e Renata prefere ir às compras. A matriz abaixo descreve este jogo. Nelson↓ / Renata → Futebol Compras Futebol 2, 1 0, 0 Compras 0, 0 1, 2 A batalha dos sexos modela também um problema de coordenação, mas que envolve uma disputa de poder. Veremos mais a frente que esse jogo tem dois equiĺıbrios, em que ambos os jogadores devem coordenar suas estratégias para alcançar um dos equiĺıbrios. Porém, o equiĺıbrio que o jogador 1 prefere, (U,L), é diferente do equiĺıbrio que o jogador 2 prefere, (D,R), (e ambos preferem estar em uma situação de equiĺıbrio do que estar em uma situação de desequiĺıbrio, (U,R) ou (D,L)). Neste caso, podemos ter uma disputa de poder entre os jogadores, onde cada um tenta implementar o seu equiĺıbrio preferido. 2.2 Conceitos de Dominância e Estratégias Racionalizáveis 2.2.1 Estratégias Estritamente Dominantes Considere um jogo com I jogadores. Vamos representar em negrito um conjunto de estratégias de todos os jogadores: s = (s1, s2, . . . , sI). Vamos usar a notação s−i = (s1, s2, . . . , si−1, si+1, . . . , sI) para representar um conjunto de estratégias de todos os jogadores, exceto o jogador i. Porém, nas definições a seguir, vamos supor dois jogadores apenas. Definição: Estratégia Estritamente Dominante. A estratégia ŝ1 é estritamente dominante para o jogador 1 em um dado jogo se para toda estratégia s1 6= ŝ1, s1 ∈ S1, onde S1 representa o conjunto de todas as estratégias dispońıveis para o jogador 1, vale: u1(ŝ1, s2) > u1(s1, s2), para todo s2 ∈ S2. 4 (de modo análogo podemos definir estratégia estritamente dominante para o jogador 2). Logo, uma estratégia si é estritamente dominante para o jogador i, i = 1, 2, se ela for a única estratégia que maximiza o payoff desse jogador, quaisquer que sejam as estratégias escolhidas pelos outros jogadores. Para o jogo do dilema dos prisioneiros, é fácil verificar que Confessar é uma estratégia estritamente dominante para os dois prisioneiros. Ela é a melhor estratégia para cada prisioneiro, independentemente do que o outro prisioneiro escolha. Nesse caso, dizemos que (C,C) é um equiĺıbrio em estratégias estritamamente dominantes. Observe que o equiĺıbrio (C,C) é Pareto dominado pelo conjunto de estratégias (NC,NC), ou seja, cada jogador obtém um payoff maior em (NC,NC) do que em (C,C). Temos, então, um caso onde o comporta- mento individual maximizador dos agentes envolvidos resulta em um equiĺıbrio Pareto ineficiente. Logo, na presença de interdependência estratégica, a interação de jogadores cujo objetivo é maximizar o seu próprio bem-estar pode levar a situações Pareto-ineficientes. Estratégias estritamente dominantes não são comuns. Existem várias situações, como no exemplo abaixo, onde não existem estratégias dominantes para nenhum dos jogadores. Exemplo: Considere o seguinte jogo: 1↓ / 2 → L M R U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5 Apesar de estratégias estritamente dominantes serem raras, podemos usar um conceito similar, de estratégia estritamente dominada, para eliminarmos estratégias que nunca devem ser escolhidas pelo jogador. 2.2.2 Estratégia Estritamente Dominada Definição: Estratégia Estritamente Dominada. Uma estratégia s̄1 é estritamente dominada para o jogador 1 quando existe uma outra estratégia ŝ1 ∈ S1 tal que: u1(ŝ1, s2) > u1(s̄1, s2), para todo s2 ∈ S2. Dizemos que ŝ1 domina estritamente s̄1 (de modo análogo podemos definir estratégia estritamente dominada para o jogador 2). Portanto, uma estratégia estritamente dominante é uma estratégia que domina estritamente todas as outras estratégias do jogador. Podemos dizer também que todas as outras estratégias são estritamente dominadas pela estratégia estritamente dominante. Vamos analisar o jogo acima, dado por: 1↓ / 2 → L M R U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 D 4, 3 3, 2 6, 5 Para o jogador 1, a estratégia D é estritamente dominada pela estratégia U . Essa é a única estratégia estritamente dominada no jogo acima. Se eliminarmos essa estratégia do jogo, usando o argumento de que o jogador 1 nunca a escolherá, já que U traz um payoff sempre maior, qualquer que seja a jogada de 2, então obtemos o jogo reduzido, dado por: 5 1↓ / 2 → L M R U 5, 2 4, 3 7, 2 C 1, 4 3, 2 8, 1 Para esse “subjogo”, a estratégia M domina estritamente R, para o jogador 2. Eliminando a estratégia R, obtemos o seguinte jogo reduzido: 1↓ / 2 → L M U 5, 2 4, 3 C 1, 4 3, 2 Observe que para este subjogo, a estratégia U domina estritamente C, para o jogador 1. Eliminando C, obtemos: 1↓ / 2 → L M U 5, 2 4, 3 Finalmente, a estratégia L é estritamente dominada por M , para o jogador 2. Por meio desse “procedimento de eliminação de estratégias estritamente dominadas (PEEED)”, obtemos (U,M) (isto é, o jogador 1 escolhe U , o jogador 2 escolhe M) como solução do jogo (dizemos que (U,M) é um equiĺıbrio obtido pela eliminação de estratégias estritamente dominadas). A ideia do procedimento é, portanto, simples. Ele usa implicitamente a hipótese de conhecimento comum da racionalidade e da estrutura do jogo para todos os jogadores, pois, para encontrarmos a solução (U,M), supomos implicitamente que o jogador 2 sabe que o jogador 1 é racional e nunca jogará a estratégia D. Como o jogador 1 sabe que o jogador 2 é racional e também que 2 sabe que ele é racional e nunca jogará D, então o jogador 1 infere que 2 nunca jogará R. É necessário continuar com esse racioćınio para podermos concluir que (U,M) é a solução do jogo. A formalização do PEEED pode ser feita do seguinte modo: Procedimento de Eliminação de Estratégias Estritamente Dominadas (PEEED): Considere o jogo G = (Si, ui) I i=1. Seja S 0 i = Si, para cada jogador i. Para n ≥ 1, seja Sni o conjunto das estratégias do jogador i resultante da n-ésima etapa de eliminação, ou seja, si ∈ Sni se si ∈ Sn−1i não é estritamente dominada em Sn−1i (no jogo dado por G n−1 = (Sn−1i , ui) I i=1). Definição: Estratégia Iterativamente Estritamente Não-Dominada. A estratégia si do jogador i é iterativamente estritamente não dominada em S (ou sobrevive ao PEEED) se si ∈ Sni , para todo n ≥ 1. O problema com o PEEED é que ele também nem sempre leva a alguma solução. No exemplo abaixo, por exemplo, não existe nenhuma estratégia estritamente dominada e, portanto, não conseguimos eliminarnenhuma estratégia do jogo usando o PEEED. Logo, não conseguimos fazer qualquer predição mais acurada sobre qual deve ser o seu resultado (ou, pelo menos, o que não pode ser resultado). 2.2.3 Estratégias Fracamente Dominantes Exemplo: Considere o jogo: 1↓ / 2 → L R U 1, 1 0, 0 D 0, 0 0, 0 6 Para esse jogo, não existem nem estratégias estritamente dominantes nem estratégias estritamente domi- nadas. Podemos enfraquecer as definições de dominância estrita, relaxando a exigência de que o payoff seja sempre estritamente maior nas definições acima. Para o relaxamento da noção de dominância estrita, obtemos o seguinte conceito. Definição: Estratégia Fracamente Dominante. Uma estratégia ŝ1 ∈ S1 é fracamente dominante para o jogador 1 se para toda s1 6= ŝ1, s1 ∈ S1, vale: u1(ŝ1, s2) ≥ u1(s1, s2), para todo s2 ∈ S2, com desigualdade estrita para pelo menos um s2 (de modo análogo podemos definir estratégia estritamente dominada para o jogador 2). Evidentemente, toda estratégia fortemente dominante é fracamente dominante, mas a volta não vale. No jogo acima, as estratégias D de 1 e R de 2 são estratégias fracamente dominadas (por U e por L, respectivamente). Eliminando as estratégias fracamente dominadas, obtemos (U,L) como solução (dizemos que (U,L) é um equiĺıbrio formado por estratégias fracamente dominantes). 2.2.4 Estratégia Fracamente Dominada Problema similar ao que ocorre com a noção de estratégias estritamente dominantes ocorre como o conceito de estratégias fracamente dominantes: pode ser que não exista solução para o jogo em estratégias fracamente dominantes, como o exemplo abaixo ilustra. Exemplo. Considere o seguinte jogo: L R U (5, 1) (4, 0) M (6, 0) (3, 1) D (6, 4) (4, 4) É fácil observar que não existe estratégia fracamente dominante para nenhum dos dois jogadores. Vamos introduzir o seguinte conceito para analisar o jogo acima, um relaxamento da noção de estratégia estritamente dominada. Definição: Estratégia Fracamente Dominada. Uma estratégia s̄1 é fracamente dominada para o jogador 1 quando existe uma outra estratégia ŝ1 ∈ S1 tal que: u1(ŝ1, s2) ≥ u1(s̄1, s2), para todo s2 ∈ S2, com desigualdade estrita para pelo menos um s2. Dizemos então que ŝ1 domina fracamente s̄1 (de modo análogo podemos definir estratégia estritamente dominada para o jogador 2). Vamos agora definir formalmente o processo de eliminação de estratégias fracamente dominadas (PEEFD): PEEFD: Considere o jogo G = (Si, ui) I i=1. Seja S 0 i = Si, para cada jogador i. Para n ≥ 1, seja Sni o conjunto das estratégias do jogador i resultante da n-ésima etapa de eliminação de estratégias fracamente dominadas, ou seja, si ∈ Sni se si ∈ Sn−1i não é fracamente dominada em Sn−1i (no jogo dado por Gn−1 = (Sn−1i , ui)Ii=1). Definição: Estratégia Iterativamente Fracamente Não-Dominada. A estratégia si do jogador i é iterativamente fracamente não dominada em S (ou sobrevive ao PEEFD) se si ∈ W ni , para todo n ≥ 1. 7 Vamos aplicar o PEEFD ao jogo acima. Podemos proceder de dois modos: 1. Se eliminarmos primeiro U para o jogador 1, a estratégia L do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando L, podemos eliminar M no jogo resultante, obtendo (D,R) (payoff (4,4)) como solução. 2. Se eliminarmos primeiro M para o jogador 1, a estratégia R do jogador 2 se torna fracamente dominada para o jogo resultante. Eliminando R, podemos eliminar U no jogo resultante, obtendo (D,L) (payoff (6,4)) como solução. O exemplo acima mostra que a ordem de eliminação das estratégias fracamente dominadas pode afetar a solução obtida. Esta é uma caracteŕıstica ruim deste procedimento, pois a solução obtida pode mudar conforme a ordem de eliminação das estratégias. Este problema não ocorre quando eliminamos estratégias estritamente dominadas. 2.2.5 Estratégias Racionalizáveis O PEEED e o PEEFD utilizam o conceito de conhecimento comum da racionalidade dos jogadores e da estrutura do jogo. Porém, esses procedimentos não esgotam toda a força dessa hipotése. Usando essa hipótese de conhecimento comum, podemos eliminar outras estratégias além das dominadas. Definição: Melhor Resposta. Considere o jogo G = (Si, ui) I i=1. A estratégia ŝi é a melhor resposta do jogador i à estratégia s−i dos seus rivais se: ui(ŝi, s−i) ≥ ui(si, s−i), para todo si ∈ Si. Portanto, a estratégia ŝi é a melhor resposta do jogador i para a estratégia s−i se ela for a escolha ótima de i quando ele acredita que seus rivais escolherão a estratégia s−i. Um jogador não deve escolher uma estratégia que nunca é uma melhor resposta, pois neste caso não existe forma de o jogador i justificar a escolha dessa estratégia. Observe que estratégias estritamente dominadas nunca são a melhor resposta. Podemos montar um procedimento de eliminação de estratégias que nunca são a melhor resposta, de modo similar ao PEEED. Mais uma vez, estamos supondo a validade da hipótese de conhecimento comum da racionalidade dos jogadores e da estrutura do jogo. Definição: Estratégias Racionalizáveis. As estratégias em Si do jogador i que sobrevivem ao procedi- mento de eliminação de estratégias que nunca são a melhor resposta são chamadas de racionalizáveis. Uma estratégia racionalizável pode sempre ser “justificada”, ou seja, o jogador pode justificar a escolha dessa estratégia com uma conjectura razoável sobre o comportamento dos outros jogadores (nenhum rival escolherá uma estratégia não racionalizável). É posśıvel mostrar que as seguintes afirmações são verdadeiras: • A ordem de remoção das estratégias que nunca são a melhor resposta não altera o resultado obtido; • Cada jogador tem pelo menos uma estratégia racionalizável, podendo ter mais de uma; • O conjunto de estratégias racionalizáveis está contido no conjunto de estratégias que sobrevivem ao PEEED; • Para jogos com dois jogadores, o conjunto de estratégias racionalizáveis é igual ao conjunto de es- tratégias que sobrevivem ao PEEED. 8 Porém, o conceito de estratégia racionalizável nem sempre fornece uma solução. Por exemplo, para a batalha dos sexos, todas as estratégias são racionalizáveis, logo o conceito não diz nada sobre qual será a solução do jogo. Queremos tornar as predições sobre o resultado de um jogo mais precisas do que o que pode ser obtido usando os conceitos vistos acima. A seguir veremos o conceito de equiĺıbrio de Nash (EN), que, satisfeitas certas condições, sempre aponta pelo menos uma solução para o jogo. Esse é o mais importante conceito em teoria dos jogos. 2.3 Equiĺıbrio de Nash 2.3.1 Equiĺıbrio de Nash em Estratégias Puras O máximo que podemos obter usando a hipótese de conhecimento comum é o conceito de estratégias racionalizáveis, que se assemelha ao conceito de estratégias que sobrevivem ao processo de eliminação de estratégias dominadas. Para obtermos qualquer outro conceito mais robusto, temos que adicionar alguma hipótese nova. Definição: Equiĺıbrio de Nash em Estratégias Puras (Dois Jogadores). Um conjunto de estratégias ŝ = (ŝ1, ŝ2) é um equiĺıbrio de Nash (EN) (em estratégias puras) para o jogo G = (Si, ui)i=1,2 se vale: u1(ŝ1, ŝ2) ≥ u1(s1, ŝ2), para todo s1 ∈ S1, e u2(ŝ1, ŝ2) ≥ u2(ŝ1, s2), para todo s2 ∈ S2. Em um equiĺıbrio de Nash (EN), a estratégia de cada jogador é a melhor resposta para as estratégias que são de fato escolhidas pelos outros jogadores. Portanto, um EN requer que os jogadores estejam certos sobre suas conjecturas a respeito das estratégias escolhidas pelos seus rivais. Dizemos que os jogadores possuem expectativas mutualmente corretas. Resultados: Pode-se mostrar que todas as estratégias que fazem parte de um equiĺıbrio de Nash são racionalizáveis. Mais ainda, todo equiĺıbrio formado por estratégias estritamente ou fracamente dominantes, ou obtido pela eliminação de estratégias estritamenteou fracamente dominadas, é um equiĺıbrio de Nash. Vamos discutir melhor esses resultados mais abaixo. O conceito de EN traz uma predição mais precisa a respeito do resultado de um jogo do que o conceito de racionabilidade. No problema de coordenação abaixo, todas as estratégias são racionalizáveis, mas apenas (s1 = L, s2 = U) e (s1 = D, s2 = R) são EN em estratégias puras. 1↓ / 2 → L R U 3, 3 0, 0 D 0, 0 1, 1 O jogo “Cara ou Coroa”, representado na matriz abaixo, não possui EN em estratégias puras. Logo, de modo geral, não podemos garantir a existência de EN em estratégias puras. 1↓ / 2 → Cara Coroa Cara −1, 1 1,−1 Coroa 1,−1 −1, 1 Intuitivamente, qualquer solução desse jogo envolve ambos os jogadores escolhendo suas estratégias de modo impreviśıvel. Para formalizar essa ideia, vamos introduzir o conceito de estratégias mistas. 9 2.3.2 Estratégias Mistas Definição: Estratégias Mistas. Seja Si o conjunto de estratégias puras do jogador i. Uma estratégia mista do jogador i é uma distribuição de probabilidade sobre Si, ou seja, uma função σi : Si → [0, 1], que associa uma probabilidade a cada estratégia pura do jogador i. Logo, temos que σi(si) ≥ 0, ∀si e ∑ si∈Si σi(si) = 1. Notação: O simplex de Si, representado por ∆Si, é o conjunto das estratégias mistas do jogador i. Esse conjunto também inclui as estratégias puras do jogador (estratégias mistas degeneradas). Se os jogadores randomizam suas estratégias, então o resultado do jogo deixará de ser determińıstico. Neste caso, calculamos o payoff dos jogadores usando utilidade esperada. Seja σ = (σ1, σ2) uma coleção de estratégias mistas para os jogadores 1 e 2. A utilidade esperada do jogador 1 para a coleção de estratégias mistas σ é calculada como: UE1(σ) = Eσ(u1) = ∑ s1∈S1,s2∈S2 [σ1(s1)σ2(s2)]u1(s1, s2) Podemos estender imediatamente os conceitos de: estratégias dominantes, estratégias dominadas, procedi- mentos de eliminação e estratégias racionalizáveis, ao permitir que os jogadores possam escolher estratégias mistas, além de estratégias puras. 2.3.3 Equiĺıbrio de Nash com Estratégias Mistas Definição: Equiĺıbrio de Nash (dois jogadores). Um conjunto de estratégias σ̂ = (σ̂1, σ̂2) é um equiĺıbrio de Nash para um certo jogo de dois jogadores se vale u1(σ̂1, σ̂2) ≥ u1(σi, σ̂2), para todo σ1 ∈ ∆S1, e u2(σ̂1, σ̂2) ≥ u2(σ̂i, σ2), para todo σ2 ∈ ∆S2 A definição acima permite que os jogadores randomizem entre as estratégias puras. Logo, eles podem não somente escolher uma estratégia pura, mas também escolher uma estratégia que envolva várias estratégias puras, cada uma escolhida com determinada probabilidade. Observe que no equiĺıbrio, cada jogador conhece o modo em que os outros jogadores estão randomizando (as estratégias mistas escolhidas por seus rivais). A definição diz que, para cada conjunto de estratégias dos jogadores candidato a equiĺıbrio, devemos verificar se para cada jogador, a sua estratégia é de fato a melhor resposta para as estratégias dos outros jogadores que fazem parte do conjunto de estratégias candidato a equiĺıbrio. Considerando estratégias mistas, existem um número infinito de estratégias, o que torna este procedimento inviável. Como fazemos então para encontrar todos os equiĺıbrios de Nash? O teorema abaixo fornece um algoritmo para encontrar equiĺıbrios de Nash em estratégias mistas. Teorema: Equivalência de Definições. As seguintes afirmativas são equivalentes: 1. (σ∗1, σ ∗ 2) ∈ ∆(S1)×∆(S2) é um equiĺıbrio de Nash; 2. Para todo jogador i, ui(σ ∗ 1, σ ∗ 2) = ui(si, σ ∗ −i), para todo si jogado com probabilidade positiva; e ui(σ ∗ 1, σ ∗ 2) ≥ ui(si, σ∗−i), para todo si que não é jogado com probabilidade positiva. 10 O teorema fornece um algoritmo para encontrar equiĺıbrios de Nash em estratégias mistas. Ele diz que em um EN em estratégias mistas, duas estratégias puras de um jogador que podem ser escolhidas (que possuem probabilidade positiva) devem necessariamente gerar o mesmo payoff para esse jogador, que será igual ao payoff obtido no equiĺıbrio. Esse resultado é consequência de utilizarmos a utilidade esperada para calcularmos o payoff de um conjunto de estratégias mistas. Caso existissem duas estratégias puras que o jogador escolhesse com probabilidade positiva e em que uma delas gera um payoff maior do que o da outra, o jogador não deveria atribuir probabilidade positiva à estratégia que lhe dá o payoff mais baixo, pois isso reduziria o seu payoff de equiĺıbrio. Ou seja, dadas as estratégias escolhidas em equiĺıbrio pelos outros jogadores, esse jogador é indiferente entre qualquer estratégia pura que ele de fato possa vir a escolher (que tem probabilidade positiva), e estas estratégias puras lhe dão um payoff igual ou maior do que qualquer outra estratégia que ele não escolhe. Lembre-se que o que de fato determina as probabilidades de cada jogador é fazer (σ∗1, σ ∗ 2) um equiĺıbrio. Vamos usar o teorema para calcular o EN para o jogo “Cara ou Coroa”. Suponha que o jogador 1 decida proceder do seguinte modo: com probabilidade α ele escolhe Ca e com probabilidade 1− α ele escolhe Co. Similarmente, o jogador 2 decide proceder do seguinte modo: com probabilidade β ele escolhe Ca e com probabilidade 1− β ele escolhe Co. Vamos representar na matriz abaixo essa situação. 1↓ / 2 → Cara (β) Coroa (1− β) Cara (α) −1, 1 1,−1 Coroa (1− α) 1,−1 −1, 1 Pelo teorema de equivalência de definições acima, essas randomizações são um EN se: u1(Ca, σ2) = u1(Co, σ2) e u2(σ1, Ca) = u2(σ1, Co), onde σ1 e σ2 representam as estratégias mistas dos jogadores 1 e 2, respectivamente. Portanto: u1(Ca, σ2) = u1(Co, σ2) ⇒ β = 0, 5 u2(σ1, Ca) = u2(σ1, Co) ⇒ α = 0, 5 Logo, σ1 = (1/2 ◦ Ca; 1/2 ◦ Co) e σ2 = (1/2 ◦ Ca; 1/2 ◦ Co) é um EN em estratégias mistas. Observe que: u1(Ca, σ2) = u1(Co, σ2) = u1(σ1, σ2) = 0 u2(σ1, Ca) = u2(σ1, Co) = u2(σ1, σ2) = 0, como esperado. 2.3.4 Teorema Nash e outros Resultados Teorema de Existência de Equiĺıbrio de Nash. Considere o jogo G = (∆(Si), ui) I i=1, onde: 1. ∆(S1) é não-vazio, compacto e convexo para todo i; e 2. ui : ∆(S1)×∆(S2)→ R é cont́ınua e quasecôncava em ∆(Si). Então sempre existe (pelo menos) um equiĺıbrio de Nash para esse jogo. Corolário. Todo jogo finito na forma normal possui pelo menos um equiĺıbrio de Nash (considerando-se estratégias mistas). Vimos acima exemplos de equiĺıbrios com estratégias puramente mistas. O exemplo abaixo mostra que pode existir um EN onde apenas um dos jogadores de fato randomize. Para que isso ocorra, é necessário que os 11 payoffs obtidos com as estratégias puras que fazem parte da randomização desse jogador sejam todos iguais, já que o outro jogador não randomiza e escolhe uma estratégia pura. Além disso, cada estratégia pura do jogador que de fato é randomizada forma um EN em estratégias puras junto com a estratégia pura escolhida pelo outro jogador. O exemplo a seguir mostra esse ponto. Exemplo: Considere o seguinte jogo com dois jogadores: 1↓ / 2 → L R U 1, 1 0, 0 D 1, 0 0, 0 Esse jogo possui três EN em estratégias puras, (U,L), (D,L) e (D,R). Não existe equiĺıbrio em estratégias estritamente mistas para os dois jogadores. Porém, (α ◦U, (1−α) ◦D;L) é um EN para todo α ∈ [0, 1], em que o jogador 1 randomiza entre as estratégias U e D, escolhendo qualquer probabilidade. Isso ocorre porque como U e D provêem o mesmo payoff para o jogador 1 quando 2 escolhe L, então qualquer randomização entre essas duas estratégias será parte de um EN junto com a estratégia L de 2. Um caso mais extremo e sem interesse seria o de um jogo em que os payoffs de cada jogador são todos iguais. Nessa situação, “tudo” será EN, já que qualquer escolha de cada jogador gerará sempre o mesmo payoff. A matriz abaixo ilustra esse caso. 1↓ / 2 → L R U 1, 2 1, 2 D 1, 2 1, 2 A relação entre equiĺıbrio de Nash e os conceitos de equiĺıbrio com estratégiasdominantes é descrita pelos seguintes resultados: 1. Se existir equiĺıbrio em estratégias estritamente dominantes, ele será único e será o único EN do jogo. O mesmo vale para equiĺıbrios obtidos com o PEEED: se existir, será único e o único EN do jogo. 2. Se existir equiĺıbrio em estratégias fracamente dominantes, então ele será um EN. Neste caso, pode ocorrer que exista outro EN, formado por estratégias fracamente dominadas. O exemplo abaixo mostra esse caso. 3. Vimos em um exemplo acima, o PEEFD pode levar a diferentes resultados, dependendo da ordem de eliminação das estratégias. De qualquer modo, se o PEEFD levar a algum resultado, qualquer que seja esse resultado, ele será um EN. Exemplo: Considere novamente o seguinte jogo: 1↓ / 2 → L R U 1, 1 0, 0 D 0, 0 0, 0 Esse jogo possui dois EN, dados por (U,L) e (D,R). Não existe equiĺıbrio em estratégias estritamente mistas. O EN (U,L) é também equiĺıbrio em estratégias fracamente dominantes (e pode ser obtido usando o PEEFD). O EN (L,D) é um equiĺıbrio formado por estratégias fracamente dominadas e portanto não pode ser encontrado usando o PEEFD. O exemplo acima mostra que pode existir um equiĺıbrio formado por estratégias fracamente dominadas. O resultado de um jogo ser um equiĺıbrio desse tipo é algo estranho, pois envolve cada jogador escolher uma estratégia para a qual existe outra opção que dará sempre um payoff maior ou igual, independentemente do que os outros jogadores façam. Existe um conceito de refinamento do EN para jogos na forma normal, 12 chamado refinamento da mão-trêmula (Selten, 1975; Myerson, 1978), que exclui a possibilidade desse tipo de equiĺıbrio ocorrer. O refinamento da mão-trêmula considera a possibilidade de que os jogadores possam cometer erros no momento da escolha da sua estratégia a ser jogada. O EN então será chamado perfeito da mão-trêmula caso satisfaça a condição imposta pelo refinamento. No exemplo acima, apenas o EN (U,L) é perfeito da mão-trêmula. Refinamentos do conceito de EN são direcionados para eliminar EN que por algum motivo não são consid- erados razoáveis. Nesse caso, existirá algum ou alguns EN que satisfazem o refinamento e algum ou alguns que não o satisfazem. 2.3.5 Discussão do Conceito de Equiĺıbrio de Nash • Consequência da racionalidade quando o equiĺıbrio é único; • Pontos focais (Schelling); • Convenção social (um tipo de ponto focal); • Forma de impor um acordo que seja “self-enforcing”. 2.3.6 QUESTÕES DA ANPEC RESOLVER: Questão 7 - 2011; Questão 10 - 2010; Questão 11 - 2009; Questão 9 - 2008; Questão 13 - 2001; Questão 14 - 1999; Questão 13 - 1998. 13 3 Jogos na Forma Extensiva 3.1 Introdução 3.1.1 Forma Extensiva de um Jogo Sabemos que para descrevermos um jogo são necessários três objetos: • Os jogadores (inclusive natureza), • A regra do jogo, • O resultado (payoff) do jogo. Um jogo na forma extensiva, definido a seguir, é a representação mais adequada para situações dinâmicas. Definição Informal de Jogo na Forma Extensiva. Representamos um jogo finito na forma extensiva em forma de árvore, onde em cada conjunto de decisão um jogador escolhe a ação que desenvolve o jogo. Definição: Jogo de Informação Perfeita. Um jogo é chamado de informação perfeita se cada conjunto de informação do jogo contém apenas um nó de decisão. Logo, em um jogo de informação perfeita, cada jogador conhece todas as jogadas dos outros jogadores escolhidas anteriormente. Se um jogo não é de informação perfeita, então existe pelo menos um ponto do jogo em que algum jogador não sabe o que foi escolhido no momento anterior (um conjunto de informação que contém mais de um nó). Nesse caso, unimos os nós que fazem parte de um mesmo conjunto de informação por um retângulo pontilhado, como ilustra o jogo à direita na figura abaixo. Jogo de Informação Perfeita t1 � � � � �� E @ @ @ @ @@ D t2 2 � � � � �� r A A A A AA l ( 1 3 ) ( 0 0 ) � � � � �� l A A A A AA r t ( 0 0 ) ( 3 1 )t t t t Jogo de Informação Imperfeita t1 � � � � �� E @ @ @ @ @@ D t 2 � � � � �� r A A A A AA l ( 1 3 ) ( 0 0 ) � � � � �� l A A A A AA r t ( 0 0 ) ( 3 1 )t t t t 3.1.2 Estratégia de um Jogo na Forma Extensiva A definição de estratégia para jogos simultâneos é simples e direta: a estratégia de cada participante é a ação escolhida para o jogo todo. No caso de jogos sequênciais, a definição de estratégia é mais complicada. Nesse caso, um determinado jogador pode ter vários pontos de escolha ao longo do jogo. Por exemplo, em xadrez, as jogadas dos dois jogadores se alternam ao longo da partida. Uma estratégia para jogos sequênciais é uma regra que determina a sua escolha de ação em TODOS os conjuntos de informação do jogo. Logo, uma estratégia para o jogador i é então um plano CONTINGENTE COMPLETO (uma regra de decisão completa) que especifica como o jogador i jogará em toda e qualquer circunstância do jogo. Dizer que uma estratégia é um plano contingente completo para o jogo significa dizer que uma estratégia define ações para TODOS os conjuntos de informação do jogo, mesmo que esses conjuntos de informação não sejam alcançados durante o jogo. Isso inclui definir ações para conjuntos de informações onde a própria estratégia do jogador em questão torna essas ações irrelevantes. 14 3.1.3 Memória Perfeita Um jogo é chamado de memória perfeita quando nenhum jogador esquece o que já sabia (inclusive ações que já foram tomadas durante o desenrolar do jogo). O jogo ilustrado na figura abaixo não apresenta memória perfeita. Nesse jogo, o jogador 1, na terceira rodada do jogo, após a sua escolha na primeira rodada e após a escolha do jogador 2 na segunda rodada, não se lembra de sua escolha feita na primeira rodada do jogo. t1� ��� ��� ����� E H HHH HHH HHHHj D t2 � � � � �� a @ @ @ @ @@R b t � � � � ��� a A A A A AAU b t1 � � � � ��� A A A A AAU l r l r l r l r t � � � � �� @ @ @ @ @@Rt � � � � ��� A A A A AAU t � � � � ��� A A A A AAU 3.1.4 Forma Extensiva e Forma Normal Um jogo representado na forma normal pode ser representado na forma extensiva sem ambiguidades? O contrário também é válido? Da forma extensiva para a forma normal sim, mas o contrário não é válido. A mesma forma normal pode representar mais de um jogo na forma extensiva. A figura abaixo mostra dois jogos diferentes que possuem a mesma representação na forma normal, que se resume a representação de um jogo do tipo “Cara ou Coroa” discutido acima. Nos dois exemplos abaixo, o payoff na primeira linha é do jogador 1 e na segunda linha, do jogador 2. Jogador 1 escolhe primeiro t1 � � � � �� Ca @ @ @ @ @@ Co t 2 � � � � �� Co A A A A AA Ca ( −1 1 ) ( 1 −1 ) � � � � �� Ca A A A A AA Co t ( 1 −1 ) ( −1 1 )t t t t Jogador 2 escolhe primeiro t2 � � � � �� Ca @ @ @ @ @@ Co t 1 � � � � �� Co A A A A AA Ca ( −1 1 ) ( 1 −1 ) � � � � �� Ca A A A A AA Co t ( 1 −1 ) ( −1 1 )t t t t A forma normal é uma estrutura mais simples de se definir do que a forma extensiva. Ela envolve menos objetos matemáticos do que a forma extensiva, porque a estratégia do jogador condensa uma quantidade enorme de informação sobre o jogador. Podemos adaptar os conceitos definidos anteriormente para jogos na forma estratégica (dominância, equiĺıbrio de Nash, etc) para jogos na forma extensiva, aplicando esses conceitos para a representação na forma normal do jogo na forma extensiva. 15 Von-Newman e Morgenstern argumentaram que de um modo geral, só é necessário sabermos a forma normal para analisarmos um jogo. Se os jogadores são inteligentes, cada jogador pode planejar toda a sua regra de decisões para o jogo antes dele começar. Assim, ele monta a sua estratégia para o jogo. Essa “suficiência” da forma normal de um jogo é uma das ideias mais importantes dateoria de jogos. Para jogos simultâneos, isso é claro. Porém, para jogos dinâmicos, existe uma perda de informação quando representamos o jogo na forma estratégica. No exemplo acima, vemos que a forma normal equivalente dos dois jogos sequênciais é a mesma - logo a informação perdida na representação do jogo na forma normal é apenas quem escolhe primeiro o lado da moeda. Essa perda de informação é irrelevante para a análise dos dois jogos e não influencia os resultados obtidos. Porém, essa perda de informação será sempre irrelevante ou existem casos em que ela é relevante? Essa é uma questão em aberto na teoria. 3.1.5 Estratégias Comportamentais Existem dois modos de se definir randomização por parte dos jogadores em um jogo na forma extensiva: 1. Randomizar a estratégia usada. Esse modo de randomização é o mesmo usado em jogos estratégicos. 2. Randomizar em cada momento de jogar. No primeiro modo, obtemos o conceito de estratégia mista visto anteriormente. No segundo modo, obtemos o conceito de estratégia comportamental O seguinte resultado garante a equivalência das duas formas de randomização, para jogos de memória perfeita. Caso o jogo não seja de memória perfeita, então pode existir um estratégia comportamental para a qual não exista estratégia mista equivalente, no sentido de levar a mesma distribuição sobre os payoffs. Teorema de Kuhn I. Para jogos na forma extensiva de memória perfeita, estratégia mista e estratégia comportamental são modos de randomização equivalentes. Logo, para toda estratégia comportamental do jogador i podemos encontrar uma estratégia mista de i tal que resulta na mesma distribuição sobre payoffs, quaisquer que sejam as estratégias, mistas ou comportamentais, usadas pelos outros jogadores, e vice-versa. Nesse caso, o tipo de estratégia, mista ou comportamental, usada, é indiferente para análise do jogo. Porém, vários tipos de jogos possuem um dinâmica de ações escolhidas em tempos diferentes. Em alguns desses jogos, representá-los na forma normal e dáı encontrarmos os EN pode não ser adequado. Quando derivamos a representção na forma normal de um jogo sequêncial, para encontrarmos os EN do jogo, alguns equiĺıbrios podem não ser cŕıveis, ou seja, baseados em ameaças de um dos jogadores que não será cumprida. Portanto, o principal problema na resolução de jogos dinâmicos por meio de encontrar os EN da sua repre- sentação na forma normal diz respeito à credibilidade de uma estratégia que faz parte de um EN do jogo na forma normal. Exemplo: Monopolista e Firma Entrante. Considere um mercado monopolista. O monopolista mantém o mercado ameaçando firmas entrantes de uma guerra de preços. Desse modo, o monopólio mantém seu lucro. Porém, se alguma firma de fato entrar, a melhor estratégia para o monopolista é formar um cartel e dividir o lucro de monopólio, já que a guerra de preços traria prejúızos não somente para a firma entrante, mas também para o incumbente. Essa situação estratégica é representada pelo seguinte jogo na forma extensiva. 16 tEntrante � � � � �� Não Entra @ @ @ @ @@R Entra ( 0 2 ) t Monopolista ( −1 −1 ) ( 1 1 ) � � � � �� Briga @ @ @ @ @@R Acomoda A forma normal equivalente do jogo acima é: Entrante/Monopolista Briga, se E entrou Acomoda, se E entrou Não entra 0,2 0,2 Entra -1,-1 1,1 Existem dois EN em estratégias puras para o jogo: 1. firma entrante (E) entrar, monopolista (M) acomoda, se E entrou, e 2. firma entrante não entra, monopolista briga se E entrar. O segundo EN é baseado em uma ameaça vazia, não-cŕıvel : M faz uma ameaça, que se for levada a sério, não precisa ser cumprida, pois nesse caso E escolhe não entrar. Porém, uma vez que E entrar, o melhor para M é se acomodar. O refinamento de perfeição em subjogos, que veremos a seguir, tenta eliminar EN baseados em ameaças não cŕıveis. 3.2 Equiĺıbrio de Nash Perfeito em Subjogos (ENPS) 3.2.1 Jogos de Informação Perfeita Vamos primeiro analisar jogos de informação perfeita, onde os jogadores estão perfeitamente informados de todas as ações previamente escolhidas quando for o seu momento de jogar. Jogos como damas, xadrez, etc são jogos de informação perfeita. O objetivo é desenvolver um conceito de equiĺıbrio que elimine equiĺıbrios baseados em estratégias não- cŕıveis, como no exemplo acima, onde o ideal seria acharmos (Entra,Ac se E entrou) como único equiĺıbrio. Portanto, queremos refinar o conceito de EN - queremos que as soluções do jogo ainda sejam EN, mas queremos eliminar os EN baseados em estratégias que envolvem ameaças não-cŕıveis. O seguinte conceito é fundamental para obtermos esse conceito de equiĺıbrio. Prinćıpio da Racionalidade Sequencial (PRS): A estratégia de um jogador qualquer deve especificar ações que são ótimas em cada ponto do jogo. Esse prinćıpio é implementado em um jogo de informação perfeita por um Algoritmo de Indução Reversa (“backward induction algorithm”): 1. Comece pelos nós de decisão finais da árvore (“nós penúltimos” - nós cujos sucessores são todos nós terminais); 17 2. Determine a escolha ótima dos jogadores que jogam nesses nós (problema de maximização individual, sem interação estratégica); 3. Redesenhe a árvore, substituindo os nós de decisão final por um nó terminal, com payoff definido pela escolha ótima no passo 2); 4. Repita passos 1), 2) e 3) para esse jogo reduzido, até chegar ao fim. A solução de indução reversa para jogos com informação perfeita se resume a que todos os jogadores façam escolhas que maximizem o seu payoff sempre que for a sua vez de jogar. Na prática, o jogo é resolvido do fim para o começo. No exemplo anterior, o único EN que satisfaz o prinćıpio da racionalidade sequêncial é (entrar,acomodar se E entrou). Definição: Estratégias de Indução Reversa. O conjunto de estratégias puras s = (s1, s2, . . . , sI) é uma estratégia de indução reversa para o jogo na forma extensiva Γ se é obtido de acordo com o algoritmo de indução reversa. O seguinte teorema garante que o conjunto de estratégias obtido resolvendo o jogo por indução reversa é um EN. Teorema de Kuhn II. Se s = (s1, s2, . . . , sI) é uma estratégia de indução reversa do jogo na forma extensiva Γ finito e de informação perfeita, então s é um EN desse jogo. Corolário: Existência de Equiĺıbrio. Todo jogo na forma extensiva finito de informação perfeita Γ tem um EN em estratégias puras, que pode ser encontrado usando indução reversa. Se os payoffs de cada jogador são diferentes nos nós terminais, para todos jogadores, então existe um único EN que pode ser encontrado usando indução reversa. Corolário. Todo jogo finito de informação perfeita tem (pelo menos) um EN em estratégias puras. Exemplo: Monopolista e Firma Entrante (continuação). No jogo Monopolista/Entrante, existem dois EN em estratégias puras, mas apenas um EN obtido usando o algoritmo de indução reversa. O algoritmo elimina exatamente o EN baseado em uma ameaça não-cŕıvel, o monopolista abrir uma guerra de preços caso o entrante de fato entre. Esta ameaça não é cŕıvel pois uma vez que o entrante entrou no mercado, se o monopolista fizer uma guerra de preços, ele próprio se prejudicará sem nenhum ganho. 3.3 Jogos de Informação Imperfeita 3.3.1 Subjogos O algoritmo de indução reversa acima só se aplica para jogos de informação perfeita. Porém a ideia de racionalidade sequêncial pode ser usada também para jogos de informação incompleta, por meio de um algoritmo similar de indução reversa. A ideia central é definir subjogos do jogo principal (Selten, 1965, 1975). Cada subjogo pode ser visto como um jogo por si só. Racionalidade sequêncial exige que um EN seja EN para cada subjogo. Definição: Subjogo. Um subjogo de um jogo Γ na forma extensiva é um subconjunto do jogo tal que: (i) Se inicia emum conjunto de informação que contém apenas um único nó de decisão, e contém todos os nós sucessores desse nó inicial; (ii) Se o nó de decisão y pertence ao subjogo, então todo nó z que pertence ao conjunto de informação de y também pertence ao subjogo. O jogo abaixo possui um único subjogo, o próprio jogo. Logo, podemos garantir que todo jogo possui pelo menos um subjogo. 18 u1 � � � � � � E @ @ @ @ @ @ D u 2 � � � � � � r A A A A A A l ( 1 3 ) ( 0 0 ) � � � � � � l A A A A A A r u ( 0 0 ) ( 3 1 )u u u u 3.3.2 Equiĺıbrio de Nash Perfeito em Subjogos Definição: ENPS em Estratégias Puras. O conjunto de estratégias s = (s1, s2, . . . , sI) do jogo Γ é um equiĺıbrio de Nash perfeito em subjogos (ENPS) se s = (s1, s2, . . . , sI) induz um equiĺıbrio de Nash em todo subjogo de Γ. ENPS é um refinamento de EN: todo ENPS é um EN, já que o próprio jogo é um subjogo seu. O contrário não é válido: existem EN que não são perfeitos em subjogos. Teorema. Para todo jogo na forma extensiva finito de informação perfeita, o conjunto de estratégias de indução reversa é igual ao conjunto de ENPS em estratégias puras. Logo, em jogos de informação perfeita, o conjunto de ENPS coincide com o conjunto de EN obtido usando o algoritmo de indução reversa visto acima. Porém, considerando jogos de informação imperfeita, nem todo jogo possui um ENPS em estratégias puras. O teorema a seguir garante a existência de ENPS para jogos de memória perfeita. Teorema: Existência de ENPS (Selten). Todo jogo na forma extensiva finito com memória perfeita possui um ENPS. A hipótese de memória perfeita é necessária. Existem exemplos de jogos que não são de memória perfeita, que não possuem ENPS. O seguinte algoritmo geral de indução reversa para jogos na forma extensiva, sejam de informação completa ou não, é válido para encontrar os ENPS: 1. Comece pelo término da árvore, ache os EN para todos os subjogos finais (subjogos que não possuem nenhum subjogo estrito); 2. Substitua cada subjogo pelo payoff de um de seus EN; 3. Repita os passos 1) e 2) para o jogo reduzido, continue até não restar nenhum subjogo; 4. Repita 1), 2) e 3) para todos os EN encontrados (no caso de algum subjogo ter mais de um EN). Para jogos de informação perfeita, esse algoritmo é igual ao algoritmo anterior. 3.3.3 QUESTÕES DA ANPEC RESOLVER: Questão 11 - 2011; Questão 11 - 2007; Questão 10 - 2006; Questão 11 - 2006; Questão 11 - 2006; Questão 11 - 2005; Questão 12 - 2005; Questão 11 - 2004; Questão 12 - 2003; Questão 13 - 2002; Questão 14 - 2001; Questão 15 - 2000. 19 3.4 Jogos Repetidos Em um jogo do tipo dilema dos prisioneiros, seria posśıvel obter cooperação se repet́ıssemos o jogo diversas vezes? Com a repetição, o número de estratégias de cada jogador aumenta. Nesse caso, é posśıvel criar estratégias onde o jogador pune o outro caso ele não coopere. Exemplo: Dilema dos Prisioneiros. 1↓ / 2 → Confessar Não Confessar Confessar −3,−3 −1,−5 Não Confessar −5,−1 −2,−2 Suponha que o jogador 1 adota a seguinte estratégia: na primeira interação ele joga NC (cooperar). Nos peŕıodos seguintes, se o outro jogador escolheu NC (cooperar) no peŕıodo anterior, ele coopera hoje. Caso contrário, o jogador 1 escolhe C (não cooperar). Essa estratégia pode levar a algum tipo de cooperação? Mais especificamente, existe algum equiĺıbrio tal que os jogadores venham a adotar estratégias cooperativas? Para jogos finitos, a resposta é negativa. Para jogos infinitos ou sem data certa para terminarem, a resposta é positiva. 3.4.1 Repetição Finita O teorema abaixo mostra que se o dilema dos prisioneiros é repetido um número fixo (finito) de vezes, o único equiĺıbrio de Nash perfeito em subjogos será formado pelo EN do jogo em cada peŕıodo sendo jogado. Logo, não é posśıvel obter o resultado eficiente com a repetição finita do jogo. Teorema Seja Γ dado por sucessivos Gt = (M ti , u t i(·))II=1 (ou seja, um jogo onde em cada peŕıodo t se joga um jogo simultâneo), t = 1, 2, . . . , T < +∞. Suponha que os jogadores observam as estratégias puras jogadas em cada jogo, imediatamente após a conlusão do jogo, e que o payoff de cada jogador é dado pela soma dos payoffs obtidos em todos os Gt. Se existe um único EN st para cada Gt, então existe um único ENPS para Γ, que consiste em cada jogador jogando sti em cada jogo G t, independente do que foi feito antes. O teorema acima tem uma consequência forte, eliminar qualquer dependência histórica nas estratégias atuais. Ou seja, tudo o que ocorreu antes é irrelevante para decidir o que fazer hoje. Para jogos que satisfaçam as condições da proposição, um ENPS não depende da história ocorrida no jogo em nenhum momento. Por exemplo, o teorema acima tem como consequência o fato que vimos de que o dilema dos prisioneiros jogado repetidamente, por um peŕıodo determinado, continua sempre tendo a mesma solução não cooperativa entre os jogadores em cada rodada do jogo. Esse resultado é consequência da racionalidade sequêncial. Por indução reversa, na última rodada, é melhor não cooperar. Resolvendo de traz para diante, obtemos não- cooperação para todas as rodadas do jogo. Intuitivamente, esse resultado é consequência do jogo ter uma data de término conhecida pelos jogadores. Resolvendo o jogo por indução reversa, cada jogador percebe que o seu rival irá descumprir o acordo de cooperação na última vez que interagirem. Eles se adiantam a isso e não cooperam na última rodada. Sabendo disso, os jogadores também não irão cooperar na penúltima rodada do jogo. Usando esse argumento, obtemos que os jogadores não cooperam em nenhuma rodada do jogo. O teorema, consequência da definição de ENPS, leva a resultados considerados pouco razoáveis, como mostra o exemplo abaixo. Exemplo: Jogo da Centópeia. Considere o seguinte jogo. sI C P( 1 1 ) sII C P( 0 3 ) I C P s ( 2 2 ) sII C P( 1 4 ) . . . . . . . . . . . . ...s sII C P( 97 100 )( 99 99 ) s sI C P II C P( 98 101 ) (100 100) 20 3.4.2 Repetição Infinita Porém, se o jogo é repetido infinitamente (ou se ele não tem uma data fixa para terminar), pode-se mostrar que o resultado eficiente em cada rodada do jogo pode ser obtido como equiĺıbrio, dependendo do quanto os jogadores descontem o futuro. As estratégias que levam a esse tipo de equiĺıbrio são chamadas estratégias gatilho (trigger ou tit-for-tat ou grim strategies, Nash-reversion strategies). Um exemplo é a estratégia “olho-por-olho”, onde a estratégia de hoje do jogador é igual à estratégia usada pelo seu adversário ontem. Considere novamente a seguinte estratégia para o i, i = 1, 2: na primeira interação ele joga NC (cooperar). Nos peŕıodos seguintes, se o outro jogador escolheu NC (cooperar) no peŕıodo anterior, ele coopera hoje. Caso contrário, o jogador i escolhe C (não cooperar). Suponha que a taxa de desconto intertemporal é 0 < δ < 1. Temos que o jogador 2 cooperará se: ∞∑ t=0 −2δt ≥ −1 + ∞∑ t=1 −3δt ⇒ −2 1− δ ≥ −1 + −3δ 1− δ Logo, se δ ≥ 1 2 = 50%, então o resultado cooperativo ((NC,NC) todo peŕıodo) é obtido como equiĺıbrio (é um equiĺıbrio de Nash perfeito em subjogos). Portanto, dependendo da taxa de desconto intertemporal e dos payoffs obtidos desviando do equiĺıbrio cooperativo e seguindo o equiĺıbrio cooperativo, podem existir equiĺıbrios em que os jogadores adotem estratégias que envolvem cooperação. Esse resultado é conhecido como “Folk Theorem.” Observação: Usualmente, a taxa de desconto intertemporal δ é determinada pela taxa de juros r, do seguinte modo: δ = 1 1 + r Logo, se encontrarmos a taxa de desconto intertemporal, podemos também encontrar a taxa de juros asso- ciada. No exemplo acima, obtemos que: r ≥ 1 3.4.3 QUESTÕES DA ANPEC RESOLVER: Questão 12 - 2009; Questão 15 - 2008; Questão 11 - 2003; Questão 11 - 2002; Questão14 - 2000. Leitura sugerida: • Varian, caṕıtulos 28 (A Teoria dos Jogos) e 29 (Aplicações da Teoria dos Jogos). 21
Compartilhar