Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 AULA 8 : ESTRATÉGIAS E JOGOS - I 1. Conceitos básicos; 2. Estratégias Dominantes e Dominadas; 3. O Dilema dos Prisioneiros; 4. Equilíbrio de Nash: Estratégias puras 5. Estratégias comportamentais: minmax e maxmin 6. Bibliografia e Exercícios sugeridos 1. Conceitos Básicos Nos dois capítulos anteriores analisamos o problema da escolha ótima de um agente individual quando confrontado com um ambiente de incerteza quanto às conseqüências das suas decisões. Neste e nos próximos dois capítulos estudaremos o problema da decisão do agente em uma situação mais complexa, em que há outros agentes decisores cujas escolhas podem afetar os resultados obtidos pelas escolhas deste agente. Em outras palavras, temos um contexto decisório interativo, em que as escolhas individuais assumem um caráter estratégico. Na literatura, convencionou-se chamar tais situações de Jogos, sobre os quais desenvolveu-se todo um conjunto teórico chamado teoria dos jogos. Jogos Trata-se de um problema de decisão em um contexto estratégico, no qual as escolhas de um jogador interagem e afetam as decisões tomadas pelos outros jogadores. 2 Todo jogo possui três ingredientes: a) Jogadores Jogadores são os tomadores de decisão, que podem ser indivíduos (como em um jogo de baralho), firmas (em um mercado concorrencial), países (em um conflito militar), etc. Portanto, jogadores são os participantes do jogo, aptos a escolher entre um conjunto de ações alternativas. Em um jogo com n indexamos os jogadores pelo índice ni ,...,2,1= b) Estratégias Uma estratégia é uma sequencia de escolhas alternativas que se abrem ao jogador ao longo do jogo. Em um mesmo jogo, múltiplas estratégias se abrem normalmente para cada jogador. Estas estratégias podem envolver uma única ação simples (tipo aumentar ou não o preço) ou condicionada (tipo aumentar o preço somente se mais de 50% dos competidores o fizerem) ou uma sequencia de ações, uma em cada nó de decisão (como em um jogo seqüencial). O conjunto de estratégias abertas no jogo para o jogador será notado . Uma estratégia em particular será: . i iS ii Ss ∈ c) Resultados Um resultado do jogo é uma recompensa (payoff), uma renda, uma utilidade, o produto de um jogo, recebido pelo jogador ao final do jogo. 3 Este resultado é funçao das estratégias adotadas pelos jogadores. Em um jogo com n jogadores, se é a estratégia adotada pelo jogador , denotamos o vetor das estratégias dos outros is i 1−n jogadores por: ),...,,,...,( 111 niii sssss +−− = Deste modo, o resultado do jogo para o jogador será a funçao: i ),(),(:......: 1 iiiiinii ssussRSSSu −− →→×××× onde é a recompensa (payoff) do jogador quando ele adota a estratégia e os outros participantes adotam suas estratégias em . ),( iii ssu − i is is− Conjuntos de Informação Cada jogador, no momento em que é chamado a jogar, possui um determinado conjunto maior ou menor de elementos que informam à ele sobre: (i) as escolhas efetuadas pelos outros jogadores que atuaram antes dele; (ii) os resultados do jogo depois das escolhas efetuadas por ele. Tipologia dos Jogos a) Do ponto de vista da atitude dos jogadores, um jogo pode ser cooperativo ou não cooperativo. No jogo cooperativo, abre-se a possibilidade dos jogadores formarem uma coalisao, jogarem de maneira préviamente concertada entre si, de modo a maximizar o resultado agregado do jogo. Por 4 exemplo, o mercado de um determinado produto, dominado por um cartel de ofertantes é um exemplo. No jogo não cooperativo, dadas as escolhas dos outros, cada jogador faz suas escolhas independentemente, de modo a maximizar o seu resultado. Um mercado onde os ofertantes de um produto homogêneo competem entre si escolhendo quantidades (Cournot) é modelado como um jogo não cooperativo. b) Do ponto de vista das estratégias, os jogos podem ser finitos ou infinitos, de acordo com a natureza do conjunto das suas estratégias. O conjunto de estratégias de cada jogador , , pode ser discreto, finito ou infinito (como um jogo “par- ímpar” jogado um número finito de vezes, ou uma infinidade de vezes) ou contínuo (como um jogo de Bertrand) onde uma estratégia pode ser a escolha de um preço abaixo de um determinado limite, isto é, dentro de um conjunto infinito de valores. i iS c) Do ponto de vista da ordem das jogadas, um jogo pode ser simultâneo, ou seqüencial. No jogo simultâneo, os jogadores fazem suas escolhas simultâneamente. No jogo seqüencial, existe uma ordem pre- estabelecida para as intervenções de cada jogador. Jogos sequenciais são considerados jogos dinâmicos. 5 d) Do ponto de vista da freqüência, jogos simultâneos podem ser jogados uma única vez ou entao jogados repetidamente, um número finito ou infinito de vezes. O jogo que é repetido, em um contexto dinâmico, é chamado jogo estágio. e) Do ponto de vista dos conjuntos de informação dos jogadores, um jogo pode envolver informação perfeita ou informação imperfeita. Em um jogo com informação perfeita, os conjuntos de informação, de todos os jogadores, são constituídos, cada um deles, por um único nó de decisão. Do contrário, quando um mesmo conjunto de informação envolve mais de um nó de decisão, trata- se de um jogo com informação imperfeita. Jogos simultâneos com mais de uma escolha, são necessáriamente jogos com informação imperfeita, como veremos adiante. f) Do ponto de vista do conhecimento dos jogadores, um do outro e dos resultados do jogo, os jogos podem ter informação completa ou incompleta. O caso de um jogo com informação completa é o de uma situação em cada jogador conhece perfeitamente as condiçoes de escolha e as preferências de cada jogador. Quando isto não ocorre, temos um jogo com informação incompleta. Situações com informação incompleta ocorrem por exemplo, em um mercado concorrencial no qual as firmas não conhecem os custos médios das concorrentes; em uma negociação salarial com ameaças de greve, a construtora não conhece a 6 capacidade do sindicato mobilizar os trabalhadores e sustentar um longo período de paralisação, etc. g) Do ponto de vista da sua descrição, os jogos podem ter uma representaçao na forma normal ou na forma extensiva. Na forma normal, um jogo entre dois jogadores é apresentado como uma tabela a duas entradas, nas quais aparecem as várias ações alternativas que se apresentam para cada jogador e, no interior da tabela, o par de resultados obtidos nas escolhas de cada um deles. Na Figura 1 abaixo temos um jogo entre dois jogadores, o primeiro tem três ações alternativas, , o segundo tem duas ações possíveis, . 111 ,, cba 22 , ba Cada jogador joga uma única vez; se o jogador 1 escolhe e o jogador 2 escolhe , o resultado para o jogador 1 será 1a 2a 6),( 211 =aau e para o jogador 2 . 2),( 122 =aau Fig.1:Jogo na forma normal a2 b2 a1 b1 c1 Jogador 2 Jogador 1 ( -1 , 4 ) ( 2 , - 2 ) ( 0 , 1 ) ( 6 , 2 ) ( -2 , 4 ) ( 2 , -6 ) 7 Na forma extensiva, o jogo se apresenta como uma árvore de decisão. Se o jogo é simultâneo qualquer jogador pode figurar no topo da árvore; se o jogo for seqüencial, entao a ordem importa. Na Figura 2a. abaixo representamos o jogo simultâneo da figura 1. Fig.2a: Jogo simultâneo na forma extensiva: informação imperfeita1 2 2 2 a1 b1 c1 a2 b2 b2 b2a2 a2 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ 2 6 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛− 4 1 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛− 4 2 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − 2 2 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − 6 2 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ 1 0 CI 2 A elipse pontilhada envolvendo os três nós de decisão do jogador 2 indicam que estes nós estão no mesmo conjunto de informação deste jogador (CI2). Isto significa que, ao fazer sua escolha, ele não sabe qual é a escolha feita pelo jogador 1. 8 Como mencionamos acima, o jogo simultâneo é um jogo com informação imperfeita, e isto pode ser observado na sua forma extensiva: o conjunto de informação do jogador 2 (CI2) tem mais de um nó de decisão. Na Figura 2b abaixo apresentamos o jogo anterior alterado: o jogador 1 joga primeiro. Neste caso, temos um jogo seqüencial com informação perfeita: o jogador observa a escolha do jogador 1 e tem três conjuntos de informação distintos, com um único nó de decisão em cada um deles. Fig.2b: Jogo seqüencial na forma extensiva: informação perfeita 1 2 2 2 a1 b1 c1 a2 b2 b2 b2a2 a2 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ 2 6 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛− 4 1 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛− 4 2 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − 2 2 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − 6 2 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ 1 0 Se os resultados representam valores monetários ($), qual seria o resultado deste jogo ? 9 Uma solução não cooperativa, na qual cada jogador maximiza o seu resultado, independentemente do outro, o jogador 2 escolherá se o jogador 1 escolher ou e se o jogador 1 escolher . 2b 1a 1c 2a 1b Os resultados, para o jogador 1 seráo, nos dois primeiros casos, ou , respectivamente, ou no último caso. 1− 0 2− Logo, a estratégia ótima para o jogador 1 será “ ”, “ se ” para o jogador 2. 1c 2b 1c Cooperação Este é no entanto um resultado pífio, o benefìcio agregado é , e há possibilidade dos jogadores obterem um resultado conjunto melhor. 110 =+ Mas para isso, é necessário que haja cooperação entre os jogadores. Se o jogador 2 se compromete a jogar caso o jogador 1 jogar , mediante divisão equitativa do valor agregado, o resultado seria 2a 1a 826 =+ , de modo que ambos teriam 4 . Neste jogo, o comprometimento do jogador 2 é crível para o jogador 1, pois o jogador 2 estará obtendo 4 , que é um resultado melhor daquele obtido na ausência de cooperação (1), e não inferior a qualquer outro resultado que ele poderia obter neste jogo. 2. Estratégias Dominantes e Dominadas Em muitas situações, o jogador possui uma estratégia que é a melhor para ele, qualquer seja a ação empreendida pelos outros jogadores. 10 Definição 1: A estratégia ii Ss ∈ˆ é uma estratégia estritamente dominante para o jogador i se para toda outra estratégia , temos, ii Ss ∈ iiiiiiii Ssssussu −−−− ∈∀> ;),(),ˆ( Obs.: Para a dominância fraca, substitui-se a desigualdade estrita na expressão acima pela desigualdade fraca ( ). ≥ Fig.3a: Estratégias estritamente dominantes e dominadas a2 b2 a1 b1 c1 Jogador 2 Jogador 1 ( -1 , 1 ) ( -2, - 1 ) ( -3 , 2 ) ( 1 , -1 ) ( -1 , 1 ) ( -2 , 5 ) Na Figura 3a. acima, é uma estratégia estritamente dominante para o jogador 1. 1a O jogador 2 não possui estratégia dominante. No jogo da Figura 1, nenhum dos jogadores possui estratégia dominante. 11 Definição 2: A estratégia ii Ss ∈~ é uma estratégia estritamente dominada para o jogador se existe i outra estratégia , tal que , ii Ss ∈* iiiiiiii Ssssussu −−−− ∈∀< ;)*,(),~( Obs.: A estratégia ii Ss ∈~ é fracamente dominada se a desigualdade fraca ( ≤) é admissível na relação acima. Obviamente, se o jogador tem uma estratégia dominante, como no jogo precedente da Figura 3a, todas as suas outras estratégias serão estratégias dominadas. Na Figura 3b abaixo, para o jogador 1 as estratégias e são fracamente dominadas pela estratégia . 1a 1b 1c Fig.3b: Estratégias fracamente dominantes e dominadas a2 b2 a1 b1 c1 Jogador 2 Jogador 1 ( 4 , 0 ) ( 3 , 1 ) ( 4 , 4 ) ( 5 , 1 ) ( 6 , 0 ) ( 6 , 4 ) O jogador 2 não possui estratégias dominadas. 12 3. O Dilema dos Prisioneiros Vamos apresentar um jogo introduzido na literatura por A.W.Tucker na década de 1940, e que se tornou célebre na teoria dos jogos: O Dilema dos Prisioneiros. Dois suspeitos de terem conjuntamente cometido um crime são presos e colocados em celas separadas. O Delegado tenta obter a confissão de ambos, ao passo que os acusados tentam obter a menor pena possível. O Delegado diz separadamente, à cada um dos presos, que se ele for o único a confessar, será beneficiado com uma pena levíssima, de 1 ano de prisão apenas, enquanto que o outro levará 10 anos de prisão . Se todavia ele for o único a não confessar, ele é que receberá a pena de 10 anos de prisão. Se ambos confessarem, entao a pena será mais branda, 5 anos de prisão para cada um. Por fim, se nenhum dos dois confessar, o Delegado informa que mesmo assim será possível incriminá-los e que ambos receberão uma pena de 2 anos de prisão. Qual será a solução deste jogo ? Trata-se de um jogo simultâneo (informação imperfeita), representado abaixo na forma normal: Fig.4a: Dilema dos Prisioneiros C ÑC C ÑC Prisioneiro 2 Prisioneiro 1 ( - 1 , - 10 ) (- 2 , - 2 ) ( - 5, - 5 ) ( - 10 , -1 ) C: confessa ; ÑC: não confessa 13 Note que ambos os jogadores possuem uma estratégia estritamente dominada, que é não confessar “ÑC”. Obviamente, se os jogadores são racionais, nunca escolherão uma estratégia estritamente dominada. Assim, fazendo a hipótese de que os jogadores são racionais, cada jogador eliminará a estratégia estritamente dominada, o que levará ao equilíbrio desejado pelo Delegado: (C , C), ambos os prisioneiros confessam o crime. Observe aqui também que esta solução não é de fato a melhor para os prisioneiros: se eles pudessem se comunicar, se concertariam para não confessar, pois neste caso teriam apenas 1 ano de prisão cada. A solução cooperativa do jogo seria ( ÑC, ÑC ). Solução de um jogo por eliminação iterada de estratégias estritamente dominadas Temos entao que em jogos que possuem estratégias estritamente dominadas, a solução pode ser encontrada quando estas estratégias podem ser eliminadas iteradamente, isto é, etapa por etapa. O jogo da Figura 4b ilustrará esta situação: 14 Fig4b: Eliminação iterada L R U C D Jogador 2 Jogador 1 ( 0 , -4 ) ( -2 , 4 ) ( -1 , 8 ) ( 3 , 0 ) ( 1 , -1 ) ( 2 , 4 ) ( 0 , -5 ) ( 3 , 3 ) ( 4 , 1 ) M A estratégia “C” do jogador 1 é estritamente dominada pela estratégia “D¨. A estratégia “M” do jogador 2 é estritamente dominada pela estratégia “R”. Se cada jogador se comportar racionalmente e cada um conjecturar que o outro também se comporte racionalmente, as estratégias dominadas serao eliminadas e o jogo se simplifica conforme a Figura 4c abaixo: Fig4c: Primeira eliminação L R U D Jogador 2 Jogador 1 ( 0 , -4 ) ( -1 , 8 ) ( 3 , 0 ) ( 2 , 4 ) 15 Note que, após a eliminaçao da estratégia “M” do jogador 2, a estratégia “D” do jogador 1 passa a ser uma estratégia estritamente dominada pela estratégia “U”. Deste modo, se o jogador 2 acha que o jogador 1 se comportará racionalmente, o jogo poderá sofrerá uma nova redução, conformeaparece na Figura 4d abaixo: Fig.4d: Segunda eliminação L R U Jogador 2 Jogador 1 ( 0 , -4 )( 3 , 0 ) Neste estágio, o jogo se resolve naturalmente, pois o jogador 1 só possui uma estratégia sobrevivente e o jogador 2 poderá eliminar a estratégia “R” que passa a ser estritamente dominada por “L”. Fig.4e: Terceira e última eliminação L U Jogador 2 Jogador 1 ( 3 , 0 ) Sendo o jogador 2 racional, a soluçao do jogo será o par de estratégias ( U , L ), com payoff e para os jogadores 1 e 2, respectivamente. 3),(1 =LUu 0),(2 =ULu 16 Dois pontos são agora importantes: a) Soluções por eliminação iterada: Nem todo jogo finito poderá ser resolvido completamente desta maneira: muitos jogos não permitem a eliminação iterada das estratégias estritamente dominadas até que seu conjunto de estratégias se reduza à uma única estratégia, como no exemplo acima. Por exemplo, o jogo da Figura 1, nenhum dos jogadores possui estratégia estritamente dominada, de modo que não podemos resolver aquele jogo pelo método da eliminação iterada. Formalizando o argumento: Seja o conjunto inicial de estratégias do jogador i e o conjunto das suas estratégias que sobreviventes após a iS k iS mak etapa de eliminação. Por definição temos: k ii Ss ∈ se 1−∈ kii Ss e não é estritamente dominada, is in,...,k 2,1= , com iSlS ≡0 onde é o número de estratégias oferecidas ao jogador no jogo inicial. in i Um jogo finito admite soluçao por eliminação iterada de estratégias estritamente dominadas se, para todo jogador , existe um número inteiro de etapas , tal que o conjunto se reduz à uma única estratégia: . i 1−≤ ii nk iklS{ }ikl sS i ˆ= b) Estratégias fracamente dominadas É possível resolver um jogo eliminando-se iteradamente estratégias fracamente dominadas ? 17 Sim, é possível, mas este procedimento apresenta o resultado indesejável de que mais de uma solução pode ser obtida para o mesmo jogo, dependendo da ordem com a qual as estratégias fracamente dominandas serão eliminadas ! Para ilustrar isto, retomemos o jogo da Figura 3b. Neste jogo, o jogador 1 possui duas estratégias fracamente dominadas pela estratégia : as estratégias e . 1c 1a 1b O jogador 2 não possui estratégia dominada, mas se ele acha que o jogador 1 se comportará racionalmente desconsiderando primeiramente a estratégia , o jogo fica reduzido conforme a figura abaixo: 1a Fig.5a: Eliminação da estratégia fracamente dominada 1a a2 b2 b1 c1 Jogador 2 Jogador 1 ( 3 , 1 ) ( 4 , 4 ) ( 6 , 0 ) ( 6 , 4 ) Agora, na segunda etapa, para o jogador 2 a estratégia é fracamente dominada pela estratégia , enquanto que, para o jogador 1, a estratégia continua sendo fracamente dominada pela estratégia . 2a 2b 1b 1c Se cada jogador conjectura que o outro se comportará racionalmente, eliminando sua estratégia fracamente dominada do jogo, na etapa 2 obtemos a solução: 18 ( c1, b2 ) com payoff para os jogadores. )4,4( Caso o jogador 2 acha que o jogador 1 eliminará primeiro a estratégia , o jogo fica reduzido conforme a figura abaixo: 1b Fig.5b: Eliminação da estratégia fracamente dominada 1b a2 b2 a1 c1 Jogador 2 Jogador 1 ( 4 , 0 ) ( 4 , 4 ) ( 5 , 1 ) ( 6 , 4 ) Neste caso, para o jogador 2 a estratégia é fracamente dominada pela estratégia , enquanto que, para o jogador 1, a estratégia continua sendo fracamente dominada pela estratégia . 2b 2a 1a 1c Novamente, se cada jogador conjectura que o outro se comportará racionalmente, eliminando nesta segunda etapa sua estratégia fracamente dominada, obtemos a solução: ( c1, a2 ) com payoff para os jogadores 1 e 2, respectivamente, que é uma solução diferente da anterior. )4,6( Vemos assim que a solução do jogo depende da ordem com a qual as estratégias dominadas fracamente foram eliminadas. 19 Quid se o jogador 2 achar que o jogador 1 descartará as duas estratégias fracamente dominadas e simultâneamente ? 1a 1b Neste caso, na segunda etapa, o jogador 2 será confrontado apenas com a última linha da Figura 5b acima, de modo que ele estará indiferente entre as estratégias e , pois ambas lhe proporcionarão o mesmo payoff. 2a 2b Como esta escolha não é indiferente para o jogador 1, se o jogador 2 for “mau”, ele escolherá ; 2b Se ele for “benevolente”, escolherá ; 2a Se ele for “justo”, buscará uma solução cooperativa, prometendo ao jogador 1 a estratégia conjunta em troca do payoff médio, equitativo , o que representaria uma melhora Paretiana com relaçao ao equilíbrio anterior. ),( 21 ac )5,5( 4. Equilíbrio de Nash Anteriormente, mencionamos que existem jogos simultâneos finitos onde nenhum jogador possui qualquer estratégia estritamente dominada. E mencionamos o jogo da Figura 1 como exemplo. Como resolver um jogo neste caso? A resolução desta questão passa pela definição do equilíbrio de Nash de um jogo. No artigo Non-cooperative games de 1951, J.F.Nash definiu o equilíbrio de um jogo estratégico que atende aos princípios comportamentais da regularidade e da racionalidade, e que se tornou desde entao no conceito mais importante da Teoria dos Jogos. 20 O princípio de Nash é simples: o vetor das estratégias dos jogadores é um equilíbrio para este jogo se cada jogador, ciente das escolhas feitas pelos outros, não tem incentivo em mudar a sua escolha. n Em outras palavras, o equilíbrio de Nash prescreve para todos os jogadores, comportamentos que podem ser racionalmente sustentados. As escolhas feitas pelos jogadores podem portar sobre as estratégias ou sobre um mix de estratégias. No primeiro caso, quando ele existe, dizemos que o equilíbrio de Nash ocorre em estratégias puras. No segundo caso, os jogadores não escolhem uma estratégia em particular, mas o conjunto delas, cada uma com um peso determinado. Assim, os jogadores escolherão de fato uma sequencia de probabilidades para estas estratégias, de modo que suas escolhas são feitas entre diferentes distribuições de probabilidade. Dizemos neste caso que o equilíbrio ocorre em estratégias mistas. Vamos definir inicialmente o equilíbrio de Nash em estratégias puras. Após alguns exemplos e observações, daremos a definição do equilíbrio em estratégias mistas. Definição 3: Equilíbrio de Nash (Estratégias Puras) Sejam o conjunto das estratégias do jogador iS i )n,...,2,1(i = em um jogo com n jogadores e o nSSS ××= ...1 conjunto das estratégias do jogo. Seja uma estratégia do jogo, onde o ),...,(; 1 nsssSs =∈ jogador i escolhe a estratégia ii Ss ∈ . O jogo pode ser então definido pelo par de estratégias e resultados: ),( uS=Γ onde ),...,( 1 nuuu = 21 e é a funçao resultado (payoff) do jogador i . iu Dizemos que Ss∈ˆ é um equilibrio de Nash (EN) em estratégia pura do jogo Γ se, para cada jogador : i iiiiii Ssssusu ∈∀≥ − ;)ˆ,()ˆ( Em outras palavras, )ˆ,ˆ(ˆ ii sss −= é um EN para o jogo Γ , se, para todo jogador i , dadas as estratégias ótimas dos outros jogadores , o melhor que o jogador tem a fazer é escolher a estratégia . is−ˆ siˆ Observações e exemplos: (i) Nem todo jogo finito possui equilíbrio de Nash em estratégias puras. O jogo da Figura 1 anteriornão tem EN. O mesmo pode ser dito do jogo tipo par-ímpar: Fig.6a: Jogo sem EN em estratégias puras Par Impar Par Impar Jogador 2 Jogador 1 ( -1 , 1 ) ( 1 , -1 ) ( 1 , -1 ) ( -1 , 1 ) 22 Em todo par de estratégias deste jogo, um dos jogadores tem incentivo em desviar, isto é, pode elhorar seu resultado mudando de estratégia. rantem a existência de um EN em stratégias puras. ii) Quando existe, o EN é estável. m ncentivo para desviar da estratégia de equilíbrio. scolha de ambos os prisioneiros é confessar: (C,C) s prisioneiros tem incentivo para não onfessar. e um deles o fizer, aumentará sua pena de 5 anos ! arem, ambos erão incentivo unilateral de confessar. quele que o fizer, terá sua pena reduzida de 1 ano ! que todos os jogadores adotem stratégias Nash. de estratégias estritamente ominadas é um EN. ue o equilíbrio de Nash é acionalizável. m A frente enunciaremos uma proposição estabelecendo as condiçoes que ga e ( Por definição, nenhum dos jogadores te i Por exemplo, no dilema dos prisioneiros, a melhor e Muito embora com esta escolha ambos peguem 5 anos de prisão, é um EN, pois se ambos confessam, nenhum do c S Por outro lado, a solução cooperativa (NC , NC) não é um EN porque se ambos não confess t A (iii) Em virtude da estabilidade do EN, em jogos repetidos espera-se e (iv) Em um jogo finito, toda solução obtida por eliminação iterada d Isto mostra q r 23 Por exemplo, no jogo da Figura 3a, a eliminação das estratégias estritamente dominadas conduz ao equilíbrio (a1,b2), com payoff )1,1(− . Como nesta escolha nenhum dos jogadores tem incentivo em desviar, é um EN. Análogamente, o resultado iterado (U,L) com payoff no jogo da Figura 4b é um EN. )0,3( Observe que quando todos os jogadores possuem uma estratégia estritamente dominante, o EN é único. (v) Nem todo EN é um equilíbrio com estratégias dominantes. O jogo abaixo, chamado batalha dos sexos, ilustrará isto. Fig.6b: Batalha dos sexos Box Ballet Box Ballet Mulher Homem ( 0 , 0 ) ( 1 , 2 ) ( 2 , 1 ) ( 0 , 0 ) Nenhum dos jogadores tem estratégia dominante. O homem prefere assistir à uma luta de box, enquanto a mulher prefere assistir à um espetáculo de ballet. 24 Mas ambos preferem estar juntos do que cada um seguir sua primeira escolha, um separado do outro. Este jogo tem dois equilíbrios de Nash: (box,box) e (ballet,ballet) Estando juntos, nenhum dos dois membros do casal tem incentivo para desviar. (vi) O EN não é necessáriamente único. Vide o exemplo da batalha dos sexos. EN múltiplos ocorrem frequentemente em equilíbrios com estratégias fracamente dominantes, como mostrado no jogo da Figura 3b: Os pares de estratégias (c1,a2) e (c1,b2) são ambos equilíbrios de Nash porque nenhum dos jogadores tem incentivo estrito em desviar da sua escolha. A Proposiçao abaixo estabelece as condiçoes que garantem a existência de uma EN em estratégias puras, no caso em que os conjuntos de escolha dos jogadores são infinitos e convexos. Proposição: Existe um EN em estratégias puras para o jogo Γ se, para todo jogador i : niii uS 1),( == (i) é um subconjunto não vazio, convexo e compacto do iS inR ; (ii) A funçao payoff é contínua em e quase côncava em . ),...,( nii ssu ),...,( 1 nss is O resultado desta proposiçao tem ampla aplicaçao na análise do funcionamento de mercados em microeconomia, sob diferentes regimes competitivos, nos quais os requerimentos da proposição são atendidos. 25 5. Estratégias minMax e Maxmin O Equilíbrio de Nash pressupõe que cada jogador maximiza o seu retorno no jogo, dada a estratégia dos outros jogadores. Trata-se, portanto, de um equilíbrio não cooperativo em que cada jogador é auto-motivado, no sentido que ele maximiza uma funçao objetivo pessoal, em interesse próprio. No EN, a atitude dos jogadores é neutra, no sentido que nenhuma ação de um jogador visa favorecer ou prejudicar deliberadamente o interesse dos outros jogadores. Mas é possível situações nas quais os jogadores adotam uma atitude não neutra, favorável ou antagônica aos demais jogadores. O consenso para empreender açoes benevolentes entre os jogadores remetem a jogos cooperativos, dos quais não trataremos neste curso. Situações em que o comportamento dos jogadores é antagônico são muito comuns na prática, algumas das quais são consideradas em economia industrial. No modelo do preço limite, por exemplo, a firma dominante adota uma estratégia de preço não maximizadora com o objetivo de prevenir a entrada de potenciais concorrentes; Outro caso é o dumping onde uma firma estabelecida adota uma estratégia predatória de preços visando infligir perdas duradouras à suas concorrentes mais próximas. 26 Definiremos abaixo as estratégias puras e os valores minMax e Maxmin de um jogo com dois jogadores, e , notando que estas noções se estendem para jogos com um número maior de jogadores, e admitem também estratégias mistas. i i− 2,1=i Estratégia e Valor minMax Um jogador adota uma estratégia minMax quando quer punir o outro jogador da melhor forma que lhe é possível. Este é o caso em que o jogador i adota um comportamento antagônico ao outro jogador. Como o jogador maximiza o seu payoff para cada escolha possível do jogador i , a estratégia minMax do jogador i é aquela que minimiza o resultado para das melhores escolhas deste jogador. i− i− Formalmente: Definição 4: minMax A estratégia ii Ss ∈ é uma estrategia minMax do jogador i se );(maxminarg iiiSsSsi ssus iiii −−∈∈ −−= O valor minMax do jogador i é o payoff iu que ele obtém quando adota a estratégia minMax is : );(maxmin iiiSsSsi ssuu iiii −−∈∈ −−= Para ilustrar como funciona a identificação das estratégias e dos valores minMax de cada jogador, consideramos os jogo da Figura 7: 27 Fig.7: Estratégias minMax e Maxmin a2 b2 a1 b1 c1 Jogador 2 Jogador 1 ( 0 , 5 ) ( 1 , 1 ) ( 0 , 0 ) ( 4 , 4 ) ( 5 , 0 ) ( 0 , 0 ) c2 ( 0 , 0 ) ( 0 , 0 ) ( 3 , 3 ) Pode-se verificar que este jogo possui dois equilíbrios em estratégias puras: EN1= (b1,b2) com payoff (1,1) ; EN2= (c1,c2) com payoff (3,3) ; e um equilibrio em estratégias mistas: EN3= ((0,3/4,1/4), (0,3/4,1/4), com payoffs esperados (3/4, 3/4). Vamos agora determinar a estratégia minMax do jogador 1: { }),(),,(),,(minarg 1221221221 11 ccubbuabus Ss ∈= { } 1122 ),(arg bbbu == E o valor minMax para o jogador 1 será: 11 =u Como este jogo é simétrico, temos para o jogador 2: { } 22112 ),(arg bbbus == e 12 =u 28 Vemos assim que se os dois jogadores forem antagônicos um ao outro e ambos jogarem estratégias minMax, o resultado do jogo será um equilíbrio de Nash, mais precisamente, EN1 que é o equilíbrio com baixo retorno. Este exemplo mostra também que o equilíbrio minMax de um jogo simultâneo pode ser estável. Estratégia e Valor Maxmin O jogador que adota uma estratégia Maxmin é uma pessoa conservadora, que prefere maximizar seu retorno no caso em que o pior venha a acontecer. Pode ser também uma pessoa paranóica, que tem mania de perseguição. Este é o caso em que o jogador i acha que o outro jogador sempre quer o pior para ele. Como o jogadorminimiza o payoff do jogador para cada escolha possível deste jogador, a estratégia Maxmin do jogador i é aquela que maximiza o seu resultado dentre as escolhas do jogador i− i i− que foram mais onerosas para ele. Definição 5: Maxmin A estratégia ii Ss ∈ é uma estratégia Maxmmin do jogador i se );(minmaxarg iiiSsSsi ssus iiii −∈∈ −−= O valor Maxmin do jogador i é o payoff iu que ele obtém quando adota a estratégia Maxmin is : );(minmax iiiSsSsi ssuu iiii −∈∈ −−= 29 O valor Maxmin do jogador é também chamado seu nível de segurança. Vamos agora achar a estratégia Maxmin do jogador 1: { }),(),,(),,(),,(maxarg 2112112112111 11 bcuacucbucaus Ss ∈= { }),(),,(),,(),,(arg 211211211211 bcuacucbucau= { }1111 ,, cbas = E o valor Maxmin para o jogador 1 será: 01 =u Como o jogo é simétrico, temos para o jogador 2: { }2222 ,, cbas = E o seu valor Maxmin também será: 02 =u Vemos assim que se os dois jogadores forem conservadores, fizerem conjecturas negativas um com relação ao outro e se ambos jogarem estratégias Maxmin, haverá várias soluções neste jogo: (a1,c2), (b1,c2), (c1,a2), (c1,b2), todos com retorno (0,0) para os jogadores. Isto mostra que em jogos nos quais os jogadores adotam estratégias Maxmin, as soluções não são necessáriamente únicas, nem estáveis. Estas são características também das soluções minMax. 30 6. Bibliografia e Exercícios Sugeridos ibliografia: B JR] Cap.7 xercícios Sugeridos [SN] Cap.8 [V0] Cap.16 [ E . 11 2008/ Q09 .1-85 Anpec: 2012/ Q09 2011/ Q07,Q 2010/ Q10 2009/ Q11 [SN]: 8
Compartilhar