Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 AULA 9 : ESTRATÉGIAS E JOGOS - II 1. Equilíbrio de Nash: Estratégias Mistas; 2. Estratégias Racionalizáveis; 3. Informação Incompleta; 4. Bibliografia e Exercícios sugeridos 1. Equilíbrio de Nash: Estratégias Mistas Na aula anterior definimos o Equilíbrio de Nash (EN) em estratégias puras e vimos que esta definição pressupõe que cada jogador conhece exatamente as estratégias a serem escolhidas pelos outros jogadores. Isto é, no EN em estratégias puras, as escolhas ótimas de cada jogador são prefeitamente previsíveis. Por outro lado, vimos que nem todo jogo simultâneo admite um EN em estratégias puras. Como entao resolver o problema de determinar um EN neste último caso em que não existe um EN em estratégias puras, isto é, quando a escolha dos jogadores não é previsível ? A melhor maneira de tratar o problema da escolha quando esta não pode ser predita é faze-lo supondo que o próprio jogador randomiza suas escolhas. Com a randomização, as “escolhas” do jogador nao são anticipadas nem por ele mesmo, uma vez que ele não faz escolhas determinísticas, mas seleciona tal ou tal estratégia “com uma certa probabilidade”. Chegamos assim à concepção do que na teoria dos jogos convencionou-se chamar estratégias mistas. 2 Estratégias Mistas Seja o jogo na forma estratégica n iii uS 1),( ==Γ . Vamos supor, sem perda de generalidade, que o jogo é finito. Γ Uma estratégia mista para o jogador i é uma funçao de probabilidade sobre o seu conjunto de estratégias . im iS Formalmente, [ ] )(:1,0: iiiii smsSm →→ é a probabilidade que o jogador i escolha a estratégia . is Seja o conjunto das funções de probabilidade que o jogador i venha a considerar. iM Obviamente, o jogador faz escolhas dentro do conjunto , que é um conjunto de cardinalidade maior que , de modo que ele tem agora muito mais escolhas do que antes. i iM iS Em particular, ele sempre pode escolher uma estratégia em particular escrevendo-a como uma probabilidade degenerada: is ⎩⎨ ⎧ ≠ == i i i ss ss sm ;0 ;1 )( Um vetor de estratégias do jogo será notado: . i n i n Mmmm ×=∈= 11 ),...,( Entao, sendo a utilidade VNM das estratégias mistas para o jogador , sua utilidade esperada no iu i 3 vetor das estratégias mistas e no vetor das estratégias puras i n i ii Mmmm ×=− ∈= 1),( ),...,1 nss(s = será: ∑ ∈− ≡ Siii mmmu ),( s imn susm )()(s )...( 11 (*) A expressáo acima diz que a utilidade esperada de uma estratégia mista adotada pelo jogador é uma combinação convexa da utilidade que ele pode auferir das estratégias puras adotadas por todos os jogadores. Esta igualdade pressupõe que os jogadores formam suas conjecturas independentemente um do outro. Equilíbrio de Nash: Estratégias Mistas Definição 1: O vetor de estratégias mistas ),...,( 1 nmmm = é um equilíbrio de Nash do jogo niii uS 1),( ==Γ se Mmmmumu iiiiii ;)ˆ,()ˆ( n,...,2,1i; =∈∀≥ − , No EN em estratégias mistas, cada jogador randomiza suas escolhas e está ciente da maneira como os outros jogadores randomizam as suas escolhas também. No equilíbrio do jogo, nenhum jogador pode melhorar seu payoff esperado ao randomizar diferentemente da estratégia mista de equilíbrio. Dado o vetor das estratégias mistas ótimas dos outros jogadores , o jogador i deverá encontrar os pesos para cada estratégia pura que se lhe apresenta, de modo a maximizar a utilidade esperada: im−ˆ )( ii sm is 4 )ˆ;()()ˆ;( iiiSs iiiii msusmmmu ii −∈− ∑= Observe que é uma combinação convexa das utilidades das diferentes estratégias puras do jogador. )ˆ;( iii mmu − )ˆ; ii ms −(iu Desta forma, temos sempre, )ˆ;(max)ˆ;( iiiSsiii msummu ii ∈− ≤ para todo . ii Mm ∈ Abaixo enunciamos um teorema que fornece um método para encontrarmos as estratégias mistas de Nash de um jogo. Teorema 1:(Testes para o EN em estratégias mistas) As três afirmações abaixo são equivalentes: (i) é um Equilíbrio de Nash; i n i Mm ×=∈ 1ˆ (ii) Para cada jogador i temos: em toda estratégia pura )ˆ;()ˆ( iiii msumu −= ii Ss ∈ que tem peso positivo em ; imˆ em toda estratégia pura )ˆ;()ˆ( iiii msumu −≥ ii Ss ∈ que tem peso em ; 0 imˆ (iii) Para cada jogador em toda ,i )ˆ;()ˆ( iiii msumu −≥ estratégia pura . ii Ss ∈ A equivalência entre as três afirmações do teorema é facilmente estabelecida: (i)→(ii): Pela definição do EN temos: niMmmmuu iiiiii ,...,2,1;;)ˆ,((m)ˆ =∈∀−≥ . Em particular, se 5 ii Ss ∈ )ˆ(i mu ≥ podemos escolher a estratégia mista degenerada: e teremos bem: . Resta agora mostrar que em toda estratégia pura ⎩⎨ ⎧ ≠ == i i i ss ss sm ;0 ;1 )( ii Ss )ˆ;( iii msu − )ˆ;()ˆ( iiii msumu −= ∈ que tem peso positivo em . Pela propriedade da utilidade esperada (*), temos que será uma combinação estritamente convexa dos números : i u mˆ ) )ˆ;( iii msu − ˆ(mi )ˆ;()(ˆ iiiSs ii msusmii −∈)ˆ;ˆ( iii mmu − ∑= Se um dos diferir de , deverá haver pelo menos algum maior que . Mas isto contradiria a desigualdade já estabelecida. Fica assim o item (ii) provado. )ˆ;( iii msu − )ˆ(i mu ≥ )ˆ(mui )ˆ(mui )ˆ;( iii msu − (ii)→(iii): Óbvio. (iii)→(i): Dado que em toda estratégia pura , tome iim . Ora, sabemos que é uma combinação convexa dos , de modo que : )ˆ;()ˆ( iiii msumu −≥ M ;( ii su iS∈is ∈ )ˆ,( iii mmu − )ˆ im− )ˆ()()ˆ()ˆ;()()ˆ;( musmmumsusmmmu iSs iiiiiiSs iiiii iiii =≤= ∑∑ ∈−∈− im . Como a estratégia mista é arbitráriamente escolhida, fica assim o item (i) estabelecido. ⊕ O item (ii) do teorema oferece um método de cálculo para se encontrar os equilibrios de Nash em estratégia mista: dadas as estratégias dos outros jogadores, cada jogador não deve ter incentivo a mudar sua estratégia. Deste modo, todas as estratégias puras que são prováveis para ele, devem proporcionar-lhe o mesmo retorno. Um corolário importante do Teorema 1 é que o vetor de estratégias puras )ˆ,...,ˆ(ˆ 1 nsss = é um equilíbrio de 6 Nash se e sòmente se ele é um equilíbrio de Nash randômico em estratégias denegeradas. A conseqüência prática deste corolário é que, ao buscar as estratégias mistas de um equilíbrio de Nash, encontraremos também todas as estratégias puras de equilíbrio. Os exemplos seguintes ilustrarão a utilização do teorema 1 na resolução do jogo. Exemplo 1: Vimos na aula anterior que a batalha dos sexos possui dois EN em estratégias puras: (box,box) e (ballet,ballet): Box Ballet Box Ballet Mulher Homem ( 0 , 0 ) ( 1 , 2 ) ( 2 , 1 ) ( 0 , 0 ) Na verdade este jogo possui ainda um terceiro equilíbrio em estratégias mistas: Com efeito, denotando por )1,(1 ppm −≡ e as estratégias mistas do Homem e da Mulher respectivamente, temos os seguintes retornos esperados de cada alternativa: )1,(2 qqm −≡ Para o Homem: )1(02);( 21 qqmboxu −+= e )1(10);( 21 qqmballetu −+= Para a Mulher: )1(0);( 12 ppmboxu −+= )1(20);( 12 ppmballetu −+= 7 Pelo teorema 1, o equilibrio requererá a igualdade dos retornos esperados das duas escolhas do Homem e da Mulher, isto é: qq −= 12 )1(2 pp −= A solução conjunta destasduas equações fornece: 3/1=q e 3/2=p . A Mulher randomizará sua escolha apostando 3/1 no box e 3/2 no ballet, enquanto que o Homem fará o contrário, apostará 3/2 no box e 3/1 no ballet. O terceiro EN deste jogo, será portanto: . ))3/2,3/1(,)3/1,3/2(()ˆ,ˆ(ˆ 21 == mmm Os retornos esperados dos dois jogadores serão: 3/21)3/2)(3/1(0)3/1)(3/1(0)3/2)(3/2(2)3/1)(3/2(1 =+++=u 3/22)3/1)(3/2(0)3/2)(3/2(0)3/1)(3/1(1)3/1)(3/2(2 =+++=u Note que 3/2 é também o retorno esperado de cada alternativa dos dois jogadores. Utilidade esperada do jogo inteiro Observe que a condiçao (ii) do teorema 1 implica que os equilíbrios em estratégia pura deste jogo não poderão ser obtidos da maneira como o fizemos acima, igualando o retorno esperado de cada alternativa. Para obtermos todos os equilíbrios do jogo de uma só vez, escreveremos a utilidade esperada do jogo inteiro, para cada jogador, e em seguida escolhemos 8 as probabilidades que maximizam a utilidade esperada de cada um deles: )1()13( )1(0)1)(1(1)1(02),( 211 qqp qpqpqppqmmu −+−= −+−−+−+= )1(2)23( )1(0)1)(1(2)1(01),( 122 ppq qpqpqppqmmu −+−= −+−−+−+= O Homem deve escolher p que maximiza , dado . Logo: ),( 211 mmu q Se ;03/1 =→< pq Se ;13/1 =→> pq Se pq →= 3/1 qualquer. A Mulher deve escolher que maximiza , dado q ),( 122 mmu p . Logo: Se ;03/2 =→< qp Se ;13/2 =→> qq Se qp →= 3/2 qualquer. As relações de p com q para o homem (em vermelho) e de com q p para a mulher (em verde) são apresentadas no gráfico abaixo: 9 Fig.1: Estratégias mistas ótimas na Batalha dos Sexos 1/3 2/3 1 0 1 p q EN1 EN2 EN3 Como vemos na figura acima, além do equilíbrio em estratégia mista (EN3) obtido anteriormente, aparecem os dois outros equilíbrios em estratégia pura: EN1 em que ambos vão ao ballet; e : EN2 em que ambos vão ao box. ))1,0(,)1,0((= ))0,1(,)0,1((= Exemplo 2: Vamos agora considerar uma situação um pouco mais complexa. 10 Trata-se do jogo da Figura 1 da Aula 8, reproduzido abaixo, no qual o jogador 1 possui três estratégias alternativas. a2 b2 a1 b1 c1 Jogador 2 Jogador 1 ( -1 , 4 ) ( 2 , - 2 ) ( 0 , 1 ) ( 6 , 2 ) ( -2 , 4 ) ( 2 , -6 ) Notemos )1,,( 21211 ppppm −−≡ e )1,(2 qqm −≡ as estratégias mistas do jogador 1 e do jogador 2, respectivamente. Os retornos esperados de cada alternativa são: Para o jogador 1: 17)1(6);( 211 −=−−= qqqmau 24)1(22);( 211 +−=−+−= qqqmbu qqqmcu 2)1(02);( 211 =−+= Para o jogador 2: 6108)1(642);( 212121122 −+=−−−+= ppppppmau 1)(3)1(24);( 212121122 +−=−−+−= ppppppmbu Observe no conjunto de equações do jogador 1, que não existe um único valor para q que compatibiliza a igualdade entre as 3 equaçoes, de modo que, pelo teorema 1 (ii), o jogador 1 não jogará uma das suas estratégias disponíveis. Qual será ela ? Por outro lado, não poderá ocorrer, pois este valor não resolve duas das três equaçoes simultaneamente. 0=q Logo, no equilíbrio, o jogador 2 adotará uma estratégia mista. 11 Igualando entao a utilidade esperada das duas opções do jogador 2: 1)(36108 2121 +−=−+ pppp , vem: 07135 21 =−+ pp (*) que é uma das equações que determinará a estratégia mista ótima do jogador 1. Vamos entao calcular o valor esperado do jogo todo, para cada jogador: qqpqp qppqppqpqpqpqpmmu 2)31(2)15( )1)(1(0)1(2)1(22)1(6),( 21 21212211211 +−+−= −−−+−−+−+−−−= 1)(3)7135( )1)(1(1)1(6)1(24)1(42),( 2121 21212211122 +−+−+= −−−+−−−−−+−+= ppppq qppqppqpqpqpqpmmu Vamos primeiro verificar se a estratégia do jogador 1 é provável: 1c Igualando qqpqpmmu 2)31(2)15(),( 21211 +−+−= com qmcu 2);( 211 = vem: 0)31(2)15( 21 =−+− qpqp (**) Se 5/1=q entao, por (**), 02 =p e, por (*) , valor que é inadmissível; 5/71 =p Se 3/1=q entao, por (**), 01 =p e, por (*) de modo que 13/72 =p 13/61 21 =−− pp . Como a estratégia é improvável neste caso, pelo teorema 1 (ii) devemos checar que seu valor esperado 1a )3/413/717 −( ==−= q não será maior que o valor esperado do jogo. Ora, 3/23/2)3/31(13/14)13/5(01 =+−+−=u 3 valor que é menor que /4 . 12 Vemos assim que a equação (**) é incompatível com o equilíbrio, de modo que o jogador 1 não jogará a estratégia . 1c Logo, 101 2121 =+→=−− pppp . Substituindo este resultado na equação (*) obtemos: 4/31 =p e . 4/12 =p Para achar o valor de , igualamos com , o que dá: q 17);( 211 −= qmau 24);( 211 +−= qmbu 11/3=q De acordo com o teorema 1 (ii), resta por fim checar que, com estas probabilidades, a utilidade esperada da estratégia 1c )11/62( == q não excede a utilidade esperada do jogo inteiro para o jogador 1. Temos com efeito: 11/10 )11/3(2))11/3(31)(4/1(2)1)11/3(5)(4/3(1 = +−+−=u valor este que é maior que 11/6 . Além disso, 2/5 )4/14/3(30)4/3(2 = −+=u Podemos verificar também que as utilidades esperadas das estratégias prováveis igualam as utilidades esperadas para o jogo inteiro dadas acima, para cada jogador. Portanto, ))11/8,11/3(,)0,4/1,4/3(()ˆ,ˆ(ˆ 21 == mmm )2 é o equilíbrio de Nash em estratégia mista deste jogo, com vetor de retornos esperados: /5,11/10( . Enunciamos agora o teorema que garante a existência de pelo menos um equilíbrio de Nash em estratégia mista em todo jogo finito. 13 Teorema 1:(Existência de EN em estratégias mistas) Em todo jogo onde os conjuntos de n iii uM 1),( ==Γ estratégias puras são finitos, sempre existe um ni SS ,..., equilíbrio de Nash em estratégias mistas. 2. Estratégias Racionalizáveis Na Aula 8 definimos as estratégias estritamente dominadas de um jogador e vimos que estas poderiam ser eliminadas independentemente do que o jogador possa antecipar sobre as estratégias dos outros jogadores. Usamos entao o conhecimento compartilhado sobre a racionalidade dos jogadores e sobre a estrutura do jogo para justificar a definição de um equilíbrio em estratégias estritamente dominadas, baseado na eliminação destas estratégias. Veremos nesta seção que o conhecimento compartilhado da estrutura do jogo e da racionalidade individual, permitirá aos jogadores eliminarem do jogo mais do que apenas suas estratégias estritamente dominadas. Primeiramente, definiremos o que é a melhor resposta de um jogador à uma dada ação do outro jogador e, em seguida, explicaremos o que é uma estratégia racionalizável, um conceito introduzido por Bernheim e Pierce, em 1984. 14 Definição 2: A estratégia ii Mm ∈ é uma melhor resposta do jogador i para a estratégia ii Mm −− ∈ adotada pelos outros jogadores se: iiiiiiii Mmmmummu ∈′′≥ −− ;),(),( A estratégia nunca é uma melhor resposta do ii Mm ∈ jogador se não existe para a qual é a melhor i im− im resposta. À partir desta definição, observe que uma estratégia estritamente dominada nunca é uma melhor resposta para o jogador. Entretanto, uma dada estratégia pode nunca ser a melhor resposta do jogador e, no entanto, não ser estritamente dominada. Temos disso um exemplo no jogo da Figura 1 da Aula 8, reproduzido como exemplo 2 na seção anterior: para o jogador1, a escolha 1c nunca é melhor resposta deste jogador, muito embora ela não seja uma estratégia estritamente dominada no seu jogo. A hipótese do conhecimento compartilhado da estrutura do jogo e da racionalidade dos jogadores permitirá eliminar iterativamente as estratégias que nunca são a melhor resposta dos jogadores. Isto será possível porque um jogador racional jamais adotará uma estratégia que nunca é melhor resposta para ele, uma vez que ele terá por certo que os outros jogadores também não jogarão aquelas que nunca são melhor resposta para eles. Não por acaso, no jogo do exemplo 2, o equilíbrio de Nash prescreve para o jogador 1 probabilidade 0 para a estratégia . 1c 15 Como nunca é a melhor resposta para o jogador 1, esta alternativa poderia ter sido eliminada do jogo, e o único equilibrio de Nash equivalente 1c ))11/8,11/3(,)4/1,4/3(( seria obtido no jogo assim reduzido. Cheque isto ! Observe que, ao eliminarmos estratégias que nunca são melhor resposta, estaremos eventualmente eliminando mais do que se eliminássemos sòmente as estratégias estritamente dominadas. As estratégias que sobrevivem à eliminação iterada das estratégias que nunca são melhor resposta, são as que o jogador racional pode justificar ou melhor, racionalizar afirmativamente, através de conjecturas razoáveis sobre a escolha dos outros jogadores. Definição 3: As estratégias de que sobrevivem à iM eliminação iterada das alternativas que nunca são a melhor resposta de são ditas estratégias i racionalizáveis do jogador i. Exemplo 3: Considere o jogo proposto pelo próprio Berheim, representado na Figura 2a. abaixo: 16 Fig.2a: Eliminação de estratégias não racionalizáveis a1 a2 a3 a4 b1 b2 b3 b4 ( 0 , 7 ) ( 2 , 5 ) ( 7 , 0 ) ( 0 , 1 ) ( 5 , 2 ) ( 3 , 3 ) ( 5 , 2 ) ( 0 , 1 ) ( 7 , 0 ) ( 2 , 5 ) ( 0 , 7 ) ( 0 , 1 ) ( 0 , 0 ) ( 0 , -2 ) ( 0 , 0 ) ( 10 , -1 ) J o g a d o r 1 Jogador 2 Vemos neste jogo que a estratégia nunca é a melhor resposta para o jogador 2 e, em conseqüência, pode ser eliminada. 4b Eliminando-se a estratégia do jogo, a estratégia do jogador 1 é estritamente dominada pela estratégia , de modo que também pode ser eliminada. 4b 4a 2a As estratégias remanescentes serão as estratégias racionalizáveis dos dois jogadores, conforme aparecem na Figura 2b: 17 Fig.2b: Estratégias Racionalizáveis a1 a2 a3 b1 b2 b3 ( 0 , 7 ) ( 2 , 5 ) ( 7 , 0 ) ( 5 , 2 ) ( 3 , 3 ) ( 5 , 2 ) ( 7 , 0 ) ( 2 , 5 ) ( 0 , 7 ) J o g a d o r 1 Jogador 2 As estratégias racionalizáveis dos dois jogadores são: { } e { respectivamente. 321 ,, aaa }321 ,, bbb Com efeito, para o jogador 1: é a melhor resposta à ; 1a 3b é a melhor resposta à ; 2a 2b é a melhor resposta à ; 3a 1b Para o jogador 2: é a melhor resposta à ; 1b 1a é a melhor resposta à ; 2b 2a é a melhor resposta à ; 3b 3a Temos aqui um EN em estratégia pura, , com payoff . ),( 22 ba )3,3( 18 O importante a observar aqui é que a escolha de qualquer estratégia por um jogador é agora racionalizável, no sentido que ele pode fundamentar a sua crença na resposta do outro jogador, através de uma cadeia (infinita) de justificações. Por exemplo, o jogador 1 escolherá com base na crença de que o jogador 2 jogará . 2a 2b O jogador 1 justificará para si mesmo esta crença, com base na idéia de que o jogador 2 imagina que ele jogará , a qual é uma idéia razoável se ele, jogador 1, acredita que o jogador 2 escolherá porque ele pensa que o jogador 1 escolherá , etc. 2a 2b 1a Assim, ao escolher o jogador 1 pode construir uma cadeia de justificações , onde a escolha de cada elemento da sequencia é justificado pela escolha do elemento seguinte. 2a ,....),,,,( 12222 ababa Outro exemplo: o jogador 1 poderá escolher (que não é a escolha de Nash) com base na seguinte cadeia de justificação: 1a O jogador 1 acredita que o jogador 2 escolherá . Ele justifica esta crença imaginando que o jogador 2 acha que ele, jogador 1, jogará . Ele justifica esta hipótese pensando que o jogador 2 pensa que o jogador 1 acha que ele, jogador 2, jogará . E assim por diante. 3b 3a 1b Assim, a escolha de pelo jogador 1 é racionalizada pela cadeia de justificações . 1a ...)...,,,,,,,,,( 13311331 babababa 19 3. Informaçao Incompleta Até aqui supusemos que os jogadores tem conhecimento comum não apenas da estrutura do jogo como também das características pessoais ou preferencias um do outro. Situações com informação completa são importantes como marco teórico da análise das decisões estratégicas, mas nem sempre freqüentes no mundo real. Em jogos competitivos, as firmas não conhecem os custos marginais umas das outras; em jogos de baralho, o jogador conhece as cartas da sua mao, mas não as dos seus parceiros ou adversários, etc. Assim, em muitas situações concretas os jogadores dispõem de informação incompleta. O desconhecimento uns dos outros pode levar os jogadores a fazerem conjecturas recíprocas sobre as preferenciais ou possíveis ações uns dos outros, um pouco no sentido da racionalidade vista anteriormente. Todavia, o problema do encadeamento de conjecturas que poderiam gerar situações de informação incompleta dos jogadores, foi contornado pelo enfoque inaugurado por Harsanyi (1967-68). Na abordagem de Harsanyi, as preferências dos jogadores tem uma representaçao paramétrica através do tipo, este formalizando a realização de uma variável aleatória. A distribuição desta variável aleatória é de conhecimento comum dos jogadores, mas a sua realização é observada únicamente pelo jogador. 20 Nesta formulação, o jogo com informação incompleta assume a forma de um jogo com informação imperfeita. A Natureza produz o primeiro moto do jogo, fornecendo as realizações das variáveis aleatórias de cada jogador, as quais identificarão as preferências de cada um, melhor dizendo, os tipos individuais. O jogador observa a realização da sua variável aleatória unicamente, não a dos outros. Em virtude desta assimetria de informação existente entre os jogadores, a qual os obriga a considerar as probabilidades a priori das preferências uns dos outros, estes jogos passaram a chamar-se jogos Bayesianos. Um exemplo extraído do livro de Mas-Colell, Wiston e Green, Microeconomic Theory, p.254, ajudará a entender melhor este tipo de jogo. Considere o Dilema dos Prisioneiros modificado no qual o prisioneiro 1 é irmão do Delegado. Este promete a seu irmão prisioneiro que, se ambos os prisioneiros não confessarem, ele será liberado sem pena, enquanto que a penalidade do prisioneiro 2 continuará sendo neste caso a mesma, 2 anos de prisão. Fig.3a: Dilema dos prisioneiros modificado: O prisioneiro 1 é irmão do Delegado C ÑC C ÑC Prisioneiro 2 Prisioneiro 1 ( - 1 , - 10 ) ( 0 , - 2 ) ( - 5, - 5 ) ( - 10 , -1 ) 21 C: confessa ; ÑC: não confessa Note que agora, para o prisioneiro 1, se o outro confessa ele também confessa, mas se o outro não confessa, sua melhor resposta será de não confessar também. O jogador 2 continuará tendo por estratégia estritamente dominanteconfessar. Logo eliminando-se a opçao ÑC do prisioneiro 2, a melhor resposta do prisioneiro 1 continuará sendo confessar, de modo que o EN deste jogo modificado não ficará alterado: (C,C). Considere agora a situaçao na qual o prisioneiro 2 detesta dedurar o colega, a ponto de considerar uma autopunição psicológica equivalente a 6 anos de prisão adicional caso venha a denunciar o seu amigo. A forma normal deste jogo novamente modificado ficaria assim: Fig.3b: Dilema dos prisioneiros modificado: O prisioneiro 2 detesta dedurar C ÑC C ÑC Prisioneiro 2 Prisioneiro 1 ( - 1 , - 10 ) ( 0 , - 2 ) ( - 5, - 11) ( - 10 , -7 ) Note que agora, nesta variante, ÑC é a estratégia dominante do prisioneiro 2. 22 Com base nas variantes das Figuras 3a. e 3b., temos agora dois “tipos” para o prisioneiro 2: o tipo que prefere “confessar”, da Figura 3a. (tipo I), e o tipo que prefere “não confessar”, da Figura 3b (tipo II). Como o prisioneiro 1 deverá escolher sua estratégia, uma vez que: ele conhece os payoffs das duas variantes do jogo, mas nao sabe qual dos dois “tipos” do seu companheiro irá se manifestar ? Suponha que o prisioneiro 1 avalie em μ a probabilidade a priori que o prisioneiro 2 seja do primeiro tipo, e 01 >− μ do segundo tipo. De acordo com Harsanyi, este jogo com informação incompleta pode ser transformado em um jogo com informação imperfeita, escrito na forma extensiva, onde o primeiro jogador a mover é a Natureza, fornecendo a realização do tipo μ , mas sòmente ao prisioneiro 2. Fig4: O Dilema dos Prisioneiros Modificado com Informação Incompleta C ÑC C C ÑC ÑC ÑCÑC ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − − 5 5 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − − 10 1 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − − 1 10 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − 2 0 ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ − − 7 10 ⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − 2 0 Natureza Prisioneiro 1 Prisioneiro 2 Prisioneiro 2 μ μ−1 ÑC C C C ⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ − − 10 1⎟⎟⎠ ⎞⎜⎜⎝ ⎛ − − 11 5 23 À partir da Figura 4, vemos que agora, uma estratégia pura para o prisioneiro 2 deve especificar, para cada realização do seu tipo (dado pela Natureza), as ações que ele pode empreender. Assim, 4 estratégias puras estão à disposição do prisioneiro 2: 1. (C se tipo I , C se tipo II) 2. (C se tipo I , ÑC se tipo II) 3. (ÑC se tipo I , C se tipo II) 4. (ÑC se tipo I , ÑC se tipo II) Estamos agora em medida de resolver o equilíbrio de Nash Bayesiano, em estratégias puras, deste jogo. Para o prisioneiro 2, como ele conhece o seu tipo, C é sua estratégia dominante no tipo I e ÑC é sua estratégia dominante no tipo II, sua estratégia de equilíbrio será evidentemente a segunda acima: (C se tipo I , ÑC se tipo II) =2sˆ Para o prisioneiro 1, como ele sabe que o outro confessará se for do tipo I e não confessará se for do tipo II, ele adotará a estratégia que lhe proporciona o maior retorno esperado. Assim, ele confessará se o retorno esperado de C for maior que o retorno esperado de ÑC, isto é se: )1(010)1)(1(5 μμμμ −+−>−−+− , ou ainda, se 6/1>μ . Logo: ⎪⎩ ⎪⎨ ⎧ = < > = 6/1;, 6/1; 6/1; 1ˆ μ μ μ ÑCC ÑC C s 24 Assim, o prisioneiro 1 confessará se a probabilidade do prisioneiro 2 ser do tipo que confessa for maior que 1/6, e não confessará se esta probabilidade for menor, isto é, suficientemente baixa. Observe a assimetria de informação existente neste jogo: o prisioneiro 2 tem informação completa, mas não o prisioneiro 1. Mas a desinformação do prisioneiro 1 porta sobre o tipo de prisioneiro 2, com quem ele deve tratar. Assim, o prisioneiro 1 maximiza seu retorno esperado baseado em uma distribuição de probabilidade a priori definida sobre o tipo do seu companheiro, cuja realização ele efetivamente não observa. Mas os dois agentes maximizam o retorno esperado. Esta é também uma característica do equilíbrio de Nash Bayesiano: cada jogador maximiza seu retorno esperado, mas não calculado com base em uma distribuição de probabilidade a ser determinada endógenamente, como no EN em estratégias mistas. No equilíbrio Bayesiano o retorno esperado é calculado com base na distribuição comum dos tipos, sendo que a realização “marginal” destes tipos é de conhecimento apenas individual. Vamos encerrar esta sessão definindo formalmente o equilíbrio de Nash Bayesiano, em estratégias puras. Jogos Bayesianos Em um jogo Bayesiano onde os jogadores adotam estratégias puras, cada jogador i tem funçao payoff );,( iiii ssu θ− onde ii Θ∈θ é uma variável aleatória dada pela Natureza que é observada sòmente pelo próprio jogador i . A distribuiçao conjunta dos s´θ é dada por ),...,( 1 nF θθ , a qual é supostamente conhecida de todos os jogadores. 25 Aqui, o suporte da distribuição conjunta é , o qual pode ser finito ou infinito. nΘ××Θ=Θ ...1 Uma estratégia pura para o jogador i em um jogo Bayesiano é uma regra de decisão )( iis θ que especifica sua escolha estratégica para cada realização do seu tipo. Assim, o retorno esperado pelo jogador i , dado o vetor das estratégias puras dos jogadores será: (.)(.),...,1 nss n );)(),...,(((.))(.),...,(~ 111 innini ssuEssu θθθθ= onde o valor esperado é calculado com a medida dF definida à partir da distribuição conjunta F de todos os tipos ),...,( 1 nθθθ = . Definição 4: Equilíbrio de Nash Bayesiano (Estratégias Puras) Um equilíbrio de Nash Bayesiano em estratégias puras é um vetor de regras de decisão tal (.)(.),...,1 nss que, para todo i , temos: ),...,2,1( ni = (.)),(.)(~(.)),(.)(~ *1 iiiii ssussu −− ≥ para toda outra regra decisão factível ao jogador (.)*is i . A Proposição seguinte ajudará a precisar melhor o EN Bayesiano: 26 Proposiçao 1: O vetor de regras de decisão (.)(.),...,1 nss é um equilíbrio de Nash Bayesiano de um jogo Bayesiano se e sòmente se, para todo jogador e toda i realização provável ii Θ∈*θ do seu tipo, temos: );)(,´();)(,)(( **1 *** 1 liiiiliiiii ssuEssuE ii θθθθθθθ θθ −−−− −− ≥ para toda outra estratégia pura ií Ss ∈, . Aqui, o valor esperado dos retornos é calculado sobre as realizações possíveis das variáveis aleatórias dos outros jogadores, condicionada à cada realização * iθ do jogador i . A proposição acima nos informa que cada tipo de jogador pode ser pensado como um jogador à parte que maximiza seu retorno esperado com base na distribuição condicionada das escolhas estratégicas dos outros jogadores. Em jogos seqüenciais, a serem estudados na próxima aula, quando um ou mais jogadores tem informação incompleta, a fórmula de Bayes para probabilidade condicional é usada. Quando o jogador observa a escolha feita pelo jogador na etapa anterior, ele poderá revisar sua distribuição de probabilidade a priori para as etapas seguintes, com base na observação destas escolhas, de acordo com a regra de Bayes. 27 4. Bibliografia e Exercícios Sugeridos Bibliografia: [SN] Cap.8 [VO] Cap.16 [JR] Cap.7 Exercícios Sugeridos. Anpec: 2012/ Q08 2011/ Q11 2010/ Q10 2009/ Q11 2008/ Q09 2007/ Q11 2006/ Q10,Q11 2005/ Q11,Q12 2004/ Q11,Q14 2003/ Q11,Q12 [SN]: 8.1-8.5
Compartilhar