Baixe o app para aproveitar ainda mais
Prévia do material em texto
5. Estratégias mistas Teoria dos Jogos Faculdade de Economia, UFF Prof. Fábio D. Waltenberg Março/Abril de 2014 Programa 1. Estratégias puras versus mistas 2. Melhores respostas e equilíbrio de Nash 1. Com estratégias puras 2. Com estratégias mistas 3. Jogos estritamente competitivos (ou “de soma zero”) 4. Minimax-maximin Referências Boa parte dos slides usados neste tópico acompanham livro do Varian Leituras complementares ao cap. 5 de Fiani Cap. 28: Teoria dos jogos Cap. 29: Aplicações da teoria dos jogos Em tudo o que disser respeito a estratégias mistas 3 4 Prólogo D L 2 1 U R 2,-2 0,0 1,-1 x,-x Que ENs possui o jogo abaixo? Se x < 0, então U ?? 5 Prólogo D L 2 1 U R 2,-2 0,0 1,-1 x,-x Se x < 0, então U domina D Se x < 1, então L ?? Que ENs possui o jogo abaixo? 6 Prólogo D L 2 1 U R 2,-2 0,0 1,-1 x,-x Se x < 0, então U domina D Se x < 1, então L domina R Portanto, se x < 0 então o EN é ?? Que ENs possui o jogo abaixo? 7 Prólogo D L 2 1 U R 2,-2 0,0 1,-1 x,-x Se x < 0, então U domina D Se x < 1, então L domina R Portanto, se x < 0, então o EN é (U, L) E se 0 < x < 1, o EN é ?? Que ENs possui o jogo abaixo? 8 Prólogo D L 2 1 U R 2,-2 0,0 1,-1 x,-x Se x < 0, então U domina D Se x < 1, então L domina R Portanto, se x < 0 então o EN é (U, L) E se 0 < x < 1, o EN é (D, L) Se x > 1, então ?? Que ENs possui o jogo abaixo? 9 Prólogo D L 2 1 U R 2,-2 0,0 1,-1 x,-x Se x < 0, então U domina D Se x < 1, então L domina R Portanto, se x < 0 então o EN é (U, L) E se 0 < x < 1, o EN é (D, L) Se x > 1, então não há EN em estratégias puras Que ENs possui o jogo abaixo? 10 Estratégias puras Jogador B Jogador A Há algum equilíbrio de Nash em estratégias puras? (1,2) (0,4) (0,5) (3,2) U D L R 11 Estratégias puras Jogador B Jogador A (U,L) é um equilíbrio de Nash? (1,2) (0,4) (0,5) (3,2) U D L R 12 Estratégias puras Jogador B Jogador A (U,L) é um equilíbrio de Nash? Não (U,R) é um equilíbrio de Nash? (1,2) (0,4) (0,5) (3,2) U D L R 13 Estratégias puras Jogador B Jogador A (U,L) é um equilíbrio de Nash? Não (U,R) é um equilíbrio de Nash? Não (D,L) é um equilíbrio de Nash? (1,2) (0,4) (0,5) (3,2) U D L R 14 Estratégias puras Jogador B Jogador A (U,L) é um equilíbrio de Nash? Não (U,R) é um equilíbrio de Nash? Não (D,L) é um equilíbrio de Nash? Não (D,R) é um equilíbrio de Nash? (1,2) (0,4) (0,5) (3,2) U D L R 15 Estratégias puras Jogador B Jogador A (U,L) é um equilíbrio de Nash? Não (U,R) é um equilíbrio de Nash? Não (D,L) é um equilíbrio de Nash? Não (D,R) é um equilíbrio de Nash? Não (1,2) (0,4) (0,5) (3,2) U D L R 16 Estratégias puras Jogador B Jogador A Portanto, o jogo não tem equilibrios de Nash em estratégias puras. O jogo apresenta um equilíbrio de Nash, porém, apenas em estratégias mistas (1,2) (0,4) (0,5) (3,2) U D L R 17 Estratégias mistas Ao invés de jogar somente Em cima (U) ou Embaixo (D), o Jogador A escolhe distribuição de probabilidades (pU,1-pU), de modo a jogar U com probabilidade pU, e D com probabilidade 1-pU Desta forma, o Jogador A alterna as estratégias puras U e D A distribuição de probabilidades (pU,1-pU) é uma estratégia mista para o Jogador A 18 Estratégias mistas Analogamente, o Jogador B escolhe uma distribuição de probabilidades (pL,1-pL), de modo a jogar Esquerda (L) com probabilidade pL, e Direita (R) com probabilidade 1-pL Assim, o Jogador B alterna as estratégias puras L e R A distribuição de probabilidades (pL,1-pL) é uma estratégia mista para o Jogador B 19 Aula anterior… O jogo da moeda Jogador 2 A B Jogador 1 A 1, -1 -1, 1 B -1, 1 1, -1 Imagine que o jogo acima se repita 100 vezes 1. Sendo você o Jogador 1, quantas vezes você jogaria A e quantas vezes você jogaria B? 2. Por que? (Em especial, indique o comportamento que você espera de B!) 20 Aula anterior… O jogo da moeda Jogador 2 A B Jogador 1 A 1, -1 -1, 1 B -1, 1 1, -1 Imagine que o jogo acima se repita 100 vezes 1. Sendo você o Jogador 1, quantas vezes você jogaria A e quantas vezes você jogaria B? Vocês: quase todos respondem 50xA e 50xB 2. Por que? (Em especial, indique comportamento esperado de B!) Respostas variadas: em geral, fazendo menções a: “minimizar riscos”; “precaver-se contra B”; “confundir B”; “surpreender B”; “diversificar”, “para não ficar manjado”, 21 Estratégias mistas Jogador B Jogador A Este jogo não tem equilibrios de Nash em estratégias puras, mas tem equilíbrio de Nash em estratégias mistas. Como calculá-lo? (1,2) (0,4) (0,5) (3,2) U D L R 22 Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, pL R, 1-pL 23 Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, pL R, 1-pL O valor esperado, para A, de escolher U é ?? 24 Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, pL R, 1-pL O valor esperado de escolher U é 1.pL + 0.(1-pL) = pL O valor esperado, para A, de escolher D é ?? 25 Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, pL R, 1-pL O valor esperado, para A, de escolher U é pL O valor esperado, para A, de escolher D é 3(1 - pL) 26 O valor esperado, para A, de escolher U é pL O valor esperado, para A, de escolher D é 3(1 - pL) Se pL > 3(1 - pL), então A escolherá apenas U, mas já sabemos que não há EN em que A jogue apenas U Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, pL R, 1-pL 27 Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, pL R, 1-pL O valor esperado, para A, de escolher U é pL O valor esperado, para A, de escolher D é 3(1 - pL) Se pL < 3(1 - pL), então A escolherá apenas D, mas já sabemos que não há EN em que A jogue apenas D 28 Para haver Eq. Nash, necessariamente devemos ter: pL = 3(1 - pL) pL = 3/4 Se for esta a forma de B alternar suas escolhas entre L e R, então A será indiferente entre U ou D Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, pL R, 1-pL 29 Para haver Eq. Nash, necessariamente devemos ter: pL = 3(1 - pL) pL = 3/4 Se for esta a forma de B alternar suas escolhas entre L e R, então A será indiferente entre U ou D Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, 3/4 R, 1/4 30 Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, 3/4 R, 1/4 31 Estratégias mistas: Em grupo! Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU O valor esperado, para B, de escolher L é ?? Em grupo!!! O valor esperado, para B, de escolher R é ?? Em grupo!!! L, 3/4 R, 1/4 32 Estratégias mistas Jogador B Jogador A (1,2)(0,4) (0,5) (3,2) U, pU D, 1-pU O valor esperado, para B, de escolher L é 2pU + 5(1 - pU) O valor esperado, para B, de escolher R é 4pU + 2(1 - pU) L, 3/4 R, 1/4 O valor esperado, para B, de escolher L é 2pU + 5(1 - pU) O valor esperado, para B, de escolher R é 4pU + 2(1 - pU) Se 2pU + 5(1 - pU) > 4pU + 2(1 - pU) então B escolherá só L, mas sabemos não haver EN em que B jogue apenas L Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, 3/4 R, 1/4 O valor esperado, para B, de escolher L é 2pU + 5(1 - pU) O valor esperado, para B, de escolher R é 4pU + 2(1 - pU) Se 2pU + 5(1 - pU) < 4pU + 2(1 - pU) então B escolherá só R, mas sabemos não haver EN em que B jogue apenas R Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, pU D, 1-pU L, 3/4 R, 1/4 35 Para haver Eq. Nash, necessariamente devemos ter: 2pU + 5(1 - pU) = 4pU + 2(1 - pU) pU = 3/5; Se for esta a forma de A alternar suas escolhas entre U e D, então B será indiferente entre L ou R Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, 3/5 D, 2/5 L, 3/4 R, 1/4 36 O único equilíbrio de Nash deste jogo consiste em A jogar a estratégia mista (3/5, 2/5) e B jogar a estratégia mista (3/4, 1/4) Estratégias mistas Jogador B Jogador A (1,2) (0,4) (0,5) (3,2) U, 3/5 D, 2/5 L, 3/4 R, 1/4 37 A resultado será (1,2) com probabilidade: 3/5 × 3/4 = 9/20 Estratégias mistas Jogador B Jogador A (1,2) 9/20 (0,4) (0,5) (3,2) U, 3/5 D, 2/5 L, 3/4 R, 1/4 38 A resultado será (0,4) com probabilidade: 3/5 × 1/4 = 3/20 Estratégias mistas Jogador B Jogador A (1,2) 9/20 (0,4) 3/20 (0,5) (3,2) U, 3/5 D, 2/5 L, 3/4 R, 1/4 39 A resultado será (0,5) com probabilidade: 2/5 × 3/4 = 6/20 Estratégias mistas Jogador B Jogador A (1,2) 9/20 (0,4) 3/20 (0,5) 6/20 U, 3/5 D, 2/5 L, 3/4 R, 1/4 (3,2) 40 A resultado será (3,2) com probabilidade: 2/5 × 1/4 = 2/20 Estratégias mistas Jogador B Jogador A (1,2) 9/20 (0,4) 3/20 (0,5) 6/20 (3,2) 2/20 U, 3/5 D, 2/5 L, 3/4 R, 1/4 41 A recompensa esperada de A no Eq. Nash é: 1×9/20 + 3×2/20 = 3/4 Estratégias mistas Jogador B Jogador A (1,2) 9/20 (0,4) 3/20 (0,5) 6/20 (3,2) 2/20 U, 3/5 D, 2/5 L, 3/4 R, 1/4 42 A recompensa esperada de A no Eq. Nash é: 1×9/20 + 3×2/20 = 3/4 A recompensa esperada de B no Eq. Nash é: 2×9/20 + 4×3/20 + 5×6/20 + 2×2/20 = 16/5 Estratégias mistas Jogador B Jogador A (1,2) 9/20 (0,4) 3/20 (0,5) 6/20 (3,2) 2/20 U, 3/5 D, 2/5 L, 3/4 R, 1/4 Teoria dos Jogos - Prof. Waltenberg 43 Aula passada: “jogo do bem público” Quatro jogadores não podem se comunicar Cada um, inclusive você, recebe 10 fichas Cada um pode: Manter um certo número de fichas Depositar um certo número de fichas num cofre comum O ganho de cada jogador é igual a: R$20,00 x fichas mantidas + R$10,00 x número total de fichas depositado por todos os jogadores no cofre comum Ex: Se você guardou 3 fichas e cada um dos outros três jogadores também, então, você ganhará 20x3 + 10x(7x4) Quantas fichas você deposita no cofre comum? Teoria dos Jogos - Prof. Waltenberg 44 Aula passada: “jogo do bem público” Versão simples de “jogo do bem público” Comece com contribuição de 5, supondo que outros 3 também depositaram 5: ganho é 20*5 + 10*(4*5) = $300 Se os outros 3 depositam 5 e você deposita 4, seu ganho é: 20*6+10*(3*5+4) = $310 > $300 Se os outros 3 depositam 5 e você deposita 0, seu ganho é: 20*10+10*(3*5) = $350 > $310 > $300 Você (e cada jogador) tem interesse em diminuir a contribuição individual Teoria dos Jogos - Prof. Waltenberg 45 Aula passada: “jogo do bem público” O único equilíbrio de Nash é ausência de contribuição ao cofre comum Em qualquer outra situação, você (e todo jogador) se arrependerá de ter posto alguma ficha no pote comum Cada um ganha apenas 20x10+0x4 = $200, que é menos do que se houvesse cooperação entre os jogadores Comportamento de carona (free-rider ou passageiro clandestino): Claro conflito entre interesse individual e coletivo Se todos contribuíssem com todas as fichas, cada um ganharia 10*40 = $400 > $200 Teoria dos Jogos - Prof. Waltenberg 46 Aula passada: “jogo do bem público” Graduação 2009 – Média: 5,79 Graduação 2011: 2,13 Mestrado 2010/2011: 4,00 M2012: 5,0 M2013: 4,5 M2014: 3,75 Moda sempre é 0 Ao lado, resultados de vocês (impressionante…) 0 0 0 0 0 0 0 0 0 0 0 1 2 10 10 10 10 10 10 Média = 3,32 Teoria dos Jogos - Prof. Waltenberg 47 Aula passada: “jogo do bem público” Resultados empíricos: Literatura Em jogos de uma só rodada, média de 40% a 60% das fichas depositadas Em jogos repetidos: cerca de 50% na primeira rodada e depois declínio Portanto, comportamento de “carona” não é regra Em contradição com auto-interesse (Em contradição com respostas de vocês) Teoria dos Jogos - Prof. Waltenberg 48 Aula passada: “jogo do bem público” Às vezes chamado de dilema do prisioneiro com n jogadores, pois estrutura é a mesma: não colaborar é estratégia dominante, porém cooperação de todos é melhor Apresentação de Bowles: n jogadores recebem uma dotação y e, simultaneamente, selecionam montante ci para contribuir para o bem público A recompensa de cada jogador é: πi = y – ci + mΣjcj para j = 1,…, n m < 1 < mn m<1: melhor resposta individual é não contribuir mn>1: payoff total é máximo quando todos contribuem integralmente Teoria dos Jogos - Prof. Waltenberg 49 Aula passada: “jogo do bem público” Fehr e Gaechter (2002): estrutura de bens públicos, porém, depois de serem feitas as contribuições, são reveladas (por um número de identificação, não pelo nome) e há possibilidade de punir quem contribui com pouco Resultados: Punições são aplicadas a quem contribui com pouco Contribuintes avarentos aumentam contribuições Voltaremos a estes temas no final do curso 50 Um jogo com: Número finito de jogadores… Cada um com um número finito de estratégias puras… Tem ao menos um equilíbrio de Nash Assim, se o jogo não tiver equilíbrio de Nash em estratégias puras… Necessariamente terá ao menos um equilíbrio de Nash em estratégias mistas Melhores respostas e equilíbrios de Nash 51 Em qualquer equilíbrio de Nash (EN), cada jogador escolhe a “melhor resposta” às escolhas feitas por todos os outros jogadores Um jogo pode ter mais de um EN Como podemos localizar todos os EN de um jogo? Se há mais de um EN, podemos afirmar que um é mais provável de ocorrer do que outro? Melhores respostas e equilíbrios de Nash 52 Melhores respostas e equilíbrios de Nash Pensem num jogo 2×2 A pode escolher entre as ações aA1 e a A 2 B pode escolher entre as ações aB1 e a B 2 Há quatro combinações de ações: (aA1, a B 1), (a A 1, a B 2), (a A 2, a B 1), (a A 2, a B 2) Cada combinação poderá proporcionar recompensas diferentes aos jogadores 53 Melhores respostas e equilíbriosde Nash Suponha que os ganhos de A e B, quando as ações escolhidas forem aA1 e a B 1, sejam: UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 Analogamente, suponha que: UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7 54 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7 55 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7 Se B escolhe a ação aB1, então a melhor resposta de A é ?? 56 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7 Se B escolhe a ação aB1, então a melhor resposta de A é a ação aA1 (pois 6 > 4) 57 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7 Se B escolhe a ação aB1, então a melhor resposta de A é a ação aA1 (pois 6 > 4) Se B escolhe a ação aB2, então a melhor resposta de A é ?? 58 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7 Se B escolhe a ação aB1, então a melhor resposta de A é a ação aA1 (pois 6 > 4) Se B escolhe a ação aB2, então a melhor resposta de A é a ação aA2 (pois 5 > 3) 59 Melhores respostas e equilíbrios de Nash Se B escolhe aB1, então A escolhe a A 1 Se B escolhe aB2, então A escolhe a A 2 A “curva” de melhor resposta de A é: Melhor resposta de A aA1 aA2 aB2 a B 1 Ação de B + + 60 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7 61 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7. Se A escolhe a ação aA1, então a melhor resposta de B é ?? 62 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7. Se A escolhe a ação aA1, então a melhor resposta de B é a ação aB2 (porque 5 > 4) 63 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7. Se A escolhe a ação aA1, então a melhor resposta de B é a ação aB2 (porque 5 > 4) Se A escolhe a ação aA2, então a melhor resposta de B é ?? 64 Melhores respostas e equilíbrios de Nash UA(aA1, a B 1) = 6 e U B(aA1, a B 1) = 4 UA(aA1, a B 2) = 3 e U B(aA1, a B 2) = 5 UA(aA2, a B 1) = 4 e U B(aA2, a B 1) = 3 UA(aA2, a B 2) = 5 e U B(aA2, a B 2) = 7 Se A escolhe a ação aA1, então a melhor resposta de B é a ação aB2 (porque 5 > 4) Se A escolhe a ação aA2, então a melhor resposta de B é a ação aB2 (porque 7 > 3) 65 Melhores respostas e equilíbrios de Nash Se A escolhe aA1 , então B escolhe a B 2 Se A escolhe aA2 , então B escolhe a B 2 A “curva” de melhor resposta de B é: Ação de A a A 1 aA2 aB2 a B 1 Melhor resposta de B 66 Melhores respostas e equilíbrios de Nash Se A escolhe aA1 , então B escolhe a B 2 Se A escolhe aA2 , então B escolhe a B 2 A “curva” de melhor resposta de B é: Ação de A a A 1 aA2 aB2 a B 1 Melhor resposta de B Notem que aB2 é ação estritamente dominante para B 67 Melhores respostas e equilíbrios de Nash Resposta de A aA1 aA2 aB2 a B 1 aA1 aA2 aB2 a B 1 + + Escolha de A Escolha de B Resposta de B Como as curvas de melhores respostas podem ser usadas para localizar os EN? B A 68 Melhores respostas e equilíbrios de Nash Resposta de A aA1 aA2 aB2 a B 1 + + Resposta de B Há equilíbrio de Nash? Sobrepondo-as! 69 Melhores respostas e equilíbrios de Nash aA1 aA2 aB2 a B 1 + + Há equilíbrio de Nash? Resposta de A Resposta de B Sim, (aA2, a B 2). Por que? aA2 é melhor resposta a a B 2 aB2 é melhor resposta a a A 2 70 Melhores respostas e equilíbrios de Nash 6,4 3,5 5,7 4,3 aA1 aA2 aB1 a B 2 Jogador B Jogador A Aqui está a forma estratégica do jogo aA2 é a única melhor resposta a a B 2 aB2 é a única melhor resposta a a A 2 Há um 2° EN em estratégias puras? 71 Melhores respostas e equilíbrios de Nash 6,4 3,5 5,7 4,3 aA1 aA2 aB1 a B 2 Jogador B Jogador A Há um 2° EN em estratégias puras? Não, porque aB2 é ação estrita- mente dominante para o Jogador B aA2 é a única melhor resposta a a B 2 aB2 é a única melhor resposta a a A 2 Aqui está a forma estratégica do jogo
Compartilhar