Baixe o app para aproveitar ainda mais
Prévia do material em texto
Microeconomia para a Anpec Theo Cotrim Martins E-mail: theocm@gmail.com mailto:theocm@gmail.com Aula 16 TEORIA DOS JOGOS V-Caps. 28 e 29; N-Cap. 8 Agenda • O que define um jogo • Equilíbrio de Nash • Dilema dos Prisioneiros • O Jogo do Dormitório • Estratégias Mistas • Jogos Repetidos • Jogos Característicos e Conjuntos de Informação • Questões Anpec • Anexo: Eq. de Nash Estrito vs Eq. de Nash Não-Estrito Teoria dos Jogos • Todos os jogos têm três elementos: i. jogadores ii. estratégias iii. payoffs • Os jogos podem ser cooperativos ou não- cooperativos. Jogadores • Cada unidade de decisão em um jogo é chamado de jogador. – Pode ser um indivíduo, uma firma, um país, etc.. • Cada jogador pode escolher entre diferentes ações, chamadas de estratégias. Estratégias • As estratégias podem ser simples ou complexas. • Em jogos não-cooperativos, os jogadores não sabem qual será a estratégia utilizada pelos outros jogadores. Payoffs • O retorno final para os jogadores no final do jogo é chamado de payoffs. • Payoffs são usualmente medidos em termos de utilidade, mas outros tipos de payoff também são comuns. • Os jogadores conseguem ordenar os payoffs associados a um determinado jogo. Notação • Iremos denominar um jogo G entre dois jogadores (A e B) por: 𝐺[𝑆𝐴, 𝑆𝐵 , 𝑈𝐴(𝑎, 𝑏), 𝑈𝐵(𝑎, 𝑏)] onde: SA = estratégias do jogador A (a SA). SB = estratégias do jogador B (b SB). UA = utilidade obtida pelo jogador A quando uma dada estratégia é utilizada. UB = utilidade obtida pelo jogador B quando uma dada estratégia é utilizada. Equilíbrio de Nash • Um par de estratégias (𝑎∗, 𝑏∗) é definida como equilíbrio de Nash se 𝑎∗ é a melhor estratégia para o jogador A quando o jogador B joga 𝑏∗, e 𝑏∗ é a melhor estratégia para o jogador B quando o jogador A joga 𝑎∗. • Em um equilíbrio de Nash, os participantes não têm incentivos a mudar seus comportamentos. Equilíbrio de Nash • Um par de estratégias (a*,b*) é definida como Equilíbrio de Nash se: UA(a*,b*) UA(a’,b*) para todo a’SA UB(a*,b*) Ub(a*,b’) para todo b’SB Equilíbrio de Nash • Não são todos os jogos que têm equilíbrio de Nash em estratégias puras. • Alguns jogos têm mais de um equilíbrio de Nash. Dilema dos Prisioneiros • O equilíbrio de Nash não é desejável (não é Pareto). B’s Strategies Confess Not Confess Confess A: 3 years B: 3 years A: 6 months B: 10 years A’s Strategies Not Confess A: 10 years B: 6 months A: 2 years B: 2 years Dilema dos Prisioneiros • Um acordo entre os prisioneiros para não confessar gera um resultado com menos tempo de cadeia (melhora de Pareto). – Entretanto esta solução não é estável. • Os dois têm a estratégia confessar como dominante. – {𝐶𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝐶𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟} é um equilíbrio de Nash. O Jogo do Dormitório • Suponha que existam dois estudantes que têm que decidir o volume para escutar seus rádios. – Cada um pode escolher escutar alto (L) ou baixo (S). A L S A escolhe alto (L) ou baixo (S) B B L S L S B faz uma escolha similar. 7,5 5,4 6,4 6,3 Os payoffs estão em termos de utilidade. Nenhum jogador conhece a estratégia do outro. O Jogo do Dormitório O Jogo do Dormitório B’s Strategies L S L 7,5 5,4 A’s Strategies S 6,4 6,3 • As vezes é mais conveniente descrever o jogo em forma de matriz (ao invés da forma extensiva): O Jogo do Dormitório • Escutar alto é uma estratégia dominante para o jogador B. – Estratégia L gera mais utilidade para B que a estratégia S, independentemente da estratégia que A escolha. • O jogador A reconhece que B tem uma estratégia dominante. – A irá escolher a estratégia que lhe dá a maior utilidade, dada a escolha de L por B. O Jogo do Dormitório • Assim, 𝐴 irá escolher escutar música alta. • O resultado 𝐴: 𝐿, 𝐵: 𝐿 é um equilíbrio de Nash. Jogos sem Equilíbrio de Nash B’s Strategies A’s Strategies Pedra Tesoura Papel Pedra 0,0 1,-1 -1,1 Tesoura -1,1 0,0 1,-1 Papel 1,-1 -1,1 0,0 Jogos sem Equilíbrio de Nash B’s Strategies A’s Strategies Pedra Tesoura Papel Pedra 0,0 1,-1 -1,1 Tesoura -1,1 0,0 1,-1 Papel 1,-1 -1,1 0,0 Jogos com dois Equilíbrios de Nash B’s Strategies A’s Strategies Ballet Futebol Ballet 2,1 0,0 Futebol 0,0 1,2 • “Batalha dos Sexos”: Jogos com dois Equilíbrios de Nash B’s Strategies A’s Strategies Ballet Futebol Ballet 2,1 0,0 Futebol 0,0 1,2 • “Batalha dos Sexos”: Estratégias Dominantes • Uma estratégia 𝑠𝑖 ∗ é dominante para o jogador i se ela é uma melhor resposta para qualquer perfil de estratégias dos outros jogadores. • O “dilema dos prisioneiros” apresenta uma estratégia dominante (não confessar). • Já a batalha dos sexos não possui uma estratégia dominante. A melhor estratégia de um jogador depende do que o outro faz. Estratégias Mistas • Até agora vimos os equilíbrios em estratégias puras, quando os jogadores fazem uma escolha específica. • Entretanto, os jogadores poderiam utilizar estratégias mistas, que consiste em fazer escolhas aleatórias, com base em um conjunto de probabilidades. Estratégias Mistas • Jogos sem equilíbrios de Nash em estratégias puras sempre têm equilíbrio de Nash em estratégias mistas. • Jogos “normais”[1] possuem um número ímpar de equilíbrios (Nash Pura + Nash Mista). [1] Jogos sem empates no payoff. Estratégias Mistas • O equilíbrio de Nash em estratégias mistas é o conjunto de probabilidades, para os dois agentes, que equilibra as ações dos indivíduos. • Cada jogador precisa garantir que o outro jogador tem o mesmo payoff esperado independente da estratégia adotada. Estratégias Mistas • Na batalha dos sexos, além do equilíbrio de Nash em estratégias puras, há um equilíbrio de Nash em estratégias mistas. • Neste equilíbrio o jogador A joga ballet 2/3 das vezes e futebol 1/3 das vezes e o jogador B joga ballet 1/3 das vezes e futebol 2/3 das vezes. Cooperação e Repetição • A cooperação entre os jogadores pode resultar em situações preferíveis em relação ao equilíbrio de Nash. – Entretanto a cooperação é instável. • Jogos repetidos podem levar à cooperação. Jogo do Dormitório em Dois Períodos • Vamos assumir que A escolhe antes o volume de seu som e depois B faz sua escolha. • A escolha da estratégia de B deve levar em consideração a estratégia adotada pelo jogador A. A L S A escolhe alto (L) ou baixo (S) B B L S L S B faz uma escolha similar já sabendo a escolha de A. 7,5 5,4 6,4 6,3 Então, devemos colocar as estratégias de B de uma forma que leve em consideração as informações das escolhas de A. Jogo do Dormitório em Dois Períodos Jogo do Dormitório em Dois Períodos B’s Strategies L,L L,S S,L S,S A’s Strategies L 7,5 7,5 5,4 5,4 S 6,4 6,3 6,4 6,3 • Cada estratégia de B é colocada como um par de ações que depende da estratégia de A. Jogo do Dormitório em Dois Períodos B’s Strategies L,L L,S S,L S,S A’s Strategies L 7,5 7,5 5,4 5,4 S 6,4 6,3 6,4 6,3 • Existem três equilíbrios de Nash: A:L, B:(L,L) A:L, B:(L,S) A:S, B:(S,L) Jogo do Dormitório em Dois Períodos B’s Strategies L,L L,S S,L S,S A’s Strategies L 7,5 7,5 5,4 5,4 S 6,4 6,3 6,4 6,3 • A:L, B:(L,S) e A:S, B:(S,L) não são plausíveis. Incorporam acordos não críveis por parte de B. Jogo do Dormitório em Dois Períodos • Então, o jogo se reduz ao payoff onde (L,L) é a estratégia dominante para B. – A reconhece isto e irá escolher L. • Este é um Equilíbrio Perfeito de Subjogo: – É um equilíbrio de Nash em que as estratégias de cada jogador não envolvem acordos (ameaças)não críveis. Equilíbrio Perfeito de Subjogo • Um “subjogo” é uma porção de um jogo maior que se inicia em determinado “nó” e inclui todas as futuras ações. • Para se candidatar a um equilíbrio perfeito de subjogo, a estratégia deve ser um equilíbrio de Nash em cada subjogo do jogo maior. • Nota: jogos simultâneos possuem apenas um subjogo. Jogos Repetidos • Muitas situações econômicas podem ser modeladas como jogos que são jogados repetidamente. • O número de repetições é muito importante. – Em jogos com um número finito de repetições, há pouco espaço para o desenvolvimento de estratégias inovadoras. – Jogos que possuem um número infinito de repetições oferecem uma gama de opções maior. Dilema do Prisioneiro: Jogo Finito B’s Strategies L R A’s Strategies U 1,1 3,0 D 0,3 2,2 • Se o jogo for jogado uma única vez, o equilíbrio de Nash A:U, B:L será o resultado esperado. Dilema do Prisioneiro: Jogo Finito B’s Strategies L R A’s Strategies U 1,1 3,0 D 0,3 2,2 • Este resultado é inferior a A:D, B:R para cada jogador. Dilema do Prisioneiro: Jogo Finito • Suponha que este jogo é repetido por um número finito de períodos (T). • Qualquer estratégia expandida em que A promete jogar D na última rodada não é crível. – No instante T, A irá jogar U. • A mesma lógica se aplica ao jogador B. Dilema do Prisioneiro: Jogo Finito • Qualquer equilíbrio perfeito de subjogo para este jogo requer o equilíbrio de Nash na rodada final. – A:U,B:L • Esta lógica se aplica para o período 𝑇 − 1. • O único equilíbrio perfeito de subjogo neste jogo finito requer o equilíbrio de Nash em cada rodada. Jogos com Infinitas Repetições • Neste caso, cada jogador pode anunciar uma estratégia de início. – Prometer cooperar desde que o outro jogador coopere. – Quanto o outro jogador deixar de cooperar, o primeiro deixa de cooperar e o jogo volta ao equilíbrio de Nash. Jogos com Infinitas Repetições • A estratégia anunciada pode ser um Equilíbrio Perfeito de Subjogo se ela é crível. • Isto dependerá dos payoffs e da taxa de desconto. Jogos com Infinitas Repetições • Se é a taxa de desconto do jogador B (ou do jogador A), o valor presente da cooperação contínua é dada por: 2 + 2 + 22 + … = 2/(1-) • O payoff da traição é: 3 + 1 + 21 + …= 2 + 1/(1-) • A cooperação será crível se: 2/(1-) > 2 + 1/(1-) > ½ Jogos Característicos (Varian) • Jogos de coordenação: ganhos dos participantes são maiores quando eles coordenam suas estratégias. Ex: batalha dos sexos, dilema dos prisioneiros. • Jogos de competição: ganho de um participante é igual às perdas de outro. Ex: jogo de soma zero. • Jogos de compromisso: jogo sequencial no qual um dos jogadores se compromete a seguir determinada estratégia. Conjunto de Informação • Informação Incompleta: jogadores não conhecem alguns dos elementos que definem as regras do jogo (ex: payoffs, conjunto de estratégias, número de jogadores, etc..). Ex: poker. • Informação Completa: jogadores conhecem todos os elementos do jogo. Ex: dilema dos prisioneiros. Conjunto de Informação • Informação Perfeita: jogadores sabem exatamente em qual nó da árvore de decisão estão. Ou seja, jogadores sabem exatamente o que ocorreu nos movimentos prévios. • Informação Imperfeita: jogadores não sabem o nó da árvore em que estão. Ex: todo jogo simultâneo é de informação imperfeita. Anpec 2014 – Q13 Anpec 2008 – Q15 O jogo acima é repetido infinitas vezes. Seja δ* o menor fator de desconto intertemporal que permite implementar a lista de estratégias Pareto-eficientes, como equilíbrio perfeito de subjogo, em que a estratégia de punição é do tipo gatilho (trigger strategy), isto é, se um jogador desvia- se do acordo, ele é punido com o equilíbrio de Nash Pareto-dominado do jogo-estágio para sempre. Calcule 100× δ * (isto é, cem vezes δ*). Respostas • Q13 – 2014: F V V F V • Q15 – 2008: 25 ANEXO Nash Estrito vs Não-Estrito Equilíbrio de Nash • Um par de estratégias (a*,b*) é definida como Equilíbrio de Nash (usual) se: UA(a*,b*) UA(a’,b*) para todo a’ SA UB(a*,b*) Ub(a*,b’) para todo b’ SB Equilíbrio de Nash Estrito • Um par de estratégias (a*,b*) é definida como Equilíbrio de Nash estrito se: UA(a*,b*) > UA(a’,b*) para todo 𝑎’ 𝑆𝐴 UB(a*,b*) > Ub(a*,b’) para todo 𝑏’ 𝑆𝐵
Compartilhar