Baixe o app para aproveitar ainda mais
Prévia do material em texto
DEPARTAMENTO DE ECONOMIA / PUC-Rio MICROECONOMIA II Profs. Marcos Antonio C. da Silveira e Eduardo P.S. Fiuza Nota de Aula 6: Introdução aos Jogos na Forma Extensiva Bibliogra a: Cabral, cap. 4, seções 4.1 e 4.2, Rasmussen, seções 2.1 a 2.3 e 4.1 a 4.3 1 Jogos na Forma Extensiva � Representação apropriada para jogos dinâmicos � Veja Quadro 1 � Ex: Fig.2 De nition 1 Um nó é um ponto do jogo no qual algum jogador ou a Natureza age, ou onde o jogo acaba. De nition 2 A Natureza é um jogador ctício que age aleatoriamente em pontos especí- cos do jogo com probabilidades especi cadas De nition 3 Um sucessor do nó t é um nó que pode ocorrer mais tarde no jogo se t tiver sido atingido De nition 4 Um predecessor de um nó t P (t) é um nó que deve ser atingido antes de t se atingido De nition 5 Um nó inicial, ou nó de partida, é um nó sem predecessores De nition 6 Um nó nal ou terminal é um nó sem sucessores De nition 7 Um ramo é uma ação de um conjunto de ações de um jogador num nó em particular De nition 8 Um caminho ou trajetória (path) é uma sequência de nós e ramos conduzindo de um nó de partida a um nó nal. De nition 9 Uma história do jogo corresponde a uma coleção de ações, uma para cada conjunto de informação De nition 10 (Fudenberg e Tirole, 1991, p.77; Rasmussen, p.41) A representação de um jogo na forma extensiva especi ca: 1. Os jogadores do jogo: N,1,...I, onde N é a natureza. 2. A con guração dos nós e ramos, que inclui: 1 (a) A ordem dos movimentos: qual jogador joga quando, i.e., a ordem dos nós de decisão e a indicação de qual nó pertence a cada jogador; (b) O que cada jogador pode fazer em cada uma das oportunidades que ele(a) tem de mover-se, i.e., o conjunto de ações disponíveis de cada jogador em cada nó de decisão, ai 2 Ai (t) (c) O que cada jogador sabe em cada uma das oportunidades que ele(a) tem de mover-se, i.e., os conjuntos de informação em que os nós de cada jogador se dividem [ver abaixo] 3. Os payo¤s recebidos por cada jogador para cada combinação de movimentos que possa ser obtida das decisões dos jogadores; 4. As probabilidades exógenas dos eventos da Natureza De nition 11 Um conjunto de informação de um jogador é uma partição do conjunto de nós de decisão que satisfaz as seguintes propriedades. Sejam t; t0dois nós de decisão do conjunto de informação h 2 H. Então: 1. i (t) = i (t0) é o mesmo jogador i que se move em qualquer nó de decisão desse conjunto de informação 2. t 2 P (t0) e t0 2 P (t) um nó não pode ser predecessor nem sucessor do outro 3. Ai (t) = Ai (t0) o conjunto de ações disponíveis para o jogador i em t deve ser o mesmo em t0, de modo que, quando o jogo atinge t ou t0, o jogador chamado a jogar não sabe qual destes nós foi atingido e, portanto, em qual ele está � Dito de outra maneira, um conjunto de informação de um jogador i, !i;em qualquer ponto particular do jogo, é o conjunto de diferentes nós na árvore do jogo que ele sabe que pode ser o verdadreiro nó, mas entre os quais ele não pode distinguir por observação direta. � Normalmente a forma extensiva é bem representada pela árvore do jogo � Veja a Figura 3 para exemplos de conjuntos de informação e histórias de jogos. 2 Categorias de Informação: � Perfeita: cada conjunto de informação é unitário =><= Imperfeita: possui pelo menos um conjunto de informação com mais de um nó; � Certa: a Natureza não se move depois de nenhum movimento dos jogadores � Simétrica: nenhum jogador tem informação diferente de outros jogadores quando ele se move, ou nos nós terminais. � Completa: a Natureza não se move primeiro, ou seu movimento inicial é observado por todos os jogadores Remark 12 Qual(is) jogo(s) já vistos têm informação perfeita e qual(is) têm informação imperfeita? Remark 13 Para informação incompleta, veja as Figuras 5 e 6. 2 2.1 Diferença entre ação e estratégia � Uma estratégia qualquer de um jogador especi ca sua ação em todo conjunto de infor- mação pertencente a este jogador cada combinação de estratégias, uma para cada jogador, determina um resultado (história) do jogo qualquer estratégia de um jogador precisa especi car a ação deste jogador até mesmo nos conjuntos de informação que não são alcançados durante a história do jogo � Notem, na Figura 2, que o jogador 1 tem apenas 2 estratégias, correspondentes às 2 ações. Isto porque, quando ele é chamado a jogar, há apenas 1 conjunto de informação e 2 ações. Logo, S1 = fE;Dg � Já o jogador 2 depara-se com 4 possíveis estratégias, já que há 2 contingências/conjs. de informação, e para cada uma, 2 ações. � Veja como ca a forma normal. Podemos identi car dois equilíbrios de Nash neste jogo, mas um deles envolve uma ação irracional do jogador 2 se um dos caminhos do jogo é percorrido. Qual é este equilíbrio e qual é esta ação irracional? 3 Equilíbrio de Nash Perfeito em Subjogos (ENPS) � Problema das ameaças não críveis: alguns EN não implicam um resultado razoável do jogo, dado que jogadores são racionais � Solução: Re namento do Equilíbrio de Nash =) EN Perfeito em Subjogos � O que é um subjogo? Um "jogo menor" que se inicia num conjunto de informação unitário e que contém todos os vértices subsequentes veja as Figs. 4A e 4B. De nition 14 Um subjogo de um jogo na forma extensiva é um nó t e todos os seus suces- sores S (t) que tenham as seguintes propriedades: 1. i (t) = ftg, i.e., o conjunto de informação do nó t é o conjunto unitário contendo o próprio t; 2. Para todo t0 2 S (t) ; i (t0) � S (t), i.e., os nós sucessores de t não podem ser confundidos (estar no mesmo conjunto de informação) com nós que não são sucessores de t a Fig. 4A viola justamente esta condição. � De nition 15 Remark 16 Um jogo inteiro é um subjogo de si mesmo. Para distinguirmos os subjogos menores, chamamo-los de subjogos próprios. � EN Perfeito em Subjogos induz um EN em todo subjogo De nition 17 Uma combinação de estratégias é um ENPS de um jogo na forma extensiva se: 1. É um EN para o jogo inteiro; 2. É um EN para cada subjogo próprio, i.e., suas regras de ação relevantes são um EN em cada subjogo próprio. 3 � Como derivar EN Perfeito em Subjogos num jogo nito =) Indução retroativa (backward induction) � No exemplo da Figura 2, o único ENPS é (D; BjE, ajD). Note como a indução retroativa eliminou o segundo EN. 4 Jogos Repetidos com Horizonte Finito � Jogo constituinte jogado um número nito de vezes � Exemplo: Dilema dos Prisioneiros jogado duas vezes prisioneiro 2 NC C prisioneiro 1 NC C � �1;�1 �9; 0 0;�9 (�6;�6) � Pay-o¤ dos jogadores: U = v1 + �v2 v1 : pay-o¤ no primeiro estágio v2 : pay-o¤ no segundo estágio 0 < � < 1 : fator de desconto intertemporal � Subjogos no segundo estágio são o próprio jogo constituinte � Equilíbrio de Nash do jogo constituinte: (C,C) � Estratégias de cooperação do jogo constituinte (ótimo de Pareto): (NC,NC) � Qual o Equilíbrio de Nash Perfeito em Subjogos? (use indução retroativa) C no primeiro estágio C no segundo estágio qualquer que seja o resultado do primeiro estágio � Conclusão: não é possível sustentar cooperação (ótimo de Pareto) � Mesmo resultado se jogo repetido um número nito qualquer de vezes 4 5 Jogos Repetidos com Horizonte In nito � Jogo constituinte jogado um número in nito de vezes � Exemplo: Dilema dos Prisioneiros repetido in nitamente prisioneiro 2 NC C prisioneiro 1 NC C � �1;�1 �9; 0 0;�9 (�6;�6) � Pay-o¤ dos jogadores: U = v1 + �v2 + � 2v3 + ::: = X1 t=0 �tvt+1 vt : pay-o¤ no t-ésimo estágio 0 < � < 1 : fator de desconto intertemporal � Subjogos são o próprio jogo � Equilíbrio de Nash do jogo constituinte: (C,C) � Estratégias de cooperação do jogo constituinte (ótimo de Pareto): (NC,NC) � É possível sustentar o ótimo de Pareto através de um ENPS, ou seja, existe um ENPS tal que o resultado do jogo seja cooperação (NC,NC) em cada estágio? 5 Estratégias de Punição como ENPS : � Considere a estratégia de punição (estratégia do gatilho) abaixo: NC em t=1 NC em t>1 se outro jogador sempre cooperou (jogou NC)no passado C em t>1 se outro jogador não cooperou (jogou C) em algum momento no passado � Qual o resultado do jogo se ambos os jogadores jogam estratégia de punição? Em todo período t=0,1,2,3,4, ambos cooperam, ou seja, jogam NC � Pode-se provar que, para determinado intervalo do fator de desconto �; um ENPS consiste em cada jogador jogar a estratégia de punição acima Relembrando: um ENPS é um EN do jogo inteiro que induz um EN em todos os subjogos Dois tipos diferentes de subjogos: subjogo de cooperação e não cooperação � subjogo de cooperação: ambos os jogadores sempre cooperaram no passado � subjogo de não cooperação: algum jogador não cooperou em algum momento no passado Nos subjogos de não cooperação, estratégia de punição é EN E nos subjogos de cooperação? � pay-o¤ com estratégia de punição, dado que outro jogador joga estratégia de punição: U = (�1) + (�1) � + (�1) �2 + ::: = X1 t=0 (�1) �t = (�1) X1 t=0 �t = (�1) 1� � � pay-o¤com desvio da estratégia de punição, dado que outro jogador joga estratégia de punição: U = 0 + �(�6) + �2(�6) + ::: = 0 + X1 t=1 (�6) �t = 0 + (�6) 1� � � (�6) = 6 + (�6) 1� � � estratégia de punição é ótima quando (�1) 1� � � 6 + (�6) 1� � () � � 1=6 Resultado: � � 1=6 =) estratégia de punição para cada jogador é ENPS � Conclusão: para � su cientemente grande, ou seja, � � 1=6, é possível sustentar cooperação através de um ENPS � Intuição: quanto maior a valorização da riqueza futura (maior �), maior a perda com o desvio da cooperação e, portanto, menor o incentivo para não cooperar 6 FORMA ESTRATÉGICA FORMA EXTENSIVA Jogadores Jogadores Estratégias A estratégia de cada jogador é uma regra que lhe diz qual ação escolher a cada instante do jogo, dado seu conjunto de informação. Outra def: é um plano completo de ações contingentes – especifica uma ação factível para o jogador em toda contingência na qual o jogador puder ser chamado a jogar. Resultados correspondem aos perfis de estratégias Resultados correspondem às histórias dos jogos. Dois perfis de estratégias diferentes podem ter o mesmo resultado Payoffs são utilidades dos jogadores associadas aos resultados Payoffs são utilidades dos jogadores associadas aos resultados. 2,1 1,2 3,1 A B E D FIGURA 2 JOGO DINÂMICO NA FORMA EXTENSIVA 2 1 O MESMO JOGO, NA FORMA NORMAL a b 0,0 2 A|E, a|D A|E, b|D B|E, a|D B|E, b|D E 3,1 3,1 1,2 1,2* 1 D 2,1 0,0 2,1* 0,0 2 3 2 h l h l h l H L M NE EL EH 2 3 3 C C NC NC A B A B b a b a Uma história de jogo possível: Ø 1 jogar EL Ø 2 jogar [C| {EH ou EL}, M|NE] Ø 3 jogar [a|NC, B|C, h|NE] FIGURA 3 1 A B E D FIGURA 4A SUBJOGOS 2 1 a b 2 Não é subjogo 3 3 A B E D FIGURA 4B SUBJOGOS 2 1 a b 2 É subjogo 3 3 3 U U U U D D D D 2 2 1 1 L L R R N [0,6] [0,4] T W FIGURA 5 JOGO DINÂMICO DE INFORMAÇÃO INCOMPLETA E ASSIMÉTRICA A B E D FIGURA 6 JOGO DE INFORMAÇÃO INCOMPLETA E SIMÉTRICA 1 N A B 2 2 [0,3] [0,7] NC C C C NC NC TRAJETÓRIA COOPERATIVA TRAJETÓRIA NÃO- COOPERATIVA FIGURA 7 DILEMA DOS PRISIONEIROS REPETIDO
Compartilhar