Nota de Aula 06 - Introdução dos Jogos na Forma Extensiva

Teoria Microeconômica II

•

PUC-RIO

João Guilherme

10/06/2012

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 14 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Teoria Microeconômica II

182 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

DEPARTAMENTO DE ECONOMIA / PUC-Rio
MICROECONOMIA II
Profs. Marcos Antonio C. da Silveira e Eduardo P.S. Fiuza
Nota de Aula 6: Introdução aos Jogos na Forma Extensiva
Bibliograa: Cabral, cap. 4, seções 4.1 e 4.2, Rasmussen, seções 2.1 a 2.3 e 4.1 a 4.3
1 Jogos na Forma Extensiva
� Representação apropriada para jogos dinâmicos
� Veja Quadro 1
� Ex: Fig.2
Denition 1 Um nó é um ponto do jogo no qual algum jogador ou a Natureza age, ou onde
o jogo acaba.
Denition 2 A Natureza é um jogador ctício que age aleatoriamente em pontos especí-
cos do jogo com probabilidades especicadas
Denition 3 Um sucessor do nó t é um nó que pode ocorrer mais tarde no jogo se t tiver
sido atingido
Denition 4 Um predecessor de um nó t P (t) é um nó que deve ser atingido antes de
t se atingido
Denition 5 Um nó inicial, ou nó de partida, é um nó sem predecessores
Denition 6 Um nó nal ou terminal é um nó sem sucessores
Denition 7 Um ramo é uma ação de um conjunto de ações de um jogador num nó em
particular
Denition 8 Um caminho ou trajetória (path) é uma sequência de nós e ramos conduzindo
de um nó de partida a um nó nal.
Denition 9 Uma história do jogo corresponde a uma coleção de ações, uma para cada
conjunto de informação
Denition 10 (Fudenberg e Tirole, 1991, p.77; Rasmussen, p.41) A representação de um jogo
na forma extensiva especica:
1. Os jogadores do jogo: N,1,...I, onde N é a natureza.
2. A conguração dos nós e ramos, que inclui:
1
(a) A ordem dos movimentos: qual jogador joga quando, i.e., a ordem dos nós de decisão e a indicação
de qual nó pertence a cada jogador;
(b) O que cada jogador pode fazer em cada uma das oportunidades que ele(a) tem de mover-se, i.e., o
conjunto de ações disponíveis de cada jogador em cada nó de decisão, ai 2 Ai (t)
(c) O que cada jogador sabe em cada uma das oportunidades que ele(a) tem de mover-se, i.e., os
conjuntos de informação em que os nós de cada jogador se dividem [ver abaixo]
3. Os payo¤s recebidos por cada jogador para cada combinação de movimentos que possa ser obtida das
decisões dos jogadores;
4. As probabilidades exógenas dos eventos da Natureza
Denition 11 Um conjunto de informação de um jogador é uma partição do conjunto de nós de decisão
que satisfaz as seguintes propriedades. Sejam t; t0dois nós de decisão do conjunto de informação h 2 H.
Então:
1. i (t) = i (t0) é o mesmo jogador i que se move em qualquer nó de decisão desse conjunto de informação
2. t 2 P (t0) e t0 2 P (t) um nó não pode ser predecessor nem sucessor do outro
3. Ai (t) = Ai (t0) o conjunto de ações disponíveis para o jogador i em t deve ser o mesmo em t0, de modo
que, quando o jogo atinge t ou t0, o jogador chamado a jogar não sabe qual destes nós foi atingido e,
portanto, em qual ele está
� Dito de outra maneira, um conjunto de informação de um jogador i, !i;em qualquer ponto
particular do jogo, é o conjunto de diferentes nós na árvore do jogo que ele sabe que pode
ser o verdadreiro nó, mas entre os quais ele não pode distinguir por observação direta.
� Normalmente a forma extensiva é bem representada pela árvore do jogo
� Veja a Figura 3 para exemplos de conjuntos de informação e histórias de jogos.
2 Categorias de Informação:
� Perfeita: cada conjunto de informação é unitário =><= Imperfeita: possui pelo menos
um conjunto de informação com mais de um nó;
� Certa: a Natureza não se move depois de nenhum movimento dos jogadores
� Simétrica: nenhum jogador tem informação diferente de outros jogadores quando ele se
move, ou nos nós terminais.
� Completa: a Natureza não se move primeiro, ou seu movimento inicial é observado por
todos os jogadores
Remark 12 Qual(is) jogo(s) já vistos têm informação perfeita e qual(is) têm informação
imperfeita?
Remark 13 Para informação incompleta, veja as Figuras 5 e 6.
2
2.1 Diferença entre ação e estratégia
� Uma estratégia qualquer de um jogador especica sua ação em todo conjunto de infor-
mação pertencente a este jogador
 cada combinação de estratégias, uma para cada jogador, determina um resultado
(história) do jogo
qualquer estratégia de um jogador precisa especicar a ação deste jogador até mesmo
nos conjuntos de informação que não são alcançados durante a história do jogo
� Notem, na Figura 2, que o jogador 1 tem apenas 2 estratégias, correspondentes às 2 ações.
Isto porque, quando ele é chamado a jogar, há apenas 1 conjunto de informação e 2 ações.
Logo, S1 = fE;Dg
� Já o jogador 2 depara-se com 4 possíveis estratégias, já que há 2 contingências/conjs. de
informação, e para cada uma, 2 ações.
� Veja como ca a forma normal. Podemos identicar dois equilíbrios de Nash neste jogo,
mas um deles envolve uma ação irracional do jogador 2 se um dos caminhos do jogo é
percorrido. Qual é este equilíbrio e qual é esta ação irracional?
3 Equilíbrio de Nash Perfeito em Subjogos (ENPS)
� Problema das ameaças não críveis: alguns EN não implicam um resultado razoável do
jogo, dado que jogadores são racionais
� Solução: Renamento do Equilíbrio de Nash =) EN Perfeito em Subjogos
� O que é um subjogo? Um "jogo menor" que se inicia num conjunto de informação unitário
e que contém todos os vértices subsequentes veja as Figs. 4A e 4B.
Denition 14 Um subjogo de um jogo na forma extensiva é um nó t e todos os seus suces-
sores S (t) que tenham as seguintes propriedades:
1. i (t) = ftg, i.e., o conjunto de informação do nó t é o conjunto unitário contendo o próprio
t;
2. Para todo t0 2 S (t) ; i (t0) � S (t), i.e., os nós sucessores de t não podem ser confundidos (estar
no mesmo conjunto de informação) com nós que não são sucessores de t a Fig. 4A viola
justamente esta condição.
� Denition 15 Remark 16 Um jogo inteiro é um subjogo de si mesmo. Para distinguirmos
os subjogos menores, chamamo-los de subjogos próprios.
� EN Perfeito em Subjogos induz um EN em todo subjogo
Denition 17 Uma combinação de estratégias é um ENPS de um jogo na forma extensiva se:
1. É um EN para o jogo inteiro;
2. É um EN para cada subjogo próprio, i.e., suas regras de ação relevantes são um EN em
cada subjogo próprio.
3
� Como derivar EN Perfeito em Subjogos num jogo nito =) Indução retroativa (backward
induction)
� No exemplo da Figura 2, o único ENPS é (D; BjE, ajD). Note como a indução retroativa
eliminou o segundo EN.
4 Jogos Repetidos com Horizonte Finito
� Jogo constituinte jogado um número nito de vezes
� Exemplo: Dilema dos Prisioneiros jogado duas vezes
prisioneiro 2
NC C
prisioneiro 1
NC
C
� �1;�1 �9; 0
0;�9 (�6;�6)
�
Pay-o¤ dos jogadores:
U = v1 + �v2
 v1 : pay-o¤ no primeiro estágio
 v2 : pay-o¤ no segundo estágio
 0 < � < 1 : fator de desconto intertemporal
� Subjogos no segundo estágio são o próprio jogo constituinte
� Equilíbrio de Nash do jogo constituinte: (C,C)
� Estratégias de cooperação do jogo constituinte (ótimo de Pareto): (NC,NC)
� Qual o Equilíbrio de Nash Perfeito em Subjogos? (use indução retroativa)
C no primeiro estágio
C no segundo estágio qualquer que seja o resultado do primeiro estágio
� Conclusão: não é possível sustentar cooperação (ótimo de Pareto)
� Mesmo resultado se jogo repetido um número nito qualquer de vezes
4
5 Jogos Repetidos com Horizonte Innito
� Jogo constituinte jogado um número innito de vezes
� Exemplo: Dilema dos Prisioneiros repetido innitamente
prisioneiro 2
NC C
prisioneiro 1
NC
C
� �1;�1 �9; 0
0;�9 (�6;�6)
�
Pay-o¤ dos jogadores:
U = v1 + �v2 + �
2v3 + ::: =
X1
t=0
�tvt+1
 vt : pay-o¤ no t-ésimo estágio
 0 < � < 1 : fator de desconto intertemporal
� Subjogos são o próprio jogo
� Equilíbrio de Nash do jogo constituinte: (C,C)
� Estratégias de cooperação do jogo constituinte (ótimo de Pareto): (NC,NC)
� É possível sustentar o ótimo de Pareto através de um ENPS, ou seja, existe um ENPS tal
que o resultado do jogo seja cooperação (NC,NC) em cada estágio?
5
Estratégias de Punição como ENPS :
� Considere a estratégia de punição (estratégia do gatilho) abaixo:
NC em t=1
NC em t>1 se outro jogador sempre cooperou (jogou NC)no passado
C em t>1 se outro jogador não cooperou (jogou C) em algum momento no passado
� Qual o resultado do jogo se ambos os jogadores jogam estratégia de punição? Em todo
período t=0,1,2,3,4, ambos cooperam, ou seja, jogam NC
� Pode-se provar que, para determinado intervalo do fator de desconto �; um ENPS consiste
em cada jogador jogar a estratégia de punição acima
Relembrando: um ENPS é um EN do jogo inteiro que induz um EN em todos os
subjogos
Dois tipos diferentes de subjogos: subjogo de cooperação e não cooperação
� subjogo de cooperação: ambos os jogadores sempre cooperaram no passado
� subjogo de não cooperação: algum jogador não cooperou em algum momento no
passado
Nos subjogos de não cooperação, estratégia de punição é EN
E nos subjogos de cooperação?
� pay-o¤ com estratégia de punição, dado que outro jogador joga estratégia de
punição:
U = (�1) + (�1) � + (�1) �2 + :::
=
X1
t=0
(�1) �t = (�1)
X1
t=0
�t =
(�1)
1� �
� pay-o¤com desvio da estratégia de punição, dado que outro jogador joga estratégia
de punição:
U = 0 + �(�6) + �2(�6) + :::
= 0 +
X1
t=1
(�6) �t = 0 + (�6)
1� � � (�6) = 6 +
(�6)
1� �
� estratégia de punição é ótima quando
(�1)
1� � � 6 +
(�6)
1� � () � � 1=6
Resultado: � � 1=6 =) estratégia de punição para cada jogador é ENPS
� Conclusão: para � sucientemente grande, ou seja, � � 1=6, é possível sustentar cooperação
através de um ENPS
� Intuição: quanto maior a valorização da riqueza futura (maior �), maior a perda com o
desvio da cooperação e, portanto, menor o incentivo para não cooperar
6
FORMA ESTRATÉGICA FORMA EXTENSIVA 
Jogadores Jogadores 
Estratégias A estratégia de cada jogador é uma regra que 
lhe diz qual ação escolher a cada instante do 
jogo, dado seu conjunto de informação. 
Outra def: é um plano completo de ações 
contingentes – especifica uma ação factível 
para o jogador em toda contingência na qual o 
jogador puder ser chamado a jogar. 
Resultados correspondem aos perfis de 
estratégias 
Resultados correspondem às histórias dos 
jogos. Dois perfis de estratégias diferentes 
podem ter o mesmo resultado 
Payoffs são utilidades dos jogadores 
associadas aos resultados 
Payoffs são utilidades dos jogadores 
associadas aos resultados. 
 
 
2,1 1,2 3,1 
A B 
E D 
FIGURA 2 
JOGO DINÂMICO NA FORMA EXTENSIVA 
2 
1 
O MESMO JOGO, NA FORMA NORMAL 
 
a b 
0,0 
 2 
 A|E, a|D A|E, b|D B|E, a|D B|E, b|D 
E 3,1 3,1 1,2 1,2* 
 
1 
D 2,1 0,0 2,1* 0,0 
 
2 
 
3 
2 
h 
l 
h 
l 
h 
l 
H 
L 
M NE 
EL 
EH 
2 
3 
3 
C 
C 
NC 
NC 
A 
B 
A 
B 
b 
a 
b a 
Uma história de jogo possível: 
Ø 1 jogar EL 
Ø 2 jogar [C| {EH ou EL}, M|NE] 
Ø 3 jogar [a|NC, B|C, h|NE] 
FIGURA 3 
1 
 
A B 
E D 
FIGURA 4A 
SUBJOGOS 
2 
1 
 
a b 
2 
Não é subjogo 
3 3 
 
A B 
E D 
FIGURA 4B 
SUBJOGOS 
2 
1 
 
a b 
2 
É subjogo 
3 3 3 
 
U U 
U U 
D
D D 
D 
2 2 
1 
1 
L 
L R 
R 
N 
[0,6] 
[0,4] 
T 
W 
FIGURA 5 
JOGO DINÂMICO DE INFORMAÇÃO 
INCOMPLETA E ASSIMÉTRICA 
A B 
E D 
FIGURA 6 
JOGO DE INFORMAÇÃO 
INCOMPLETA E SIMÉTRICA 
1 
N 
 
A B 
2 2 
[0,3] [0,7] 
 
 
NC 
C 
C 
C 
NC 
NC 
TRAJETÓRIA COOPERATIVA 
TRAJETÓRIA NÃO-
COOPERATIVA 
FIGURA 7 
DILEMA DOS PRISIONEIROS REPETIDO