Buscar

TEORIA JOGOS-AULA 01 ATE AULA 10

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 84 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

AULA 01.
Conceituação da Teoria dos Jogos
Quando começou a teoria dos jogos?
O primeiro momento em que se tem notícia sobre a teoria dos jogos remonta ao século XVIII, quando, através de uma correspondência dirigida a Nicolas Bernoulli, James Waldegrave analisa um determinado jogo de cartas, propondo uma solução que é denominada em Teoria de Jogos de equilíbrio de estratégia mista.
Posteriormente, em 1838, o matemático (e filósofo e economista) francês Antoine Auguste Cournot (1801–1877) publicou uma análise do comportamento de duas empresas no mercado, referenciada atualmente como o Modelo de Cournot. Em 1913, Ernst Zamelo apresentou o primeiro teorema matemático da Teoria dos Jogos aplicado ao jogo de xadrez, mostrando que, a cada jogada, pelo menos um dos dois jogadores tem alguma estratégia que poderá conduzi-lo à vitória ou, pelo menos, ao empate. Outro matemático, chamado Emile Bordel, publicou quatro artigos sobre jogos estratégicos em economia e nas guerras, através de um método denominado MiniMax.
Mas foi John von Neumann, considerado o co-inventor do computador moderno, a publicar o livro Theory of Games and Economic Behavior, escrito em parceria com o economista Oskar Morgenstein, que estabeleceu a Teoria dos Jogos como um campo de estudo. Essa teoria se constitui numa ferramenta relevante para entender o processo de tomada de decisões em diversas áreas (economia, administração, negócios, projetos etc.).
Uma contribuição fundamental foi dada pelo matemático John Forbes Nash Júnior ao desenvolver o chamado Equilíbrio de Nash, mostrando que nem todos os jogos são de soma zero (se alguém perde algo, o outro ganha o mesmo algo). Ele mostrou que existem situações em que todas as estratégias adotadas por todos os jogadores são as melhores respostas possíveis, sem os jogadores se sentirem motivados para mudar.
 
Mas o que vem a ser um jogo?
Constitui-se em um jogo o contexto onde dois ou mais participantes (jogadores) estão envolvidos em uma situação onde cada um deles tem um ou mais objetivos (e as recompensas associadas) a atingir segundo certas regras, e as decisões que cada um toma para atingir esses objetivos são influenciadas pelas decisões dos outros participantes (interdependência estratégica) dentro de certas condições (racionalidade ou lógica nas decisões).
Os jogos lúdicos e os esportivos, que já fazem parte do cotidiano, são tipos de jogos. Mas também podem-se incluir, na categoria de jogos, decisões políticas/econômicas (nacionais ou internacionais) ou decisões de executivos em empresas, as quais caracterizam uma interação estratégica, onde os participantes (indivíduos ou organizações) reconhecem a interdependência mútua de suas decisões na hora de avaliar, por exemplo, como participar de algum mercado. Também se caracterizam como jogo algumas escolhas interpessoais, como se um casal deve ir ao cinema ou ao futebol considerando os interesses e objetivos de cada uma. E assim por diante.
 
E o que é a teoria dos jogos?
A teoria dos jogos estuda, através do uso de modelos, situações (jogos) onde existem ganhos de alguma natureza (payoffs) para os participantes da situação (jogadores), e onde as decisões que cada um destes toma, visando o melhor resultado possível, têm interdependência entre si (interação estratégica), moldando o resultado final dessa interação mútua (resultado do jogo).
Um exemplo de jogo é a denominada Batalha do mar de Bismarck, ocorrida na Guerra do Pacífico, em 1942. Os japoneses precisavam transferir um grande reforço do Japão e China para Lae (Papua-Nova Guiné) através de duas rotas alternativas, procurando desviar dos ataques aéreos dos aliados. Havia duas rotas possíveis: a rota sul, com bom tempo e boa visibilidade, e a rota norte, com tempo ruim e baixa visibilidade. O objetivo era escolher a rota para minimizar o bombardeio aliado. Já os aliados tinham suas restrições: escolher a primeira rota a pesquisar, dado que só podiam pesquisar uma rota por dia. O objetivo aliado era maximizar o bombardeio. O jogo, neste caso, seria determinar a solução que cada um adotaria para atingir da melhor forma possível o seu objetivo, dadas as informações disponíveis e assumindo a racionalidade nas decisões (veja a solução no pdf da apresentação desta unidade).
 
Quais as vantagens de se estudar a Teoria dos Jogos?
Existem duas principais. Primeiro, ela nos auxilia a entender teoricamente o processo de decisão de agentes que interagem entre si a partir da compreensão da lógica da situação em que estão envolvidos. Em segundo, ela ajuda a desenvolver a capacidade de raciocinar estrategicamente, explorando as possibilidades de interação entre agentes, possibilidades estas que nem sempre correspondem à intuição.
 
Qual o ponto de partida para analisar jogos?
Para auxiliar na compreensão lógica da situação e no raciocínio estratégico, o ponto de partida de aplicação da teoria dos jogos será sempre um modelo. Por exemplo, o modelo utilizado na análise da batalha do mar de Bismarck é uma matriz ou tabela (ver pdf da apresentação). Existem modelos para diversas situações de interação estratégica: para interação única com decisões simultâneas, para interações repetidas, para interações com decisões em ordem definida e interações com decisões tendo conhecimento prévio de outras.
 
 
Vá mais Longe
· Ler o Capítulo 1, páginas de 1 até 23, da referência 1 (disponível na web).
· Ler o Capítulo 1, páginas de 4 até 8, da referência 2 (biblioteca virtual).
· Ver o vídeo sobre o uso da teoria de jogos em processos preditivos.
Teoria dos Jogos:Teoria dos Jogos (Links para um site externo.)
 
Agora é sua Vez
Procure exemplos em seu cotidiano de situações que podem ser representadas pela Teoria dos Jogos. Compartilhe com os colegas no Fórum da Disciplina.
Veja a resposta logo abaixo, mas antes procure responder e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
Referências
1. FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
2. FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
3. IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.
AULA 02.
Representação de Jogos
 
Por que modelos?
A teoria dos jogos permite analisar várias situações e circunstâncias importantes na economia, nos negócios, nas empresas, no governo, no mercado consumidor, biologia, ciência da computação etc., que envolvem em processos de interação estratégica (jogos). Mas para que isso seja possível, é preciso saber como modelar esses processos para viabilizar a sua análise, o que permite determinar as possíveis consequências das interações a partir da teoria dos jogos, ou seja, os possíveis resultados do jogo. E para se modelar um jogo é preciso conhecer quais são os elementos fundamentais que devem sempre fazer parte do modelo e que tipos de modelos podem ser construídos.
 
Quais os principais elementos de um jogo?
Os principais elementos são três:
· O jogador, que é qualquer indivíduo, grupo de indivíduos ou organização, envolvido no processo de interação estratégica com capacidade para tomar uma decisão. Na Teoria dos Jogos, supõe-se que os jogadores são racionais, isto é, eles realizam as interações (ver a seguir) levando em conta os melhores resultados para si;
· A estratégia, que é uma das escolhas dentre um conjunto possível, que o jogador pode realizar em um dado momento do jogo. Cada jogador tem um conjunto de estratégias que podem ser determinísticas ou probabilísticas. Quando a estratégia é determinística (a escolha do jogador é baseada em uma dedução racional), ela é chamada de estratégia pura. Quando um jogador escolhe de forma probabilística (a escolha acontece após o jogador avaliar as possibilidades de ganho ou perda), uma estratégia de seu conjunto de estratégias puras, diz-se que ele escolheu uma estratégia mista;
· A recompensa (payoff) é o ganho que o jogador obtém após a escolha da estratégia, sendo dada por um número, representando o resultado da escolha do jogador.
Paralelamentea esses elementos existem interações entre os jogadores, que são as ações que cada um deles realiza que, consideradas individualmente, afetam os demais. Essas ações podem ser simultâneas ou alternadas, definindo o tipo de jogo (simultâneo ou sequencial). Além disso, podem surgir incertezas se a hipótese de racionalidade dos jogadores puder se mostrar falha, o que pode ser contornado até certo ponto usando probabilidades.
 
Como os jogos são classificados?
Existem duas classificações principais:
· Jogos por tipo de interesse dos jogadores.
· O jogo não cooperativo, quando as condições do mesmo não permitem a formação de coalizões, que possam determinar o resultado do jogo. Exemplo: duas empresas decidindo entre transportar suas cargas compartilhando suas frotas, ou terceirizando uma frota para transporte comum.
· O jogo cooperativo, quando as condições do jogo permitem a possibilidade de os participantes atuarem por meio de coalizões. Exemplo: duas empresas que disputam um mercado decidindo se entram uma na região dominada pela outra.
· Jogos mistos (cooperativos/não cooperativos), quando há uma combinação de interesses: podem ser idênticos ou opostos. Exemplo: duas empresas decidindo entre investir isoladamente em uma tecnologia (oposto) ou cooperar dividindo gastos (idêntico).
· Jogos conforme a cronologia.
· Jogos simultâneos ou estáticos, onde as decisões dos jogadores são tomadas simultaneamente, que é equivalente ao fato de cada jogador não conhece as decisões dos outros.
· Jogos sequenciais ou dinâmicos, onde as decisões são tomadas em uma ordem predeterminada, implicando que alguns jogadores conhecem previamente as decisões dos outros antes de tomar as suas. Nessa categoria, tem-se um jogo de informação completa ou perfeita quando todos os jogadores conhecem previamente as decisões dos outros; caso alguns não conheçam, diz que é um jogo de informação não completa ou imperfeita.
 
Como os jogos são representados?
Jogos simultâneos são tipicamente representados por uma matriz (ou tabela) de recompensas, conhecida também como forma normal onde, no encontro de uma linha com uma coluna, são mostradas as recompensas de cada jogador (RA e RB) conforme a sua estratégia/decisão (DA ou DB) adotada confrontada com a estratégia do outro jogador (EA e EB). Alguns Jogos sequenciais também poderiam ser representados usando essa matriz, porém ela tende a ficar muito grande e, eventualmente, com células não utilizáveis.
 
	
	Jogador B
	Jogador A
	DB1
	DB2
	DA1
	RA1, RB1
	RA2, RB2
	DA2
	RA3, RB3
	RA4, RB4
 
Assim, jogos sequenciais são normalmente representados por árvores de decisão, que melhor podem representar um fluxo de decisões (escolha da estratégia) realizadas em sequência, uma vez que jogadores (A ou B) têm conhecimento prévio da decisão de outros.
Veja o pdf da apresentação desta unidade, onde há exemplos dessas duas formas de representação.
 
 
Vá mais Longe
Ler o Capítulo 2, das páginas 41 até 56, da referência 1 (disponível na web).
· FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
 
Ver os vídeos abaixo sobre construção e uso da matriz de recompensas e representação em árvore.
· Teoria dos Jogos - Interpretando Matriz de Payoff:Teoria dos Jogos: Interpretando Matriz de Payoff (Links para um site externo.)
· Teoria dos Jogos 2: Representação Extensiva:Teoria dos Jogos 2: Representação Extensiva (Links para um site externo.)
 
Agora é sua Vez
Duas lojas, 1 e 2, devem decidir se investem em uma nova linha de produtos em substituição a uma linha obsoleta.  Se ambas investirem, os ganhos serão de 3 para cada uma. Se não investirem, não ganham nada (ganho 0). Se uma investir e a outra não, a que investir tem um ganho de 3, e a outra perda de 1 (ganho -1).  Pede-se:
1. representar esse jogo sabendo-se que as decisões de cada loja são simultâneas;
2. analisando a tabela obtida, qual seria a solução desse jogo, isto é, qual decisão cada loja tomaria?
Veja a resposta logo abaixo, mas antes procure responder e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
Referências
1. FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
2. FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
3. IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.
AULA 03.
Análise dos Jogos - Estratégias Dominantes
 
O que é necessário para realizar a análise de um jogo?
Para se proceder à análise de um jogo, as informações abaixo são necessárias:
· É preciso conhecer os objetivos do jogo, ou seja, qual resultado se almeja ao final;
· Deve-se ter conhecimento dos possíveis movimentos/ações dos jogadores, que são as estratégias possíveis de serem adotadas por cada jogador;
· É importante se ter estimativas das recompensas de acordo com as possíveis combinações de estratégias adotadas pelos jogadores. Essas estimativas muitas vezes necessitam de alguma experiência ou conhecimento de situações prévias semelhantes;
· Consideração de que os jogadores agem racionalmente, e não ao acaso. Havendo possibilidade de não racionalidade, pode-se agregar alguma análise de probabilidade para mitigar falhas na análise.
· Saber se o jogo é de informação completa ou não, relevante para os jogos sequenciais;
· Representar o jogo: matriz de recompensa (simultâneo) ou árvore de decisão (sequencial);
· Pesquisar as soluções de equilíbrio representando os resultados possíveis para o jogo, que são as situações onde os jogadores tendem, racionalmente, a se acomodar.
 
O que são estratégias estritamente dominantes/dominadas?
Uma estratégia estritamente dominante ocorre quando, ao ser adotada por um jogador, ela leva sempre a um melhor resultado do jogo a este jogador para qualquer estratégia adotada pelos outros jogadores. Ela se aplica a jogos simultâneos (ou estáticos), e quando identificada (Estratégia 1 do jogador A: E1A; ver tabela abaixo), a racionalidade leva obrigatoriamente os outros jogadores a decidir levando em conta a estratégia dominante desse jogador (EB2).
 
	
	Jogador B
	Jogador A
	E1B
	E2B
	E1A
	7, 3
	5, 4
	E2A
	4, 5
	3, 5
 
Assim, na tabela acima, E1A é a estratégia estritamente dominante. Em contrapartida, diz-se que E2A é a estratégia estritamente dominada por E1A.
 
E o que são estratégias fracamente dominantes/dominadas?
Uma estratégia estritamente dominante ocorre quando, ao ser adotada por um jogador, ela leva sempre a um melhor resultado do jogo para este jogador para algumas estratégias adotadas pelos outros jogadores, sendo indiferentes em outras. Também se aplica a jogos simultâneos. Quando identificada (Estratégia 1 do jogador A: E1A; ver tabela abaixo), a racionalidade leva obrigatoriamente os outros jogadores a decidir levando em conta a estratégia dominante desse um jogador (EB2).
 
	
	Jogador B
	Jogador A
	E1B
	E2B
	E1A
	7, 3
	5, 4
	E2A
	4, 5
	5, 5
 
Assim, na tabela acima, E1A é a estratégia fracamente dominante (melhor para E1B, mas indiferente para E2B). Em contrapartida, diz-se que E2A é a estratégia fracamente dominada por E1A.
Como resolver jogos simultâneos com estratégias dominantes
Utiliza-se a eliminação iterativa de estratégias estritamente dominadas (EIEED), que consiste em identificar as estratégias estritamente dominadas e eliminá-las do jogo, já que não serão adotadas, visto que outra estratégia sempre vai prevalecer (a estratégia dominante).
Seja a tabela abaixo, mais à esquerda. Pode-se observar que, para o jogador B, a estratégia E2B pode ser eliminada, pois é estritamente dominada por E1B e E3B (sempre melhores recompensas). Após a transição 1, nota-se que, para o jogador A, a estratégia E1A pode ser eliminada por ser dominada (fortemente no caso) pela estratégia E2A, que após a eliminação de E2B, passou a ser estritamente dominante. Após a transição 2, obtém-se a tabela mais à direita na qual fica evidente a solução do jogo.
 
	
	Jog. B
	1
->
	 
	Jog. B
	2
->
	 
	Jog. B
	Joga. A
	E1B
	E2B
	E3B
	
	Joga. A
	E1B
	E3B
	
	Joga. A
	E1B
	E3BE1A
	2, 4
	5, 2
	3, 4
	
	E1A
	2, 4
	3, 4
	
	E2A
	3, 2
	4, 3
	E2A
	3, 2
	1, 1
	4, 3
	
	E2A
	3, 2
	4, 3
	
	 
	 
	 
 
Quando a eliminação iterativa de estratégias estritamente dominadas (EIEED) deixa como resultado apenas uma estratégia para cada jogador, diz-se que o jogo analisado é solucionável por dominância. É o caso do exemplo acima: solução {E2A, E3B}.
 
O que vem a ser conhecimento comum da racionalidade (CCR)?
O CCR é o princípio por trás da EIEED: assume-se que todo jogador é racional e sabe que os outros também são racionais, sendo esse um conhecimento mútuo entre todos. Isso conduz a interações estratégicas racionais, como a eliminação das estratégias dominadas realizadas no exemplo anterior.
 
Limitações da EIEED.
O método EIEED funciona somente se existirem estratégias estritamente dominadas para todos os jogadores. Nem sempre isso é possível. Quando isso acontece, é necessário aplicar outro método: o equilíbrio de Nash.
Veja o pdf da apresentação desta aula com mais exemplos sobre a EIEED.
 
Vá mais Longe
· Ler o Capítulo 3, das páginas 81 até 93, da referência 1 (disponível na web).
· Ler o Capítulo 1, das páginas 8 até 13, da referência 2 (biblioteca virtual).
 
Ver o vídeo abaixo sobre a análise de jogos com estratégia dominantes.
· Teoria dos Jogos- Análise: Eliminação Iterativa de Estratégias Estritamente Dominadas,Teoria dos Jogos- Análise: Eliminação Iterativa de Estratégias Estritamente Dominadas (Links para um site externo.)
 
Agora é sua Vez
Seja a tabela abaixo, que representa um jogo simultâneo. Usando o método da EIEDD, determine a solução do jogo.
Observação. Trata-se de um jogo com estratégias fracamente dominantes. Mesmo assim, é passível de resolução por esse método.
 
	
	Jog. B
	Joga. A
	E1B
	E2B
	E3B
	E1A
	4, 1
	5, 4
	4, 3
	E2A
	5, 2
	4, 2
	4, 5
 
Veja a resposta logo abaixo, mas antes procure responder e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
Referências
1. FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
2. FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
3. IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.
AULA 04.
Análise dos Jogos – Equilíbrio de Nash
 
O que é o equilíbrio de Nash?
Na Unidade de Aprendizagem anterior, definiu-se que uma estratégia dominante ocorre quando, ao ser adotada por um jogador, ela leva sempre a um melhor resultado do jogo para este jogador a qualquer estratégia adotada pelos outros jogadores, em jogos simultâneos (ou estáticos). Quando uma estratégia dominante é identificada para um jogador A, a racionalidade leva obrigatoriamente os outros jogadores (B, C etc.) a decidirem levando em conta essa estratégia dominante do jogador A. Assim, na tabela abaixo, E1A é a estratégia estritamente dominante. Em contrapartida, diz-se que E2A é a estratégia estritamente dominada por E1A.
 
	
	Jogador B
	Jogador A
	E1B
	E2B
	E1A
	7, 3
	5, 4
	E2A
	4, 5
	3, 5
 
Assim, na tabela abaixo, E1A é a estratégia estritamente dominante. Em contrapartida, diz-se que E2A é a estratégia estritamente dominada por E1A.
Mas jogos com estratégias dominantes/dominadas não são muito comuns. Como então “resolver" jogos que não são solucionados por eliminação de estratégias dominadas?
A noção de equilíbrio de Nash oferece uma alternativa mais geral. Uma combinação de estratégias constitui um equilíbrio de Nash quando cada estratégia é a melhor resposta possível às estratégias dos demais jogadores, sendo isso verdade para todos os jogadores. Sendo o caso mais geral, jogos com estratégias dominantes também podem ser resolvidos através da identificação do equilíbrio de Nash.
 
Como resolver um de jogo usando o equilíbrio de Nash?
Seja a matriz do jogo simultâneo abaixo para dois jogadores, A e B, cada um com suas estratégias (jogador A: estratégias do topo, meio e base; jogador B: estratégias da esquerde, centro e direita). Com as recompensas representadas, pode-se notar que nenhum jogador tem uma estratégia dominante sobre outra qualquer. Será necessário, então, identificar o equilíbrio de Nash.
 
	
	Jogador B
	Jogador A
	E
	C
	D
	T
	3, 2
	0, 0
	1, 1
	M
	2, 0
	1, 5
	4, 4
	B
	1, 0
	2, 1
	3, 2
 
Para encontrar o equilíbrio de Nash, incialmente marca-se com (l), para cada estratégia do jogador B, na coluna, a melhor estratégia nas linhas para o jogador A. Analogamente, marca-se com (c), para cada estratégia do jogador A, na linha, a melhor estratégia nas colunas para o Jogador B. A combinação de estratégias onde houver simultaneamente assinalados (l) e (c) será um equilíbrio de Nash. Neste caso, é a combinação das estratégias T e E: {T, E}.
 
	
	Jogador B
	Jogador A
	E
	C
	D
	T
	(l) 3, 2 (c)
	0, 0
	1, 1
	M
	2, 0
	1, 5 (c)
	(l) 4, 4
	B
	1, 0
	(l) 2, 1
	3, 2 (c)
 
O equilíbrio da Nash e estratégias estritamente dominadas.
Seja a tabela abaixo, mais à esquerda, representando um jogo onde existem estratégias dominantes e dominadas. Nas transições 1 e 2 as estratégias dominadas do jogador A e do jogador B foram eliminadas, obtendo-se a tabela mais à direita, na qual fica evidente a solução do jogo. Esse é o exemplo apresentado na aula anterior.
 
	
	Jog. B
	1
->
	 
	Jog. B
	2
->
	 
	Jog. B
	Joga. A
	E1B
	E2B
	E3B
	
	Joga. A
	E1B
	E3B
	
	Joga. A
	E1B
	E3B
	E1A
	2, 4
	5, 2
	3, 4
	
	E1A
	2, 4
	3, 4
	
	E2A
	3, 2
	4, 3
	E2A
	3, 2
	1, 1
	4, 3
	
	E2A
	3, 2
	4, 3
	
	 
	 
	 
 
Determinando-se, para esse jogo, o equilíbrio de Nash, é possível notar, como já mencionado, que o resultado obtido é o mesmo, conforme mostra a tabela abaixo:
 
	
	Jog. B
	Joga. A
	E1B
	E2B
	E3B
	E1A
	2, 4 (c)
	(l) 5, 2
	3, 4 (c)
	E2A
	(l) 3, 2
	1, 1
	(l) 4, 3 (c)
 
Esse jogo tem uma característica relevante. Se um jogo apresenta um equilíbrio em estratégias estritamente dominantes, esse equilíbrio é necessariamente o que se denomina equilíbrio estrito de Nash.
 
O que é o equilíbrio estrito de Nash?
Como mostrado acima, se um jogo apresenta um equilíbrio em estratégias dominantes (obtido, por exemplo, pelo EIEED), esse equilíbrio é também denominado de equilíbrio estrito de Nash. Além do mais, esse equilíbrio é denominado também de equilíbrio estrito de Nash, visto que a estratégia encontrada no equilíbrio para um jogador resulta em uma recompensa estritamente maior do que qualquer outra estratégia que ele possa adotar frente às estratégias dos outros jogadores, sendo isso válido para qualquer jogador (no caso acima, tanto para A quanto para B). Ou seja, o equilíbrio estrito de Nash é o único equilíbrio.
Em contrapartida, quando não existem estratégias dominantes, pode-se encontrar mais de um equilíbrio de Nash, como na tabela abaixo, que é uma versão de tabela anterior com pequena alteração nas recompensas. Nota-se que existem dois equilíbrios, e é necessário então escolher entre os dois (neste caso, apesar do equilíbrio, uma escolha é melhor que a outra para cada jogador: é preciso algum critério adicional, externo, para escolher). Como será visto em uma próxima aula, o conceito de ponto focal poderá auxiliar na escolha.
 
	
	Jogador B
	Jogador A
	E
	C
	D
	T
	(l) 3, 2 (c)
	0, 0
	1, 1
	M
	2, 0
	1, 5 (c)
	(l) 4, 4
	B
	1, 0
	(l) 2, 3 (c)
	3, 2
 
Equilíbrio de Nash e o ótimo de Pareto.
O equilíbrio de Nash permite a cada jogador adotar individualmente uma melhor estratégia frente às estratégias dos outros, mas não necessariamente garante que a situação resultante das decisões conjuntas seja a melhor possível, ou seja, não garante um ótimo de Pareto.
Um ótimo de Pareto define uma situação onde, se um agente (jogador) alterar a condição para uma condição melhor, a condição dos outros agentes envolvidos não é deteriorada: permanece igual, ou também pode melhorar.
Seja o jogo representado na tabela abaixo. O Equilíbrio de Nash foi obtido na combinação de estratégias {E1A, E1B}, mas é possível perceber que combinação {E2A, E2B} é claramente um ótimo de Pareto. Por que isso ocorreu? Trata-se de um jogo simultâneo, onde não há conhecimentomútuo das decisões. A única solução que garante 100% de ganho para ambos os jogadores, independentemente da decisão do outro, é a do equilíbrio de Nash. Mas se os jogadores puderem combinar as estratégias, e forem leais, a solução de Pareto pode ser considerada.
 
	
	Jogador B
	Jogador A
	E1B
	E2B
	E1A
	(l) 3, 4 (c)
	(l) 6, -1
	E2A
	-1, 6 (c)
	4, 5
 
Não deixe de ver o pdf da apresentação desta aula, onde outros exemplos e mais explicações sobre os assuntos abordados estão disponíveis.
 
 
Vá mais Longe
· Ler o Capítulo 3, das páginas 93 até 103, da referência 1 (disponível na web).
· Ler o Capítulo 1, das páginas 13 até 15, da referência 2 (biblioteca virtual).
· Ler a Unidade 4, das páginas 129 até 134, da referência 3 (biblioteca virtual).
 
Ver o vídeo abaixo sobre o equilíbrio de Nash.
· Dilema dos prisioneiros e equilíbrio de Nash,
Dilema dos prisioneiros e equilíbrio de Nash | Microeconomia | Khan Academy (Links para um site externo.)
 
Agora é sua Vez
Seja a tabela abaixo, que representa um jogo simultâneo. Encontre a solução para esse jogo.
 
	
	Jogador B
	Jogador A
	E
	C
	D
	T
	3, 2
	0, 0
	1, 1
	M
	3, 0
	1, 5
	4, 3
	B
	1, 0
	4, 4
	3, 2
 
Veja a resposta logo abaixo, mas antes procure responder e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
 
Referências
1. FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
2. FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
3. IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.
AULA 05.
Múltiplos Equilíbrios de Nash
 
O que são equilíbrios de Nash múltiplos?
Seja o jogo simultâneo abaixo. Trata-se de um jogo onde ocorre mais de um equilíbrio de Nash. Os equilíbrios expressam situações em que os jogadores não têm nenhum estímulo para mudar suas decisões, podendo se acomodar em uma situação que não necessariamente seja a melhor para alguns deles, como o exemplo em questão.
 
	
	Jogador B
	Jogador A
	E
	C
	D
	T
	(l) 3, 2 (c)
	0, 0
	1, 1
	M
	2, 0
	1, 5 (c)
	(l) 4, 4
	B
	1, 0
	(l) 2, 3 (c)
	3, 2
 
A pergunta que se faz é: em qual dos equilíbrios os jogadores irão se acomodar? É necessário mais alguma informação que esteja disponível a ambos os jogadores e que possa induzi-los a escolher um dos equilíbrios possíveis.
 
O que é um ponto focal?
Justamente o conceito de ponto focal irá responder à pergunta anterior: onde os jogadores vão se acomodar dentro dos equilíbrios de Nash possíveis?
Vamos supor que ambos os jogadores têm acesso a um mesmo canal de comunicação relacionado às estratégias adotadas pelos jogadores. Vamos supor também que as estratégias estão relacionadas com atividades de um negócio, e que o canal de comunicação prevê uma tendência de mercado que irá induzir o jogador A a ser obrigado em adotar a estratégia T. Também sabedor disso, o jogador B tenderá então a escolher a estratégia E, e ambos acabarão a se acomodar no equilíbrio {T, E}.
Assim, o conceito de ponto focal relaciona-se com algum elemento que se destaca no contexto em que os jogadores estão inseridos, e que permite a eles coordenarem suas decisões em um,opa
maravilha
dentre os vários equilíbrios de Nash possíveis. Para tal, é necessário existir um conhecimento comum ou experiência compartilhada entre os jogadores relativos ao elemento em questão no contexto do jogo para ele poder ser um ponto focal. Normalmente, para esse conceito melhor se aplicar, a interação deve ocorrer em pequenos grupos, onde é mais fácil de ocorrer o compartilhamento de conhecimento ou experiências.
 
O que é a batalha dos sexos?
Na teoria dos jogos, a batalha dos sexos representa um jogo de coordenação entre dois jogadores. Imaginemos que um casal concordou em se encontrar de noite, mas ainda não se decidiu se irá ao teatro ou a uma partida de futebol, e não tem nenhum conhecimento comum que possa auxiliar na decisão (ponto focal). O marido prefere ir ao jogo de futebol. A esposa prefere ir a teatro. Ambos preferem ir para ao mesmo lugar juntos ao invés de separados. Se eles não conseguem se comunicar, para onde devem ir? Esse jogo é representado pela tabela abaixo.
 
	
	Esposa
	Marido
	Ir ao futebol
	Ir ao teatro
	Ir ao futebol
	(l) 2, 1 (c)
	0, 0
	Ir ao teatro
	0, 0
	(l) 1, 2 (c)
 
Uma possível forma de resolução da dificuldade na escolha de um dos equilíbrios de Nash seria descobrir um ponto focal (final de campeonato ou uma boa avaliação da peça) ou, em sua forma mais simples, ambos concordarem em fazer uma escolha aleatória jogando uma moeda: escolher futebol, no caso de cara, ou teatro, no caso de coroa. Uma vez que o resultado da moeda é revelado, nem o marido nem a esposa têm incentivo para alterar as ações propostas, pois isso resultaria em descoordenação e menor recompensa (0,0) do que simplesmente aderir às estratégias acordadas. O resultado é que a coordenação perfeita normalmente é alcançada nesse tipo de jogo.
 
O que é o dilema dos prisioneiros?
O dilema do prisioneiro é um exemplo clássico de um jogo que mostra por que dois indivíduos completamente racionais podem não cooperar, mesmo que possa ser de seu interesse fazê-lo. Trata-se de um jogo de interesse próprio versus cooperação.
Nesse jogo, dois membros de uma quadrilha criminosa, A e B, são presos. Cada prisioneiro está em total isolamento, sem meios de se comunicar com o outro. Os promotores não têm provas suficientes para condenar o par pela acusação principal, mas eles têm o suficiente para condenar ambos por uma acusação menor. Simultaneamente, os promotores oferecem a cada prisioneiro uma barganha. Cada prisioneiro tem a opção de trair o outro, testemunhando que o outro cometeu o crime, ou de cooperar com o outro, permanecendo em silêncio. Os possíveis resultados são:
· se A e B traem um ao outro, cada um deles cumpre dois anos de prisão;
· se A trai B, mas B permanece em silêncio, A será libertado (ou terá uma pena menor: existem variações desse enunciado) e B cumprirá três anos de prisão (e vice-versa);
· se A e B permanecerem calados, ambos servirão apenas um ano de prisão.
 
	
	Preso B
	Preso A
	Trair
	Não trair
	Trair
	(l) -2, -2 (c)
	(l) 0, -3
	Não trair
	-3, 0 (c)
	-1, -1
Como trair um parceiro oferece uma recompensa maior do que cooperar com ele, todos os prisioneiros egoístas puramente racionais trairão o outro, o que significa que o único resultado possível para dois prisioneiros puramente racionais é que eles se traiam. Entretanto, se houvesse a possibilidade de combinação, ambos poderiam optar por não trair desde que existisse lealdade (mesmo assim, poderia ser um risco).
 
O que é o jogo da "galinha"?
O jogo da galinha é um jogo que modela o conflito entre dois jogadores na teoria dos jogos. O princípio do jogo é que, embora o resultado bom para um jogador seja ceder (para evitar o pior resultado, se o outro não ceder), os jogadores tentam evitá-lo por orgulho, por não quererem parecer um fraco, uma "galinha". Assim, cada jogador provoca o outro para aumentar o risco de vergonha em ceder. No entanto, quando um jogador cede, o conflito é evitado e o jogo normalmente termina.
 
	
	Jogador B
	Jogador A
	Não Ceder
	Ceder
	Não Ceder
	-2, -2
	(l) 2, -1 (c)
	Ceder
	(l) -1, 2 (c)
	0, 0
O nome "galinha" tem suas origens em um jogo no qual dois pilotos dirigem um contra o outro, em rota de colisão: um deve desviar ou ambos podem morrer no acidente, mas se um motorista desvia e o outro não, aquele que desviou será chamado de "galinha", significando um covarde; essa terminologia é mais prevalente na ciência política e na economia. Esse tipo de jogo também foi usado para descrever a destruição mútua garantida numa guerra nuclear, como na crise dos mísseis em Cuba, ocorrida em 1962, na época da Guerra Fria.
Uma vez que o jogo seja caracterizado como sendo desse tipo, os participantes tenderão a criar mecanismos para evitar o confronto (como ocorreu na crise dos mísseis).
 
O que é o jogo da caça ao cervo?
Na teoria dos jogos, a caça ao cervo é um jogo que descreve um conflitoentre segurança e cooperação social. Outros nomes para ele ou suas variantes incluem "jogo de garantia", "jogo de coordenação" e "dilema de confiança". O filósofo francês Jean-Jacques Rousseau propôs esse jogo através da descrição de uma situação em que dois indivíduos saem em uma caçada. Cada um pode escolher individualmente caçar um cervo ou caçar uma lebre. Cada jogador deve escolher uma ação sem saber a escolha do outro. Se um indivíduo caça um cervo, ele deve ter a cooperação de seu parceiro para ter sucesso. Um indivíduo pode caçar uma lebre sozinho, mas uma lebre vale menos que um cervo. Esse jogo é considerado uma analogia útil para a cooperação social, como entre sócios em uma sociedade comercial.
 
	
	Caçador B
	Caçador A
	Caçar cervo
	Caçar lebre
	Caçar cervo
	(l) 3, 3 (c)
	0, 1
	Caçar lebre
	1, 0
	(l) 1, 1 (c)
A caça ao cervo difere do dilema do prisioneiro, pois existem dois equilíbrios puros de estratégia de Nash: quando os dois jogadores cooperam e os dois desertam para caçar a lebre. No dilema do prisioneiro, em contraste, apesar do fato de os dois jogadores cooperarem serem eficientes em termos de Pareto, o único equilíbrio puro de Nash é quando os dois jogadores decidem trair.
Não deixe de ver o pdf da apresentação desta aula, onde outros exemplos e mais explicações sobre os assuntos abordados estão disponíveis.
 
 
Vá mais Longe
· Ler o Capítulo 3, das páginas 103 até 115, da referência 1 (disponível na web).
· Ler o Capítulo 1, das páginas 15 até 17, da referência 2 (biblioteca virtual).
 
 
Agora é sua Vez
Seja a tabela abaixo, que representa um jogo simultâneo. Responda os itens abaixo:
1. Algum jogador possui alguma estratégia dominante?
2. Existe algum equilíbrio de Nash? Quantos?
3. Caso exista um equilíbrio de Nash, ele é ótimo de Pareto?
4. Caso exista um equilíbrio de Nash, ele é estrito?
 
	
	Jogador B
	Jogador A
	B1
	B2
	A1
	3, 2
	4, 3
	A2
	1, 0
	5, 2
 
Veja a resposta logo abaixo, mas antes procure resolver e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
Referências
1. FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
2. FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
3. IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.
AULA 06.
Jogos de Soma Zero
 
O que são jogos de soma zero e como são representados?
Na Teoria dos Jogos, um jogo de soma zero é uma representação matemática de uma situação em que os ganhos ou perdas de cada participante é exatamente equilibrado pelas perdas ou ganhos dos outros participantes, de sorte que a soma dos ganhos e perdas em cada combinação de estratégias é nula. Ou seja, se os ganhos totais dos participantes forem somados e as perdas totais subtraídas, o resultado será zero. A representação genérica para esse tipo de jogo é mostrada na matriz de recompensas abaixo.
 
	
	Jogador Coluna
	Jogador Linha
	B1
	B2
	A1
	R1, -R1
	R2, -R2
	A2
	R3, -R3
	R4, -R4
 
Para simplificar a representação, costuma-se mostrar apenas a recompensa do jogador na linha.
 
	
	Jogador Coluna
	Jogador Linha
	B1
	B2
	A1
	R1
	R2
	A2
	R3
	R4
 
O que são os critérios maximin e minimax para resolução de jogos de soma zero?
Uma premissa importante no contexto de jogos de soma zero é que todo jogador deve ser pessimista, ou seja, toda vez que um jogador (ou jogadores) visar maximizar a sua recompensa, ele estará automaticamente visando minimizar a recompensa do outro jogador.
Com isso em mente, para cada estratégia passível de ser adotada pelo jogador linha, ele deve se concentrar na menor recompensa que ele poderia receber ao adotá-la, e optar pela estratégia que produz o máximo dessa menor recompensa, ou seja, o máximo do mínimo. A maximização da menor recompensa recebe a denominação de critério maximin. Com esse critério, o jogador linha terá a garantia de receber uma recompensa de, no mínimo, rmin = maximinj{rij}: máximo entre as recompensas mínimas de cada linha. Foi Von Neumann que desenvolveu o teorema que leva a esses critérios.
Já o jogador coluna, avaliando as recompensas do jogador linha, irá procurar minimizar a máxima recompensa deste jogador. Por buscar minimizar a maior recompensa do jogador da linha, esse critério recebe a denominação de critério minimax. Com esse critério, o jogador coluna terá a garantia de que o jogador linha não receberá um payoff maior que rmax = minimax{pij}: mínimo entre as recompensas máximas de cada coluna.
Se, ao aplicar os critérios maximin e minimax, for observado que r = rmin = rmax, então o jogo tem solução estritamente determinada para as estratégias correspondentes a essa recompensa. Neste caso, caracteriza-se um jogo de estratégias puras: uma das estratégias disponíveis para cada jogador é escolhida com certeza. O jogo da batalha de Bismarck (ver pdf da apresentação da aula) é um exemplo de um jogo desse tipo.
Entretanto, se a aplicação dos critérios maximin e minimax levar a  rmin ≠ rmax, então cada jogador poderá, para se beneficiar de alguma forma, aplicar uma ou outra estratégia com alguma probabilidade específica, o que irá constituir um jogo de estratégias mistas. O jogo das moedas (ver pdf da apresentação da aula) é um exemplo de um jogo desse tipo.
Como aplicar estratégias puras (batalha do mar de Bismarck)?
Este jogo está descrito na apresentação (vídeo ou pdf) desta aula.
Sobre jogos com estratégias puras estritamente competitivos, cabem os comentários abaixo.
· Os jogadores identificam suas estratégias maximin/minimax e as reproduzem.
· Nenhum jogador irá mudar de ideia para tentar enganar o outro, tentando "descobrir" a estratégia de seu oponente ou enganá-lo sobre a sua própria.
· Nenhum jogador vai se arrepender de sua escolha estratégica, porque o resultado é sempre uma “estratégia pura” (Equilíbrio de Nash).
 Como aplicar mistas (jogo das moedas)?
Este jogo está descrito na apresentação (vídeo ou pdf) desta aula.
Sobre jogos com estratégias mistas estritamente competitivos, o Teorema de Von Neumann diz que, se estratégias mistas são permitidas em jogos de soma zero, o par de estratégias mistas que é ótimo de acordo com o critério minimax fornece uma solução estável em rmin = rmax para dado par de probabilidades (no jogo das moedas, p=q=1/2), de tal maneira que nenhum jogador pode melhorar sua situação mudando sua estratégia.
 
Com aplicar estratégias mistas em jogos não estritamente competitivos (jogo da guerra fria)?
Este jogo está descrito na apresentação (vídeo ou pdf) desta aula.
Não deixe de ver o pdf da apresentação desta aula, onde outros exemplos e mais explicações sobre os assuntos abordados estão disponíveis.
 
 
Vá mais Longe
Ler o Capítulo 5 da referência 1 (disponível na web).
 
Ver o vídeo abaixo sobre jogos de soma zero.
· Teoría de Juegos de suma cero - maximin-minimax (está em espanhol: ativar legendas e configurar a tradução automática para o português),Teoría de Juegos de suma cero. Maximin-minimax (Links para um site externo.)
 
 
Agora é sua Vez
Duas empresas, A e B, disputam certo mercado, e cada uma delas tem a possibilidade de lançar apenas um novo produto dentre quatro novos possíveis. A tabela de recompensas abaixo mostra o ganho possível à empresa A para cada combinação de lançamentos com a empresa A, lembrando que, se a empresa A ganha mercado, a empresa B perde mercado na mesma proporção (soma zero). Pergunta-se: existe solução para esse jogo em estratégias puras pelo método minimax-maximin?
 
	
	Empresa B
	Empresa A
	B1
	B2
	B3
	B4
	A1
	10
	20
	15
	30
	A2
	40
	30
	50
	55
	A3
	35
	25
	20
	40
	A4
	25
	15
	35
	60
 
Veja a resposta logo abaixo, mas antes procure responder e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
Referências
1. FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
2. FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
3. IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.AULA 07.
Modelo de Cournot
 
O que é o modelo de Cournot e quando surgiu?
Antoine Augustin Cournot (1801-1877) esboçou sua teoria da competição em seu volume de 1838, Recherches sur les Principes Mathematiques of the Theorie des Richesses, como uma maneira de descrever a competição em um mercado de água de nascente dominado por dois fornecedores (um duopólio). Especificamente, Cournot construiu funções de lucro para cada empresa e, em seguida, usou a diferenciação parcial para construir uma função que representa a melhor resposta de uma empresa para determinados níveis de produção das outras empresas no mercado (problema de otimização multivariável). Ele então mostrou que um equilíbrio estável ocorre onde essas funções se cruzam, que corresponde à solução simultânea das melhores funções de resposta de cada empresa em relação à(s) outra(s).
A consequência disso é que, em equilíbrio, as expectativas de cada empresa, de como outras empresas agirão, são mostradas de forma correta, e quando tudo é revelado, nenhuma empresa terá o desejo de alterar sua decisão de produção. Essa ideia de estabilidade foi posteriormente adotada e construída como uma descrição de um equilíbrio de Nash, do qual os equilíbrios de Cournot seriam um subconjunto.
 
O que é derivada parcial?
Esse é um conceito matemático aplicado em problema de otimização. Fala-se em derivação parcial quando uma função é multivariável, porém as regras de derivação são as mesmas do que para função a apenas uma variável.
Seja a função a uma variável,
f ( x ) = 3 x + 2
A derivada primeira dessa função é:
d f d x = f ′ ( x ) = 3
Nesse caso, a derivada em relação a  x coincide com a derivada da função, pois não há outra variável em jogo.
Seja agora a função de duas variáveis,
f ( x 1 , x 2 ) = 3 x 1 + 2 x ( 2 2 )
Derivar parcialmente significa derivar a função em relação a uma variável considerando que as outras variáveis permanecem constantes (o que é verdade quando os eixos de coordenadas são ortogonais entre si). Neste caso, as derivadas parciais da função são:
a f a x 1 = 3 e   a f a x 2 = 4 x 2
A derivação parcial é utilizada para determinar o ponto extremo da função, que pode ser um máximo ou um mínimo, na análise de otimização.
 
O que é um problema de otimização?
Na essência, o modelo de Cournot é um problema de otimização, já que utiliza as técnicas da teoria clássica da otimização. Nessa teoria, tendo-se uma função do tipo f ( x 1 , . . . , x n ), multivariável, procura-se uma solução x ∗ = ( x 1 ∗ , . . . , x n ∗ ) tal que f ( x 1 ∗ , . . . , x n ∗ ) seja um valor máximo ou mínimo da função em dada região do domínio da função. Tal função pode representar a função lucro, que normalmente se deseja maximizar, ou a função custo que, para dado nível de produção de algum produto, deseja-se minimizar.
A condição de otimalidade requer que, no ponto extremo, todos as derivadas parciais da função sejam nulas, ou seja:
a f a x i = 0 , i = 1 , . . . , n
Para saber se o ponto é de mínimo ou máximo, é necessário analisar a matriz Hessiana,  H, dada por
Entretanto, dependendo da natureza da função, é possível saber de antemão a natureza do ponto extremo sem precisar analisar essa matriz, que por vezes é trabalhoso.
No caso do problema de Cournot, a análise irá procurar pela condição de maior lucro, e sabe-se que a função lucro normalmente sempre terá um máximo, de forma que apenas a derivação primeira será o suficiente para obter o ponto procurado.
 
O que está envolvido na resolução do Modelo de Cournot?
O modelo de Cournot baseia-se num jogo entre duas empresas (1 e 2) que fabricam produtos homogêneos (indiferenciáveis pelo consumidor em termos de qualidade) oferecidos em um mesmo mercado que disputam, sendo a escolha do consumidor baseada exclusivamente no preço. O objetivo é maximizar o lucro, definido como a diferença entre receitas e despesas, decidindo simultaneamente a quantidade que cada uma deve produzir conforme a demanda do mercado. Logo, trata-se de um problema de otimização.
Esse modelo está descrito na apresentação desta aula (vídeo e pdf), onde todas as considerações e equacionamento envolvidos na resolução do modelo são apresentados.
 
O modelo de Cartel é melhor?
Na apresentação desta aula (vídeo e pdf), o mesmo problema (produção de fábricas de cimento) é resolvido de duas formas. Na primeira, considera-se que não existe combinação prévia entre a quantidade total a ser produzida, e sim sobre quanto cada fabricante deve produzir para maximizar o seu lucro. Na segunda forma, consideram-se que os fabricantes formam um cartel, e a maximização ocorre sobre o total produzido pelo cartel, e não por cada empresa individualmente. Como resultado, a formulação da otimização sofre uma modificação, e o resultado do lucro para o cartel se torna maior do que para empresas concorrendo livremente, conforme as regras de mercado.
Entretanto, a formação de cartéis é uma prática notoriamente nociva para o mercado consumidor, sendo sua formação proibida em muitos países, além do fato de que cartéis são instáveis: a traição de uma empresa (alterando a sua produção), desrespeitando o acordo, pode aumentar mais ainda o seu lucro.
Assim, o equilíbrio de Nash, obtido no modelo de Cournot, é Pareto-ineficiente: as empresas, por coalizão (formação de cartel), podem aumentar seu lucro. Entretanto, existem as considerações acima que inibem que tais coalizões se estabeleçam.
Não deixe de ver o pdf da apresentação desta aula, onde outros exemplos e mais explicações sobre os assuntos abordados estão disponíveis.
 
 
Vá mais Longe
· Ler o Capítulo 4, das páginas 121 até 129, da referência 1 (disponível na web).
· Ler o Capítulo 2, das páginas 30 até 41, da referência 2 (biblioteca virtual).
· Ler a Unidade 4, das páginas 135 até 138, da referência 3 (biblioteca virtual).
 
Ver o vídeo abaixo sobre modelo de Cournot.
· 09_Modelo de Cournot (está em espanhol: ativar legendas e configurar a tradução automática para o português),09_Modelo de Cournot (Links para um site externo.)
 
 
Agora é sua Vez
Duas empresas estão num mercado em que a função de demanda é dada por
 
p = 122 − 0 , 5 ( q 1 + q 2 )
 
Calcule a produção de cada empresa no equilíbrio de Cournot para as seguintes situações:
1. funções de custo iguais, C 1 = 2 q 1 e C 2 = 2 q 2;
2. funções de custo diferentes, C 1 = 0 , 5 q 1 e C 2 = q 2.
Nota. Para funções de custo diferentes, q 1 ∗e q 2 ∗ são diferentes: q 1 ∗ = ( A + c 2 − 2 c 1 ) 3 b e q 2 ∗ = ( A + c 1 − 2 c 2 ) 3 b
Veja a resposta logo abaixo, mas antes procure resolver a equação e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
Referências
1. FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
2. FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
3. IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.
AULA 08.
Modelo de Bertrand
 
O que é o modelo de Bertrand e quando surgiu?
O modelo de competição de Bertrand, assim denominado em homenagem ao matemático francês Joseph Louis François Bertrand (1822–1900), descreve interações entre empresas, que definem os preços, e seus clientes que escolhem quantidades de produtos conforme os preços estabelecidos. O modelo foi formulado em 1883 por Bertrand em uma resenha do livro de Antoine Augustin Cournot, Recherches sur les Principes Mathématiques of the Théorie des Richesses (1838), onde Cournot havia apresentado o seu modelo. No modelo de Cournot as empresas escolhem quantidades que maximizem seus lucros, sendo o preço estabelecido pela demanda, enquanto no modelo de Bertrand as empresas escolhem os preços em vez de quantidades: o resultado competitivo ocorreria com preço igual ao custo, constituindo o paradoxo de Betrand.
O modelo de Bertrand baseia-se em suposições bem definidas. Existem pelo menos duas empresas produzindo um produto homogêneo (não diferenciado) e não podem cooperar de forma alguma. As empresas competem definindo preços simultaneamente, e os consumidores procuram comprartudo da empresa com o preço mais baixo (uma vez que o produto é homogêneo, não há outro fator além do preço para diferenciar). Caso as duas empresas pratiquem o mesmo preço, a demanda dos consumidores é dividida igualmente entre elas. Embora o modelo se concentre no caso do duopólio, onde existem apenas duas empresas, os resultados são válidos para qualquer número de empresas (maior ou igual a dois).
No modelo de Bertrand, assume-se que ambas as empresas têm o mesmo custo unitário de produção, constante. Isso significa que, desde que o preço definido esteja acima do custo unitário, a empresa está disposta a fornecer qualquer quantia exigida, pois obtém lucro por cada unidade vendida. Se o preço é igual ao custo unitário, então é indiferente o quanto a empresa vende, uma vez que não obtém lucro. Mas modelo de Bertrand leva a esse paradoxo, o que caracteriza uma competição acirrada e dura entre as empresas envolvidas, que devem eventualmente reduzir os preços a nível dos custos, por meio de uma série de subcotações para poder competir melhor.
 
Qual o resultado do modelo de Bertrand sem restrição de produção?
Nesse modelo a produção  q  é assumida como sendo uma função linear do preço p = q ( p ) = 100 − p, e os custos de produção das empresas são os mesmos, C ( q i ) = c q 1, onde  é o custo unitário. A função recompensa (preço x quantidade) nesse modelo é dada conforme a expressão abaixo (ver apresentação da aula).
Para esse modelo, quando a função custo é a mesma para ambos, só existe um par de preços que é a melhor reposta de um competidor em relação ao preço outro, e vice versa, estabelecendo-se um equilíbrio (lógica do equilíbrio de Nash): p i ∗ = p j ∗ = c. Ou seja, melhor ter lucro zero do que prejuízo. Esse resultado representa justamente o paradoxo de Bertrand mencionado anteriormente: tem-se um mercado caracterizado como um duopólio, porém produzindo o mesmo resultado de um mercado competitivo, que são preços idênticos a nível de custo.
Porém, deve-se notar que o resultado acima deixa de ser válido se as hipóteses de não haver diferenciação de produto, de não haver restrição de capacidade produtiva e de que as decisões são simultâneas, também deixarem de ser válidas. Essa situação de competição acirrada induz as empresas a otimizarem os seus processos visando, por exemplo, diminuir seus custos em relação aos concorrentes. Assim, havendo uma diferenciação de produto apenas no quesito custo, aquela empresa que conseguir ter um custo menor que a outra acaba por conquistar mais mercado por poder praticar um preço menor com algum lucro.
 
Qual o resultado do modelo de Bertrand com restrição de produção?
A diferença desse modelo está na limitação das empresas atenderem totalmente o mercado, o que leva a algumas situações interessantes na competição entre uma empresa 1 e a empresa 2.
Se a demanda q for definida pelo preço p,  segundo a expressão q ( p ) = 100 − p, e o limite de produção de cada empresa for de 60 unidades do produto, ocorrem as situações abaixo.
· Se o preço praticado pela empresa 1 for menor do que o da empresa 2, a empresa 1 vai atender a todo o mercado se esse preço for superior ou igual a 40 (limite da produção: 60=100-40), e a recompensa da empresa 2 é nula.
· Se os preços forem iguais (𝑝1=𝑝2), as empresas dividem o mercado.
· Se o preço praticado pela empresa 1 for maior que o da empresa 2, a empresa 2 vai atender a todo o mercado se seu preço for superior ou igual a 40 (limite da produção: 60=100-40), e a recompensa da empresa 1 é nula.
· Se o preço praticado pela empresa 1 for maior que o da empresa 2, a empresa 2 vai atender parte do mercado (60 unidades) se seu preço for inferior a 40 (limite da produção), restando à empresa 1 atender o restante do mercado. E vice-versa.
O modelo matemático que descreve as situações acima está descrito na apresentação da aula.
Do modelo matemático de Bertrand com restrição de produção chega-se a uma conclusão paradoxal: conforme a demanda, uma empresa praticando um preço mais alto pode ter um lucro maior do que a empresa praticando o preço mais baixo, que por sua vez pode ter lucro zero se o seu preço for igual ao de custo, conforme preconizado pelo modelo sem restrição de custo. Conforme mostrado na apresentação da aula, se o preço de uma empresa for o menor entre as duas empresas competindo, e for menor também do que o preço que define limite da produção, haverá uma demanda não atendida. Neste caso, existe espaço para a outra empresa atender parte da demanda não atendida pela empresa com preço mais baixo praticando um preço superior e tendo lucro (ver exemplo da apresentação). Assim sendo, ao contrário do modelo sem restrição, não é possível estabelecer um equilíbrio seguindo a lógica do equilíbrio de Nash para estratégias puras (existe equilíbrio em estratégias mistas, mas está fora do escopo de nosso estudo). Esse resultado foi percebido pela primeira pelo economista e estatístico irlandês Francis Y. Edgeworth (1845-1926) e, por isso, é conhecido também como o paradoxo de Edgeworth.
Não deixe de ver o pdf da apresentação desta aula, onde outros exemplos e mais explicações sobre os assuntos abordados estão disponíveis.
 
Vá mais Longe
· Ler o Capítulo 4, das páginas 134 até 142, da referência 1 (disponível na web).
· Ler o Capítulo 2, das páginas 41 até 48, da referência 2 (biblioteca virtual).
· Ler a Unidade 4, das páginas 135 até 138, da referência 3 (biblioteca virtual).
 
Agora é sua Vez
Duas empresas, A e B, estão num mercado em que a função de demanda é dada por  q(p) = 90 - p mensal, sendo a função de custo a mesma para ambas:  Ci =  6qi. A capacidade produtiva de cada empresa é de, no máximo, 50 unidades mês. Supondo que a empresa A resolva aumentar o seu preço para 8, acima do preço da empresa B, que pratica o preço de custo, qual seria o ganho mensal da empresa A?
 
Veja a resposta logo abaixo, mas antes procure resolver e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
Referências
1. FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
2. FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
3. IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.
AULA 09.
Equilíbrio de Nash em Jogos Sequenciais
Existe diferença entre as decisões tomadas em jogos simultâneos e em jogos sequenciais?
O estudo realizado até este ponto envolveu situações de interação estratégica em que cada jogador não tinha conhecimento das escolhas feitas pelos demais jogadores. Conforme Fiani (ref. 1), o conceito de equilíbrio de Nash é uma ferramenta fundamental para análise desse tipo de interação estratégica: quando os jogadores decidem sem conhecer antecipadamente as escolhas dos demais, uma situação de equilíbrio é aquela em que os jogadores estão adotando, todos eles, as melhores respostas possíveis ao que os demais podem vir a fazer. Nesse caso, ninguém ganharia nada se alterasse sua escolha. É nesse sentido que há um equilíbrio.
Porém, há situações em que os jogadores efetivamente tomam suas decisões conhecendo antecipadamente as escolhas dos demais jogadores. Um exemplo é o no jogo de xadrez: ao chegar à sua vez de jogar, cada jogador conhece as decisões anteriores de seu adversário. Desse modo, ao tomarem suas decisões, os jogadores possuem maior informação do que aquela que é suposta ao modelarmos uma situação de interação estratégica como um jogo simultâneo. Assim, considerando sempre que os jogadores são racionais, não se pode supor que os jogadores tomem suas decisões ignorando o que os demais jogadores decidiram nas etapas anteriores do jogo, uma vez que seja possível ter o acesso a essa informação. Isso seria o equivalente a imaginar um jogador de xadrez que toma suas decisões sem considerar os movimentos feitos pelo seu adversário até ali.
Desse modo, a informação de que um jogador dispõe acerca das decisões dos demais jogadores pode alterar de forma bastante significativa as opções do jogador que tem de tomar suasdecisões em uma dada etapa do jogo.
Como realizar a análise do equilíbrio em jogos sequenciais?
Em jogos sequenciais é feita uma análise considerando os subjogos que podem ser identificados dentro do jogo em si. Conforme Fiani (ref. 1), o conceito de subjogo está relacionado aos possíveis desdobramentos de um processo de interação estratégica em que os jogadores tomam suas decisões em uma ordem predeterminada. O conhecimento dos diversos subjogos em um jogo sequencial permitirá encontrar o equilíbrio de Nash perfeito para esse tipo de jogo.
O que é um subjogo?
Um subjogo é qualquer parte de um jogo na forma extensiva (árvore) que obedece às seguintes condições:
· sempre se inicia em um único nó de decisão;
· sempre contém todos os nós que se seguem ao nó no qual ele se iniciou;
· se contiver qualquer nó de um conjunto de informação, ele conterá todos os nós do conjunto de informação.
A figura abaixo mostra os subjogos em um jogo (o jogo como um todo também é considerado um subjogo).
Fonte: ref. 4.
 
Como encontrar o equilíbrio de Nash perfeito em subjogos?
Seja o seguinte jogo: o jogador A precisa decidir entre subir ou descer, enquanto o jogador B precisa decidir entre ir para a esquerda ou direita. Nesse caso, pode-se representar este jogo usando a forma normal ou estratégica, estabelecendo todas as estratégias possíveis para o jogador B:
· ir para a direita se o jogador A subir, ir para a esquerda caso A desça;
· ir para a esquerda se o jogador A subir, ir para a direita caso A desça;
· ir para a direita, independentemente da decisão de A;
· ir para esquerda, independentemente da decisão de A.
Assim, para esse jogo, as duas representações (normal e extensiva), com as respectivas recompensas, são mostradas abaixo.
 
Ao se pesquisar o equilíbrio deste jogo, considerado como um todo, descobre-se que {Subir, Esquerda} é um equilíbrio de Nash (figura abaixo). No entanto, não é um equilíbrio perfeito, pois {Descer, Direita} também é um equilíbrio de Nash:
 
Para encontrar o equilíbrio de Nash perfeito em subjogos, é necessário realizar o processo de indução inversa, começando no último lance do jogo, depois prosseguindo para o penúltimo lance, e assim por diante, eliminado a pior opção para o jogador do respectivo lance. Nesse problema, sabe-se que o jogador B escolherá esquerda se o jogador A subir, e direita se o jogador A descer, pois esses são os movimentos que maximizam sua recompensa. Assim, as outras possibilidades são eliminadas (figura a seguir). Como há informação completa (isto é, as recompensas de cada jogador são conhecidas), o jogador A conhece essas opções com antecedência e, portanto, decide descer, porque o pagamento será maior. Portanto, {Descer, Direita} é o equilíbrio perfeito desse jogo (verde).
 
 
Não deixe de ver o pdf da apresentação dessa aula, onde outros exemplos e mais explicações sobre os assuntos abordados estão disponíveis.
 
Vá mais Longe
· Ler o Capítulo 6, páginas 215 até 233, da referência 1 (disponível na web).
· Ler o Capítulo 6, páginas 111 até 121, da referência 2 (Biblioteca Virtual).
· Ler a Unidade 4, páginas 141 até 142, da referência 3 (Biblioteca Virtual).
· Ver o vídeo abaixo sobre equilíbrio de Nash Perfeito em Subjogos.
Teoria dos Jogos - Equilíbrio de Nash Perfeito em Subjogos - Jogo sequencial,Teoria dos Jogos - Equilibrio de Nash Perfeito em Subjogos - Jogo sequencial (Links para um site externo.)
Agora é sua Vez
Algumas vezes os jogos sequenciais podem envolver etapas em que os jogadores tomam suas decisões sem conhecer as decisões dos demais jogadores. Nesses casos, os jogadores enfrentam nesse tipo de etapa uma situação igual à que enfrentam em um jogo simultâneo. Considere assim o jogo abaixo:
 
Fonte: ref. 1
Nesse jogo há dois jogadores, denominados simbolicamente I e II. I possui duas ações possíveis no início do jogo, "a" e "b", e duas ações possíveis na terceira e última etapa do jogo, quando I não sabe o que II decidiu: "c" e "d". II possui duas ações possíveis na segunda etapa do jogo, exatamente as ações que I não pode observar: "a" e "b". As recompensas de cada jogador estão indicadas nos nós terminais. Pede-se:
A) representar o jogo na forma estratégica;
B) identificar os subjogos do jogo;
C) encontrar o equilíbrio perfeito (sugestão: determine o equilíbrio de Nash no subjogo em que há um conjunto de informação que não é unitário tratando esse subjogo como um jogo simultâneo).
 
Veja a resposta logo abaixo, mas antes procure resolver e discutir com os colegas no Fórum da Disciplina.
Resposta A
 
Resposta B
 
Resposta C
 
Referências
FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.
Subgames. Disponível em: https://policonomics.com/subgame-equilibrium/ (Links para um site externo.). Acesso: 28/02/2020.
 
AULA 10.
Avaliando ameaças e promessas em Jogos Sequenciais
Como avaliar se ameaças ou promessas são críveis?
Uma ameaça não é crível se, caso ocorra a situação em que se faça necessário efetivá-la, não seja do interesse do jogador que a realizou levá-la a cabo. O equilíbrio encontrado no jogo sequencial auxilia nessa análise. Somente ameaças que, caso tenham de ser efetivadas, sejam do interesse do jogador que as fez realmente concretizá-las devem ser levadas a sério.
O mesmo raciocínio empregado na avaliação de ameaças se aplica para avaliar promessas. Somente são críveis as promessas feitas por um jogador que, caso se apresente a situação em que terá de cumpri-las, realmente tenha interesse em mantê-las. Caso contrário, ou seja, se, ao ser alcançado o subjogo em que o jogador que fez as promessas tem de escolher se as cumpre ou não, e se esse jogador obtiver uma recompensa maior ao deixar de cumprir as promessas, essas promessas não serão críveis.
Na apresentação dessa aula há exemplos de ameaças e promessas que não são críveis.
 
De que forma se pode tornar uma ameaça ou promessa crível?
Tornar ameaças ou promessas críveis passa pela realização de movimentos estratégicos que, segundo Fiani (ref. 1), são ações adotadas pelos jogadores que visam alterar alguma característica do jogo, em geral a ordem em que os jogadores jogam ou as recompensas dos jogadores. Um movimento estratégico é uma ação adotada por um dos jogadores, que se move primeiro, buscando com esse primeiro movimento mudar o desenvolvimento do jogo a seu favor. Essa mudança do desenvolvimento do jogo a seu favor pode-se dar por uma alteração na ordem em que os jogadores inicialmente jogariam, ou por uma modificação nas recompensas dos jogadores, ou pelas duas coisas ao mesmo tempo. A ideia é que a mudança no desenvolvimento do jogo seja suficiente para tornar a ameaça ou a promessa crível.
 
Como seria um exemplo onde uma ameaça ou promessa seja crível?
Vamos analisar uma extensão do “jogo da entrada” (visto na aula anterior), denominado “jogo da prevenção da entrada”, conforme Fiani (ref. 1). A diferença está na inclusão de uma decisão da empresa Dominante antes do início do jogo: a de investir ou não em capacidade produtiva através de ativos específicos, que tornam a capacidade produtiva inflexível, ou seja, voltada apenas para o produto em questão. Isso significa que o custo desse investimento é perdido caso de perda mercado.
Com essa nova decisão prévia para a Dominante, a representação desse novo jogo fica representado como abaixo.
(Adaptado da ref. 1)
 
No jogo original (“jogo da entrada”) foi identificado que a ameaça da Dominante é lutar caso a Desafiante entrasse não fosse crível. Para saber se esse contexto muda, a seguir o “jogo da prevenção da entrada” é resolvido por indução inversa.
O primeiro passo da resolução é eliminar as piores estratégias finais para a Dominante (abaixo).
 
Agora, eliminam-se as piores estratégias para a Desafiante (abaixo).
 
Da figura acima, conclui-se que a melhor opção para a Dominante, considerado todoo desdobramento que se segue no jogo, é escolher uma capacidade de produção inflexível, e assim assegurar a maior recompensa (de 8 milhões). Em outras palavras, a Dominante escolhe uma capacidade inflexível e, com isso, lutar no caso de entrada da Desafiante se torna mais interessante do que acomodar. Neste caso, a ameaça de lutar é crível. Por esse motivo, a Desafiante não entra. Com seu primeiro movimento, um movimento estratégico, ao escolher ativos específicos que geram custos irrecuperáveis e tornam a capacidade produtiva inflexível, a Dominante alterou o desenrolar do jogo, impedindo a entrada da Desafiante.
 
Não deixe de ver a apresentação dessa aula, onde outros exemplos e mais explicações sobre os assuntos abordados estão disponíveis.
 
Vá mais Longe
· Ler o Capítulo 6, páginas 234 até 249, da referência 1 (disponível na web).
· Ler o Capítulo 6, páginas 121 até 122, da referência 2 (biblioteca virtual).
 
Agora é sua Vez
Duas importantes emissoras estão concorrendo entre si para obter índices de audiência no horário entre 20 e 21 horas e entre 21 e 22 horas, em uma determinada noite na semana. Cada uma delas, preparando-se para a disputa, conta com dois programas para preencher esses horários. Elas poderão veicular seu programa “principal” no primeiro horário (20-21h) ou no segundo horário (21-22h). As possíveis combinações de decisões levam aos resultados abaixo em termos de “pontos de audiência”:
 
 
Suponha que os administradores das duas empresas se reúnam para coordenar suas programações e a Emissora 1 prometa apresentar seu programa principal no primeiro horário. Essa promessa é crível? Qual é o resultado mais provável?
 
Veja a resposta logo abaixo, mas antes procure resolver e discutir com os colegas no Fórum da Disciplina.
Resposta
 
 
Referências
FIANI, Ronaldo. Teoria dos Jogos. 3ª ed. Rio de Janeiro: Editora Campus, 2009.
FERNANDES, Luis; BIERMAN, H. Scott. Teoria dos jogos. 2ª ed. São Paulo: Pearson Prentice Hall, 2011.
IZIDORO, C. (org.). Métodos Quantitativos. São Paulo: Pearson Education do Brasil, 2015.

Outros materiais