Prévia do material em texto
TEORIA DOS JOGOS Microeconomia II 2015 DEFINIÇÕES Uma maneira formal de se analisar interações entre agentes racionais que agem estrategicamente. Um conjunto de técnicas para prever o resultado da interação de agentes na qual a ação de um participante diretamente afeta a recompensa dos outros participantes. O QUE É TEORIA DOS JOGOS? Jogos de soma zero O interesse de cada jogador está em conflito com o outro. Ou seja, qualquer jogo que exista um vencedor e um perdedor como, por exemplo, futebol e xadrez. Jogos de soma não zero O interesse dos jogadores não está sempre em conflito havendo possibilidade dos dois jogadores ganharem. TIPOS DE JOGOS Há dois ou mais jogadores Há uma escolha estratégica de ações Há um ou mais resultados Há interação estratégica, ou seja, o resultados depende da estratégia escolhida pelos jogadores. Deste modo nós não estudaremos jogos de sorte como loteria nos quais a estratégia não faz a menor diferença, nem jogos de apenas um jogador no qual o jogador não interagem estrategicamente com outros jogadores. CARACTERÍSTICAS DOS JOGOS Jogador: qualquer indivíduo, grupo ou organização envolvidos no processo de interação estratégica e que tenha autonomia para tomar decisões. Ação ou Movimento: é uma escolha que o jogador pode fazer em um dado momento do jogo. Conjunto de Ações: conjunto que descreve todas as possíveis ações de um jogador. DEFINIÇÕES Por exemplo, em um jogo que dois bancos estão decidindo se renovam ou não o empréstimo de uma firma devedora que está tendo problema para pagar o empréstimo o conjunto de ações de cada banco é composto por duas ações: renova o empréstimo e não renova o empréstimo. Assim o conjunto de ação do banco A pode ser escrito como: 𝐴𝐴={Renova o empréstimo, Não renova o empréstimo} Deste modo, qual seria o conjunto de ações do banco B? Qual o conjunto de ações do jogador 1 em um jogo zero ou um? CONJUNTO DE AÇÕES - CONTINUAÇÃO Em um jogo em que cada jogador é identificado por um subíndice i, no qual i=1,2,..,n, o conjunto de ações do i-ésimo jogador lista todas as ações disponíveis para aquele jogador. Esse conjunto de ações é representado por: 𝑨𝒊{𝒂𝒊} Conhecer o conjunto de ações de cada jogador é um passo fundamental na análise de um processo de interação estratégica. Ao avaliar a melhor ação, cada jogador considera não apenas toas as ações relevantes que dispões, mas também todas as ações relevantes disponíveis para os demais jogadores. CONJUNTO DE AÇÕES - GENERALIZANDO Estratégia : um plano de ações que especifica, para um determinado jogador, que ação tomar em todos os momentos em que ele terá de decidir o que fazer. Conjunto de Estratégias ou Espaço de Estratégias : conjunto de estratégias que cada jogador dispõe. Por exemplo, em um jogo que a empresa inovadora está decidindo antes se lança um produto novo ou não e a empresa l íder decidindo depois se mantém ou reduz o preço do seu produto antigo, o conjunto de estratégias da empresa inovadora é: 𝑆 𝑖𝑛𝑜𝑣𝑎𝑑𝑜𝑟𝑎 = {𝑙𝑎𝑛ç𝑎 𝑜 𝑝𝑟𝑜𝑑𝑢𝑡𝑜 𝑛𝑜𝑣𝑜, 𝑛ã𝑜 𝑙𝑎𝑛ç𝑎 𝑜 𝑝𝑟𝑜𝑑𝑢𝑡𝑜 𝑛𝑜𝑣𝑜} No caso do jogo dos bancos que decidem renovar ou não o empréstimo da firma devedora o conjunto de estratégias dos dois bancos coincide com o conjunto de ações dos dois bancos. CONJUNTO DE ESTRATÉGIAS Como a empresa líder decidindo depois da empresa inovadora se mantém ou reduz o preço do seu produto antigo, o conjunto de estratégias da empresa líder é um pouco mais complexo: 𝑆 𝑙í𝑑𝑒𝑟 = {mantém o preço se inovadora lança produto novo, mantém o preço se inovadora não lança o produto novo; reduz o preço se inovadora lança produto novo, mantém o preço se inovadora não lança o produto novo; mantém o preço se inovadora lança produto novo, reduz o preço se inovadora não lança o produto novo; reduz o preço se inovadora lança produto novo, reduz o preço se inovadora não lança o produto novo} O conjunto de estratégia da empresa líder é mais complexo porque o conjunto a empresa líder possui mais informação quando ela toma sua decisão. CONJUNTO DE ESTRATÉGIAS - CONTINUAÇÃO Se chamarmos de 𝑠𝑗 𝑖 a j-ésima estratégia do jogador i, o conjunto de estratégias ou espaço de estratégias do jogador i é dado por: 𝑆 𝑖 = 𝑠𝑗 𝑖 Combinação de Estratégias é representada por um conjunto ordenado, no qual cada elemento é uma estratégia para cada um dos n jogadores. 𝑆 = 𝑠1 , 𝑠2 … , 𝑠𝑛 CONJUNTO DE ESTRATÉGIAS - GENERALIZAÇÃO Recompensa (Payoff): aquilo que o jogador obtém depois de encerrado o jogo, de acordo com suas próprias escolhas e a dos demais jogadores. Função de Recompensa: especifica um valor numérico que nos ajuda a perceber como o jogador avalia um determinado resultado do jogo. Deste modo, a função de recompensa possibilita a ordenação dos possíveis resultados do jogo. Então a função de recompensa é tal que: ∀ 𝒙 𝒆 𝒚, 𝝅 𝒙 ≥ 𝝅 𝒚 𝒔𝒆 𝒙 ≿ 𝒚 A função de recompensa ordena as preferências de um mesmo jogador. A função de preferência não pode ser usada para ordenar as preferências de jogadores diferentes. Cada combinação estratégica produz recompensas diferentes para os jogadores. DEFINIÇÕES - CONTINUAÇÃO JOGOS SIMULTÂNEOS COM INFORMAÇÃO COMPLETA Forma Normal 1. Recompensas são fixas e conhecidas. 2. Os jogadores se comportam de forma racional Entendem o jogo e cada jogador busca maximizar sua a recompensa. 3. As regras do jogo, incluindo recompensas, são de conhecimento comum 4. Jogadores são neutros ao risco Maximizam o retorno esperado. JOGOS SIMULTÂNEOS COM INFORMAÇÃO COMPLETA - HIPÓTESES Toda informação (quem são os jogadores, quais são as estratégias, quais são as recompensas para cada possível combinação de estratégias) é conhecida por todos os jogadores e todos os jogadores sabem que os outros jogadores sabem que os outros jogadores conhecem toda informação do jogo. Os jogadores racionais adotarão as estratégias que maximizam suas recompensas, por isso, afirmar que as recompensas são de conhecimento comum significa dizer que nenhum dos jogadores possui dúvidas sobre o resultado que os demais jogadores buscam obter. Assim, cada jogador sabe exatamente com quem está jogando, pois sabe quais os objetivos dos outros jogadores. CONHECIMENTO COMUM Os jogos simultâneos com informação completa são, geralmente, representados pela forma normal. Definição: A representação na formal normal de um jogo especifica os jogadores i=1,2,..,n, os espaços de estratégias 𝑆1 , 𝑆2,… , 𝑆𝑛 dos jogadores e suas funções de recompensas 𝜋1 , 𝜋2 ,...,𝜋𝑛 Desta forma o jogo pode ser denotado por 𝐺 = 1,2,...,n; 𝑆1 , 𝑆2,… , 𝑆𝑛 ; 𝜋1 , 𝜋2 ,...,𝜋𝑛 . Observação: Os valores das recompensas não precisam representa exatamente o valor obtido por cada jogador, mas sim a ordenação de suas preferências. FORMA NORMAL Jogadores: Luísa (linha) e Carlos (coluna); Luísa quer ir ao cinema; Carlos quer ir ao Futebol; Os dois gostam de ficarem juntos. EXEMPLO: BATALHA DOS SEXOS Futebol Cinema Futebol 1,2 0,0 Cinema 0,0 2,1 Carlos Luí sa Confessa Não Confessa Confessa -2,-2 0,-4 Não Confessa -4,0 -1,-1 BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO ESTRATÉGIAS ESTRITAMENTE DOMINADAS Dilema dos Prisioneiros: Para o jogador 1, a estratégia confessar estritamente dominaa estratégia não confessar. Ou seja, a estratégia não confessar é estritamente dominada pela estratégia confessar. Definição: Uma estratégia 𝑠𝑖 ∗∗ é estritamente dominada para o jogador i por uma estratégia 𝑠𝑖 ∗ se: 𝜋 𝑠𝑖 ∗ , 𝑠−𝑖 > 𝜋 𝑠𝑖 ∗∗ , 𝑠−𝑖 , para todo 𝑠−𝑖 ESTRATÉGIA ESTRITAMENTE DOMINADA Definição: Uma estratégia 𝑠𝑖 ∗ é estritamente dominante para o jogador i em relação a uma estratégia 𝑠𝑖 ∗∗ se: 𝜋 𝑠𝑖 ∗ , 𝑠−𝑖 > 𝜋 𝑠𝑖 ∗∗ , 𝑠−𝑖 , para todo 𝑠−𝑖 ESTRATÉGIA ESTRITAMENTE DOMINANTE AGORA É A SUA VEZ: IDENTIFIQUE E ELIMINE A ESTRATÉGIA ESTRITAMENTE DOMINADA DO JOGADOR 2 Dilema dos Prisioneiros: Para o jogador 2, a estratégia confessar é estritamente dominante em relação à estratégia não confessar. Ou seja, a estratégia não confessar é estritamente dominada pela estratégia confessar. BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO ESTRATÉGIAS ESTRITAMENTE DOMINADAS Dilema dos Prisioneiros: Confessar é a estratégia estritamente dominante para os dois jogadores, então a solução desse jogos é os prisioneiros confessam e cada um será sentenciado com dois anos de cadeia. Este jogo é solucionável por dominância, ou seja, podemos encontrar a solução (o equilíbrio) através da eliminação iterativa das estratégias dominantes. Lançar Nova Versão Reduzir Preço Lançar Modelo Próprio 1,4 1,3 Importar da Matriz 2,2 2,3 BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO ESTRATÉGIAS ESTRITAMENTE DOMINADAS O resultado dado pela combinação das estratégias (Importar da Matriz, Reduzir o Preço) é um equilíbrio em estratégias estritamente dominantes. Este jogo é solucionável por dominância. Para solucionar o jogo por intermédio da eliminação iterativa de estratégias estritamente dominadas assumiu-se o conhecimento comum da racionalidade (CCR). O jogador 1 sabe que os jogadores 1 e 2 são racionais. O jogador 2 sabe que jogador 1 sabe que os jogadores 1 e 2 são racionais. O jogador 1 sabe que o jogador 2 sabe que jogador 1 sabe que os jogadores 1 e 2 são racionais,... CONSIDERAÇÕES As estratégias que resultam da eliminação iterativa de estratégias estritamente dominadas são chamadas de racionalizáveis. Uma dada estratégia 𝑠𝑖 ∗ do um jogador 𝑖 é considerada a melhor resposta desse jogador 𝑖 a uma dada estratégia 𝑠−𝑖 dos demais jogadores se: 𝜋 𝑠𝑖 ∗ , 𝑠−𝑖 ≥ 𝜋 𝑠𝑖 , , 𝑠−𝑖 , para algum 𝑠−𝑖 e todo 𝑠𝑖 , ≠ 𝑠𝑖 ∗ Ou seja, a melhor resposta é a estratégia que dá a melhor recompensa ao jogador 𝑖 para uma dada estratégia dos outros jogadores. ESTRATÉGIAS RACIONALIZÁVEIS E MELHOR RESPOSTA Lançar nova versão Manter preço Reduzir Preço Lançar modelo próprio 1,4 4,1 1,3 Importar da matriz 2,2 2,1 2,3 Não competir 0,1 0,6 0,0 BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO ESTRATÉGIAS ESTRITAMENTE DOMINADAS A estratégia Não Competir não é a melhor resposta para nenhuma estratégia que a empresa Carro Novo possa adotar, então a estratégia Não Competir não é uma estratégia racionalizável para a empresa Novo Auto. Empresa Carro Novo E m p re s a N o vo A u to BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO ESTRATÉGIAS ESTRITAMENTE DOMINADAS Este jogo não é solucionável por dominância. Eliminar estratégias fortemente dominadas pode não ser aplicável, mas sempre que é dá certo. Não Exporta Exporta em Pequena Escala Exporta em Grande Escala Investe 2,1 1,0 0,-1 Não Investe 1,0 2,1 -1,2 JOGO DA PREVENÇÃO DA ENTRADA NO MERCADO NACIONAL Entrante Potencial E m p re s a D o m in a n te Nem sempre as estratégias que não podem ser eliminadas em um processo de eliminação iterativa de estratégias estritamente dominadas são, necessariamente, racionalizáveis. Exportar em pequena escala não é uma estratégia racionalizável para a empresa entrante. EQUILÍBRIO DE NASH Diz-se que uma combinação de estratégias constitui um equilíbrio de Nash quando cada estratégia é a melhor resposta possível às estratégias dos demais jogadores, e isso é verdade para todos os jogadores. Definição: as estratégias 𝑠1 , 𝑠2 , … , 𝑠𝑛 constituem um equilíbrio de Nash para o jogo G se: 𝜋𝑖 𝑠𝑖, ∗𝑠−𝑖, ∗ ≥ 𝜋𝑖 𝑠𝑖 ,𝑠−𝑖, ∗ para todo 𝑠𝑖 , e todo 𝑖 . Ou seja, no Equilíbrio de Nash nenhum jogador conseguirá aumentar a sua recompensa mudando unilateralmente a sua estratégia. EQUILÍBRIO DE NASH Lançar Nova Versão Reduzir Preço Lançar Modelo Próprio 1,4 1,3 Importar da Matriz 2,2 2,3 BUSCANDO A SOLUÇÃO DO JOGO: IDENTIFICADOS AS ESTRATÉGIAS QUE SÃO MELHOR RESPOSTAS Conforme discutido anteriormente, o resultado dado pela combinação das estratégias (Importar da Matriz, Reduzir o Preço) é um equilíbrio em estratégias estritamente dominantes. Ou seja, este jogo é solucionável por dominância. Este mesmo resultado é, também um equilíbrio de Nash. ENCONTRANDO O EQUILÍBRIO DE NASH Este jogo não é solucionável por dominância. Porém, este jogo possui uma solução que corresponde ao conceito de equilíbrio de Nash. Não Exporta Exporta em Pequena Escala Exporta em Grande Escala Investe 2,1 1,0 0,-1 Não Investe 1,0 2,1 -1,2 JOGO DA PREVENÇÃO DA ENTRADA NO MERCADO NACIONAL Entrante Potencial E m p re s a D o m in a n te O resultado dado pela combinação das estratégias (Investe, Não Exporta) é o Equilíbrio de Nash neste jogo. BUSCANDO A SOLUÇÃO DO JOGO: ELIMINANDO ESTRATÉGIAS ESTRITAMENTE DOMINADAS Dilema dos Prisioneiros: O resultado dado pela combinação das estratégias (Confessa, Confessa) é o Equilíbrio de Nash neste jogo. EXEMPLO: BATALHA DOS SEXOS Futebol Cinema Futebol 1,2 0,0 Cinema 0,0 2,1 Carlos Luí sa Os resultados (Futebol, Cinema) e (Cinema, Futebol) são soluções para este jogo. Há mais que um Equilíbrio de Nash neste jogo. JOGO DURÃO E MEDROSO Os resultados (M, D) e (D, M) são soluções para este jogo. Há mais que um Equilíbrio de Nash neste jogo. Definição: As estratégias 𝑠1 , 𝑠2 , … , 𝑠𝑛 constituem um equilíbrio de Nash Estrito para o jogo G se: 𝜋𝑖 𝑠𝑖, ∗𝑠−𝑖, ∗ > 𝜋𝑖 𝑠𝑖 ,𝑠−𝑖, ∗ para todo 𝑠𝑖 , e todo 𝑖 . Dado a estratégia escolhida do oponente, não há nenhuma estratégia que seja pelo menos tão boa quanto a estratégia que os outros jogadores estão jogando no equilíbrio de Nash. EQUILÍBRIO DE NASH ESTRITO IDENTIFICANDO EQUILÍBRIO DE NASH ESTRITO Dilema dos Prisioneiros: O resultado dado pela combinação das estratégias (Confessa, Confessa) é um Equilíbrio de Nash Estrito. Um equilíbrio em estratégia estritamente dominantes é sempre um equilíbrio de Nash, mas um equilíbrio de Nash nem sempre é um equilíbrio em estratégia dominante. Se existir um equilíbrio em estratégia estritamente dominantes este equilíbrio também é um equilíbrio de Nash Estrito. RELAÇÃO ENTRE EQUILÍBRIO DE NASH E EQUILÍBRIO EM ESTRATÉGIAS ESTRITAMENTE DOMINANTES Ótimo de Pareto: um dada situação em que não é possível melhorar a situação de um agente sem piorar a de outro. Equilíbrio de Nash: Cada jogador individualmente adota a melhor resposta às estratégias dos demais jogadores, mas isso não significa que a situação resultante das decisões conjuntas será a melhor possível.EQUILÍBRIO DE NASH E ÓTIMO DE PARETO DILEMA DOS PRISIONEIROS O resultado dado pela combinação das estratégias (Confessa, Confessa) é um Equilíbrio de Nash, mas não é uma Alocação Ótima de Pareto. Se os dois jogadores conseguissem cooperar eles poderiam melhorar as recompensas obtidas desse jogo. Definições: Um jogo é dito Não-Cooperativo quando os jogadores não podem estabelecer compromissos garantidos. Se os jogadores podem estabelecer compromissos, e esses compromissos possuem garantias efetivas, diz- se que o jogo é Cooperativo. JOGOS COOPERATIVOS E NÃO- COOPERATIVOS Tarifa Alta Tarifa Baixa Tarifa Alta 800 , 800 2.300 , (700) Tarifa Baixa (700) , 2300 1.700 , 1.700 O JOGO DO COMÉRCIO INTERNACIONAL Vimos no Jogo da Batalha dos Sexos que é possível que haja mais que um equilíbrio de Nash para um dado jogo. Esse jogo é um exemplo de coordenação com várias opções. Na realidade, há uma série de situações com várias possibilidades de equilíbrio, ou seja, situações em que os agentes não teriam estímulos para mudar suas decisões. Porém em qual desses equilíbrios os agentes irão acomodar-se? EQUILÍBRIO DE NASH: CONSIDERAÇÕES Adota Campanha Agressiva Não Adota Campanha Agressiva Adota Campanha Agressiva -20,-20 10,-10 Não Adota Campanha Agressiva -10,10 0,0 O JOGO DA CAMPANHA PUBLICITÁRIA Definição: Um ponto focal é um elemento que destaca de um contexto, e que permite aos jogadores coordenarem suas decisões em um dentre vários equilíbrios de Nash possíveis. O conceito do ponto focal baseará a coordenação dos agentes para a obtenção da solução cooperativa. Para tanto, precisaremos que existam: 1. Conhecimento comum; 2. Compartilhamento de experiência; 3. Pequenos grupos de jogadores. O CONCEITO DO PONTO FOCAL Atualizar Não Atualizar Desenvolver 2,1 -1,-2 Não Desenvolver 0,-1 1,2 JOGO DE COORDENAÇÃO DO PADRÃO TECNOLÓGICO Empresa de Antivírus E m p re s a d e S is te m a O p e ra c io n a l Ponto Focal: Colunista especializado em uma revista internacional de novidades em tecnologia de informação. Cara Coroa Cara 1,-1 -1,1 Coroa -1,1 1,-1 AUSÊNCIA DE EQUILÍBRIO DE NASH Não existe equilíbrio de Nash com estratégias puras. Esse jogo, matching pennies, é um jogo estritamente competitivo ou de soma zero. Nesta aula nós discutimos alguns jogos que são importantes na literatura da teoria dos jogos, como: 1. A batalha dos Sexos Coordenação com várias opções. 2. O Dilema do Prisioneiro Cooperação versus interesse próprio. 3. O Jogo da Galinha Competição destrutiva JOGOS IMPORTANTES Cervo Lebre Cervo 3,3 0,1 Lebre 1,0 1,1 O JOGO DA CAÇA AO CORVO: O DILEMA DO CONTRATO SOCIAL O jogo da caça ao cervo representa situações de interação estratégicas em que: O melhor resultado depende da cooperação de todos. Se alguém buscar um resultado individual mais imediato, aqueles que se mantiverem fiéis ao compromisso inicial serão prejudicados. JOGOS ESTRITAMENTE COMPETITIVOS Também conhecidos como Jogos de Soma Zero. Jogadores estão preocupados em infligir o maior dano possível uns aos outros, uma vez que a perda para um dos jogadores representa o ganho para o outro. Definição: Seja um par qualquer de estratégias do jogador 𝑎 , representado por 𝒔𝒊 𝒂 , 𝒔𝒋 𝒂 , e seja um par qualquer de estratégias do jogador 𝒃, representado por 𝒔𝒊 𝒃 , 𝒔𝒋 𝒃 . Para que o jogo seja estritamente competitivo, é necessário que: 𝝅𝒂 𝒔𝒊 𝒂 , 𝒔𝒋 𝒃 ≥ 𝝅𝒂 𝒔𝒋 𝒂 , 𝒔𝒊 𝒃 𝒔𝒆, 𝒆 𝒔𝒐𝒎𝒆𝒏𝒕𝒆 𝒔𝒆, 𝝅𝒃 𝒔𝒋 𝒂 , 𝒔𝒊 𝒃 ≥ 𝝅𝒃 𝒔𝒊 𝒂 , 𝒔𝒋 𝒃 JOGOS ESTRITAMENTE COMPETITIVOS Uma combinação de estratégias fornece uma recompensa maior ou igual à outra combinação de estratégias para um dos jogadores, se o inverso acontecer para o outro jogador. Portanto, é permitido escrever os jogos estritamente competitivos indicando apenas as recompensas de um dos jogadores, pois o resultado que um dos jogadores prefere é exatamente o resultado que o outro jogador despreza. JOGOS ESTRITAMENTE COMPETITIVOS Então, podemos escrever a recompensa de um dos jogadores como sendo a recompensa do outro jogador, com o sinal trocado: 𝝅𝒂 𝒔𝒊 𝒂 , 𝒔𝒋 𝒃 = −𝝅𝒃 𝒔𝒊 𝒂 , 𝒔𝒋 𝒃 Logo, a soma das recompensas dos dois jogadores será zero: 𝝅𝒂 𝒔𝒊 𝒂 , 𝒔𝒋 𝒃 +𝝅𝒃 𝒔𝒊 𝒂 , 𝒔𝒋 𝒃 =0 Esta é a razão desses jogos serem conhecidos como jogos de soma zero. Assim, em um jogo estritamente competitivo, não existe combinação de estratégias preferível a qualquer outra para os dois jogadores simultaneamente. JOGOS ESTRITAMENTE COMPETITIVOS A BATALHA DE BISMARK: ESTE JOGO É UM JOGO ESTRITAMENTE COMPETITIVO? Rota Sul Rota Norte Busca Rota Sul no primeiro dia 3,-3 1,-1 Busca Rota Norte primeiro dia 2,-2 2,-2 Comboio Japonês For ças Alia das Cara Coroa Cara 1,-1 -1,1 Coroa -1,1 1,-1 MATCHING PENNIES Esse jogo é um jogo estritamente competitivo ou de soma zero. Jogadores: Luísa (linha) e Carlos (coluna); Número iguais Luísa ganha; Números diferentes Carlos ganha; ZERO OU UM 0 1 0 1,-1 -1,1 1 -1,1 1,-1 Lu ísa Carlos Jogadores: Luísa (linha) e Carlos (coluna); TESOURA , PAPEL OU PEDRA T PP PR T 0,0 1,-1 -1,1 PP -1,1 0,0 1,-1 PR 1,-1 -1,1 0,0 Lu ísa Carlos Alternativamente podemos representar os jogos estritamente competitivos (ou jogos de soma zero) representando apenas a recompensa do jogador que está na linha, uma vez que a recompensa do jogador que está na coluna é o seu oposto. REPRESENTAÇÃO ALTERNATIVA 0 1 0 1,-1 -1,1 1 -1,1 1,-1 Lu ísa Carlos 0 1 0 1 -1 1 -1 1 Carlos Lu ísa A BATALHA DE BISMARK Rota Sul Rota Norte Busca Rota Sul no primeiro dia 3,-3 1,-1 Busca Rota Norte primeiro dia 2,-2 2,-2 Comboio Japonês For ças Alia das Rota Sul Rota Norte Busca Rota Sul no primeiro dia 3 1 Busca Rota Norte primeiro dia 2 2For ças Alia das Comboio Japonês EQUILÍBRIO EM JOGOS ESTRITAMENTE COMPETITIVOS Minimax e Maxmin Cada jogador está tomando suas decisões procurando causar o maior dano possível ao outro jogador. Uma estratégia prudente é tentar minimizar o dano que o oponente pode lhe causar. QUAL A MELHOR ESTRATÉGIA EM UM JOGO ESTRITAMENTE COMPETITIVO? Representando as recompensas apenas do jogador que está na linha, podemos representar o pior resultado que o jogador que está na coluna pode obter caso ele escolha a estratégia representada pela coluna 𝑡 ′ por: max 𝑠 𝜋 𝑠, 𝑡 ′ Onde s é a estratégia do jogador que está na linha. E a função de recompensa acima apresentada é a função de recompensa do jogador que está na linha. RESOLVENDO PELO MÉTODO DO MAXMIN OU MINIMAX O pior resultado que o jogador que está na linha pode obter caso ele escolha a estratégia representada pela linha 𝑠 ′ é representado por: min 𝑡 𝜋 𝑠 ′ , 𝑡 Onde t é a estratégia do jogador que está na coluna. E a função de recompensa acima apresentada é a função de recompensa do jogador que está na linha. RESOLVENDO PELO MÉTODO DO MAXMIN OU MINIMAX A BATALHA DE BISMARK Rota Sul Rota Norte Busca Rota Sul no primeiro dia 3 1 Busca Rota Norte primeiro dia 2 2For çasAlia das Comboio Japonês Então, o valor maxmin do jogo, ou seja, o maior dano que os aliados podem garantir, dadas as suas opções e as opções da marinha japonesa, é dado por: max 𝑠 min 𝑡 𝜋 𝑠, 𝑡 = 𝜋 𝑠2 , 𝑡2 Quando a combinação de estratégias para os quais o máximo entre os mínimos que o jogador na linha pode obter for a mesma para o qual o jogador nas colunas obtém o mínimo entre os máximos, temos: 𝑚𝑖𝑛𝑖𝑚𝑎𝑥 𝑛𝑎𝑠 𝑐𝑜𝑙𝑢𝑛𝑎𝑠 = 𝑚𝑎𝑥𝑚𝑖𝑛 𝑛𝑎𝑠 𝑙𝑖𝑛ℎ𝑎𝑠 Ou seja, Que no caso anterior é 𝜋 𝑠2 , 𝑡2 = 2. PONTO DE SELA min 𝑡 max 𝑠 𝜋 𝑠, 𝑡 =max 𝑠 min 𝑡 𝜋 𝑠, 𝑡 PONTO DE SELA O equilíbrio maxmin-minimax é um equilíbrio, pois nenhum dos jogadores tem incentivo a desviar da escolha estratégica que compõe a combinação de estratégias que tenta impor o maior dano possível ao seu oponente. A combinação de estratégias cuja recompensa tenta impor o maior dano possível ao seu oponente, tem como melhor resposta minimizar as suas próprias perdas. Assim, como cada jogador está buscando escolher a estratégia que é a melhor resposta a estratégia do seu oponente, o equilíbrio maxmin-minimax é um Equilíbrio de Nash. EQUILÍBRIO MINIMAX ESTRATÉGIAS MISTAS Os jogadores jogam estratégias puras quando adotam uma estratégia com certeza. Quando um jogador varia a escolha de suas estratégias de forma a tentar surpreender o outro jogador, diz-se que ele adota estratégia mista. Faz-se uso de estratégias mistas para buscar surpreender e evitar ser surpreendido, neutralizando os efeitos da estratégia escolhida pelo outro jogador. ESTRATÉGIA MISTAS Definição: Quando, em vez de escolher entre suas estratégias uma dada estratégia para jogá-la com certeza, um jogador decide alternar entre suas estratégias aleatoriamente, atribuindo uma probabilidade a cada estratégia a ser escolhida, diz-se que o jogador utiliza estratégias mistas. Caso contrário, diz-se que emprega estratégias puras . ESTRATÉGIA MISTAS Definição : A recompensa esperada de um jogador pela adoção de uma dada estratégia é a recompensa que ele pode vir a obter, em média, dadas as probabilidades com que os outros jogadores escolhem suas estratégias. RECOMPENSA ESPERADA ZERO OU UM: RESOLVENDO POR ESTRATÉGIAS MISTAS. 𝜋𝐶𝑎𝑟𝑙𝑜𝑠 𝑒 0 = 𝑝 × −1 + 1 − 𝑝 × 1 𝜋𝐶𝑎𝑟𝑙𝑜𝑠 𝑒 1 = 𝑝 × 1 + 1 − 𝑝 × −1 𝜋𝐿𝑢í𝑠𝑎 𝑒 0 = 𝑞 × 1 + 1 − 𝑞 × −1 𝜋𝐿𝑢í𝑠𝑎 𝑒 1 = 𝑞 × −1 + 1 − 𝑞 × 1 0 (q) 1 (1-q) RE Luísa 0 (p) 1,-1 -1,1 q*1+(1-q)*(-1) 1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1) RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1) Luísa Carlos ZERO OU UM: RESOLVENDO POR ESTRATÉGIAS MISTAS. O Jogo zero ou um não tem equilíbrio em estratégias estritamente dominantes, não tem equilíbrio de Nash em estratégias puras, mas tem equilíbrio em estratégias mistas. 0 (q) 1 (1-q) RE Luísa 0 (p) 1,-1 -1,1 q*1+(1-q)*(-1) 1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1) RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1) Luísa Carlos ZERO OU UM: RESOLVENDO POR ESTRATÉGIAS MISTAS. O Jogo zero ou um não tem equilíbrio em estratégias estritamente dominantes, não tem equilíbrio de Nash em estratégias puras, mas tem equilíbrio em estratégias mistas. O equilíbrio de Nash em estratégias mista para esse jogo acontece quando a Luísa e o Carlos escolhem suas estratégias com a mesma probabilidade, 𝑝 = 𝑞 = 1 2 , de tal forma que nenhum deles consegue antecipar se o seu oponente escolherá zero ou um. Ou seja, cada um dos jogadores neutralizou a vantagem que seu oponente teria variando aleatoriamente sua escolha. O Equilíbrio de Nash em estratégias mistas é: 𝑝, 1 − 𝑝 , 𝑞, 1 − 𝑞 = 1 2 , 1 2 , 1 2 , 1 2 ZERO OU UM: A FUNÇÃO DE RECOMPENSA ESPERADA QUANDO TODOS OS JOGADORES JOGAM ESTRATÉGIAS MISTAS. 𝜋𝐿𝑢í𝑠𝑎 𝑒 = 𝑝𝑞 1 + 1 − 𝑝 1 − 𝑞 −1 + 1 − 𝑝 𝑞 −1 + 1 − 𝑝 1 − 𝑞 1 = 0 𝜋𝐶𝑎𝑟𝑙𝑜𝑠 𝑒 = 𝑝𝑞 −1 + 1 − 𝑝 𝑞(1)+ 𝑝 1 − 𝑞 (1) + 1 − 𝑝 1 − 𝑞 −1 =0 0 (q) 1 (1-q) RE Luísa 0 (p) 1,-1 -1,1 q*1+(1-q)*(-1) 1 (1-p) -1,1 1,-1 q*(-1)+(1-q)*(1) RE Carlos p*(-1)+(1-p)*1 p*1+(1-p)*(-1) Luísa Carlos O JOGO DA GUERRA FRIA: RESOLVENDO POR ESTRATÉGIAS MISTAS Ameaça Não Ameaça Ameaça -100,-100 10,-10 Não Ameaça -10,10 0,0 URSS EU A O JOGO DA GUERRA FRIA: RESOLVENDO POR ESTRATÉGIAS MISTAS Ameaça (q) Não Ameaça (1-q) RE EUA Ameaça (p) -100,-100 10,-10 q*(-100)+(1-q)*10 Não Ameaça (1-p) -10,10 0,0 q*(-10)+(1-q)*0 RE URSS p*(-100)+(1-p)*10 p*(-10)+(1-p)*0 EUA URSS Os EUA escolherão a probabilidade de ameaçar que fará a URSS ser indiferente entre ameaçar e não ameaçar. Ou seja: 𝜋𝑈𝑅𝑆𝑆 𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝜋𝑈𝑅𝑆𝑆 𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎 Sendo, 𝜋𝑈𝑅𝑆𝑆 𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝑝 × −100 + 1 − 𝑝 × 10 𝜋𝑈𝑅𝑆𝑆 𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎 = 𝑝 × (−10) + 1 − 𝑝 × 0 O JOGO DA GUERRA FRIA: RESOLVENDO POR ESTRATÉGIAS MISTAS Ameaça (q) Não Ameaça (1-q) RE EUA Ameaça (p) -100,-100 10,-10 q*(-100)+(1-q)*10 Não Ameaça (1-p) -10,10 0,0 q*(-10)+(1-q)*0 RE URSS p*(-100)+(1-p)*10 p*(-10)+(1-p)*0 EUA URSS A URSS, também, escolherá a probabilidade de ameaçar que fará os EUA ser indiferente entre ameaçar e não ameaçar. Ou seja: 𝜋𝐸𝑈𝐴 𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝜋𝐸𝑈𝐴 𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎 Sendo, 𝜋𝑈𝑅𝑆𝑆 𝑒 𝐴𝑚𝑒𝑎ç𝑎 = 𝑞 × −100 + 1 − 𝑞 × 10 𝜋𝑈𝑅𝑆𝑆 𝑒 𝑁ã𝑜 𝐴𝑚𝑒𝑎ç𝑎 = 𝑞 × (−10) + 1 − 𝑞 ×0 Assim, a combinação de estratégias mistas que faz os jogadores indiferentes entre ameaçar e não ameaçar é Este jogo possui dois equilíbrios de Nash em estratégias pura e um equilíbrio em estratégia mistas. É melhor escolher o equilíbrio em estratégia mista que dá uma recompensa de -1 a cada um do jogadores, que é uma recompensa melhor do que ter a chance de uma ameaça mútua. O JOGO DA GUERRA FRIA: RESOLVENDO POR ESTRATÉGIAS MISTAS 𝑝, 1 − 𝑝 , 𝑞, 1 − 𝑞 = 1 10 , 9 10 , 1 10 , 9 10 Em todo o jogo que há um número finito de jogadores, com um número finito de estratégias, sempre há um equilíbrio de Nash, provavelmente em estratégias mistas. ESTRATÉGIAS MISTAS JOGOS SEQUENCIAIS Que acontece em sequencia, ou seja, os jogadores se movem (um após o outro) em resposta a ações e reações do oponente. Mais comumente representado pela forma extensiva Representação de possíveis movimentos de um jogo no formato de uma árvore de decisões. JOGOS SEQUENCIAIS A BATALHA DOS SEXOS JOGADA SEQUENCIALMENTE Luísa escolhe primeiro, Carlos observa escolha e joga em seguida. No jogo simultâneo, haviam dois equilíbrios de Nash: (Futebol, Futebol) e (Cinema, Cinema). Agora a Luísa tem a vantagem de ser a primeira a escolher. Matriz esconde a característica sequencial do jogo, (Futebol, Futebol) não será um equilíbrio razoável neste jogo sequencial. FORMA EXTENSIVA DO JOGO - INFORMAÇÃO PERFEITA Luísa Carlos Futebol Cinema Futebol Cinema Futebol Cinema 1,2 0,0 0, 0 2, 1 Jogo com informação Perfeita. Resolução do jogo por indução reversa (Luísa, Carlos) Carlos Árvore de Escolha Equilíbrio por indução reversa ou equilíbrio de Nash sequencialmente racional. FORMA EXTENSIVA DO JOGO – INFORMAÇÃO IMPERFEITA Luísa Carlos Futebol Cinema Futebol Cinema Futebol Cinema 1,2 0,0 0, 0 2, 1 Jogo com informação Imperfeita.Resolução do jogo por subjogo perfeito Carlos O conceito de subjogo perfeito foi desenvolvido por Selten e é um refinamento do conceito de equilíbrio de Nash. JOGO DA CONFIANÇA Consumidor Empresa Confia Não Confia Entrega Não Entrega 1,1 -1,2 0,0 JOGO COM BARREIRAS À ENTRADA Entrante Escolhe Estabelecido escolhe Fica de fora Entra Luta Não luta Luta Não luta 1, 9 1, 9 0, 0 2, 1 Estabelecido escolhe Lutar é uma ameaça crível? Entrante espera que Estabelecido aja racionalmente. Uma vez que a entrada ocorreu, o melhor a fazer é não lutar: ameaça é vazia. JOGO COM BARREIRAS À ENTRADA Entrante Escolhe Estabelecido escolhe Fica de fora Entra Luta Não luta Luta Não luta 1, 9 1, 9 0, 2 2, 1 Estabelecido escolhe Se estabelecido tiver capacidade extra que permita lutar no caso de entrada e ganhar 2. Lutar torna-se uma ameaça crível. Equilíbrio de Nash: (Fica de fora, não luta) Firma estabelecida continua monopolista e nunca usa capacidade extra. “Excesso” de capacidade para manter credibilidade da ameaça a possíveis entrantes. JOGOS REPETIDOS Jogos nos quais as ações são tomadas e as decorrentes recompensas são recebidos várias vezes, de modo consecutivo. JOGOS REPETIDOS DILEMA DOS PRISIONEIROS O resultado do jogo não repetido é dado pela combinação das estratégias (Confessa, Confessa) que é um Equilíbrio de Nash Estrito. Se o jogo for repetido dez vezes os jogadores serão capazes de cooperar e atingir um resultado que é Pareto eficiente, (Não Confessa, Não Confessa)? Qualquer jogo repetido em n finitas vezes, em que o jogo-base apresente apenas um equilíbrio de Nash, possui um único equilíbrio de Nash em subjogo perfeito, que consiste em jogar o equilíbrio de Nash do jogo-base em todas as n etapas. Se um jogo-base possui mais de um equilíbrio de Nash, combinações de estratégias que não envolvam em alguma etapa do jogo um equilíbrio de Nash no subjogo podem constituir um equilíbrio de Nash em subjogo perfeito. JOGOS COM UM NÚMERO FINITO DE REPETIÇÕES É a presença de estratégias que envolvam retaliações em função do comportamento dos demais jogadores ao longo da história do jogo que possibilitam um equilíbrio de Nash em subjogo perfeito composto por combinações de estratégias que não necessariamente são equilíbrio de Nash no jogo-base em todos os subjogos. AMEAÇAS E RETALIAÇÕES A empresa automobilística informa a fornecedora que pedirá peça em liga especial com entrega urgência no primeiro ano e se a fornecedora entregar ela pedirá peça em liga especial com entrega rápida, senão ela pedirá peça em aço comum com entrega normal. A fornecedora cumpre o acordo, pois a soma das suas recompensas é maior que se ela não cumprir o acordo. O JOGO DA COORDENAÇÃO DA CADEIA PRODUTIVA Empresa Automobilística Entrega Urgente Entrega Normal Entrega Rápida Peça em Liga Especial 4,3 0,0 2,5 Peça em Aço Comum 0,1 2,2 0,1 Fornecedor DILEMA DOS PRISIONEIROS JOGADO INFINITAMENTE Se o jogo for repetido um número infinito de vezes os jogadores serão capazes de cooperar e atingir um resultado que é Pareto eficiente, (Não Confessa, Não Confessa)? Neste caso, estratégias severas permitem que a cooperação seja atingida no jogo finito. Estratégia de Gatilho: Cooperar enquanto o outro jogador cooperar e não cooperar nunca mais quando o outro jogador não cooperar uma vez. Tit-for-tat: Começa cooperando e depois adota a estratégia que o oponente adotou na última jogada. ESTRATÉGIAS SEVERAS Se um jogo-base possui uma combinação de estratégias com uma recompensa maior que a recompensa do equilíbrio de Nash do jogo- base, então, se os jogadores foram pacientes (taxa de paciência próxima de um) e os jogadores adotem estratégias severas, existe um equilíbrio de Nash em subjogo perfeito em que a recompensa média esperada do jogo infinito será o valor da maior recompensa do jogo-base. TEOREMA POPULAR: VERSÃO DO FRIEDMAN (1971) LEILÕES Mercados em que os produtos são comprados e vendidos por meio de processos formais de lances. Há vários tipos de leilões: Aberto versus fechados Primeiro preço e segundo preço. Valor privado e valor comum LEILÕES TIPOS DE LEILÃO Leilão inglês (ou oral) Leilão em que o vendedor solicita ativamente lances mais altos de um grupo de potenciais compradores. Leilão holandês Leilão em que um vendedor inicia oferecendo o item a um preço relativamente alto que depois é reduzido em quantias fixas até que ocorra a venda. Leilão de lances fechados Leilão em que todos os lances são feitos simultaneamente em envelopes lacrados e o vencedor é aquele que oferece maior valor. ● TIPOS DE LEILÃO Leilão de primeiro preço Leilão em que o preço de venda é igual ao lance mais alto. Leilão de segundo preço Leilão em que o preço de venda é igual ao segundo lance mais alto. Leilão de valor privado Leilão em que cada potencial comprador sabe qual é sua avaliação individual do objeto leiloado e as avaliações diferem de um comprador para outro. Leilão de valor comum Leilão em que o item a ser leiloado tem o mesmo valor para todos os potenciais compradores, mas este não sabe exatamente qual é o valor e, por isso, as estimativas variam. ESTRATÉGIAS EM LEILÕES DE VALOR PRIVADO Qualquer que seja o tipo do leilão, cada comprador deve ter uma estratégia. Em um leilão inglês, a estratégia é a escolha do valor em que se deixará de oferecer lances. Em um leilão holandês, a estratégia é o preço que os indivíduos esperam utilizar para fazer o único lance. Em um leilão de lances fechados, a estratégia é a escolha do lance a ser colocado no envelope. Suponhamos que você e outras quatro pessoas estejam participando de um leilão oral para comprar um pote de moedas, que irá para o vencedor a um preço igual ao lance mais alto. Depois de estimar o número de moedas no pote, qual será sua decisão de lances mais favorável? Maldição do vencedor Situação em que o vencedor de um leilão de valor comum obtém pior resultado por haver superestimado o valor do item e oferecido um lance maior. ESTRATÉGIAS EM LEILÕES DE VALOR COMUM Em um leilão de valor privado, incentive o maior número possível de compradores a participar. Em um leilão de valor comum, (a) utilize um leilão aberto em vez de um de lances fechados, pois, como regra geral, um leilão inglês (aberto) de valor comum gera maior receita esperada do que um leilão de lances fechados; e (b) revele informações sobre o valor real do objeto em leilão para reduzir a preocupação com a maldição do vencedor e incentivar mais lances. Em um leilão de valor privado, estabeleça um lance mínimo igual, ou até mesmo um pouco superior, ao valor que o faria guardar o bem para uma venda futura. MAXIMIZAÇÃO DA RECEITA DO LEILÃO LANCES E COALIZÕES Os compradores também podem aumentar o poder de barganha ao reduzirem o número de participantes no leilão ou a frequência de lances. Em alguns casos, isso pode ser conseguido legalmente por meio da formação de grupos de compradores; mas a manobra também pode ser feita ilegalmente, graças a acordos de coalizão que violam a legislaçãoantistruste. Como o eBay conseguiu dominar o mercado de leilões pela Internet? Por que outros sites de leilão (como o do Yahoo ou o da Amazon) não conseguiram avançar sobre a fatia de mercado do eBay? A resposta é que os leilões por Internet estão sujeitos a externalidades de difusão muito fortes. Se você quisesse leiloar algumas moedas raras ou cartões do Pokémon, qual site de leilão você escolheria? Aquele que tivesse o maior número de compradores potenciais. Da mesma maneira, se você estivesse atrás de moedas raras ou cartões do Pokémon, você escolheria o site com o maior número de vendedores. Como foi o primeiro grande site de leilão na Internet, o eBay já começou com a maior fatia de mercado, e ela cresceu graças à externalidade de difusão.