Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIDADE III Estratégias dos jogos Nara Medianeira Stefano Equilíbrio de Nash Pense no que é uma estratégia; você sabe o que ela signi�ca? Quando ela está presente na teoria dos jogos, onde ela se encaixa? Quando surge o Equilíbrio de Nash na Teoria dos jogos, o que ele signi�ca? Pensou em tudo isso? Na realidade, usamos estratégias para quase tudo na vida e, com isso, buscamos um equilíbrio; mas em jogos, infelizmente, não existe nenhum equilíbrio de estratégia. Tudo isso que nos referimos é o Equilíbrio de Nash, que é um conceito dentro da Teoria dos Jogos em que o resultado ideal de um jogo é aquele em que não há incentivo para se desviar de sua estratégia inicial. Aqui, o resultado ótimo de um jogo é aquele em que nenhum jogador tem um incentivo para se desviar de sua estratégia escolhida depois de considerar a escolha de um oponente. Um jogo pode ter múltiplos Equilíbrios de Nash ou nenhum. Ao �nal desta aula, você será capaz de: reconhecer a importância da estratégia em jogos; identi�car como se dá o Equilíbrio de Nash; conhecer o que é incentivo no Equilíbrio de Nash. Aula 01 Introdução 2 Estratégia Caro(a) aluno(a), para podermos falar de Equilíbrio de Nash, vamos em primeiro lugar, discutir o que é estratégia. Você sabia que a estratégia, como conceito, surgiu em conexão com operações militares? Todos os elementos estavam presentes e tornaram a estratégia valiosa: recursos �nitos; incerteza sobre a capacidade e as intenções de um adversário; comprometimento irreversível de recursos; necessidade de coordenar as ações ao longo do tempo e da distância; incerteza sobre o controle da iniciativa; e a natureza crítica das percepções mútuas entre os adversários. Segundo Dranove e Marciano (2017), para que a estratégia seja possível, é necessário imaginar e avaliar as possíveis consequências de alternativos de ação. Mas imaginação e poder de raciocínio não são su�cientes; também deve haver conhecimento da concorrência e os efeitos característicos de ordem superior de ações alternativas. Esse conhecimento deve atingir uma massa crítica antes de se tornar realmente signi�cativo. Até que relacionamentos su�cientes tenham sido integrados para se ver todo o padrão, o conhecimento não é mais do que as peças individuais de um quebra- cabeça. Os requisitos básicos para o desenvolvimento de estratégias são: uma massa crítica de conhecimento; capacidade de integrar todo esse conhecimento e examiná-lo como um sistema dinâmico interativo; habilidade na análise do sistema para entender a sensibilidade, as defasagens de tempo, as possibilidades e consequências imediatas e futuras; imaginação e a lógica para escolher entre alternativas especí�cas; controle de recursos além das necessidades imediatas; vontade de renunciar aos benefícios atuais para investir no potencial futuro. Os indivíduos usam a “estratégia” de várias maneiras diferentes, sendo as mais comuns: como um plano, um meio de ir daqui para lá; como um padrão nas ações ao longo do tempo, por exemplo: uma empresa que comercializa regularmente produtos muito caros está usando uma estratégia “high end”; como posição, isto é, re�ete as 3 decisões de oferecer determinados produtos ou serviços em mercados especí�cos; e como perspectiva, isto é, visão e direção. Em um jogo, uma estratégia é um “plano de batalha” que especi�ca a ação que um jogador fará com as informações disponíveis em cada jogada e por qualquer possível contingência. Por exemplo, uma empresa pode usar uma estratégia de negócios simples, produzindo unidades de produção, independentemente do que qualquer rival faça, ou pode escolher uma estratégia mais complexa na qual produza uma pequena quantidade, desde que sua rival produza uma pequena quantia no período anterior e uma grande quantidade de outra forma. Os payoffs de um jogo são a avaliação dos jogadores sobre o resultado do jogo, como lucros para empresas ou utilidades para indivíduos. ATENÇÃO Estratégia é um termo que se refere a uma teia complexa de pensamentos, ideias, insights, experiências, objetivos, conhecimentos, memórias, percepções e expectativas que fornece orientação geral para ações especí�cas em busca de �ns especí�cos. 4 Assim, o comportamento estratégico é um conjunto de ações que um jogador realiza para aumentar seu payoff, levando em consideração as possíveis ações de outros jogadores. Por exemplo, uma empresa pode de�nir um nível de saída, agir para desencorajar as empresas potenciais de entrar em um mercado ou optar por empregar uma tecnologia. Os con�itos frequentemente surgem porque as ações de cada empresa que maximiza o lucro afetam os lucros de outras empresas. Embora chamemos con�ito o que se dá entre �rmas ou indivíduos, os envolvidos não consideram essa competição super�cial. Dessa forma, assumimos que cada jogador deseja obter o maior retorno possível no �nal do jogo. Mas quando se está elaborando ou atuando com estratégias e players (ou jogadores), o conhecimento deve ser uma informação conhecida por todos os jogadores. Em cada jogo, assumimos que todos os jogadores têm um conhecimento comum sobre as regras do jogo, sobre o fato de que a recompensa de cada jogador depende das ações tomadas por todos os jogadores e de que todos querem maximizar os seus resultados. Os economistas usam a teoria dos jogos quando a estratégia ótima de um jogador depende das ações dos outros, o que é chamado de interdependência estratégica. Figura 1 - Estratégia como um plano de batalha Fonte: Alvinge / 123RF. 5 Por exemplo, oligopolistas, como os fabricantes de Coca-Cola e a Pepsi, monitoram cuidadosamente o comportamento um do outro. Como relativamente poucas empresas competem em tal mercado, cada empresa pode in�uenciar o preço e, portanto, os pagamentos de empresas rivais. Logo, para entendermos o equilíbrio de Nash, vimos, nesta seção, o conceito de estratégia, pois o equilíbrio de Nash é de�nido como a combinação de estratégias em um jogo, de tal maneira que não haja incentivo para que os jogadores se desviem de suas escolhas. Na próxima seção, veremos que a(s) estratégia(s) é(são) a(s) melhor(es) opção(ões) que um jogador pode fazer levando em conta a decisão dos outros jogadores e que as mudanças na decisão de um jogador só levarão a um resultado pior se os outros jogadores seguirem a estratégia. Um dos mais conhecidos equilíbrios de Nash pode ser encontrado no dilema do prisioneiro. INFOGRÁFICO INTERATIVO Para consultar o Infográ�co Interativo, acesse a versão digital deste material 6 Equilíbrio de Nash Quando a eliminação iterativa de estratégias estritamente dominadas não consegue prever um resultado único, podemos usar um conceito relacionado. Para qualquer conjunto de estratégias escolhidas pelos rivais, um jogador deseja usar sua melhor resposta, a estratégia que maximiza a recompensa de um jogador, considerando suas crenças sobre as estratégias de seus rivais. Os economistas geralmente con�am em um conceito de solução introduzido por John Nash (1951), baseado na crença de que os jogadores usam suas melhores respostas. Formalmente, um conjunto de estratégias é um Equilíbrio de Nash se, quando todos os outros jogadores usarem essas estratégias, nenhum jogador puder obter um retorno maior escolhendo uma estratégia diferente. Uma propriedade atraente do equilíbrio de Nash é que ele é auto impingido. Se os jogadores usam uma estratégia de equilíbrio de Nash, nenhum deles quer se desviar escolhendo outra estratégia. Figura 2 - Equilíbrio de Nash Fonte: Vetre Antanaviciute-Meskauskiene / 123RF. 7 Você sabe por que devemos nos preocupar com o equilíbrio de Nash? Existem duas razões principais. A primeira supõe que os jogadores racionais raciocinam em direção à solução de um jogo; a segunda supõe que as pessoas encontram o caminho para uma solução por algum processo evolutivo de tentativa e erro. Muito do poder preditivo da teoria dos jogos surge da possibilidade de se passar de um lado para outro entre essas interpretações alternativas. Raramente sabemos muitosobre os detalhes dos processos evolutivos, mas às vezes podemos nos antecipar e prever onde eles eventualmente acabarão se perguntarmos o que os atores racionais fariam na situação em estudo. Segundo Fiani (2015), uma combinação de estratégias compõe um equilíbrio de Nash quando cada estratégia é a melhor aceitável às estratégias dos outros jogadores, e isso é verdade para todos os jogadores. ATENÇÃO O Equilíbrio de Nash é a solução para um jogo no qual dois ou mais jogadores têm uma estratégia; e com cada participante considerando a escolha do oponente, ele não terá incentivo, nada a ganhar, mudando sua estratégia. A estratégia de cada jogador é ótima por considerar as decisões de outros jogadores. Cada jogador ganha porque todos recebem o resultado que desejam. 8 Há muitas interpretações evolutivas possíveis do Equilíbrio de Nash, que diferem no processo de ajuste por meio do qual os jogadores podem encontrar o caminho para um equilíbrio. Nos processos de ajuste mais simples, os payoffs de um jogo são identi�cados com a adequação dos jogadores. Processos que favoreçam estratégias complexas podem, então, parar de funcionar quando se chegar a um Equilíbrio de Nash, porque somente as estratégias sobreviventes serão tão adequadas quanto possível nas circunstâncias. Assim, não precisamos que nossos jogadores sejam gênios matemáticos para que o equilíbrio de Nash seja relevante. Se eles costumam prever o comportamento dos animais muito bem, tampouco o signi�cado evolucionário do equilíbrio de Nash é con�nado à biologia. Eles têm um papel preditivo sempre que um processo de ajuste tende a eliminar estratégias que geram baixos retornos. 9 Esse exemplo baseia-se na competição de duopólio da United e da American Airlines na rota Chicago-Los Angeles (PERLOFF, 2014). Suponha que cada companhia aérea possa realizar apenas uma das duas ações possíveis: cada uma pode voar 64 (Quantidade – q) ou 48 mil (quantidade) passageiros entre Chicago e Los Angeles por trimestre. A representação de forma normal desse jogo estático é a matriz de payoff (matriz de lucro) na Figura 3. Essa matriz de payoff mostra os lucros para cada uma das quatro combinações possíveis das estratégias que as empresas podem escolher. SAIBA MAIS O equilíbrio de Nash é uma concepção de solução mais forte do que a eliminação iterada de estratégias estritamente dominadas. Nem todos os equilíbrios de Nash podem ser determinados usando-se a eliminação iterada de estratégias estritamente dominadas. No entanto, se a eliminação iterada de estratégias estritamente dominadas produz uma solução que consiste em um único par de estratégias, então essa combinação de estratégias é o único equilíbrio de Nash naquele jogo. 10 Por exemplo, se a American escolhe uma grande quantidade, por trimestre, e a United escolhe uma pequena quantidade por trimestre, os lucros das empresas são os que estão na célula, no canto inferior esquerdo da matriz de lucro. Essa célula mostra que o lucro da American (número máximo) é de US $ 5,1 milhões por trimestre e o lucro da United (número inferior esquerdo) é de US $ 3,8 milhões por trimestre. Podemos usar a matriz de lucro da Figura 3 para ilustrar que o par de estratégias que escolhemos usando a eliminação iterativa de estratégias estritamente dominadas é um equilíbrio de Nash. Ao eliminarmos estratégias estritamente dominadas, concluímos que ambas as empresas querem de�nir a saída em 64 passageiros. E se a �rma quiser desviar-se do resultado proposto? Se a American soubesse das mudanças de estratégias da United e esta da American, não mudaria, porque seu lucro cairia de US $ 4,1 milhões para US $ 3,8 milhões (PERLOFF, 2014). Pelo mesmo raciocínio, a United também não gostaria de mudar as estratégias. Ou seja, uma vez que a outra empresa escolhe 64, essa é a melhor resposta da empresa. Como nenhuma empresa queira mudar sua estratégia, dado que a outra empresa está jogando sua estratégia de equilíbrio de Nash, o par de estratégias é um equilíbrio de Nash. Figura 3 - Matriz de lucro para um jogo de de�nição de quantidade: estratégia dominante Fonte: Adaptada de Perloff (2014). 11 Além disso, para qualquer outra combinação de estratégias, uma ou outra �rma gostaria de mudar seu comportamento. Portanto, nenhum dos outros pares de estratégia é um equilíbrio de Nash. Considerando , qualquer uma das empresas poderia aumentar seu lucro de US $ 4,6 para US $ 5,1 milhões aumentando sua produção para 64. Se e , a American pode aumentar seu lucro de US $ 3,8 para US $ 4,1 milhões, aumentando sua quantidade para . Da mesma forma, a United gostaria de aumentar sua produção quando e . Uma análise semelhante aplica-se ao modelo mais geral de Cournot, em que as empresas podem escolher qualquer resultado desejado. Esse modelo pode ser apresentado como uma forma normal de jogo com n jogadores (�rmas), uma escolha de estratégias (qualquer número real, quantidade não negativa) e uma função de recompensa que é de conhecimento comum (ou seja, todas as �rmas sabem a função de lucro de cada empresa). Nós derivamos o equilíbrio de Nash para aquele jogo encontrando as quantidades que eram as melhores respostas para todas as �rmas. É possível obter esse equilíbrio de Nash em um modelo duopólio linear de Cournot, eliminando iterativamente estratégias estritamente dominadas. Com três ou mais empresas, a eliminação iterativa fornece apenas a observação imprecisa de que a quantidade de cada empresa não excederá a quantidade de monopólio. = = 48qA qU = 48qA = 64qU = 64qU = 64qA = 48qU 12 Segundo Pindyck e Rubinfeld (2018), conceito de equilíbrio de Nash depende muito da racionalidade individual, pois a escolha da estratégia de cada jogador depende não apenas de sua própria racionalidade, mas também da racionalidade de seu oponente. Isso pode ser uma limitação, como mostra o exemplo da Tabela 1. Neste jogo, duas empresas competem na venda de software (criptogra�a de arquivos). Como as duas empresas usam o mesmo padrão de criptogra�a, os arquivos criptografados pelo software de uma empresa podem ser lidos pela outra - uma vantagem para os consumidores. ATENÇÃO Se as �rmas de oligopólio agem de forma independente, a produção de mercado e os lucros das empresas �cam entre os níveis competitivo e de monopólio. Em um modelo de Cournot, cada �rma de oligopólio de�ne sua saída ao mesmo tempo. No equilíbrio de Cournot (Nash), cada �rma produz seu produto de melhor resposta – o resultado que maximiza seu lucro – dado o resultado que seu rival produz. À medida que o número de empresas Cournot aumenta, o preço, a quantidade e os lucros de equilíbrio de Cournot aproximam-se dos níveis de tomada de preços. 13 Tabela 1 - Exemplo de estratégia max-min Fonte: Pindyck e Rubinfeld (2018, p. 490). A Empresa 1 tem uma participação de mercado muito maior. Ambas as empresas estão considerando um investimento em um novo padrão de criptogra�a. Note que investir é uma estratégia dominante para a Empresa 2 porque, ao fazê-lo, fará melhor, independentemente do que a Empresa 1 �zer. Dessa forma, a Empresa 1 deve esperar que a Empresa 2 invista. Nesse caso, a Empresa 1 também faria melhor investindo (e ganhando R$ 20 milhões) do que não investindo (e perdendo R$ 10 milhões). O resultado (investir, investir) é um equilíbrio de Nash para esse jogo, e é o único equilíbrio de Nash. Mas observe que os gerentes da Empresa 1 devem ter a certeza de que os gerentes da Empresa 2 entendem o jogo e são racionais. Se a Empresa 2 cometer um erro e não investir, seria extremamente caro para a Empresa 1. Portanto, em jogos em que a eliminação iterada de estratégias estritamente dominadas não determina um único par de estratégias, pode haver um único equilíbrio de Nash (como o modelo de Cournot com três ou mais empresas), múltiplos equilíbrios de Nash ou nenhum equilíbrio de Nash. Múltiplos Equilíbrios de Nash e mix de Estratégias Agora vamos considerar um jogo de entrada que tem mais de um equilíbrio de Nash em estratégias puras.Além disso, além de usar uma estratégia pura, uma empresa neste jogo de entrada pode empregar uma estratégia mista (ou mix de estratégias) na qual o jogador escolhe entre possíveis ações, de acordo com as probabilidades que atribui. Empresa 1 Empresa 2 Não investir Investir Não investir 0, 0 -10, 10 Investir -100, 0 20, 10 14 Um jogo de entrada tem ambos os equilíbrios de Nash de estratégia mista (ou mix de estratégias) e pura. Estratégia pura é uma escolha especí�ca de uma das possíveis estratégias do jogador em um jogo. A estratégia mista é uma escolha entre duas ou mais estratégias puras de acordo com probabilidades pré-especi�cadas; ou seja, uma estratégia pura é uma regra que diz ao jogador qual ação tomar, enquanto uma estratégia mista é uma regra que diz ao jogador qual dado lançar, moeda a virar ou outro dispositivo a ser usado para se escolher uma ação. Suponha que duas empresas estejam considerando a abertura de postos de gasolina em um ponto de parada numa estrada que não tenha postos de gasolina. Há espaço físico su�ciente para no máximo dois postos de gasolina. A matriz de lucro da Figura 4 mostra que há demanda su�ciente para que apenas uma estação opere de forma lucrativa. Se ambas as �rmas entram, cada uma perderá $ 1 (cem mil). Nenhuma das empresas tem uma estratégia dominante. A melhor ação de cada empresa dependerá do que a outra empresa �zer. ATENÇÃO Uma estratégia pura atribui uma probabilidade de 1 a uma única ação, enquanto uma estratégia mista é uma distribuição de probabilidade sobre ações. Ou seja, é uma regra que diz ao jogador qual ação tomar, enquanto uma estratégia mista é uma regra que diz ao jogador qual dado lançar, moeda a virar ou outro dispositivo a ser usado para escolher uma ação. 15 Esse jogo tem dois equilíbrios de Nash em estratégias puras: a Empresa 1 entra e a Empresa 2 não entra ou a Empresa 2 entra e a Empresa 1 não entra. O equilíbrio no qual apenas a Empresa 1 entra é Nash porque nenhuma das empresas quer mudar seu comportamento. A Empresa 2 não entra, a Empresa 1 não quer mudar sua estratégia de entrar para �car fora do mercado. Se mudasse seu comportamento, passaria de US $ 1 para nada. Similarmente, a Firma 1 entra, a Firma 2 não quer mudar seu comportamento e entrar, porque perderia $ 1 em vez de empatar (ganhando $ 0). Onde somente a Empresa 2 entra é também um equilíbrio de Nash pelo mesmo tipo de raciocínio. Como os jogadores sabem qual (se algum) equilíbrio de Nash resultará? Eles não sabem! É difícil ver como as empresas escolhem estratégias, a menos que consigam e possam impor seu acordo. Por exemplo, a empresa que entra pode pagar à outra empresa para �car fora do mercado. Figura 4 - Jogo de entrada simultânea Fonte: Adaptada de Perloff (2014). 16 Se ambas as empresas usarem essa estratégia mista, cada um dos quatro resultados na matriz de payoff da Figura 4 será igualmente provável. A probabilidade de que o resultado em uma célula particular da matriz ocorra é o produto das probabilidades de que cada jogador escolha a ação relevante, porque suas ações são independentes. A probabilidade de um jogador escolher uma determinada ação é, portanto, a probabilidade de ambos escolherem um determinado par de ações (uma célula). A Empresa 1 tem uma quarta chance de ganhar $ 1 (célula superior direita), um quarto de chance de perder $ 1 (célula inferior direita) e uma chance e meia de ganhar $ 0 (células superior esquerda e inferior esquerda). Assim, o lucro esperado da empresa 1 – o lucro da empresa em cada resultado possível – aumenta a probabilidade desse resultado ser: . SAIBA MAIS Sem um acordo colusório possível, até mesmo as discussões entre as empresas antes que as decisões sejam tomadas di�cilmente ajudarão. Esses puros equilíbrios de Nash não são atraentes porque exigem que empresas idênticas usem estratégias diferentes. No jogo de entrada, ambas as empresas podem usar a mesma estratégia mista. Quando ambas as empresas entram com uma probabilidade de meio - digamos, se uma moeda virada surgir - há um equilíbrio de Nash em estratégias mistas porque nenhuma delas quer mudar sua estratégia, dado que a outra empresa usa sua estratégia mista de equilíbrio de Nash. ($1 × ) + (−$ × ) + ($0 × ) = $01 4 1 4 1 2 17 A Empresa 1 usa essa estratégia mista, a Empresa 2 não pode alcançar um lucro esperado mais alto usando uma estratégia pura. Se a Empresa 2 usa a estratégia pura de entrar com probabilidade 1, ela ganha $ 1 na metade do tempo e perde $ 1 na outra metade, então, seu lucro esperado é $ 0. Se �car de fora com certeza, a empresa 2 ganhará $ 0 com certeza. Se a Empresa 2 acredita que a Empresa 1 usará sua estratégia mista de equilíbrio, a Empresa 2 é indiferente sobre qual estratégia pura deve usar (embora considere apenas as estratégias que têm uma probabilidade positiva na estratégia mista da empresa). Suponha, ao contrário, que uma das ações na estratégia mista de equilíbrio tenha um retorno esperado maior do que alguma outra ação. Então, pagaria para aumentar a probabilidade de que a Empresa 2 tome a ação com o maior retorno esperado. Porém, se todas as estratégias puras que têm probabilidade positiva em uma estratégia mista tiverem o mesmo resultado esperado, então, o retorno esperado da estratégia mista também deverá ter esse retorno esperado. Dessa forma, a Empresa 2 é indiferente quanto ao uso de qualquer uma dessas estratégias puras ou qualquer estratégia mista sobre essas estratégias puras. Por que uma empresa escolheria uma estratégia mista em que sua probabilidade de entrar seja metade? Em um jogo simétrico, sabemos que ambos os jogadores têm a mesma probabilidade de entrar ( ). Além disso, para a Empresa 2 usar uma estratégia mista, ela deve ser indiferente entre entrar ou não entrar; para a Empresa 2 usar uma estratégia mista, ela deve ser indiferente entre entrar ou não entrar se a Empresa 1 entrar com probabilidade . A recompensa da empresa 2 de entrar será: . Sua recompensa por não entrar será: . Equacionando esses dois lucros esperados e resolvendo- os, temos, assim, que se ambas as empresas usarem uma estratégia mista, em que entrem com uma probabilidade de metade, haverá um equilíbrio de Nash. Esse jogo tem dois equilíbrios de Nash de estratégia pura (uma empresa que emprega a pura estratégia de entrar e a outra de não entrar) e um equilíbrio de Nash de estratégia mista. Se a Firma 1 decide entrar com uma probabilidade de metade, a Firma 2 será indiferente entre escolher entrar com probabilidade de 1 (a estratégia pura de entrar), 0 (a estratégia pura de não entrar) ou qualquer fração entre esses extremos. No entanto, para as estratégias das empresas constituírem um equilíbrio de Nash de estratégia mista, ambas as empresas devem optar por entrar com uma probabilidade de metade. θ θ [θ × (−1) ]+[ (1 − θ) × 1] = 1 − 2θ [θ × 0 ]+[ (1 − θ) ×] = 0 18 QUESTÃO OBJETIVA A de�nição é melhor dada em termos de “melhores respostas”, em que uma melhor resposta para o jogador a um conjunto de estratégias jogadas por outros jogadores é simplesmente uma estratégia que resultará no maior retorno possível para o jogador, dadas as estratégias jogadas. por outros. Dessa forma, assinale a alternativa correta sobre a que se refere o conceito apresentado. Payoffs. Player. Estratégia pura. Equilíbrio de Nash. Estratégia mista. 19 QUESTÃO OBJETIVA Nos negócios, preocupa-se o modo como a empresa compete em um determinado setor ou mercado. Se a empresa deve prosperar dentro de uma indústria, deve estabelecer uma vantagem competitiva sobre seus rivais. Marque a alternativa correta em relação a que o conceito apresentado se refere. Equilíbrio de Cournot. Payoffs. Equilíbrio de Nash. Ação Estratégia. 20 Os jogadores têm informações perfeitas sobre os movimentos de outros jogadores em períodos anteriores, mas possuem informações imperfeitas dentro de um período, porque os jogadores se movem simultaneamente. A solução mais conhecida é o Equilíbrio de Nash,em que cada jogador em um jogo escolhe a estratégia que gerará o maior retorno, dadas as estratégias escolhidas pelos outros jogadores. No equilíbrio de Nash, então, expectativa é igual a resultado – comportamento esperado e comportamento real convergem –, o que não seria verdade em resultados de equilíbrio não Nash. Nesta aula, você teve a oportunidade de: conhecer o que é Equilíbrio de Nash; veri�car exemplo de aplicação do Equilíbrio de Nash; distinguir os tipos de estratégia no Equilíbrio de Nash. Fechamento 21 Jogos Dinâmicos Com Informação Perfeita Até agora, estudamos jogos nos quais os jogadores tomam decisões simultaneamente. Em muitos jogos interessantes, no entanto, um jogador pode se mover antes de outros jogadores. Um exemplo disso é o modelo de Stackelberg, em que um jogador é um líder e o outro jogador é um seguidor. Em jogos desse tipo, por exemplo, o jogador A escolhe a parte superior ou inferior. O jogador B consegue observar a escolha do primeiro jogador e depois escolhe a esquerda ou à direita. Estes são chamados jogos de movimento sequencial. Em um jogo de movimento sequencial, um jogador (o primeiro movimento) realiza uma ação antes de outro jogador (o segundo movimento). O segundo proponente observa a ação tomada pelo primeiro proponente antes de decidir que ação deve tomar. Veremos que a capacidade de se mover primeiro em um jogo de movimento sequencial pode, às vezes, ter um valor estratégico signi�cativo. Ao �nal desta aula, você será capaz de: reconhecer o que são jogos dinâmicos e sequenciais; veri�car o Equilíbrio de Nash em um subjogo perfeito; Aula 02 Introdução 22 conhecer jogos repetitivos e diferenciá-los dos sequenciais. 23 Jogos Dinâmicos De acordo com Perloff (2014), em jogos estáticos de forma normal, os jogadores têm informações imperfeitas sobre como os outros jogadores vão agir, porque todos se movem simultaneamente e apenas uma vez. Em contraste, em jogos dinâmicos, os jogadores se movem sequencialmente ou se movem simultaneamente repetidamente ao longo do tempo, de modo que um jogador tenha informações perfeitas sobre os movimentos anteriores de outros jogadores. Em vez de usar a forma normal, os economistas analisam os jogos dinâmicos em sua forma extensiva, que especi�ca os n jogadores, a sequência na qual eles fazem seus movimentos, as ações que podem realizar a cada jogada, as informações que cada jogador tem sobre o desempenho anterior dos jogadores, os movimentos e a função de pagamento sobre todas as estratégias possíveis. Nesta aula, supomos que os jogadores não apenas tenham informações completas sobre a função de pagamento, mas também tenham informações perfeitas sobre o jogo até este ponto. Consideramos dois tipos de jogos dinâmicos. Começamos com um jogo de dois estágios, que é jogado uma vez e, portanto, pode-se dizer que ocorre em um “período único”. No primeiro estágio, o Jogador 1 se move. No segundo estágio, o Jogador 2 se move e o jogo termina com os pagamentos dos jogadores com base em suas ações. Um exemplo de tal jogo é o modelo Stackelberg. 24 Em seguida, examinamos um jogo repetido ou multiperíodo em que um jogo de movimento simultâneo de período único, como o jogo do dilema dos prisioneiros das companhias aéreas, é repetido pelo menos duas vezes e possivelmente muitas vezes. Embora os jogadores se movam simultaneamente em cada período, eles sabem sobre as jogadas de seus rivais em períodos anteriores, de modo que o movimento anterior de um rival pode afetar a ação atual de um jogador. Como resultado, é um jogo dinâmico. Por �m, veremos o comportamento dos jogos repetitivos. SAIBA MAIS O modelo Stackelberg (quantidade sequencial) é um modelo de liderança quantitativa; descreve o comportamento estratégico das indústrias em que há uma empresa dominante ou um líder natural enquanto as outras empresas são os seguidores. Assim, se a empresa A toma sua decisão primeiro, a empresa A é a líder do setor e a empresa B reage ou segue a decisão da empresa A. No entanto, ao tomar sua decisão, a empresa A deve antecipar como a empresa B reage a essa decisão. 25 Nos jogos em que os jogadores se movimentam sequencialmente, temos que distinguir claramente uma ação e uma estratégia. Uma ação é um movimento que um jogador faz em um ponto especi�cado, como a quantidade de saída que uma empresa produz nesse período (PERLOFF, 2014). Uma estratégia é um plano de batalha que especi�ca a ação que um jogador fará com as informações disponíveis em cada jogada. Por exemplo, a estratégia da American Airlines pode a�rmar que vai voar 64 mil passageiros entre Chicago e Los Angeles num determinado trimestre se a United Airlines tiver voado 64 mil no trimestre anterior, mas que voará apenas 48 mil num trimestre se a United tiver voado 48 mil no trimestre anterior. Essa distinção entre uma ação e uma estratégia é discutível em um jogo estático de movimento simultâneo, em que uma ação e uma estratégia são efetivamente as mesmas. Jogos Sequenciais e Repetitivos Supomos que a American e a United Airlines possam escolher apenas níveis de saída de 96, 64 e 48 milhões de passageiros por trimestre. Se uma empresa, a líder do modelo Stackelberg, escolhe sua produção antes de seus rivais, os seguidores, o líder produz mais e obtém um lucro maior do que cada empresa seguidora de custo idêntico. Isto é, a empresa designada a “mover primeiro” é chamada de líder de Figura 1 - Jogos dinâmicos Fonte: Texelart / 123RF. 26 Stackelberg, enquanto a empresa que se move em segundo lugar é chamada de seguidora de Stackelberg. Um governo pode subsidiar uma �rma de oligopólio nacional para produzir a quantidade da líder do Stackelberg, que ela vende em um mercado internacional. Um exemplo dessa liderança pode ser o domínio da Microsoft nos mercados de software. Embora a Microsoft possa tomar decisões primeiro, outras empresas menores reagem às ações da Microsoft ao tomar suas próprias decisões. As ações desses seguidores, por sua vez, afetam a Microsoft. A árvore de decisão é a representação de forma normal deste jogo, a não captura a natureza sequencial dos movimentos das empresas. Para demonstrar o papel dos movimentos sequenciais, usamos um diagrama de formato extenso ou árvore de jogo, ATENÇÃO Nos jogos de movimento sequencial, essas ameaças não incríveis são eliminadas, restringindo-os aos equilíbrios de Nash que são subindicadores, isto é, para o equilíbrio em que os primeiros impulsionadores olham para frente e determinam as melhores respostas dos seus oponentes mais tarde no jogo. Jogos sequenciais são representados por meio de árvores de decisão (PINDYCK; RUBINFELD, 2018). 27 Figura 2, que mostra a ordem dos movimentos das empresas, as possíveis ações de cada empresa no momento de sua mudança e os lucros resultantes no �nal do jogo. Na Figura 2, cada caixa é um ponto de decisão de uma das empresas, chamado de nó de decisão. O nome na caixa do nó de decisão indica que é a vez daquele jogador se mover. As linhas ou rami�cações que se estendem para fora da caixa representam uma lista completa das possíveis ações que o jogador pode fazer naquele ponto do jogo. No lado esquerdo da �gura, American, o líder, começa escolhendo um dos três níveis de saída. Ainda analisando a Figura 2, o United, o seguidor, escolhe uma das três quantidades depois de aprender o nível de saída que a American escolheu. O lado direito da �gura mostra os lucros que a American e a United ganham, uma vez que, sequencialmente, tomaram as medidas para alcançar esse ramo �nal. Por exemplo, se a American seleciona 64 e a United escolhe 96, a American ganha um lucro de US $ 2,0 milhões por trimestre e a United ganha US $ 3,1 milhões. Dentro desse jogo há subjogos. Em um determinado estágio, um subjogo consiste em todas as decisões subsequentes que os jogadores podem tomar, dadas as ações já tomadas e os payoffs correspondentes. No segundo estágio em que o United faz uma escolha, existem três subjogos possíveis. Figura 2 - Árvore de jogo de StackelbergFonte: Adaptada de Perloff (2014, p. 497). 28 Na Figura 2, se no primeiro estágio a American escolhe , o subjogo relevante é o nó superior no segundo estágio e seus três ramos. Esse jogo tem quatro subjogos. Há três subjogos no segundo estágio em que o United toma uma decisão considerando cada uma das três possíveis ações do primeiro estágio da American, havendo um subjogo adicional no momento da decisão do primeiro estágio, que é o jogo inteiro. Equilíbrio de Nash em um Subjogo Perfeito Como todo o jogo dinâmico é um subjogo, um equilíbrio de Nash perfeito no subjogo também é um equilíbrio de Nash. Em contraste, em um jogo de movimento simultâneo como o dilema dos prisioneiros estáticos, o único subjogo é o próprio jogo, portanto, não há distinção importante entre o equilíbrio de Nash e o equilíbrio de Nash perfeito no subjogo. A Figura 2 mostra a representação em forma normal desse jogo em que no equilíbrio de Nash para o jogo de movimento simultâneo é para cada empresa escolher 64. Entretanto, se as empresas se moverem sequencialmente, o equilíbrio perfeito de Nash do subjogo resultará em um resultado diferente. = 48qA 29 Como deve a American, a líder, selecionar sua saída no primeiro estágio? Para cada quantidade possível que pode produzir, a American prevê o que a United produzirá e escolhe o nível de produção que maximizará seu próprio lucro. Assim, para prever a ação da American no primeiro estágio, ela determina o que a United (seguidora) fará no segundo estágio considerando cada possível saída da American no primeiro estágio. Usando suas conclusões sobre a reação do segundo estágio do United, a American toma sua decisão no primeiro estágio. Usando o mesmo raciocínio, a American determina como a United responderá a cada uma das ações possíveis da American, como o lado direito da �gura ilustra. A American prevê que: SAIBA MAIS Podemos resolver o equilíbrio de Nash perfeito no subjogo usando a indução reversa, em que primeiro determinamos a melhor resposta do último jogador a se mover, em seguida determinamos a melhor resposta para o jogador que fez a penúltima jogada e, depois, repetimos o processo até chegarmos ao movimento no início do jogo. Em nosso exemplo, retrocedemos da decisão do seguidor, United, para a decisão da líder, American, sendo o movimento feito da direita para a esquerda da árvore do jogo. 30 Se a American escolher 48, a United venderá 64, então, o lucro da American será de US $ 3,8 milhões. Se a American escolher 64, a United venderá 64, então, o lucro da American será de 4,1 milhões de dólares. Se a American escolher 96, a United venderá 48, então, o lucro da American será de US $ 4,6 milhões. Para maximizar seu lucro, a American escolhe 96 no primeiro estágio. A estratégia do United é dar a melhor resposta à ação de primeiro estágio da American: o United seleciona 64 se a American escolher 48 ou 64, e o United escolhe 48 se a American escolher 96. Assim, o United responde no segundo estágio, selecionando 48. Nesse equilíbrio de Nash perfeito para subjogos, nenhuma das empresas quer mudar sua estratégia. Dado que a American Airlines de�ne sua produção em 96, a United está usando uma estratégia que maximiza seu lucro, por isso, não quer mudar. Da mesma forma, dada a forma como a United responderá a cada nível possível de produção americana, a American não poderá obter mais lucros do que se vender 96. 31 Em um jogo repetido, uma empresa pode in�uenciar o comportamento de seu rival ameaçando puni-lo (Figura 3). Por exemplo, uma companhia aérea poderia usar uma estratégia de baixa quantidade por alguns períodos para indicar à outra empresa seu desejo de que as duas empresas cooperassem e produzissem essa baixa quantidade no futuro (PERLOFF, 2014). Se a outra �rma não responder diminuindo sua produção em períodos futuros, a primeira �rma sofrerá lucros menores por apenas alguns períodos. ATENÇÃO O equilíbrio perfeito de Nash no subjogo requer que os jogadores acreditem que seus oponentes agirão de maneira ideal - de acordo com seus próprios interesses. Nenhum jogador tem incentivo para se desviar das estratégias de equilíbrio. A razão para adicionarmos o requisito da perfeição do subjogo é que queremos explicar o que acontecerá se um jogador não seguir o caminho de equilíbrio. 32 No entanto, se a outra empresa responder a esse sinal e diminuir sua quantidade, ambas as empresas poderão produzir com lucro na baixa quantidade a partir de então. Além de (ou em vez de) sinalizar, uma empresa pode ameaçar punir um rival por não restringir a saída. Suponha que a American anuncia ou de alguma forma indica à United que usará a seguinte estratégia de duas partes: A American produzirá a menor quantidade a cada período desde que a United faça o mesmo. Se a United produzir a quantidade maior no período t, a American produzirá a quantidade maior no período e em todos os períodos subsequentes. Se a United acreditar que a American seguirá essa estratégia, a United fará US $ 4,6 milhões a cada período se produzir a menor quantidade. Embora a United possa obter um lucro maior (US $ 5,1 milhões) no período t produzindo a maior quantidade, ao fazê-lo, reduzirá seu lucro potencial para US $ 4,1 milhões em cada período seguinte. Quando trabalhamos com jogos de movimento simultâneo e sequencial, observamos que eles apresentam resultados diferentes, mas por quê? Dada a opção de agir primeiro, por exemplo, a American escolhe um grande nível de produção para obter, Figura 3 - Punição em jogos de empresas Fonte: Dazdraperma / 123RF. 33 no melhor interesse da United, um nível de produção relativamente pequeno, 48. A American se bene�cia ao mover-se primeiro e escolher a quantidade de líderes do Stackelberg. No jogo de movimento simultâneo, por que a American não anuncia que produzirá a saída do líder da Stackelberg para induzir a United a produzir o nível de saída do seguidor da Stackelberg? A resposta é que, quando as empresas se movem simultaneamente, o United não acredita na advertência da American de que produzirá uma grande quantidade, porque não é do interesse da American produzir uma quantidade tão grande de produção. SAIBA MAIS Para que a estratégia anunciada de uma empresa seja uma ameaça crível, os rivais precisam acreditar que a estratégia da empresa foi racional, no sentido de que é do interesse da empresa usá-la. A intuição do motivo do compromisso ser uma ameaça credível é a de “pontes em chamas”. Se o general queima a ponte atrás do exército para que as tropas só possam avançar e não recuar, o exército se torna um inimigo mais temível – como um animal encurralado. Da mesma forma, ao limitar suas opções futuras, uma empresa se fortalece. 34 Conforme Perloff (2014), nem todas as empresas podem fazer ameaças credíveis, porque nem todas as empresas podem assumir compromissos. Normalmente, para que uma ameaça tenha sucesso, uma empresa deve ter uma vantagem que lhe permita prejudicar a outra empresa antes que a empresa possa retaliar. Empresas idênticas que agem simultaneamente não podem ameaçar uma à outra. Porém, uma �rma pode ser capaz de tornar seu comportamento ameaçador crível se as �rmas forem diferentes. Uma diferença importante é a capacidade de uma empresa agir antes da outra. Jogos repetitivos Agora, voltaremos para jogos estáticos que são repetidos. Em cada período, há um único estágio: ambos os jogadores se movem simultaneamente. No entanto, estes são jogos dinâmicos porque o movimento do Jogador 1 no período t precede o movimento do Jogador 2 no período, portanto, quanto mais cedo se dá a ação, mais ela pode afetar o posterior. Segundo Pindick e Rubinfeld (2018), um jogo repetitivo (Figura 4) é um jogo de informações quase perfeitas: os jogadores conhecem todos os movimentos de períodos anteriores, mas não conhecem as jogadas um do outro no período, porque todos se movimentam simultaneamente. Figura 4 - Jogos repetitivos Fonte: Karel Miragaya / 123RF. 35 Em um jogo repetido, uma empresa pode in�uenciaro comportamento de seu rival ameaçando puni-lo (BÊRNI; FERNANDEZ, 2014). Por exemplo, uma companhia aérea poderia usar uma estratégia de baixa quantidade por alguns períodos para indicar à outra empresa seu desejo de que as duas empresas cooperassem e produzissem essa baixa quantidade no futuro. Se a outra �rma não responder diminuindo sua produção em períodos futuros, a primeira �rma sofrerá lucros menores por apenas alguns períodos. No entanto, se a outra empresa responder a esse sinal e diminuir sua quantidade, ambas as empresas poderão produzir com lucro na baixa quantidade a partir de então. Além de (ou em vez de) sinalizar, uma empresa pode ameaçar punir um rival por não restringir a saída. Agora, considere que a American anuncia ou de alguma forma indica à United que usará a seguinte estratégia de duas partes: A American produzirá a menor quantidade a cada período, desde que a United faça o mesmo. Se a United produzir a quantidade maior no período t, a American produzirá a quantidade maior no período e em todos os períodos subsequentes. Se a United acreditar que a American seguirá essa estratégia, a United sabe que fará US $ 4,6 milhões a cada período se produzir a menor quantidade. Embora a United possa obter um lucro maior (US $ 5,1 milhões) no período t produzindo a maior quantidade, ao fazê-lo, reduzirá seu lucro potencial para US $ 4,1 milhões em cada período seguinte. 36 A United pode levar a sério essa ameaça da American (porque a melhor resposta da American será produzir a maior quantidade) se acreditar que não pode con�ar na United para produzir a menor quantidade. Caso as empresas joguem o mesmo jogo inde�nidamente, elas deverão achar mais fácil conspirar. SAIBA MAIS Assim, a melhor política da United é produzir a menor quantidade em cada período, a menos que se importe muito com o lucro atual e pouco com os lucros futuros. Se a United valorizar os lucros futuros quase tanto quanto os atuais, o ganho de um período de desvios do nível de produção colusivo não compensará as perdas de lucros reduzidos em períodos futuros, que é a punição que a American imporá. 37 QUESTÃO OBJETIVA Permite que a empresa dominante no mercado de�na seu preço primeiro e, subsequentemente, as empresas seguidoras otimizem sua produção e preço. Marque a alternativa correta sobre a que se refere o conceito apresentado. Jogos repetitivos. Equilíbrio de Nash. Subjogo. Jogos estáticos. Modelo de Stackelberg. 38 QUESTÃO OBJETIVA Em um jogo de Stackelberg, o líder se compromete a produzir tanta saída que é do interesse do seguidor produzir uma quantidade relativamente pequena de produto. Considerando a informação apresentada, marque a alternativa correta sobre um jogo repetido. Em um jogo repetido, os jogadores repetem um jogo estático no qual eles se movem simultaneamente dentro de um período. Em um jogo repetido, os jogadores repetem um jogo sequencial no qual eles se movem simultaneamente dentro de um período. Em um jogo repetido, os jogadores repetem um subjogo no qual eles se movem simultaneamente dentro de um período. Em um jogo repetido, uma empresa não pode in�uenciar o comportamento de seu rival ameaçando puni-lo. Caso as empresas joguem o mesmo jogo inde�nidamente, elas deverão achar mais difícil conspirar. 39 Em jogos dinâmicos, um jogador leva em consideração os movimentos anteriores dos outros jogadores ao escolher um movimento. Em jogos de movimento sequencial, um jogador se move antes do outro jogador. Economistas tipicamente estudam jogos sequenciais de informações completas sobre pagamentos e informações perfeitas sobre movimentos anteriores. A solução mais conhecida de um jogo dinâmico é um equilíbrio de Nash perfeito no subjogo em que as estratégias dos jogadores são um equilíbrio de Nash em cada subjogo. Os jogadores podem usar estratégias mais complexas em jogos dinâmicos do que em jogos estáticos. Além disso, é mais fácil para os jogadores maximizar o seu pagamento conjunto em um jogo repetido do que em um jogo de período único. Nesta aula, você teve a oportunidade de: veri�car as características dos jogos dinâmicos e sequenciais; entender o modelo de Stackelberg e a árvore de jogo; analisar o equilíbrio de Nash em subjogo perfeito. Fechamento 40 Indução Inversa A indução inversa é usada para mostrar que apenas um re�namento do conceito de equilíbrio de Nash, chamado de equilíbrio de Nash perfeito no subjogo, exclui ameaças não credíveis. Jogos envolvendo ameaças para se processar invasores e combater a entrada são usados para explorar a ideia de comprometimento. Sempre que um jogador tem que se mover, a indução inversa deduz, para cada uma de suas possíveis ações, as ações que os jogadores (incluindo ela mesma), subsequentemente, tomarão racionalmente, bem como escolhe a ação que produzirá o �nal que o jogador prefere. O jogo centopeia também é analisado e algumas questões são levantadas sobre o escopo do método de indução inversa. Ao �nal desta aula, você será capaz de: conhecer de forma geral a indução inversa; veri�car como se dá o processo de indução inversa; conhecer o jogo da centopeia e sua relação com a indução inversa. Aula 03 Introdução 41 Indução Inversa: De�nições A indução inversa na teoria dos jogos é um processo iterativo de raciocínio inverso no tempo, a partir do �nal de um problema ou situação, para se resolver jogos extensos e de formato extensivos, bem como inferir uma sequência de ações ótimas. Em cada estágio do jogo, a indução reversa determina a estratégia ideal do jogador que fará o último movimento no jogo. Então, a ação ótima do penúltimo jogador em movimento é determinada considerando-se a ação do último jogador como dada. Esse processo continua para trás até que a melhor ação para cada ponto no tempo tenha sido determinada. Efetivamente, um deles é determinar o equilíbrio de Nash de cada subjogo do jogo original. Segundo Bêrni e Fernandez (2014, p. 167): SAIBA MAIS Ela tem sido usada para resolver jogos desde que John von Neumann e Oskar Morgenstern estabeleceram a teoria dos jogos como um assunto acadêmico quando publicaram seu livro Teoria dos Jogos e Comportamento Econômico, em 1944. 42 Em termos metodológicos, indução é a forma de raciocínio que foi originalmente defendida pela corrente do Indutivismo (ou Empirismo). Esta foi a perspectiva �losó�ca padrão sobre como era obtido o conhecimento cientí�co durante todo o período que se estendeu do século XVII até as primeiras décadas do século XX. Em termos lógicos, trata-se de uma forma de inferência que propõe que, a partir de uma lista �nita de observações de algum fato ou fenômeno feitas no passado e no presente, se conclua que o fenômeno em pauta voltará a se repetir também no futuro. O procedimento de indução inversa funciona da seguinte maneira: começamos a encontrar as ações ótimas dos jogadores que se movem nos subjogos de comprimento 1 (os “últimos” subjogos); então, tomando essas ações como dadas, encontramos as ações ótimas dos jogadores que se movem primeiro nos subjogos de tamanho 2. Continuamos a trabalhar de volta para o começo do jogo, em cada estágio k, descobrindo as ações ótimas dos jogadores que se movem no início dos subjogos de comprimento k, dadas as ações ótimas. Em cada estágio k desse procedimento, as ações ótimas dos jogadores que se movem no início dos subjogos de longitude k são fáceis de determinar: elas são simplesmente as ações que proporcionam aos jogadores os maiores retornos, dadas as ações ótimas em todos os menores subjogos. Considere, por exemplo, o jogo na Figura 1. Figura 1 - Jogo ilustrando o procedimento de indução inversa Fonte: Elaborada pela autora. 43 Com base na Figura 1, temos o seguinte: I. Em primeiro lugar, considere subjogos de comprimento 1. O jogo tem dois desses subjogos; em ambos, o jogador 2 se move. No subjogo após o histórico C, a ação ótima do jogador 2 é E, e no subjogo após o histórico D, sua ação ideal é H. II. Agora, considere subjogos decomprimento 2. O jogo tem um subjogo desse tipo, ou seja, um jogo inteiro, em que o jogador 1 se move. Dadas as ações ótimas nos subjogos de duração 1, a escolha do jogador 1 no início do jogo lhe renderia um pagamento de 2, enquanto a escolha de D renderia uma recompensa de 1. Assim, a ação ótima do jogador 1 no início do jogo seria C. O jogo não tem um subjogo de tamanho maior que 2, então, o procedimento de indução reversa produz o par de estratégia (C, EH). Como outro exemplo, considere o jogo na Figura 2. Em primeiro lugar, deduzimos que no subjogo de comprimento 1 após a história (C, E), o jogador 1 escolherá G; então, no início do subjogo de comprimento 2, seguindo o histórico C, o jogador 2 escolherá E; então, no início de todo o jogo, o jogador 1 escolherá D. Assim, o procedimento de indução inversa neste jogo produzirá o par de estratégia (DG, E). Figura 2 - Extenso jogo no qual o jogador 1 se move antes e depois do jogador 2 Fonte: Elaborada pela autora. 44 Em qualquer jogo no qual esse procedimento seleciona uma única ação para o jogador que se move no início de cada subjogo, o per�l de estratégia selecionado é o único equilíbrio perfeito para o subjogo do jogo. Considere o exemplo, o jogo na Figura 3: ATENÇÃO O que acontece em um jogo no qual, no início de alguns subjogos, há mais de uma ação ótima? Em tal jogo, uma extensão do procedimento de indução inversa localizará todo o equilíbrio perfeito do subjogo. Essa extensão traçará de volta, separadamente, as implicações para o comportamento nos subjogos mais longos de cada combinação de ações ótimas nos subjogos mais curtos. 45 Observando a Figura 3, temos: A. O jogo tem três subjogos de comprimento um, e em cada um deles, o jogador 2 se move. Nos subjogos que seguem as histórias C e D, o jogador 2 é indiferente entre suas duas ações. No subjogo que segue a história E, a ação ótima exclusiva do jogador 2 é K. Assim, há quatro combinações de ações ótimas do jogador 2 nos subjogos de duração 1: FHK, FIK, GHK e GIK (em que o primeiro componente em cada caso é a ação do jogador 2 após o histórico C, o segundo componente é sua ação após o histórico D, e o terceiro componente é sua ação após o histórico E). B. O jogo tem um único subjogo de comprimento dois, ou seja, o jogo inteiro, no qual o jogador 1 se move primeiro. Consideramos agora a ação ótima do jogador 1 neste jogo para cada combinação das ações ótimas do jogador 2 nos subjogos de duração 1, logo: Para as combinações FHK e FIK das ações ótimas do jogador 2, a ação ótima do jogador 1 no início do jogo é C. Para a combinação GHK de ações ótimas do jogador 2, as ações C, D e E são todas ótimas para o jogador 1. Figura 3 - Jogo em que o primeiro movimento em alguns subjogos tem múltiplas ações ótimas Fonte: Elaborada pela autora. 46 Para a combinação GIK de ações ótimas do jogador, a ação ótima do jogador 1 no início do jogo é D. Assim, os pares de estratégias isolados pelo procedimento são (C, FHK), (C, FIK), (C, GHK), (D, GHK), (E, GHK) e (D, GIF). Quando você resolve um jogo de movimento sequencial usando a indução inversa, você começa no �nal da árvore do jogo, e para cada ponto de decisão (representado pelos quadrados sombreados), você encontra a melhor decisão para o jogador naquele ponto. Você continua fazendo isso até chegar ao começo do jogo. O processo de pensamento de indução reversa tem a propriedade atraente que nos permite dividir um jogo potencialmente complicado em partes gerenciáveis. Vamos a mais um exemplo de indução inversa? Suponha que a Honda possa tomar sua decisão de capacidade antes que a Toyota decida o que fazer (talvez porque tenha acelerado o processo de tomada de decisão). Agora temos um jogo de movimento sequencial no qual a Honda é a primeira a ser movida e a Toyota é a segunda a ser movida. Para analisar esse jogo de movimento sequencial, usamos uma árvore de jogos, que mostra as diferentes estratégias que cada jogador pode seguir no jogo e a ordem em que essas estratégias são escolhidas. A Figura 4 mostra a árvore de jogos do nosso jogo de expansão de capacidade. Em qualquer árvore de jogo, a ordem dos movimentos �ui da esquerda para a direita, porque a Honda se move primeiro e está na posição mais à esquerda. Para cada uma das possíveis ações da Honda, a árvore mostra as possíveis decisões para a Toyota. 47 Para aplicar a indução inversa nesse exemplo, precisamos encontrar a decisão ideal da Toyota para cada uma das três opções que a Honda pode dar: “não construir”, “construir pequenas” e ‘construir" grande ‘(na Figura 4, as escolhas ideais da Toyota estão em negrito): Se a Honda escolher “não construir”, a escolha ideal da Toyota será “construir pequena”. Se a Honda escolher “construir pequenas”, a escolha ideal da Toyota será “construir pequenas”. Se a Honda escolher “construir grande”, a escolha ideal da Toyota será “não construa”. Assumimos que a Honda antecipa que a Toyota escolherá sua melhor resposta para cada uma das três ações que a Honda puder tomar. Podemos em seguida, determinar qual das três estratégias da Honda lhe dará o maior lucro, identi�cando o lucro que a Honda obterá de cada opção que escolher, uma vez que a Toyota responderá de forma otimizada: Se a Honda escolher “não construir”, então, dada a reação ideal da Toyota, o lucro da Honda será de US $ 15 milhões. Se a Honda escolher “construir pequeno”, então, dada a reação ideal da Toyota, o lucro da Honda será de US $ 16 milhões. Se a Honda escolher “construir grande”, então, dada a reação ideal da Toyota, o lucro da Honda será de US $ 18 milhões. Dessa forma, a Honda obtém o maior lucro quando escolhe “construir grande”. Para o equilíbrio de Nash, neste jogo, a Honda deve escolher “construir grande” e a Toyota escolher “não construir”. Nesse equilíbrio, o lucro da Honda será de US $ 18 milhões, e o lucro da Toyota será de US $ 9 milhões. Figura 4 - Árvore de jogos para o jogo de expansão de capacidade de movimento sequencial entre a Toyota e a Honda *Recompensas em milhões de dólares Fonte: Besanko e Braeutigam (2014, p. 595). 48 Por que o comportamento da Honda é tão diferente quando pode se mover primeiro? Porque no jogo sequencial, os problemas de decisão da empresa estão ligados no tempo: a Toyota pode ver o que a Honda fez, e a Honda conta com uma resposta racional da Toyota para qualquer ação que escolher. Isso permite que a Honda force a Toyota a um canto. Ao se comprometer com uma expansão de grande capacidade, a Honda coloca a Toyota em uma posição em que o melhor que pode fazer não é construir. Em contraste, no jogo de movimento simultâneo, a Toyota não pode observar a decisão da Honda de antemão e, portanto, a Honda não pode forçar a mão da Toyota. Por causa disso, a escolha de “construir grande” pela Honda não é tão convincente quanto no jogo de movimento sequencial. ATENÇÃO Observe que o equilíbrio de Nash do jogo de movimento sequencial difere signi�cativamente daquele do jogo de movimento simultâneo (ambas as empresas escolhem “construir pequeno”). De fato, no jogo de movimento sequencial, a estratégia de equilíbrio da Honda (“construir grande”) seria dominada se a Toyota e a Honda �zessem suas escolhas de capacidade simultaneamente. 49 No jogo da centopeia, dois jogadores alternadamente obtêm uma chance maior de ganhar um pote crescente de dinheiro ou passar o pote para o outro jogador. Os pagamentos são arranjados de modo que se o pote (que é usado para o jogo) for passado para o oponente e ele receber o pote na próxima rodada, um dos jogadores receberá um pouco menos do que se alguém tivesse pegado o pote nessa rodada. O jogo termina assim que um jogador leva o dinheiro, sendo que um receberá a maior parte e o outro jogador receberá a parte menor. Jogo da Centopeia O jogo da centopeia ou centipede game (por causa da maneira como eles são representados diagramaticamente, Figura 5) é um jogo de forma extensa na teoria dos jogos cujos dois jogadores, alternadamente, têm a chance de ganhara maior SAIBA MAIS No entanto, os resultados inferidos da indução inversa muitas vezes não conseguem prever o jogo humano real (BESANKO; BRAEUTIGAM, 2014). Estudos experimentais mostraram que o comportamento “racional” (como previsto pela teoria dos jogos) raramente é exibido na vida real. Os jogadores irracionais podem, na verdade, acabar obtendo maiores recompensas do que o previsto pela indução inversa, como ilustrado no jogo de centopeia. 50 parte de um estoque de dinheiro aumentando-o lentamente. É organizado de modo que, se um jogador passar o esconderijo para o seu oponente, que receberá o esconderijo, tal jogador receberá uma quantia menor do que se ele tivesse pegado o pote. O jogo termina assim que um jogador leva o esconderijo, recebendo a maior porção, enquanto o outro jogador recebe a porção menor. O jogo tem um número total pré- de�nido de rodadas, que são conhecidas por cada jogador antecipadamente. Figura 5 - Jogo da centopeia Fonte: Carmichael (2005, p. 102). 51 Os principais pontos-chave do jogo da centopeia são: é um jogo no qual dois jogadores se alternam para receber uma parte de uma soma cada vez maior de dinheiro; é uma abordagem inovadora para o con�ito entre interesse próprio e benefício mútuo; e apenas uma porcentagem muito pequena de indivíduos escolheu passar o estoque para aumentar a quantidade de estoque. Como exemplo, considere a seguinte versão do jogo centopeia envolvendo dois jogadores, Pedro e Carlos. O jogo começa com um pagamento total de R$ 2. Pedro vai primeiro e tem que decidir entre “pegar” ou “passar’ o pagamento. Se ele ganhar, receberá R$ 2 e Carlos receberá R$ 0, mas se ele passar, a decisão de “pegar ou passar” deverá ser feita por Carlos. O pagamento agora aumentará de R$ 2 para R$ 4; se Carlos receber R$ 3, Pedro receberá $ 1, mas se ele passar, Pedro decidirá se vai tirar ou passar, e se ele passar, o SAIBA MAIS Embora não tão conhecido quanto o famoso Dilema do Prisioneiro, o jogo da centopeia também destaca o con�ito entre o interesse próprio e o benefício mútuo com o qual as pessoas têm de lidar. Foi introduzido pela primeira vez pelo psicólogo Robert Rosenthal, em 1982. O jogo da centopeia é assim chamado porque sua versão original consistia em uma sequência de 100 movimentos. 52 pagamento aumentará de R$ 2 para R$ 6; se Pedro pegar, receberá R$ 4, enquanto Carlos receberá R$ 2. Se Pedro e Carlos receberem, o pagamento aumentará de R$ 2 a R$ 8, e Pedro receberá R$ 3, enquanto Carlos receberá R$ 5. O jogo continuará nesse sentido por um total de 100 rodadas. Se ambos os jogadores escolherem passar, cada um receberá uma recompensa de R$ 50 no �nal do jogo. Note que o dinheiro é contribuído por um terceiro e não por algum dos jogadores. Em estudos experimentais, no entanto, apenas uma porcentagem muito pequena de indivíduos escolheu assumir o primeiro movimento. Essa discrepância poderia ter várias explicações. Uma razão é que algumas pessoas são altruístas e preferem cooperar com o outro jogador, sempre passando em vez de derrubar o pote. Outra razão é que as pessoas podem simplesmente ser incapazes de fazer o raciocínio dedutivo necessário para fazer a escolha racional prevista pelo equilíbrio de Nash. O fato de poucas pessoas pegarem o estoque na primeira jogada não é ATENÇÃO O que a teoria dos jogos prevê? Usando a indução inversa, a teoria dos jogos prevê que Pedro (ou o primeiro jogador) escolherá dar o primeiro passo e ambos os jogadores receberão um pagamento de R$ 1. 53 muito surpreendente, dado o pequeno tamanho da recompensa inicial quando comparado com os pagamentos crescentes à medida que o jogo avança. 54 QUESTÃO OBJETIVA É usada para escolher entre vários equilíbrios de Nash, veri�cando se as jogadas dos jogadores são as melhores respostas entre si em cada nó de decisão. Marque a alternativa correta sobre a que o fragmento de texto se refere. Jogo da centopeia. Ameaças. Indução inversa. Dilema do prisioneiro. Árvore de jogo. 55 QUESTÃO OBJETIVA Tendo por base o jogo da centopeia, que representa um exemplo clássico de uma situação estratégica em que a previsão de equilíbrio está em desacordo com o comportamento humano, marque a alternativa correta. Assim que um jogador leva, o jogo termina com ele recebendo a menor parte da pilha enquanto o outro jogador recebe a parte maior. É um jogo de forma extensa no qual dois jogadores alternadamente têm a chance de pegar a maior parte de uma pilha de dinheiro em crescimento contínuo. Passar estritamente aumenta o pagamento de um jogador se o oponente �zer o próximo movimento. Se o oponente também passar, os dois jogadores são confrontados com a mesma situação de escolha, com papéis invertidos e menores pagamentos. O jogo tem um número in�nito de movimentos, que são conhecidos antecipadamente para ambos os jogadores. 56 Fechamento Um procedimento para se resolver um jogo de movimento sequencial é a indução inversa, que tem seu início no �nal da árvore do jogo, encontrando a melhor decisão para o jogador em cada ponto de decisão. É fácil aplicar a indução inversa com a suposição de que ambos os jogadores se preocupam apenas em obter o máximo de dinheiro possível. Se João oferecer a Maria uma quantia positiva, ela dirá que sim, porque qualquer coisa é melhor que nada. O máximo que João oferecerá, portanto, será um centavo. Em um equilíbrio perfeito no subjogo, João, portanto, pegará o pote. Vimos que o jogo centopeia é um jogo para dois jogadores que alternam a escolha entre terminar o jogo (“pegar’) ou passar para o outro jogador (“passar”). A recompensa em se receber o nó de decisão atual é maior do que a recebida pelo outro jogador, porém, menor do que a recompensa que ele poderia receber se o outro jogador também passasse. O jogador que faz a escolha �nal recebe um pagamento melhor do que o que passa. Nesta aula, você teve a oportunidade de: conhecer o conceito de indução inversa; veri�car como se dá a indução inversa nos jogos; Analisar o jogo da centopeia. 57 Ameaças Críveis e Não Críveis Na realidade, alguns compromissos e ameaças são credíveis, outros não. Aqui, o princípio para julgar a credibilidade do compromisso e da ameaça é que, dadas as condições que podem levar ao comprometimento e à ameaça, se é mais vantajoso levar a cabo as promessas da pessoa que emitiu o compromisso ou ameaça, então, o compromisso ou ameaça é credível. Por outro lado, se é desvantajoso para a pessoa que emitiu o compromisso ou ameaça cumprir as promessas, então, o compromisso ou ameaça não é credível. Isso porque acreditamos que uma pessoa racional, quando confrontada com escolhas de comportamento, só escolherá aquela que é mais bené�ca para si mesma. Não é possível julgar a credibilidade de compromisso e ameaça de uma pessoa irracional. Ao �nal desta aula, você será capaz de: analisar credibilidade e ameaças; conhecer o que são ameaças críveis e não críveis; veri�car como as ameaças se dão nos jogos. Aula 04 Introdução 58 Movimento Estratégico e o Compromisso As empresas (os players) podem realizar vários movimentos estratégicos diferentes para gerar vantagem competitiva. O objetivo é criar uma diferença clara que seja importante para seus clientes, que seja algo que seus concorrentes não possam igualar. Pode-se criar vantagem competitiva desenvolvendo uma estratégia de liderança em fatores como custo, qualidade, inovação e experiência do cliente. Nesse contexto, temos o movimento estratégico. 59 As principais características de um movimento estratégico (Figura 1) envolvem o compromisso do jogador, signi�cando que ele pode restringir suas próprias escolhas e que o compromisso tem que ser crível, ou seja,, uma vez empregado, deve ser do interesse do jogador seguir com o movimento. Movimentos credíveis também devem ser observáveis para os outros jogadores. Por exemplo, a Empresa 1 terá de conter seu comportamento de modo que convença a Empresa 2 de que a Empresa 1 não tem outra alternativa. ATENÇÃOUm movimento estratégico na teoria dos jogos é uma ação tomada por um jogador fora das ações de�nidas do jogo a �m de se obter uma vantagem estratégica e aumentar o retorno de uma pessoa. Movimentos estratégicos podem ser movimentos incondicionais ou regras de resposta. 60 Segundo Pindyck e Rubinfeld (2018), os movimentos estratégicos não são avisos ou garantias. Avisos e garantias são apenas declarações do interesse de um jogador em vez de um compromisso real do jogador. Os primeiros movimentos devem ser observáveis e irreversíveis para serem verdadeiros primeiros golpes, e eles devem ser críveis se quiserem ter o efeito desejado na alteração do resultado de equilíbrio do jogo. Um jogador pode usar ameaças e promete alterar as expectativas dos outros jogadores sobre suas ações futuras, e assim induzi-los a tomar ações favoráveis a ele ou impedi-los de fazer movimentos que o prejudiquem. Para ter sucesso, as ameaças e promessas devem ser con�áveis. Isso é problemático porque, quando chega a hora, é geralmente caro fazer uma ameaça ou cumprir uma promessa. Figura 1 - Movimento estratégico Fonte: Strelok / 123RF. 61 O comprometimento é o primeiro passo incondicional usado para se aproveitar a vantagem de ser o primeiro quando existe um. Tal movimento geralmente implica o comprometimento com uma estratégia que não teria sido uma estratégia de equilíbrio na versão original do jogo, podendo existir, então, um incentivo para se renegar o comprometimento mais tarde. ATENÇÃO A teoria dos jogos estuda várias maneiras de aumentar a credibilidade. O princípio geral é que pode ser do interesse do jogador reduzir sua própria liberdade de ação futura. Ao fazer isso, ele remove sua própria tentação de renegar uma promessa ou perdoar as transgressões dos outros. 62 Ameaças e Credibilidade Jogos estratégicos são diferenciados da tomada de decisão individual pela presença de interações signi�cativas entre os jogadores. Os jogos podem ser classi�cados de acordo com uma variedade de categorias, incluindo o tempo de jogo, os interesses comuns ou con�itantes dos jogadores, o número de vezes que uma interação ocorre, a quantidade de informação disponível para os jogadores, o tipo de regras e a viabilidade de uma ação coordenada. Racionalidade ou comportamento consistente é assumido por todos os jogadores, que também devem estar cientes de todas as regras relevantes de conduta. O equilíbrio surge quando todos os jogadores usam estratégias que são melhores respostas às estratégias dos outros; algumas classes de jogos permitem aprender com a experiência e estudar movimentos dinâmicos em direção ao equilíbrio. SAIBA MAIS Os jogadores têm estratégias que levam a diferentes resultados com diferentes recompensas associadas. Os payoffs incorporam tudo o que é importante para um jogador sobre um jogo e são calculados usando médias probabilísticas ou valores esperados se os resultados forem aleatórios ou envolver algum risco. 63 Na teoria dos jogos, os jogadores podem obter uma vantagem estratégica por meio da regra de resposta. Uma regra de resposta de�ne a(s) ação(ões) como resposta à(s) outra(s) ação(ões). As regras de resposta são predominantes em nossas vidas. Um gerente dizendo a um funcionário que ele receberá um aumento se exceder seu plano de vendas para o ano é um exemplo simples de uma regra de resposta. A regra de resposta pode ser de�nida de duas maneiras: ameaças e recompensas. Ameaças e promessas são essencialmente as mesmas; ambas são mensagens que os jogadores podem enviar uns aos outros para afetar o outro jogador na escolha de uma determinada ação. Com uma ameaça, a falta de cooperação resulta em algum tipo de compensação negativa. Com uma recompensa (Figura 2) ou promessa, a cooperação resulta em algum tipo de recompensa positiva. Os primeiros movimentos condicionais, como ameaças e promessas, são regras de resposta concebidas para impedir as ações dos rivais e preservar o status quo ou para obrigar as ações dos rivais e alterar o status quo. Ameaças carregam a possibilidade de danos mútuos, mas não custam nada se funcionam; ameaças que criam apenas o risco de um resultado ruim são conhecidas como atos de arrogância. As promessas são caras apenas para o fabricante e somente se forem bem-sucedidas. As ameaças podem ser arbitrariamente grandes, embora o tamanho excessivo Figura 2 - Analogia à recompensa Fonte: Iqoncept / 123RF. 64 comprometa a credibilidade, mas as promessas geralmente são su�cientemente grandes para serem efetivas. Credibilidade deve ser estabelecida para qualquer movimento estratégico. Há uma série de princípios gerais a considerar para tornar os movimentos credíveis e vários dispositivos especí�cos que podem ser usados para se adquirir credibilidade. Estes geralmente funcionam reduzindo a própria liberdade futura de escolha ou alterando os próprios resultados de ações futuras. A reputação corporativa pode ser uma fonte adicional de vantagem competitiva por meio de compra, encaminhamento, boca a boca positivo e benefício da dúvida em crise; ou seja, não é, em geral, in�uenciada somente por produtos e serviços. Empresas líderes comunicam e agem de uma maneira valorizada por seus stakeholders, bem como estão criando uma abordagem equilibrada e são ATENÇÃO Dispositivos especí�cos desse tipo incluem o estabelecimento de uma reputação, usando o trabalho em equipe, demonstrando aparente irracionalidade, queimando pontes e fazendo contratos, embora a aquisição de credibilidade seja frequentemente especí�ca do contexto. Dispositivos semelhantes existem para combater movimentos estratégicos feitos por jogadores rivais. 65 recompensadas pela con�ança e pelos negócios em produtos, mercados e culturas. Todas as empresas têm uma reputação, seja boa ou ruim. Ameaças não Críveis Uma ameaça não credível (Figura 3) ou vazia é um termo usado na teoria dos jogos e na economia para descrever uma ameaça em um jogo sequencial que um jogador racional, na verdade, não executaria, porque não seria de seu interesse fazê-lo (PINDYCK; RUBINFELD, 2018). Por exemplo, a Empresa 1 fabrica uma máquina multifunções e a Empresa B, uma máquina com uma função. As duas empresas podem cobrar um preço elevado e ter altos lucros. Ainda que a Empresa 2 pratique um preço mais baixo e a Empresa 1 pratique um preço alto, muitos indivíduos ainda comprarão a máquina da Empresa 1. Figura 3 - Ilustração para ameaça vazia Fonte: Elnur Amikishiyev / 123RF. 66 Porém, se a Empresa 1 praticar um preço baixo, os lucros de ambas serão diminuídos expressivamente. A Empresa 1 tem preferência pela situação em que as duas pratiquem o preço alto. Para a Empresa 2, praticar um preço baixo é uma estratégia predominante. A Empresa 1 poderia ameaçar a Empresa 2 por praticar um preço baixo caso ela quisesse praticar um preço baixo. Essa ameaça não seria credível, pois, mesmo quando a Empresa 2 praticar um preço menor, a Empresa 1 terá muito a perder praticando um preço menor. Considerando o seguinte exemplo: quando um sindicato exige um aumento salarial para os trabalhadores de uma empresa, a ameaça frequentemente usada é: “Se não obtivermos um aumento salarial, entraremos em greve”. Para a empresa, essa é uma ameaça não credível. Embora a empresa sofra uma perda de greve, os trabalhadores também sofrerão. ATENÇÃO Uma ameaça não credível é feita na esperança de que se acredite, e, portanto, a ação indesejável ameaçadora não precise ser realizada. Para que uma ameaça seja credível dentro de um equilíbrio, sempre que um nó for alcançado onde uma ameaça deve ser cumprida, ela será satisfeita. O Equilíbrio de Nash que depende de ameaças não credíveis pode ser eliminado por meio da indução inversa; os equilíbrios restantes são chamados de equilíbrio de Nash perfeito no subjogo. 67 A condição de que a empresa “não dará um aumento salarial aos trabalhadores” fará com que os trabalhadores escolham o comportamento “sem greve” que é mais bené�co para eles. Deve-se salientar que “não-credível”aqui não signi�ca que “de�nitivamente não vai acontecer”. Por exemplo, se o sindicato acredita que a empresa �nalmente vai encontrá-lo demais e terá que dar aos trabalhadores um aumento salarial no �nal, então, o sindicato escolherá “greve” (Figura 4). Portanto, a análise da invasão, por exemplo, mostra como o conceito de um subjogo perfeito equilíbrio de Nash exclui resultados apoiados por ameaças vazias. Existem outras situações de ameaças vazias (BÊRNI; FERNANDEZ, 2014) que podem ser modeladas como jogos. Por exemplo, a ameaça de um funcionário se demitir de seu emprego se não receber um aumento é provável que seja um vazio em uma recessão ou quando não há outros empregadores procurando suas habilidades particulares na localidade. Da mesma forma, a ameaça de greve de um sindicato pode não ser crível se o sindicato tiver apenas fundos de greve limitados. A ameaça de uma esposa deixar o marido (ou vice-versa) também pode estar vazia se ela (ou ele) não tiver mais para onde ir. No cenário internacional, a ameaça de invadir um país pode não ser crível se os tomadores de decisão da força invasora estiverem divididos. 68 Ameaças Críveis Durante um jogo, uma maneira de tornar o compromisso ou a ameaça de alguém credível é mudar o ambiente que acionará a condição, de modo que a execução do compromisso ou ameaça se torne uma estratégia vantajosa. Em tal situação, quando a condição é desencadeada, a outra parte, ao assumir que o oponente neste jogo é racional, acredita que a promessa, de�nitivamente, será realizada (SUN; SUN, 2018). Por outro lado, se ele coloca seu carro como garantia para o credor (supondo que o valor de mercado do carro seja maior do que a quantia que deseja tomar emprestada), sua promessa de devolver o dinheiro é um compromisso crível. É SAIBA MAIS Por exemplo, se alguém quer tomar dinheiro de outra pessoa, não uma grande soma, e não pagar de volta, ele não será penalizado legalmente. Se ele simplesmente disser: “De�nitivamente eu pagarei de volta. Por favor, acredite em mim”, então, esse será um compromisso não-credível, porque em tal situação, é mais vantajoso não devolver o dinheiro (não levando em conta a perda de reputação e o efeito adverso que ele terá em seu negócio). 69 credível, porque se ele inadimplir, o credor manterá a garantia e ele sofrerá uma perda maior. Ao prometer garantias para um empréstimo, pagar um depósito pela encomenda de bens, etc., as pessoas estão de fato transformando compromissos não-críveis em compromissos con�áveis. O antigo idioma chinês na história para “quebrar os caldeirões e afundar o barco” (na verdade, queimar as pontes) é, de fato, tornar inevitável a realização da ameaça, levando-se em consideração todas as escolhas que uma vez foram feitas. Estudar a credibilidade de um compromisso e como aumentar sua credibilidade (Figura 4) tem um signi�cado relevante em setores como contratos comerciais. Normalmente, você se bene�cia de escolhas. Geralmente pensamos que quanto mais opções tivermos, mais poderemos lucrar. A existência de algumas escolhas, no entanto, aumenta a di�culdade de se emitir ameaças credíveis. Consequentemente, a eliminação de opções pode aumentar seu retorno. Figura 4 - Credibilidade Fonte: Jakub Jirsak / 123RF. 70 QUESTÃO OBJETIVA São ações que um jogador realiza em um estágio inicial de um jogo que alteram o comportamento do jogador e o comportamento dos outros jogadores de maneira favorável ao primeiro jogador. Depois de analisar o fragmento de texto apresentado, marque a alternativa correta sobre a que ele se refere. Ameaças críveis. Compromisso. Movimento estratégico. Ameaças não críveis. Reputação. 71 QUESTÃO OBJETIVA Considerando que nas ameaças não credíveis a execução do compromisso ou ameaça não é vantajosa ou até prejudicial para a parte que emite os compromissos, marque a alternativa correta. É intimidadora. É feita na esperança de que se acredite e que, portanto, a ação indesejável ameaçadora precisará ser executada. Para que uma ameaça seja não credível dentro de um equilíbrio, sempre que um nó for alcançado, uma ameaça deverá ser cumprida, e assim ela será satisfeita. Aqueles equilíbrios de Nash que dependem de ameaças credíveis podem ser eliminados. Podem ser paradas se a aceitarmos. 72 Fechamento Exploramos estrutura de movimento estratégico das empresas e o processo de ameaças (credíveis e não credíveis), credibilidade e compromisso. O movimento estratégico na teoria dos jogos é uma ação tomada por um jogador fora das ações de�nidas do jogo, a �m de se obter uma vantagem estratégica e aumentar o retorno de uma pessoa. Os primeiros movimentos como ameaças e promessas são regras de resposta concebidas para se impedir as ações dos rivais. Ameaças criam apenas o risco de um resultado ruim; elas são conhecidas como atos de arrogância. Credibilidade deve ser estabelecida para qualquer movimento estratégico, o que nos leva à reputação corporativa, que pode ser uma fonte adicional de vantagem competitiva. As ameaças vazias consistem em uma ameaça, ou seja, um jogo sequencial que um jogador racional na verdade não executaria, porque não seria de seu interesse fazê- lo. A ameaça credível é um anúncio de que uma empresa usará uma estratégia prejudicial a seu rival e que o rival acredita que a estratégia da empresa é racional, no sentido de que é do interesse da empresa usá-la. Nesta aula, você teve a oportunidade de: entender movimentos estratégicos; veri�car o que são ameaças, credibilidade e compromisso; analisar as ameaças críveis e são críveis sob contexto de exemplos. 73 Leilões Até este ponto, examinamos jogos em que os jogadores têm informações completas sobre as funções de pagamento. Agora, vamos nos voltar para um jogo importante, o leilão, no qual os jogadores criam estratégias de lance sem conhecer as funções de pagamento dos outros jogadores. Um leilão é uma venda em que um bem ou serviço é vendido ao maior lance. Uma quantidade substancial de troca ocorre por meio de leilões. Os contratos do governo são normalmente concedidos usando-se leilões de aquisição. Nos últimos anos, os governos leiloaram partes das ondas de rádio para estações de rádio, telefones celulares e acesso à Internet sem �o, bem como usaram leilões para montar mercados de eletricidade e transporte. Ao �nal desta aula, você será capaz de: entender o conceito de leilão; conhecer os diferentes tipos existentes; como se dá a informação em leilões. Aula 05 Introdução 74 Leilões Os leilões são frequentemente usados para produtos diferenciados, especialmente itens exclusivos, como arte, antiguidades e os direitos de extrair petróleo de um pedaço de terra. Um leilão é um processo de vendas em que compradores em potencial fazem lances (Figura 1) competitivos em ativos ou serviços, seja em formato aberto ou fechado. O ativo ou serviço em questão será vendido para a parte que �zer o lance mais alto em um leilão aberto e, normalmente, para o maior lance em um leilão fechado (PINDYCK; RUBINFELD, 2018). Em um leilão aberto, as partes se reúnem em um local físico ou em uma troca online para fazer uma oferta por um ativo. Uma parte interessada conhece os valores dos lances concorrentes e continua suas decisões de lances até que seja declarada vencedora do leilão (ou seja, tenha enviado o último lance mais alto abaixo do limite de tempo do leilão) ou desista do leilão. Figura 1 - Lance em um leilão Fonte: Happymay / 123RF. 75 Às vezes, em uma situação em que uma divisão de uma empresa ou de toda a empresa está à venda, o preço não é a única consideração. O vendedor, por exemplo, pode querer preservar o máximo de empregos possível para seus funcionários. Se um licitante não apresentar o preço mais alto, mas puder oferecer os melhores termos de continuidade para os funcionários, o vendedor poderá selecionar esse licitante. Segundo Perloff (2014), os leilões oferecem um método exclusivo para se vender itens com base em concorrentes que concorrem entre si para fazer um lance
Compartilhar