Baixe o app para aproveitar ainda mais
Prévia do material em texto
Teoria dos Jogos Ronaldo Fiani; Editora Campus, 3ª edição Capítulo 1: Por que estudar teoria dos jogos? > O interesse por jogos A ideia de jogo remete à competição; Desde crianças a adultos; Geralmente as pessoas adotam a ideia de “jogo” nas relações sociais, já que os indivíduos ou organizações tomam decisões em situação de interação estratégica; Interação estratégica: situação em que os indivíduos ou organizações reconhecem a interdependência de suas ações com relação aos demais agentes; Situações em que há interação estratégica podem ser caracterizadas como “jogos”; > Entendendo a lógica da situação: A batalha do mar de Bismark Em dezembro de 1942 o comando de guerra japonês decidiu transferir parte de suas tropas para reforçar uma de suas bases avançadas; Tinham duas opções: sul, com boa visibilidade, e norte, com visibilidade ruim; Precisavam de três dias para completar a transferência das unidades; Corriam o risco de sofrera ataque por parte das forças aliadas; Se os aliados encontrassem os japoneses no primeiro dia de buscas poderiam iniciar os ataques ainda no primeiro dia; Se encontrassem no sul teriam três dias para atacar, em função da boa visibilidade; Se encontrassem no norte teriam dois dias para atacar, por conta da visibilidade ruim; Se procurassem no lugar errado perderiam um dia de ataque por conta das buscas; Os aliados encontraram os japoneses no norte ainda no primeiro dia de buscas; Como? Dada a complexidade da situação são muitos os fatores envolvidos; Necessita-se de um modelo simplificador; Modelo: representação simplificada de um objeto de estudo; Objeto de estudo: interação estratégica; Simplificada: Propositalmente alguns elementos são destacados enquanto outros são omitidos; Não é uma seleção arbitrária, dependendo da relevância de cada fator para o entendimento da situação; Implica na importância da seleção dos elementos, que podem direcionar à conclusões equivocadas; Modelo para a batalha de Bismark Comboio japonês Sul Norte Forças aliadas Sul (1º dia) 3 1 Norte (1º dia) 2 2 Forças aliadas: A melhor estratégia depende da escolha do comboio japonês; Comboio japonês: Ir pelo norte é a melhor estratégia; Se os aliados orem para o sul só haverá um dia de bombardeios; Se os aliados forem para o norte haverá um ataque de dois dias, equivalente a decisão de os japoneses irem pelo sul; Hipóteses observadas no jogo: H1: Os agentes agem racionalmente; H2: As informações são conhecidas por todos os jogadores; O modelo simplificado permite entender a lógica situacional/da situação; Lógica da situação: Compreender a lógica de uma situação em termos objetivos, excluindo a subjetividade presente; Termos objetivos: dados concretos/objetivos; Termos subjetivos: contextos, pensamentos e emoções dos indivíduos analisados; O ponto de partida de qualquer análise de uma situação estratégica será a aplicação de um modelo; > As vantagens de estudar teoria dos jogos Duas vantagens principais: 1 – Entender teoricamente, porque utiliza de abstrações, o processo de decisão dos agentes interagidos numa situação na qual se aplique a lógica situacional; Dependerá: Que as hipóteses iniciais se apliquem ao modelo; Que cada modelo seja compreendido a partir das circunstâncias específicas em que é concebido; 2 – Desenvolve a capacidade de raciocinar estrategicamente, evitando que se fique preso à intuição; Exemplo: Jogo da votação da diretoria; Jogo de votação da diretoria: Uma empresa conta com três diretores e deseja estabelecer seu plano para o ano seguinte, contando com três decisões possíveis: Investir (nova fábrica), Ampliar (aumentar a fábrica existente), Aplicar (mercado financeiro); A votação é realizada em dois turnos, comparando a vencedora entre duas opções quaisquer com a terceira opção restante; As preferências dos diretores são: Diretor 1: Investir, Aplicar, Ampliar; Diretor 2: Aplicar, Investir, Ampliar; Diretor 3: Ampliar, Investir, Aplicar; No primeiro turno, entre Investir e Ampliar, vence Investir; No segundo turno, entre Investir (vencedor do primeiro) e Aplicar, vence Investir; Investir será o resultado final se cada diretor votar sem considerar as opções do demais; Mas e se resolvessem agir estrategicamente? Por simplificação consideramos que apenas o Diretor 2 irá agir assim; Votaria em Ampliar no 1º turno, opção que sairia vitoriosa. Assim, no segundo turno ficariam Ampliar e Aplicar, e daí votaria em Aplicar, fazendo com que essa opção vencesse no 2º turno, prevalecendo o resultado por ele almejado; Hipótese observada no jogo: H1 – Informação perfeita; > Quando estamos jogando Caracterização das situações que podem ser consideradas como jogos: situações que envolvam interações estratégicas entre agentes racionais que adotam comportamento estratégico; Elementos necessários à caracterização de um jogo: 1 – Um jogo é um modelo formal; Envolve regras e técnicas para análise de um jogo; 2 – Interações; As decisões/ações de um jogador afetam os demais jogadores; 3 – Agentes; Indivíduos, grupo de indivíduos e organizações com capacidade de decisão para afetar os demais jogadores; 4 – Racionalidade; Supõe que os agentes utilizam os melhores meios que dispõem para alcançar seus objetivos; 5 – Comportamento estratégico; Implica a consciência do agente sobre a interdependência entre suas ações possíveis e efetivas em relação aos demais agentes, assim como a deles em relação às suas; Agentes consideram ações e reações; Só interessa à teoria dos jogos as situações em que caiba a aplicação de estratégia; Não comporta a ocorrência de sorte, apenas as decisões estratégicas; Em teoria dos jogos não há qualquer restrição quanto aos objetivos que os jogadores almejam; Saber a intenção dos agentes é fundamental para modelar um jogo; Exemplo: Freakonomics: caso dos lutadores de sumô; Seis campeonatos de 15 lutas cada; A probabilidade de vitória de um lutador específico com a mesma pontuação de outro na final do campeonato, num caso de 7 vitórias e 7 derrotas para ambos, é diferente (maior) da probabilidade de vitória desse lutador quando tem pontuação superior, 8 vitórias e 6 derrotas, quando enfrenta um lutador que esteja com 7 vitórias e 7 derrotas; Racionalidade: Considerados os objetivos dos agentes, estes devem agir com coerência entre seus meios e fins; Agente racional: 1 – Aplica lógica à premissas dadas para retirar suas conclusões; 2 – Escolhe as premissas adequadas a partir do seu julgamento; 3 – Faz uma leitura neutra, não viesada, dos fatos empíricos; Se os agentes forem racionais a teoria da escolha racional indicará suas decisões durante os jogos; > A teoria da escolha racional Teoria da escolha racional: 1 – Hipótese de racionalidade dos agentes; 2 – Considera as preferências dos jogadores; Para expressar as preferências faz-se necessário o conceito de relação (relação binária: entre dois elementos); Exemplo: Se o conjunto “capitais” = {Santiago, Montevidéu, Buenos Aires}; E o conjunto “Países do cone sul” = {Argentina, Chile, Uruguai}; O conceito “relação” expressa um vínculo entre os dois conjuntos. Assim: R1 = {(Buenos Aires, Argentina), (Santiago, Chile), (Montevidéu, Uruguai)}; Se chamarmos o primeiro elemento de x e o segundo de y, R1 expressa a relação “x é a capital de y”; A relação que interessa à teoria dos jogos é a relação de preferência, esta última representada por: ≥ que significa “ao menos tão bom quanto” **Observar que os símbolos ≥ e > são utilizados de forma aproximada ao original, pela ausência de caracteres adequados para sua representação. Qualquer dúvidabasta consultar o livro referenciado ou um manual de microeconomia; Exemplificando as preferências: L é um conjunto de opções de lazer de um indivíduo; a e b são dois elementos desse conjunto, respectivamente, praia e futebol; Se a ≥ b: A opção a é tão boa quanto a opção b; Não há como afirmar se uma é preferida ou se há indiferença na escolha entre elas; Dessa indefinição resultam duas possibilidades: 1 – Preferência estrita ( > ) x > y <-> x ≥ y, mas não y ≥ x; 2 – Indiferença ( ~ ) x ~ y <-> x ≥ y e y ≥ x; Incluída a noção de preferências, a racionalidade dos jogadores ocorre se suas preferências forem racionais; Propriedades de uma relação de preferência racional (hipóteses): 1 – As preferências são completas; Os agentes são capazes de definir suas preferências em qualquer relação de escolha que se apresente; Haverá preferência estrita ou indiferença entre a escolha de duas cestas; 2 – As preferências são transitivas; Há consistência/racionalidade na demonstração das preferencias; x ≥ y e y ≥ z, x ≥ z; Essas propriedades são chamadas preferências ordinais, porque ordenam as preferências dos jogadores; > Jogando com as preferências: O paradoxo de Condorcet Paradoxo de Condorcet: as preferências isoladas dos indivíduos sendo transitivas não implica em transitividade das preferências de um conjunto de indivíduos; Quando as decisões são tomadas em grupo; Exemplo: Três partidos políticos: conservador, moderado e radical; Três propostas: Aumentar (G), Manter (M) ou Diminuir (D) os gastos com programas sociais; Preferências: Conservador: D > G > M Se não consegue diminuir, vota num aumento, para que no ano seguinte haja redução dos gastos do governo; Moderado: M > D > G Se não for possível manter, preferem diminuir; Radical: G > D > M Se não for aumentar, preferem ao menos manter como está; Conservador: D > G > M Moderado: M > D > G Radical: G > D > M Possíveis resultados: G x M -> 2 x 1 pra G M x D -> 2 x 1 pra M G x D -> 2 x 1 pra D Os resultados implicam: G > M > D > G (Intransitividade das preferências); A ordem das preferências dependerá da ordem de votação; > Afinal, a vida é um jogo? Condições necessárias para um jogo, mas não suficientes: 1 – O jogo é relativamente simples; Implica disponibilidade de informações; 2 – Os jogadores aprendem a jogar através da tentativa e erro; Implica que os participantes conhecem as regras do jogo e as melhores estratégias cada caso; 3 – Há incentivos adequados para que o jogo aconteça; Com incentivo há estímulos para que os jogadores se disponham a jogar e adotem decisões racionais; Exemplo: Setor automobilístico; 1 – Oligopólio: Poucas empresas e poucos fatores a serem determinados, preço e quantidade; 2 – O processo concorrencial é dinâmico ocorre continuamente ao longo do tempo; 3 – As empresas buscam estratégias para maximizar os lucros; Capítulo 2: Modelos de jogos: Representando uma situação de interação estratégica > Introdução O objetivo de se modelar os processos em que ocorre interação estratégica é conhecer os possíveis resultados do jogo; A explicação se desenvolve a partir de dois exemplos de jogo: 1 – Uma empresa toma emprestado 5 milhões de reais tanto do banco A como do banco B, totalizando 10 milhões em empréstimos. Após um ano a empresa só dispõe de capitais que somam o valor de 6 milhões de reais, e a perspectiva é a de que continue a operar por apenas um ano, caso consiga renovar os empréstimos; 2 – Uma montadora está decidindo se irá ou não lançar seu primeiro modelo de van no mercado, empresa denominada Inovadora. Só que já existe um modelo de van sendo comercializado, o da empresa denominada Líder. Se a Inovadora decidir entrar no mercado a Líder terá como opções manter ou reduzir seus preços; A Líder só entrará no jogo caso a Inovadora resolva entrar no mercado; Líder é a segunda a agir, já conhecendo a ação da Inovadora; > Representando as ações dos jogadores e suas consequências Jogador: Indivíduo ou organização em situação de interação estratégica que tenha autonomia para tomar decisões; Suposições (hipóteses): 1 – Número finito de jogadores em interação estratégica; 2 – Dadas suas preferências, cada jogador busca o melhor resultado possível do processo; Ação ou movimento: Escolha que um jogador pode fazer num determinado momento do jogo; Conjunto de ações: Ações disponíveis a um jogador; Ai = {ai} Onde: ai são as ações disponíveis ao jogador i; Ai é o conjunto de ações do jogador i; A construção de um jogo depende do conhecimento sobre todas as ações relevantes disponíveis aos jogadores, já que cada jogador age considerando tanto o seu conjunto de ações como os conjuntos de ações dos demais jogadores; Não considerar todas as ações relevantes disponíveis implica irracionalidade; Jogos em que as decisões ocorrem simultaneamente diferem de jogos em que há decisões sucessivas, sequenciais, porque nos últimos a cada movimento aumenta a quantidade de informação disponível aos jogadores; Porque a cada movimento um jogador já agiu; > Empregando a forma estratégica ou normal para representar um jogo simultâneo Utilizando o exemplo dos bancos A e B: Cada banco dispõe de duas opões, renovar ou não os empréstimos; Se renovam, a empresa poderá continuar pagando os juros dos empréstimos, totalizando 1 milhão para cada banco, tendo direito ao recebimento do valor emprestado. Porém, com a perspectiva de falência da empresa, cada banco receberá um total de 4 milhões, 3 da divisão dos 6 que a empresa possui em ativos mais 1 do pagamento dos juros; Se apenas um banco renovar, receberá integralmente a quantidade emprestada, 5 milhões, retirados dos 6 de ativos da empresa, adiantando seu processo de falência, e implicando ao outro banco, que renovou o empréstimo, receber apenas o 1 milhão restante dos ativos; Se nenhum banco renovar o empréstimo, cada um ficará com 3 milhões restantes da divisão dos ativos da empresa; Recompensa: É aquilo que cada jogador obtém ao término do jogo; Jogo em forma estratégica ou normal Banco B Renova Não renova Banco A Renova 4,4 1,5 Não renova 5,1 3,3 Os bancos A e B são os jogadores; Renova e não renovar são as opões dos jogadores, seu conjunto de ações; AA,B = {Renovar o empréstimo, não renovar o empréstimo} 4 e 4, 1 e 5, 5 e 1, 3 e 3, são os possíveis resultados do jogo, ou seja, representam as possíveis recompensas de A e B, respectivamente; O primeiro número é a recompensa do jogador na linha, e o segundo é a recompensa do jogador na coluna; Função de recompensa: Valor que traduz numericamente, para fins de ordenamento, a preferência de cada jogador por determinado resultado do jogo; Não busca “medir” essas preferências; Se x é um resultado qualquer e y é outro: F(x) ≥ F(y) , sempre que x for ao menos tão bom quanto y; Implica que o resultado x é ao menos tão bom quanto o resultado y para o jogador analisado; Enquanto (≥, >) comparam quantidades, as preferências dos agentes permitem comparar objetos diferentes; Uma função de recompensa só pode ordenar as preferências de um único jogador, sendo impossível ordenar através dela as preferências de jogadores diferentes; Jogos simultâneos: Jogos em que os jogadores ignoram as decisões dos demais, preocupando-se apenas com o resultado imediato do processo, desprezando as consequências futuras da decisão; A vantagem é que esse tipo de jogo fornece todas as combinações possíveis das ações dos jogadores e seus possíveis resultados; A limitação é que não permite avaliação dos resultados futuros da decisão, caso a interação estratégica continue ocorrendo ao longo do tempo entre os jogadores; > Empregandoa forma estendida para representar um jogo sequencial Método aplicado para avaliação de interações estratégicas com desdobramentos ao longo do tempo; Jogos que impliquem em interação estratégica que se desenvolve em etapas sucessivas; Jogo “sequencial”; Observa ações e reações, já que cada jogador atua num momento do tempo, sequencialmente; Utiliza o exemplo das montadoras: A empresa Inovadora enfrenta duas opções, lançar ou não sua van no mercado, enquanto a empresa Líder decide entre manter ou reduzir o preço de sua van; A Inovadora é a primeira empresa a jogar, e a partir da sua decisão é que a Líder irá tomar a sua; Se a Inovadora lançar a van e a Líder reduzir seu preço, cada uma fatura 2 milhões de reais, dado o processo concorrencial; Se a Inovadora lançar a van e a Líder manter seu preço, a Inovadora ganhará parcela de mercado e irá lucrar apenas 1 milhão; Se a Inovadora não lançar sua van, não terá seus lucros influenciados, mantendo-os em 1 milhão, qualquer que seja a estratégia da Líder, que irá lucrar 4 milhões se manter o preço, e 3 se reduzir; #Jogo sequencial na forma estendida; Em geral os jogos sequenciais são representados por árvores de jogos, que são compostas por ramos e nós; Nó: Etapa do jogo onde um dos jogadores deve tomar uma decisão; Ramo: Uma ação do jogador, dentro de um conjunto de ações deste em um dado nó; Cada nó torna possível novos desdobramentos, novos ramos, e consequentemente novos nós: Nó sucessor: Escolha possível no futuro, caso seja alcançado no jogo; Nó predecessor: Nó que precisa ser alcançado para se chegar ao sucessor, ou seja, é aquele que antecede a jogada em questão; Nó inicial: Início do jogo, onde não há predecessor; Nó terminal/final: Nó que não possui sucessor, onde são apresentadas as recompensas de cada jogador; A forma estendida é uma maneira de representar processos de interação estratégica que ocorram em etapas sucessivas, convenientemente moldados em jogos sequenciais; Jogo sequencial: Jogo em que os jogadores decidem suas ações sucessivamente numa ordem pré-determinada; Regras da árvore de jogos: 1 – Cada nó terá no máximo um nó predecessor; Se um nó for precedido por dois nós, qualquer ação nesses predecessores implicará na escolha do nó analisado, não importando a decisão do jogador; #Nó com dois predecessores; 2 – Nenhuma trajetória pode ligar um nó a ele mesmo; Se for possível um nó resultar nele mesmo não haverá como saber quem fará o primeiro movimento no jogo, podendo resultar num looping de escolhas; #Nó ligado a ele mesmo; 3 – Todo nó deve ser sucessor de um único e mesmo nó; Se houver mais de um ponto de início não haverá como saber em que ponto inicia o jogo; #Nó com dois predecessores; > Estratégias e conjuntos de informação A hipótese de racionalidade dos jogadores implica, num modelo sequencial, que os jogadores consideram todo o desenvolvimento do processo de interação até sua decisão, assim como seus desdobramentos. Portanto, os jogadores utilizam de estratégias para jogar; Estratégia: Plano de ações de um jogador que direciona suas decisões em todas as jogadas; Conjunto de estratégias (espaço de estratégias): Conjunto de estratégias de que cada jogador dispõe; Si = {sij} Onde sij é a estratégia j do jogador i, e S i é o conjunto de estratégias desse jogador; A combinação de estratégias que os jogadores podem adotar é um conjunto ordenado, onde a ordenação representa o jogador correspondente; Exemplo: a terceira estratégia corresponde ao terceiro jogador; S = (s1, s2, ..., sn) Onde sn é a estratégia do n-ésimo jogador, e S é a combinação de estratégias; Cada combinação de estratégias produz diferentes recompensas para os jogadores; Essa ideia pode ser formalizada por meio de uma função de recompensa; Ui = (s1, ..., si, ..., sn) Onde s1 é a estratégia do primeiro jogador, e Ui é a recompensa que o jogador i recebe, dada uma combinação específica de estratégias; No jogo simultâneo a estratégia de cada jogador coincide com as ações que lhe são disponíveis, já que não há sequência de eventos/decisões; Já nos jogos sequenciais os jogadores traçam estratégias antecipando as decisões dos demais, premeditando suas reações de acordo com cada possível ação dos outros jogadores; A diferença entre jogos simultâneos e sequenciais reside na característica lógica dos últimos, não na cronológica, já que nos jogos sequenciais aumenta-se a informação disponível dos jogadores a cada rodada, em razão das ações efetuadas; Se um jogo sequencial ocorresse com os jogadores tomando decisões sem saber as ações dos demais, ainda assim seria uma sucessão de eventos no tempo, mas que por não permitir maior volume de informações aos jogadores poderia ser representada por um jogo simultâneo; Mesmo nos jogos simultâneos a ideia de decisões ao mesmo tempo é uma simplificação; Quanto mais informação tem um jogador, maiores as chances dele distinguir as circunstâncias no jogo em que deve agir; No exemplo dos bancos nenhum sabe o que o outro escolheu, portanto tomam suas decisões sem conhecer as circunstâncias do jogo; Já no caso das empresas a Líder joga sabendo qual foi a decisão da empresa Inovadora, conhecendo as circunstâncias de sua decisão; Implica que a Líder sabe, dentro de um conjunto de informações, o nó em que se encontra quando é a sua vez de jogar; Conjunto de informação: Conjunto de nós em que o jogador acredita estar quando é a sua vez de jogar; Por que “acredita”? Porque pode não haver perfeita informação sobre o jogo; Informação perfeita: Os jogadores conhecem todos os movimentos que antecedem sua jogada; Pode ser observado quando todos os conjuntos de informação de um jogo são unitários; Conjunto de informação unitário ocorre quando o jogador sabe a jogada que o antecedeu; Portanto, nesse conjunto só há um nó; #Conjunto de informação unitário; Informação imperfeita: Quando um jogador tem de agir sem conhecer algum dos movimentos realizados anteriormente; Pode ser observado pela existência de um conjunto de informações não-unitário; Conjunto de informação não-unitário ocorre quando o jogador não sabe a jogada que o antecedeu; Portanto, agrega mais de um nó; #Conjunto de informação não-unitário; Regras para a definição dos conjuntos de informação: 1 – Um conjunto de informações não pode conter nós de jogadores diferentes; Já que a ordem dos jogadores é pré-determinada #Conjunto de informações com dois jogadores; 2 – Um conjunto de informações não pode incluir nós sequenciais Se o conjunto de informações é válido para apenas um jogador, cada movimento distinto deve ser identificável pelo jogador que decide; Nós em sequência de um mesmo jogador implicaria que ele continuaria jogando, que é o mesmo de ter o nó sucessor no lugar do antecessor, apontando que não haveria diferença entre esses nós; Se não houver diferença entre os nós os jogadores não poderão identifica-los como movimentos distintos; #Nós sequenciais de um mesmo jogador; 3 – Diferentes nós num conjunto de informação não podem oferecer diferentes conjuntos de ações; Diferentes nós num mesmo conjunto implicam que este último é não-unitário, portanto de informação imperfeita, determinando que o jogador desconhece o movimento que o antecedeu; Porém, se cada nó implicar em diferentes conjuntos de ações, B1 em I e II e B2 em III e IV, a partir das decisões com que se depara, o jogador saberá a jogada antecessora; #Diferentes ações a partir de nós num mesmo conjunto de informação; Conquanto tenha se apresentado jogos simultâneos de forma estratégica e osequencial de forma estendida, não são necessariamente correspondentes, já que jogos simultâneos podem ser apresentados de forma estendida e jogos sequenciais de forma estratégica; Depende da melhor maneira para ilustrar a situação; > Forma estratégica versus forma estendida; 1 – Apresentando um jogo simultâneo em forma estendida; Utilizando o exemplo dos bancos; Jogo simultâneo; Jogadores jogam sem conhecer as decisões dos demais; Implica num conjunto de informação não-unitário; O jogador não sabe a jogada que “antecede” a sua; #Jogo dos bancos na forma estendida; Conquanto a forma estratégica seja mais intuitiva para representar um jogo simultâneo, a forma estendida apresenta vantagem na construção de jogos com mais jogadores; 2 – Apresentando um jogo sequencial em forma estendida; Utiliza o exemplo de um mercado em monopólio, cuja empresa existente é denominada Dominante. Nesse jogo uma empresa considera a possibilidade de entrar no mercado, denominada Desafiante; Desafiante joga primeiro, tendo duas opções: entrar ou não no mercado; Se a Desafiante entrar no mercado a Dominante terá duas opções: lutar ou se acomodar; Lutar implica guerra de preços, prejudicando os lucros das empresas no processo, enquanto acomodar implica abrir espaço no mercado à Desafiante, na tentativa de controlar o lucro através do nível de preços; #Jogo da entrada na forma estendida; #Jogo da entrada na forma estratégica; Tornando a situação mais complexa com o exemplo das montadoras; Jogo sequencial das montadoras na forma estratégica; Inovadora Líder Reduz preço, Reduz preço Reduz preço, Mantém preço Mantém preço, Reduz preço Mantém preço, Mantém preço Lança van 2, 2 2, 2 4, 1 4, 1 Não lança van 1, 3 1, 4 1, 3 1, 4 A forma estratégica implica apontar a estratégia que dispõe cada jogador. Porém, como ocorre um jogo sequencial e a empresa Líder é a segunda a jogar, depois de adquirir maior volume de informação, o jogo deve compreender e apresentar as ações disponíveis à empresa Líder, já determinados antecipadamente; A primeira e segunda opções da Líder, na mesma coluna, correspondem à primeira e segunda opções da Inovadora, nas linhas, respectivamente; Assim, os resultados se repetem, e as opções da Líder dependerão das opções da Inovadora; Aumenta o número de colunas para demonstrar o conjunto de estratégias pré-determinado da empresa Líder, que aguarda a jogada da Inovadora; Capítulo 3: Jogos Simultâneos: Encontrando as melhores respostas estratégicas > Introdução Até o momento apresentou-se como modelar os jogos, e este capítulo é voltado a explicar como eles são jogados; Espera-se que os jogadores sejam racionais; Escolham a estratégia que lhes proporciona o melhor resultado de acordo com seu objetivo; Estrutura do jogo: Estratégias e respectivas recompensas disponíveis a cada um dos jogadores; Informação de conhecimento comum: Informação conhecida por todos os jogadores, que sabem ser de conhecimento geral; Jogos de informação completa: Quando as recompensas dos jogadores são informação de conhecimento comum; Porque todos os jogadores sabem as recompensas almejadas pelos demais; > Uma primeira busca da solução do jogo: Eliminando estratégias estritamente dominadas; Tomando o exemplo das empresas de sabão em pó, Limpo e Bonito. A primeira decide se irá ou não lançar seu produto biodegradável, para concorrer com a segunda. Esta, por sua vez, enfrenta o dilema entre aumentar ou não seus gastos com publicidade. O jogo das empresas de sabão em pó apresenta as respectivas recompensas em milhões de reais; Jogo das empresas de sabão em pó (exemplo de estratégia estritamente dominante) Bonito Aumenta gasto com publicidade Não aumenta gasto com publicidade Limp o Lança o produto biodegradável 5, 5 7, 3 Não lança o produto biodegradável 2, 4 2, 7 Independente da ação de Bonito, para Limpo a melhor estratégia é lançar o produto; {Lançar o produto biodegradável} domina a estratégia {não lançar o produto biodegradável}; {Não lançar o produto biodegradável} é uma estratégia dominada por {lançar o produto biodegradável}; Limpo tem {lançar o produto biodegradável} como estratégia dominante; Todas as recompensas de {lançar o produto biodegradável} permitem resultados estritamente maiores que a estratégia {não lançar o produto biodegradável}, independentemente das ações de Bonito; Implica que a estratégia {lançar o produto biodegradável} é estritamente dominante em relação a estratégia {não lançar o produto biodegradável}; Algebricamente: πi (s*i, s -i) > πi (s**i, s -i), para todo s -i Qualquer que sejam as estratégias adotadas pelos demais jogadores, para i s*i será sempre superior a s**i; Um jogador também pode se depara com uma estratégia que seja fracamente dominante, como pode ser visto a partir de uma modificação nas recompensas do exemplo das empresas de sabão em pó; Jogo das empresas de sabão em pó (exemplo de estratégia fracamente dominante) Bonito Aumenta gasto com publicidade Não aumenta gasto com publicidade Limp o Lança o produto biodegradável 2, 5 7, 3 Não lança o produto biodegradável 2, 4 2, 7 Nesse exemplo reformulado, caso Bonito resolva aumentar os gastos com publicidade, os resultados permitidos pelas opções da empresa Limpo são tão bom quanto os outros que ela mesmo dispõe. Porém, caso Bonito não aumente seus gastos com publicidade, Limpo terá maiores lucros se adotar a estratégia {lançar o produto biodegradável}; Numa situação a estratégia {não lançar o produto biodegradável} produz recompensas tão boas quanto {lançar o produto biodegradável}, mas numa situação específica, quando Bonito não aumenta os gastos com publicidade, os lucros de se adotar a estratégia {lançar o produto biodegradável} são superiores; {Lançar o produto biodegradável} é fracamente dominante em relação a {não lançar o produto biodegradável} para a empresa Limpo; {Não lançar o produto biodegradável é fracamente dominada pela estratégia {lançar o produto biodegradável}; Algebricamente: πi (s’’i, s -i) ≥ πi (s’i, s -i), para todo s -i πi (s’’i, s -i) > πi (s’i, s -i), para algum s -i Somente para algum s –i a estratégia s”i será necessariamente mais recompensadora do que s’i, pois para os demais casos pode ser maior ou igual; Identificadas as estratégias dominantes e dominadas, faz-se necessário um método para avaliar quais as estratégias os jogadores devem escolher para obterem as melhores recompensas; > Eliminação Interativa de estratégias estritamente dominadas; A eliminação iterativa de estratégias estritamente dominadas é o método mais simples para se determinar o resultado de um jogo simultâneo; O método é explicado através do exemplo do mercado automobilístico; Suas empresas, Carro Novo e Novo Auto, competem no setor de automóveis. Carro Novo já comercializa um modelo utilitário, enquanto Novo Auto depara-se com as seguintes opções: 1 – Importar o modelo utilitário de sua matriz estrangeira; 2 – Produzir nacionalmente um modelo utilitário; 3 – Continuar fora desse segmento no setor; Dada a escolha de Novo Auto, Carro Novo poderá responder de três maneiras: 1 – Mantém o preço do seu utilitário; 2 – Diminui o preço do seu utilitário; 3 – Lança uma nova versão do seu utilitário no mercado; Como se trata de um jogo simultâneo, supõe-se que cada jogador tome sua decisão isoladamente, como num plano para o próximo ano, sem conhecer a escolha do concorrente; Jogo do mercado automobilístico (1ª rodada) Carro Novo Lança nova versão Mantémpreço Reduz preço Novo Auto Lança seu modelo 1, 4 4, 1 1, 3 Importa o modelo 2, 2 2, 1 2, 3 Não entra no segmento 1, 1 0, 6 1, 0 Comparando as recompensas disponíveis à Carro Novo, observa-se que não há estratégia dominante, cada opção que a empresa toma apresenta um resultado melhor de acordo com a decisão da empresa Novo Auto; Novo Auto também não apresenta estratégia dominante, porém apresenta uma decisão que contém as piores recompensas para si, qualquer que seja a estratégia de Carro Novo, {Não entra no segmento}; Comparando {não entra no segmento} com {importa o modelo} percebe-se que a primeira estratégia é estritamente dominada pela segunda; Considerando esses fatores, pode-se eliminar a estratégia {não entra no segmento} das opções da Novo Auto; Jogo do mercado automobilístico (resultado da 1ª rodada) Carro Novo Lança nova versão Mantém preço Reduz preço Novo Auto Lança seu modelo 1, 4 4, 1 1, 3 Importa o modelo 2, 2 2, 1 2, 3 Após a eliminação de uma estratégia da empresa Novo Auto percebe-se que nenhuma das opções restantes à empresa se sobressai às outras. Porém, modifica-se a situação da Carro Novo, que passa a ter {mantém preço} como estratégia estritamente dominada por qualquer uma das outras opções; Essa é uma característica do método de eliminação iterativa de estratégias estritamente dominadas. Qualquer estratégia que não fosse estritamente dominada pode passar a sê-lo após a eliminação de alguma das estratégias do jogo; Assim, na 2ª rodada elimina-se a opção de manter o preços para a empresa Carro Novo; Jogo do mercado automobilístico (2ª rodada) Carro Novo Lança nova versão Reduz preço Novo Auto Lança seu modelo 1, 4 1, 3 Importa o modelo 2, 2 2, 3 Com as opções restantes observa-se que não há estratégia dominante ou dominada para Carro Novo. Já para Novo Auto a opção de lançar seu modelo mostra-se estritamente dominada nessa nova configuração do jogo, implicando sua eliminação na 3ª rodada; Jogo do mercado automobilístico (3ª rodada) Carro Novo Lança nova versão Reduz preço Novo Auto Importa o modelo 2, 2 2, 3 Dessa rodada tem-se que a empresa Carro Novo passa a ter a estratégia {lança nova versão} como estratégia dominada por {reduz preço}; Implica que o resultado do jogo é dado pela combinação de estratégias {Importa o modelo, reduz preço}; Esse resultado constitui um equilíbrio em estratégias estritamente dominantes; > Estratégias racionalizáveis e melhor resposta; Jogo solucionável por dominância: Jogo que resulta numa única combinação de estratégias pelo método de eliminação iterativa; Estratégias racionalizáveis: Estratégias que resultam do método de eliminação iterativa, mesmo que sejam mais de uma para cada jogador; Implicitamente, na solução de jogos por eliminação iterativa de estratégias estritamente dominadas, está a hipótese de conhecimento comum da racionalidade (CCR); Conhecimento comum da racionalidade (CCR): Quando supõe-se que a racionalidade dos jogadores é de conhecimento comum; Os jogadores sabem que os demais sabem... Princípio da racionalização: Se a estrutura e a racionalidade dos jogadores são de conhecimento comum, e uma estratégias s**i sempre proporciona o pior resultado para o jogador i, independente do que fazem os demais jogadores, não há nenhuma razão, independentemente das possíveis decisões dos demais jogadores, que justifique o jogador i adotar s**i; Essa ideia pode ser descrita através do conceito de melhor resposta: πi (s*i, s -i) ≥ πi (s’i, s -i), para algum s-i e todos os s’i ≠ s*i s*i será a melhor resposta do jogador i, dada a combinação s-i de jogadas dos demais jogadores, quando comparada à estratégia s’i; Da mesma forma pode ocorrer o inverso, de uma estratégia nunca ser a melhor resposta para um jogador, independente da estratégia adotada pelos demais: πi (s**i, s -i) < πi (s*i, s -i), para todo s-i e algum s*i ≠ s**i s**i será a pior estratégia que o jogador i poderá adotar, porque sempre haverá uma estratégia diferente que proporciona uma resposta melhor; s**i nunca é a melhor resposta; Por analogia, percebe-se que a estratégia que for estritamente dominada para um jogador nunca será a melhor resposta (decisão) para ele; > A limitação do método de eliminação iterativa de estratégias estritamente dominadas A principal limitação do método de eliminação iterativa é que nem todos os jogos possuem estratégias estritamente dominadas; Para solucionar esse problema faz-se necessário um método mais geral que o de eliminação iterativa, que dependerá do conceito de Equilíbrio de Nash; > Solucionando um jogo simultâneo: O Equilíbrio de Nash O conceito de Equilíbrio de Nash atende para a solução de jogos simultâneos tanto nos casos em que cabe como nos que não cabe o método de eliminação iterativa; Equilíbrio de Nash: Combinação de estratégias que proporciona o melhor resultado individual para cada um dos jogadores; Anteriormente foi especificado que: πi (s*i, s -i) ≥ πi (s’i, s -i), para algum s-i e todos os s’i ≠ s*i Dada uma combinação de estratégias s-i dos demais jogadores, não há estratégia ao jogador i que lhe proporcione maior recompensa que s*i; O que o conceito de Equilíbrio de Nash implica é que todos os jogadores adotem as melhores respostas em relação as estratégias dos demais: πi (s*i, s*-i) ≥ πi (si, s*-i), para algum s-i e todo i; O asterisco indica que a estratégia faz parte de um equilíbrio de Nash; Como exemplo disso tem-se o jogo de prevenção na concorrência pelo comércio nacional; Jogo em que há uma empresa brasileira atendendo o mercado nacional, denominada Dominante. Outra empresa, estrangeira, está avaliando os benefícios de exportar seus produtos ao Brasil, denominada Potencial. Como o jogo é simultâneo, nenhuma empresa sabe o que a outra decidiu; Jogo de prevenção na concorrência pelo comércio nacional Potencial Não exporta Exporta em pequena escala Exporta em larga escala Dominan te Investe 2, 1 1, 0 0, -1 Não investe 1, 0 2, 1 -1, 2 Qual é o Equilíbrio de Nash? E as outras recompensas? Por que? Só há um Equilíbrio de Nash; Mesmo numa interação estratégica pequena como a anterior pode levar tempo a identificação do Equilíbrio de Nash apenas olhando para o jogo; Um método conveniente é observar qual a melhor estratégia, a que proporciona a maior recompensa, de cada jogador para cada uma das opções do outro jogador, assinalando-as para conferir quais os pontos de convergência; Jogo de prevenção na concorrência pelo comércio nacional Potencial Não exporta Exporta em pequena escala Exporta em larga escala Dominan te Investe (D) 2, 1 (P) 1, 0 (D) 0, -1 Não investe 1, 0 (D) 2, 1 -1, 2 (P) A combinação da melhor estratégia para Dominante (D) quando a Potencial adota sua melhor estratégia (P), e vice-versa, aponta para o Equilíbrio de Nash: {investe, não exporta}; > O Equilíbrio de Nash estrito O equilíbrio do jogo apresentado anteriormente consiste num equilíbrio de Nash estrito, porque dada a melhor escolha de um jogador, não há outra estratégia para o outro jogador em seu conjunto de estratégias que proporcione recompensa ao menos tão boa quanto aquela que permite o Equilíbrio de Nash estrito; Formalmente: πi (s*i, s*-i) > πi (si, s*-i), para todo s-i e todo i; Mas o equilíbrio de Nash não implica necessariamente recompensas estritamente superiores, podendo indicar que há outros resultados ao menos tão bons quanto; Formalmente: πi (s*i, s*-i) ≥ πi (si, s*-i), para todo s-i e todo i; Implica que alguma estratégia si poderá ser tão boa quanto s*i, mas nunca ocorrerá umamelhor que s*i; Reformulando as recompensas do jogo apresentado anteriormente: Jogo de prevenção na concorrência pelo comércio nacional Potencial Não exporta Exporta em pequena escala Exporta em larga escala Dominan te Investe (D) 2, 1 (P) 1, 0 (D) 0, -1 Não investe (D) 2, 0 (D) 2, 1 -1, 2 (P) {Investe, não exporta} continua sendo a combinação de estratégias que dá o Equilíbrio de Nash no jogo; Como as recompensas da empresa Dominante são iguais para diferentes estratégias, caso a Potencial adote a estratégia {não exporta}, diz-se que não há equilíbrio de Nash estrito; > Equilíbrio em estratégias estritamente dominantes e Equilíbrio de Nash estrito Até aqui tem-se que mesmo não existindo equilíbrio em estratégias estritamente dominantes pode haver Equilíbrio de Nash. Mas, se houver equilíbrio em estratégias estritamente dominantes, este será um Equilíbrio de Nash? Para responder a esta questão utiliza-se o jogo do comércio internacional; Dois países, A e B, transacionam seus produtos entre si, num mesmo montante de receita. Cada um deles têm como opções adotar uma tarifa alta ou baixa sobre os produtos importados, e as receitas possíveis de serem proporcionadas após a aplicação das tarifas são as recompensas do jogo; Jogo do comércio internacional País B Tarifa alta Tarifa baixa País A Tarifa alta 800, 800 2.300, 700 Tarifa baixa 700, 2.300 1.700, 1.700 Pelo método de eliminação iterativa das estratégias dominadas vê-se que o resultado será que os dois países adotam tarifas altas; Pelo método de avaliação da melhor estratégia para cada jogador também tem-se {tarifa alta, tarifa alta} como combinação em que ocorre Equilíbrio de Nash; Nesse caso específico ocorre Equilíbrio de Nash estrito; Esse resultado é uma regra geral: sempre que houver um equilíbrio em estratégias estritamente dominantes esse equilíbrio será um Equilíbrio de Nash estrito; Essa conclusão também pode ser obtida pela representação formal/algébrica de cada um dos equilíbrios: 1. Equilíbrio de Nash estrito: πi (s*i, s*-i) > πi (si, s*-i), para todo s-i e todo i; Dado s*-i, s*i será a melhor estratégia de i; 2. Equilíbrio em estratégias estritamente dominantes: πi (s*i, *-i) > πi (si, s-i), para todo s-i, todo si e todo i; Dado s-i, s*i será a melhor estratégia de i; Ocorre que s-i pode combinar as melhores estratégias dos demais jogadores, resultado que s-i possa ser s*-i; Enquanto o Equilíbrio de Nash estrito indica uma melhor estratégia para i quando os demais jogadores adotam suas melhores estratégias, o Equilíbrio em estratégias estritamente dominantes é ainda mais restrito (difícil de ocorrer), porque impõe o mesmo resultado para o jogador i para quaisquer que sejam as estratégias dos outros jogadores; Todo equilíbrio em estratégias estritamente dominantes é um equilíbrio de Nash estrito; > Equilíbrio de Nash e Ótimo de Pareto; Ótimo de Pareto: Situação em que não é possível melhorar a situação de um agente sem piorar a de outro; Se há possibilidade de melhoria sem afetar negativamente outro agente então ocorre uma ineficiência no sentido de Pareto; Situação que permite uma melhoria no sentido de Pareto; Ocorre que o Equilíbrio de Nash não está direcionado a uma eficiência conjunta, observa apenas a escolha individual; A diferença possível entre o Equilíbrio de Nash e o ótimo de Pareto pode ser observada nas recompensas do jogo de comércio internacional; Jogo do comércio internacional País B Tarifa alta Tarifa baixa País A Tarifa alta 800, 800 2.300, 700 Tarifa baixa 700, 2.300 1.700, 1.700 {Tarifa alta, tarifa alta} é a combinação de estratégias que resulta no Equilíbrio de Nash; Mas é uma situação ineficiente no sentido de Pareto, já eu permite melhoria na recompensa de um jogador sem prejudicar a recompensa do outro. Nesse caso específico há possibilidade de melhoria no sentido de Pareto para os dois jogadores; A combinação estratégica {tarifa baixa, tarifa baixa} é um ótimo de Pareto; > Um caso de mais do que um Equilíbrio de Nash Um jogo pode der um, mais de um ou nenhum Equilíbrio de Nash. O exemplo de dois equilíbrios pode ser visto no jogo de coordenação do padrão tecnológico; Dois jogadores, a SysOp e a AntiVírus. A primeira enfrenta a decisão de desenvolver ou não uma nova ferramenta para seu software, enquanto a AntiVírus, simultaneamente, decide se irá ou não atualizar seu produto para esse possível modificação no software da SysOp; Jogo de coordenação de padrão tecnológica AntiVírus Atualizar Não atualizar SysOp Desenvolver 2, 1 -1, -2 Não desenvolver 0, -1 1, 2 As estratégias convergentes são interessantes a ambas, tanto {desenvolver, atualizar} quanto {desenvolver, não atualizar}, sendo as duas Equilíbrios de Nash; Assim, não há como predizer o resultado do jogo com as informações disponíveis; Então qual a utilidade do Equilíbrio de Nash? Busca situações em que os agentes não tenham estímulos para modificar suas decisões; Conquanto possam existir mais de uma dessas situações, os agentes podem se acomodar numa situação que lhes seja a melhor disponível no jogo; O resultado será dado por fatores circunstanciais; > Selecionando entre vários Equilíbrios de Nash: O conceito de ponto focal Ponto focal: Elemento de destaque em determinado contexto, que permite aos jogadores convergirem para um Equilíbrio de Nash específico num jogo que possua mais de um desses equilíbrios; Quando há conhecimento comum ou uma experiência compartilhada pelos agentes que indique e/ou influencie a decisão dos jogadores para uma determinada combinação de estratégias; Jogo de coordenação de padrão tecnológica AntiVírus Atualizar Não atualizar SysOp Desenvolver 2, 1 -1, -2 Não desenvolver 0, -1 1, 2 Um exemplo de ponto focal poderia ser um famoso colunista de tecnologia, conhecido o bastante para ser lido por representantes/funcionários das duas empresas, que comente sob o advento ou não de uma nova tecnologia em desenvolvimento; Por essa contribuição, sobre o ponto focal, Thomas Schelling ganhou o Nobel de economia em 2005; > Um caso em que não há Equilíbrio de Nash Um exemplo de jogo que não possui Equilíbrio de Nash é o jogo de combinar moedas; Dois jogadores, 1 e 2, mostram uma moeda ao outro ao mesmo tempo. Se ambas forem iguais, cara ou coroa, o jogador 1 fica com as duas moedas. Se diferirem, o jogador 2 fica com as duas; Cada um escolhe a face da moeda que irá mostra; Jogo de combinar moedas Jogador 2 Cara Coroa Jogador 1 Cara 1, -1 -1, 1Coroa -1, 1 1, -1 Nesse jogo não há estratégia dominante ou dominada, nem Equilíbrio de Nash; Jogo conhecido como estritamente competitivo ou de soma zero; Não há acomodação; A ausência de um Equilíbrio de Nash ocorre porque não são admitidas estratégias mistas, que sempre apresentam um Equilíbrio de Nash, como será visto no quinto Capítulo; > Alguns jogos importantes A seguir são apresentados jogos famosos que identificam diferentes situações de interação entre os jogadores; 1. A batalha dos sexos: O problema da coordenação com várias opções Um casal fez planos para se encontrar a noite, mas a programação não ficou definida. Ambos valorizam o encontro mais do que o desencontro, conquanto cada um tenha uma preferência específica quanto ao local do encontro. Eles não tem como se comunicar; Jogo da batalha dos sexos Ele Futebol Show Ela Futebol 1, 2 -1, -1 Show -1, -1 2, 1 Situação em que sempre há ganho quando existe coordenação entre os jogadores; Ocorrem dois Equilíbrios de Nash; 2. O dilema do prisioneiro: Cooperaçãoversus interesse próprio Dois suspeitos são detidos após o acontecimento de um crime, por estarem rondando nas proximidades. Colocadas em celas separadas, de forma que não possam se comunicar, recebem as seguintes instruções da polícia: Se um confessar e o outro não, quem confessa é o beneficiado pela cooperação e apenas o outro recebe punição; Se os dois confessarem, ambos irão dividir a pena máxima; Se nenhum confessar, ambos serão detidos por um tempo mínimo pelo crime de vadiagem; Jogo do dilema do prisioneiro Ladrão 2 Confessa Não confessa Ladrão 1 Confessa -2, -2 0, 4 Não confessa -4, 0 -1, -1 O Equilíbrio de Nash implica no pior resultado conjunto, {confessa, confessa}; Isso decorre dos jogadores não poderem se comunicar; Implica num jogo não-cooperativo; Jogo cooperativo: Quando os jogadores podem estabelecer compromissos entre si com garantias efetivas; Quando isso não ocorre há um jogo não-cooperativo; 3. O jogo da “galinha”: Quando a competição é destrutiva Dois adolescentes disputam o jogo da galinha, cada um em seu carro acelerando em direção ao outro. O primeiro a desviar é apelidado de galinha enquanto o outro leva a fama de durão; Jogo da galinha Jovem 1 Não desvia Desvia Jovem 2 Não desvia -2, -2 2, -1 Desvia -1, 2 0, 0 O jogo apresenta dois Equilíbrios de Nash; Como ambos os jogadores maximizam seus interesses, não há possibilidade de coordenação; O resultado será circunstancial; 4. O jogo da caça ao cervo: O dilema do contrato social O jogo exemplifica o dilema do contrato social de Rousseau, sobre o instinto incontrolável do homem mesmo quando trabalha em grupo mediante o benefício do todo. Pelo exposto, tem-se que o indivíduo tentará trabalhar pela sociedade, mas não tardará em buscar o benefício particular se a oportunidade surgir; O jogo derivado do exemplo apresenta dois caçadores, A e B, que estão buscando um cervo para alimentar o grupo. Ocorre que se passar por ali uma lebre qualquer um dos dois estará disposto a persegui-la para seu ganho pessoal em detrimento à caça ao cervo; Jogo da caça ao cervo Caçador B Cervo Lebre Caçador A Cervo 3, 3 0, 1 Lebre 1, 0 1, 1 Há dois equilíbrios de Nash {cervo, cervo} e {lebre, lebre}; Um deles é um Ótimo de Pareto; O jogo exemplifica situações em que manter o compromisso original é a melhor estratégia para o indivíduo e para o grupo;
Compartilhar