Baixe o app para aproveitar ainda mais
Prévia do material em texto
FERNANDO MORI – prof.fmori@gmail.com TEORIA DOS JOGOS FERNANDO MORI Fernando Mori Prof.fmori@gmail.com Resumo Breve introdução à teoria dos jogos para o curso de engenharia de produção Teoria dos Jogos | Fernando Mori 1 TEORIA DOS JOGOS Introdução A Teoria dos Jogos foi desenvolvida com a finalidade de analisar situações competitivas que envolvessem interesses conflitantes. Nessas situações, existem duas ou mais pessoas com objetivos diferentes, sendo que a ação de cada uma influência, mas não determina completamente o resultado do jogo. Além disso, admite-se que cada jogador sabe os objetivos de seu oponente. A Teoria dos Jogos fornece um resultado para este jogo, admitindo que cada um dos jogadores deseja maximizar seus ganhos. A maioria dos jogos recreativos, como jogo da velha, damas, xadrez e outros, podem ser analisados como jogos de estratégia. Os jogos de azar, como roleta e dados não são jogos de estratégia, uma vez que uma pessoa ao jogar fica na dependência da sorte e não de análises racionais. Existem várias situações como não são exatamente jogos e que podem ser analisadas pela teoria dos jogos. Chamamos de jogos a situações que envolvam interações entre agentes racionais que se comportam estrategicamente. A seguir são dadas definições importantes para o entendimento da teoria dos jogos: - um jogo é um modelo formal de uma situação de interação estratégica ; - interações são as ações de cada jogador, que afetam todos os participantes; - jogador é qualquer indivíduo, ou grupo de indivíduos, com capacidade de decisão e que se utiliza da racionalidade para agir. - racionalidade é o uso dos meios mais adequados aos objetivos que se pretendem alcançar. - comportamento estratégico é o fato de cada jogador, ao tomar sua própria decisão, leva em consideração o fato de que os jogadores interagem entre si, e que, portanto, sua decisão terá consequências sobre os demais jogadores, assim como as decisões do demais jogadores terão consequências sobre ele. Teoria dos Jogos | Fernando Mori 2 Exemplo: Jogo de Votação da Diretoria Imagine que a diretoria de uma empresa hipotética vai se reunir para definir, por meio de votação, os planos da empresa para o ano seguinte. Vamos supor que há apenas três decisões possíveis: - investir na construção de uma nova fábrica (Investir) - ampliar a fábrica já existente (Ampliar) - aplicar os recursos no sistema financeiro (Aplicar) Vamos supor também que, para facilitar a decisão, os diretores decidem votar em dois turnos: - Turno I: votam se Investem ou Ampliam - Turno II: decidem entre a escolha vitoriosa do Turno I e Aplicar A ordem de preferências dos diretores são as seguintes: Diretor 1 Diretor 2 Diretor 3 Investir Aplicar Ampliar Aplicar Investir Investir Ampliar Ampliar Aplicar Caso não haja interação estratégica, o resultado da votação será o seguinte: 1o. Turno: Investir ou Ampliar Diretor 1: Investir Diretor 2: Investir Diretor 3: Ampliar Escolha Vencedora: Investir 2o. Turno: Investir ou Aplicar Diretor 1: Investir Diretor 2: Aplicar Diretor 3: Investir Escolha Vencedora: Investir Teoria dos Jogos | Fernando Mori 3 Caso o Diretor 2 resolvesse agir estrategicamente, conhecendo as preferências dos outros 2: 1o. Turno: Investir ou Ampliar Diretor 1: Investir Diretor 2: Ampliar Diretor 3: Ampliar Escolha Vencedora: Ampliar 2o. Turno: Ampliar ou Aplicar Diretor 1: Aplicar Diretor 2: Aplicar Diretor 3: Ampliar Escolha Vencedora: Aplicar (que era a preferência inicial do Diretor 2) . Teoria dos Jogos | Fernando Mori 4 ESTRATÉGIAS Estratégia é uma descrição completa de como uma pessoa deverá agir sob quaisquer circunstâncias possíveis. Quando não há dúvida sobre como o jogador deve agir dizemos tratar-se de uma estratégia pura e quando as decisões se baseiam em probabilidades estamos diante de uma estratégia mista. Descrição de um jogo Considere o jogo descrito a seguir: Temos uma mesa com quatro quadrados 1,2 3 e 4. Dois jogadores participam do jogo: Jogador I tem o movimento de abertura em que ele escolhe um dos quadrados. Em vezes sucessivas cada um dos jogadores vai escolhendo cada um dos quadrados segundo as regras: 1) Um quadrado é escolhido se não foi escolhido anteriormente por outro jogador. 2) O quadrado 4 não pode ser escolhido se o 2 ou o 3 foi escolhido anteriormente. 3) O jogo termina quando o quadrado 1 for escolhido. O jogador que escolher o quadrado 1 perde o jogo. Uma descrição gráfica deste jogo é: Cada círculo é uma decisão do jogador. Este jogo está na forma extensiva. 1 4 3 2 Teoria dos Jogos | Fernando Mori 5 Jogos com movimentos probabilísticos No jogo anterior, a transição de um estado peara outro foi feita por ações tomadas pelos jogadores. Tal modelo é apropriado para jogos de xadrez por exemplo, mas para jogos de cartas isso não ocorre. É possível pensarmos em situações em que as transições de um estado para outro dependem de outros fatores tais como, o tempo, as oscilações de índices de mercado, etc.. Exemplo: Considere um jogo em que o jogador I tem a opção de escolher entre a ação a, que leva ao fim do jogo com prêmio (0,0) e a ação b que leva a um movimento probabilístico em A. Em A temos uma loteria (moeda) com probabilidade ½ de cara ou coroa levando ao estado B. No estado B o jogador II escolhe entre a ação f levando ao fim do jogo com prêmio (2,0) e a ação levando ao estado D o qual é um movimento aleatório. No estado C o jogador escolhe entre a ação g levando ao fim do jogo com prêmio (1,1) e a ação h levando ao vértice com movimento aleatório E. Se tivermos estratégias para o jogo, escolhidas pelos jogadores I e II tais que: ( ) ( ) ( ) I I II S R b S C h S B f = = = Os seguintes resultados podem ocorrer: 1 (2,0) com probabilidade 2 1 1 1 (0,2) com probabilidade . 2 4 8 1 1 1 ( 1,1) com probabilidade 2 2 4 1 1 1 (1,1) com probabilidade 4 2 8 R A B R A C E R A C E R A C E → → → → → → → = → → → → − = → → → → = Teoria dos Jogos | Fernando Mori 6 Jogos com informação imperfeita Uma das propriedades mais importantes dos jogos é que em cada estágio do jogo cada jogador tem conhecimento perfeito do desenvolvimento do jogo anterior a este estágio. Ele conhece exatamente as ações executadas pelos outros jogadores e se existem movimentos probabilísticos quais resultados possíveis de ocorrer. Um jogo deste tipo é chamado de jogo com informação perfeita. Podemos ter jogos em que a informação não é perfeita como no exemplo: Exemplo: Considere o jogo em que cada jogador escolhe o lado de uma moeda (cara ou coroa) da seguinte forma: cada jogador coloca em um envelope um pedaço de papel no qual a escolha foi escrita. O envelope é fechado e entregue a um juiz. Se ambos escolherem o mesmo lado da moeda, o jogador II paga 1 real ao jogador I. Se eles escolherem lados opostos das moedas, o jogador I paga um real ao jogador II. Quando o jogador II faz a escolha entre h e t ele não sabe se o jogo está no vértice A ou vértice B pois ele não conhece a escolha do jogador I. Este é um jogo com informação imperfeita. Os vértices A e B formam um conjunto de informações do jogador II. Teoria dos Jogos | Fernando Mori 7 Jogos na forma estratégica. Exemplo: Considere o jogo pedra, papel, tesoura em que cada um dos jogadores escolhe uma ação a partir de 3 alternativas: pedra, papel e tesoura. A ação é selecionada pelos jogadores simultaneamente com a dominação circular entre as três alternativas:pedra esmaga tesoura, que corta papel, que embrulha pedra. O jogo na forma extensiva fica: Atribuindo o prêmio do jogador como sendo 1 para ganhar e -1 para perder e 0 para empate temos o jogo na forma estratégica dado abaixo: Jogador II Jogador I Em cada célula da figura o numero a esquerda representa o prêmio do jogador I e o do lado direito o prêmio do jogador II. pedra papel tesoura pedra (0,0) (1,-1) (1,-1) papel (1,-1) (0,0) (-1,1) tesoura (-1,1) (-1,1) (0,0) Teoria dos Jogos | Fernando Mori 8 Dominação Uma primeira busca da solução do jogo: eliminando estratégias estritamente dominadas Em alguns casos, os jogadores têm uma ou mais opções de estratégia que proporcionam resultados melhores do que alguma outra estratégia, não importando o que os demais jogadores façam. Exemplo 1: Considere a seguinte situação de interação estratégica. A empresa de sabão em pó Limpo tem de decidir se lança, ou não, uma marca biodegradável para competir com o produto biodegradável de sua concorrente, a empresa Bonito. Esta última, por sua vez, tem de decidir se aumenta, ou não, os gastos de propaganda com o seu produto. Os lucros de cada empresa estão apresentados de forma estratégica a seguir, em milhões de reais. Bonito Limpo Aumentar os gastos com publicidade Não aumentar os gastos com publicidade Lançar o produto biodegradável 5,5 7,3 Não lançar o produto biodegradável 2,4 2,7 Observar que não importa o que a empresa Bonito decida, é sempre melhor para a empresa Limpo lançar seu produto biodegradável. Utilizando os termos empregados pela Teoria dos Jogos, no caso do jogador Limpo, a estratégia {Lançar o Produto Biodegradável} domina a estratégia {Não lançar o produto biodegradável}. Podemos dizer que o jogador Limpo possui uma estratégia estritamente dominante sobre outra dominada. Note que todas as recompensas da estratégia {Lançar o produto biodegradável} são estritamente maiores do que as recompensas da estratégia (não lançar o produto biodegradável}. Nesse caso diz-se que a primeira estratégia é estritamente dominante em relação à outra. Teoria dos Jogos | Fernando Mori 9 Mas, além de estratégias estritamente dominantes, também podemos ter casos em que uma estratégia é melhor do que a outra em pelo menos uma situação, sendo no restante das vezes apenas tão boa quanto esta outra. Veja o exemplo anterior ligeiramente reformulado: Bonito Limpo Aumentar os gastos com publicidade Não aumentar os gastos com publicidade Lançar o produto biodegradável 2,5 7,3 Não lançar o produto biodegradável 2,4 2,7 Aqui, para a empresa Limpo, a estratégia {Lançar o produto biodegradável} é fracamente dominante em relação à estratégia {Não lançar o produto biodegradável}. Eliminação Iterativa de Estratégias Estritamente Dominadas O método mais simples para se determinar o resultado de um jogo simultâneo é a chamada eliminação iterativa de estratégias estritamente dominadas. Situação Hipotética: Duas, empresas, X e Y, competem no mercado automobilístico. A empresa Y já tem seu carro utilitário, que é um sucesso, enquanto a empresa X ainda não oferece nenhum modelo utilitário. A empresa X tem 3 opções: - importar o utilitário de sua matriz estrangeira; - produzir o utilitário nacionalmente; - permanecer fora do segmento de utilitários. A empresa Y pode responder às escolhas de X de três formas: - mantendo o preço de seu modelo; - diminuindo o preço de seu modelo; - lançando uma nova versão dos eu modelo. Vamos supor que as empresas tomam suas decisões ao mesmo tempo, no momento de finalizar seu planejamento anual, sem conhecer as decisões uma da outra. Teoria dos Jogos | Fernando Mori 10 Como são empresas experientes no mercado e que já competiram entre si em outras oportunidades, conhecem o comportamento dos consumidores e fazem uma estimativa bastante razoável dos seus lucros e dos lucros da rival em cada situação. Empresa Y Empresa X Lançar Nova Versão Manter Preço Reduzir Preço Lançar Modelo Próprio 1,4 4,1 1,3 Importar da Matriz 2,2 2,1 2,3 Não Competir com a Empresa Y 1,1 0,6 1,0 Como se pode observar, a Empresa Y não possui estratégia estritamente dominante. Para a Empresa X, a estratégia {Não Competir com a Empresa Y} sempre resulta em uma recompensa pior do que {Importar da Matriz}, independentemente da escolha que a Empresa Y faça, ou seja, {Não Competir com a Empresa Y} é estritamente dominada por {Importar da Matriz}. Portanto Eliminação Iterativa da 1a. Estratégia Estritamente Dominada. Empresa Y Empresa X Lançar Nova Versão Manter Preço Reduzir Preço Lançar Modelo Próprio 1,4 4,1 1,3 Importar da Matriz 2,2 2,1 2,3 Não Competir com a Empresa Y 1,1 0,6 1,0 Estratégia Estritamente Dominada (recompensa sempre pior que as demais estratégias) Teoria dos Jogos | Fernando Mori 11 Exemplo: Considere um jogo de 2 jogadores no qual o jogador I escolhe uma linha e o jogador II escolhe coluna. Jogador II Jogador I Se o jogador I joga T o prêmio do jogador II usando a estratégia M é 2, comparando com somente 1 sob a estratégia R. Se o jogador I joga B, o prêmio do jogador II sob a estratégia M é 1 comparado com 0 sob a estratégia R. Vemos que independente da estratégia do jogador I, a estratégia M sempre fornece um prêmio maior ao jogador II que a estratégia R. Hipótese: Um jogador racional não irá escolher uma estratégia que seja totalmente dominada. No jogo em questão dizemos que a estratégia R é estritamente dominada pela estratégia M. Assim eliminamos a estratégia R. Jogador II Jogador I A estratégia B é estritamente dominada pela estratégia T para o jogador I. Assim eliminamos a estratégia B: Jogador II Jogador I O jogador II escolhe M com prêmio 2. L M R T (1,0) (1,2) (0,1) B (0,3) (0,1) (2,0) L M T (1,0) (1,2) B (0,3) (0,1) L M T (1,0) (1,2) Teoria dos Jogos | Fernando Mori 12 Exemplo: Dilema do prisioneiro Duas pessoas que cometeram um crime sério são presas. Na falta de evidencias que incriminem estas pessoas, a polícia pode obter indiciamento convencendo um (ou ambos) prisioneiros a confessar o crime. Os policiais dão a cada um dos prisioneiros, ambos em celas separadas e sem comunicação as seguintes escolhas: 1) Se você confessar e seu amigo recusar a confessar você será solto. 2) Se você recusar a confessar e seu amigo confessar, você recebe a pena máxima (10 anos) pelo crime. 3) Se ambos recusarem confessar, serão acusados com um ano de prisão cada. 4) Se ambos confessarem, a pena será reduzida para 6 anos de prisão cada. A situação é um jogo estratégico com duas estratégias confessar (C ) o crime e não confessar (NC) o crime. Os prêmios da tabela estão em anos de prisão. Jogador II Jogador I Lembrando do conceito de utilidade já visto anteriormente, podemos representar o problema em termos de utilidade para o tomador de decisão: U(solto) = 5 , U(um ano de prisão) = 4 , U(6 anos de prisão) = 1 , U(10 anos de prisão) = 0. Em termos da utilidade nossa tabela de prêmios fica: Jogador II Jogador ISe o jogador I começar então ele escolhe a estratégia C que domina a estratégia NC. Em seguida o jogador II escolhe C que domina NC. Se o jogador II começa então ele escolhe a estratégia C que domina NC, em seguida o jogador I escolhe C que domina sobre NC. A melhor estratégia é que ambos confessem C e C com prêmio (1,1). O que torna o jogo interessante é que se ambos os jogadores escolhem estratégia C, o prêmio que eles recebem é (4,4), o que é preferível para ambos. O par de estratégias (NC,C) é instável porque cada jogador pode desviar e ganhar um prêmio maior que 0. C NC C (6,6) (0,10) NC (10,0) (1,1) C NC C (1,1) (5,0) NC (0,5) (4,4) Teoria dos Jogos | Fernando Mori 13 Exemplo: Podemos ter casos em que não existem estratégias estritamente dominadas, mas estratégias fracamente dominadas. Considere o jogo com a matriz de prêmios: Jogador II Jogador I Não existe estratégia dominada neste jogo. No entanto a estratégia B garante um prêmio maior para I em relação e estratégia T, em especial se o jogador II escolher a estratégia L, B é estritamente melhor que T. Neste caso dizemos que B domina fracamente a estratégia T. Quando estratégias estritamente dominadas estão envolvidas em um processo de eliminação iterada, o resultado é independente da ordem em que as estratégias são eliminadas. Na eliminação iterada de estratégias fracamente dominadas o resultado pode ser sensível a ordem de eliminação. Exemplo: Jogador II Jogador I Consideremos três procedimentos de eliminação de estratégias dominadas conforme dadas a seguir: 1) Jogador I elimina T, jogador II elimina R, jogador I elimina B e jogador II elimina C. O resultado será M,L com prêmio (2,2) . 2) Jogador I elimina B, jogador II elimina L, jogador I elimina T e jogador II elimina C. O resultado será M,R com prêmio (3,2). Como não existem estratégias estritamente dominantes, a ordem de eliminação de estratégias fracamente dominadas leva a resultados distintos para o jogo. L R T (1,2) (2,3) B (2,2) (2,0) L C R T (1,2) (2,3) (0,3) M (2,2) (2,1) (3,2) B (2,1) (0,0) (1,0) Teoria dos Jogos | Fernando Mori 14 ESTABILIDADE: Equilíbrio de Nash A dominância é um conceito importante que nos leva diretamente ao conceito de estabilidade em um jogo, ou seu equilíbrio de Nash. Um jogador que conhece as estratégias usadas por outros jogadores está em efeito jogando um jogo no qual ele deve escolher uma estratégia. Se este jogador for racional ele irá escolher a melhor resposta possível a estratégia usada por outros jogadores. O Equilíbrio de Nash representa uma situação em que, em um jogo envolvendo dois ou mais jogadores, nenhum jogador tem a ganhar mudando sua estratégia unilateralmente. Para melhor compreender esta definição, suponha que há um jogo com n participantes. No decorrer deste jogo, cada um dos n participantes seleciona sua estrategia ótima, ou seja, aquela que lhe traz o maior benefício. Então, se cada jogador chegar à conclusão que ele não tem como melhorar sua estratégia dadas as estratégias escolhidas pelos seus n-1 adversários (estratégias dos adversários não podem ser alteradas), então as estratégias escolhidas pelos participantes deste jogo definem um "equilíbrio de Nash". Dois jogadores A e B estão em um Equilíbrio de Nash se a estratégia adotada por A é a melhor dada à estratégia adotada por B e a estratégia adotada por B é a estratégia ótima dada a adotada por A. Ou seja, nenhum dos jogadores pode aumentar seu ganho alterando, de forma unilateral, sua estratégia. Exemplo: Equilíbrio de Nash no Dilema dos Prisioneiros Prisioneiro 1 Prisioneiro 2 Coopera Trai Coopera -1 . -1 -6 , 0 Trai 0 , -6 -3 , -3 O dilema dos prisioneiros possui somente um par de ações configurando um equilíbrio de Nash: (trai, trai) é um equilíbrio de Nash, pois dado que o jogador 2 escolheu trair a melhor escolha para o jogador 1 é trair, já que essa alternativa oferece um pagamento maior que cooperar. Além disso, dado que o jogador 1 escolheu trair, o jogador 2 não possui nenhuma escolha melhor que trair também. (coopera, coopera) não é um equilíbrio de Nash, pois se o jogador 1 escolher cooperar o pagamento que o jogador 2 receberá ao escolher trair é maior que escolher cooperar. (coopera, trai) não é um equilíbrio de Nash, pois dado que o jogador 2 escolhe trair, o jogador 1 teria um pagamento maior escolhendo trair também. (trai, coopera) não é um equilíbrio de Nash, pois dado que o jogador 1 escolhe trair, o jogador 2 teria um pagamento maior escolhendo trair também. http://pt.wikipedia.org/wiki/John_Forbes_Nash Teoria dos Jogos | Fernando Mori 15 Prisioneiro 1 Prisioneiro 2 Coopera Trai Coopera -1 . -1 -6 , 0 -3,5 Trai 0 , -6 -3 , -3 -1,5 -3,5 -1,5 Aplicado na Teoria dos Jogos, o Equilíbrio de Nash (ou Equilíbrio Cooperativo) representa uma situação em que nenhum jogador pode melhorar a sua situação dada a estratégia seguida pelo jogador adversário. Um par de estratégias EA e EB, em que EA é a estratégia seguida pelo jogador A e EB é a estratégia seguida pelo jogador B diz-se um Equilíbrio de Nash se não for possível a nenhum dos jogadores melhorar a sua situação dada a estratégia do outro jogador. Definição matemática para o Equilíbrio de Nash: Deixe (S, f) ser um jogo com n participantes, onde Si é o conjunto de estratégias possíveis para o participante i, S=S1 X S2 … X Sn é o conjunto de estratégias que especificam todas as ações em um jogo (somente uma estratégia por participante) e f=(f1(x), …, fn(x)) é a função do premio. Deixe x − i ser o conjunto de estratégias de todos os jogadores com exceção do jogador i. Quando cada jogador i {1, …, n} seleciona sua estratégia xi resultando no conjunto de estratégias x = (x1, …, xn) então o jogador i obtém o payoff fi(x). Note que o premio depende da estratégia selecionada pelo jogador i e também pelas estratégias escolhidas pelos seus adversários. Um conjunto de estratégias x* S é um equilíbrio de Nash caso nenhuma alteração unilateral da estratégia é rentável para este jogador, ou seja: http://www.notapositiva.com/dicionario_economia/teoriadojogos.htm http://pt.wikipedia.org/wiki/Payoff Teoria dos Jogos | Fernando Mori 16 Exemplo 1: Jogador II Jogador I Se o jogador II sabe que o jogador I escolherá T, ele escolherá L que é sua melhor resposta a T. Se o jogador I sabe que o jogador II escolherá L, então ele escolherá M, que é sua melhor resposta a L. Se o jogador II sabe que o jogador I escolherá M, ele escolherá C que é sua melhor resposta a M. Se o jogador I sabe que o jogador II escolherá C, ele escolherá T que é sua melhor resposta a C. Se o jogador II sabe que o jogador I escolherá B, então ele escolhe R que é sua melhor resposta a B. Se o jogador I sabe que o jogador II escolhe R, ele escolherá B que é sua melhor resposta a R.O par de estratégias B,R satisfaz uma propriedade de estabilidade: cada estratégia neste par é a resposta a outra estratégia. Supondo que os jogadores escolhem B,R nenhum deles tem um desvio lucrativo, ou seja nenhum deles tem uma estratégia que garante um prêmio maior que B,R. Esta propriedade de estabilidade é chamada de equilíbrio de Nash. L C R T (0,6) (6,0) (4,3) M (6,0) (0,6) (4,3) B (3,3) (3,3) (5,5) Teoria dos Jogos | Fernando Mori 17 Exemplo 2: Batalha dos sexos Umcasal está tentando planejar o que fazer no fim de semana. As alternativas são ir a um concerto (C ) ou assistir a uma partida de futebol (F) . O homem prefere o futebol, e a mulher o concerto, mas ambos querem ficar juntos. A matriz de prêmios para este jogo é: Mulher Homem Temos dois pontos de equilíbrio F,F com prêmio (2,1) e C,C com prêmio (1,2). O homem prefere F,F e a mulher prefere C,C. Exemplo: Temos duas firmas que estão decidindo no mesmo instante entre duas estratégias que são fazer propaganda ou não fazer propaganda, com a matriz de prêmios dada abaixo: Firma B Firma A Determine o equilíbrio de Nash se houver. 1) A escolhe F e B escolhe F. 2) B escolhe F e A escolhe F. São estratégias dominantes e portanto o equilíbrio de Nash ocorre em F,F com prêmio (10,5). F C F (2,1) (0,0) C (0,0) (1,2) Fazer Não fazer Fazer (10,5) (15,0) Não fazer (6,8) (10,2) Teoria dos Jogos | Fernando Mori 18 Exemplo 3: Suponha que duas operadoras do setor de turismo estão decidindo simultaneamente qual pacote de turismo (C ou D) irão lançar de acordo com a obtenção de lucros. Determine se houver o equilíbrio de Nash. Operadora B Operadora A Não existe equilíbrio de Nash para este jogo. Exemplo 4: Considerando a matriz abaixo com seus ganhos, se (A,E) é um equilíbrio de Nash, que relações devem ser satisfeitas? Operadora 2 Operadora 1 Para a operadora 1 : a > e , c > g. Para a operadora 2: b > d, f > h. C D C (2,3) (3,2) D (4,2) (1,5) esquerda direita alto (a,b) (c,d) baixo (e,f) (g,h) Teoria dos Jogos | Fernando Mori 19 Exemplo 5: Supondo o seguinte jogo entre dois jogadores cada qual com três estratégias possíveis (A,B,C) com seus respectivos prêmios. Jogador2 Jogador 1 a). Determine as estratégias dominantes e dominadas. b). Os equilíbrios de Nash. a) Não existe estratégia estritamente dominante para nenhum jogador. Para o jogador 1 a estratégia B1 é dominada por A1 e C1 mas C1 não domina A1. Para o jogador 2 a estratégia B2 é estritamente dominada por A2 e C2 porem C2 não domina A2. b) Os equilíbrios de Nash: Se o jogador I começa então ele elimina B1, o jogador II elimina B2. A seguir o jogador I pode escolher A1 ou C1 pois nenhuma domina a outra. Se ele escolher A1 então o jogador II escolhe A2 e a solução é o ponto (4,1). Se ele escolher C1 então o jogador II escolhe C2 e o ponto (1.5,3) é solução. Se o jogador II começa então ele elimina B2, o jogador I elimina B1, o jogador II pode escolher A2 ou C2. Se ele escolhe A2 então o jogador I escolhe A1 e o ponto (4,1) é solução do jogo. Se ele escolhe C2, então o jogador I escolhe C1 e a solução é (1.5,3). Os pontos (4,1) e (1.5,3) são equilíbrios de Nash. A2 B2 C2 A1 (4,1) (9,0) (1,0.5) B1 (2,3) (7,2) (0.5,2.5) C1 (3,2) (8,1.5) (1.5,3) Teoria dos Jogos | Fernando Mori 20 Exemplo 6: De acordo com o jogo abaixo, onde duas firmas estão decidindo, no mesmo instante, entre duas estratégias, que são Fazer Propaganda ou Não Fazer Propaganda, determine: Firma B Fazer Não Fazer Firma A Fazer 10 ; 5 15 ; 0 Não Fazer 6 ; 8 10 ; 2 a) o equilíbrio de Nash e o equilíbrio com estratégias dominantes, apontando quais são as estratégias dominantes e dominadas para cada uma das firmas; b) os novos equilíbrios de Nash e com estratégia dominante; se os ganhos para cada firma, quando não fizerem propaganda fossem (20;10) em vez de (10;2). Qual a conclusão que se obtêm em relação ao Equilíbrio de Nash? a) o equilíbrio com estratégias dominantes e o de Nash é: (10; 5); as estratégias dominantes para ambas firmas são Fazer Propaganda, e as dominadas para ambas são Não Fazer; b) os equilíbrios de Nash serão: (10; 5) e (20; 10); mas não existirá estratégia dominante para nenhuma firma; c) todo equilíbrio com estratégias dominantes é um equilíbrio de Nash, mas nem todo equilíbrio de Nash é um equilíbrio com estratégias dominantes. Teoria dos Jogos | Fernando Mori 21 Exemplo 7: Supondo que um mercado está sendo disputado por duas firmas (F1 e F2), sendo F1 a firma que está operando no mercado e F2 a entrante em potencial. As estratégias para cada firma são as seguintes: para F1 cobrar preço alto, sendo os lucros do mercado iguais a $100, ou cobrar preço baixo, com lucros de mercado iguais a $40; e para F2 entrar no mercado ou não entrar. Sabendo ainda que para entrar no mercado a F2 tem que investir $40 na construção de uma fabrica e que ambas dividirão os lucros do mercado, determine: a) a representação desse jogo na forma normal e encontre o equilíbrio de Nash; b) a representação desse jogo na forma extensiva e encontre sua solução; c) se a estratégia da F1 de cobrar preço baixo, para desencorajar a entrada de F2l pode interferir na decisão dela. a) A representação do jogo é : F1 F2 a) os equilíbrios de Nash é: (50;10); b) o equilíbrio de Nash será: (50;10); c) a F1 não consegue interferir na decisão da F2, e o equilíbrio permanece o mesmo. Entrar Não entrar Preço alto (50,10) (100,0) Preço baixo (20,-20) (40,0) Teoria dos Jogos | Fernando Mori 22 Exemplo 8: Suponha dois vendedores que veem, simultaneamente, entrar um cliente em uma loja. Ambos estão perto do cliente. Se um deles aborda o cliente, ele marca um ponto na sua avaliação com o gerente da loja, o que pode lhe render uma promoção ao fim do mês, enquanto o outro que não abordou perde um ponto, pois não mostrou iniciativa, e muito provavelmente perde a promoção. E nenhum dos dois aborda o cliente, nenhum deles marca ponto com o cliente. Mas, se os dois abordam o cliente, ele fica irritado e vai embora, e, cada um dos dois perde um ponto com o gerente. Modele esse jogo, na foram estratégicas, supondo que nenhum dos dois tem tempo de perceber o que o outro irá fazer. Resolução: Jogo Simultâneo V 2 V1 Aborda Não Aborda Aborda -1,-1 1,-1 Não Aborda -1,1 0,0 Teoria dos Jogos | Fernando Mori 23 Exemplo 9: Determine o equilíbrio a partir da forma estratégica dos jogadores A (linhas) e B (colunas) a seguir, utilizando a eliminação iterativa de estratégias estritamente dominadas. B(1) B(2) B(3) B(4) A(1) 3,0 1,1 5,4 0,2 A(2) 1,1 3,2 6,0 2,-1 A(3) 0,2 4,4 7,2 3,0 Resolução: B(1) B(2) B(3) B(4) A(1) 3,0 1,1 5,4 0,2 A(2) 1,1 3,2 6,0 2,-1 A(3) 0,2 4,4 7,2 3,0 2) B(2) x B(1) 1) B(3) x B(4) 5) B(2) x B(3) Resposta: Combinação de Estratégias A(3) com B(2) Teoria dos Jogos | Fernando Mori 24 CLASSIFICAÇÃO DOS JOGOS Jogos de soma zero e jogos de soma não-zero Os jogos de soma zero são aqueles em que os interesses dos participantes são diametralmente opostos. O ganho de um jogador necessariamente corresponde a uma perda de igual magnitude de outro jogador. Dessa forma não há a criação de riqueza, apenas a transferência de riqueza de um jogador para outro.Quando o que um jogador perde pode não ser necessariamente o que o outro jogador ganha, ou seja, quando ambos podem ganhar ou ambos perder, temos um jogo de soma não zero. Os jogos de soma zero podem ser analisados mais facilmente, pois o objetivo de cada jogador é claramente obter o máximo de recompensa e, portanto, prejudicar ao máximo o oponente. Já nos jogos de soma não zero existem possibilidades que devem ser conhecidas anteriormente, como a intenção em cooperar. A matriz de um jogo de soma zero apresenta números opostos em cada célula e por isso podemos indicar apenas as recompensas do jogador das linhas, já as recompensas do jogador das colunas são as mesmas com os sinais trocados. jogador 2 jogador 1 estratégia c estratégia d estratégia a 3,-3 1,-1 estratégia b -2,2 -2,2 jogador 2 jogador 1 estratégia c estratégia d estratégia a 3 1 estratégia b -2 -2 Teoria dos Jogos | Fernando Mori 25 2 – Jogos simultâneos e jogos sequenciais Jogos simultâneos são aqueles em que as escolhas das estratégias acontecem ao mesmo tempo, ou se eles não se movem simultaneamente, ao menos os jogadores desconhecem previamente as ações de seus adversários. Jogos sequenciais são aqueles que se desenvolvem em etapas sucessivas, assim os jogadores tomam suas decisões baseados nas decisões anteriores dos adversários. 3 – Jogos cooperativos e jogos não-cooperativos Os jogos cooperativos são aqueles em que a comunicação prévia é permitida entre os jogadores, antes de decidirem as estratégias que irão ser adotadas, sendo que dessa forma os jogadores podem combinar estratégias e dessa forma dizemos que estão cooperando. Na situação oposta, ou seja, quando os jogadores não têm oportunidade para estabelecer estratégias comuns, visando o bem geral, são chamados de jogos não-cooperativos. 4 – Jogos de informação perfeita e jogos de informação imperfeita Um jogo é de informação perfeita quando todos os jogadores conhecem todas as informações importantes antes de tomarem suas decisões. Se algum jogador, em algum momento do jogo, tem de tomar uma decisão sem conhecer alguma informação importante, o jogo é de informação imperfeita. 5 – Jogos simétricos e jogos assimétricos Um jogo é simétrico quando a posição do jogador não é importante, nenhum jogador possui vantagem por ocupar determinada posição no jogo. Caso contrário o jogo é assimétrico. Teoria dos Jogos | Fernando Mori 26 6 – Jogos repetitivos São aqueles em que se realizam em etapas sucessivas em que as opções de estratégias não mudam, de forma que em cada etapa cada jogador deve decidir se mantêm ou altera suas opções MÉTODOS DE SOLUÇÕES DE JOGOS 1 – Estratégia dominante Se uma das estratégias de um jogador for sempre melhor que as demais, independente das estratégias adotadas pelos oponentes, será escolhida pelo jogador. 2 – Minimax e Maximin Bastante útil na solução de jogos estritamente competitivos. Um dos jogadores tenta impor a maior perda possível ao outro (o mínimo dos máximos disponíveis ao adversário) e este tenta se defender garantindo a menor perda possível ( o máximo dos mínimos de que dispõe). Neste critério, o jogador 1 deve escolher uma estratégia cujo prêmio mínimo seja o maior, ao passo que o jogador 2 deve escolher aquela cujo prêmio máximo para o jogador 1 fosse o menor possível. Esta é a estratégia do mínimo máximo para o jogador 1 e estratégia 2 é a estratégia do máximo mínimo para o jogador 2 Quando um jogador possuir informações de que seu opositor tentará lhe infligir o maior prejuízo possível talvez seja conveniente analisar a situação escolhendo o máximo entre os mínimos disponíveis. Quando um jogador pretende infligir o maior prejuízo possível a seu adversário pode escolher o mínimo entre as maiores recompensas que o outro possui. Teoria dos Jogos | Fernando Mori 27 Exemplo 1: Resolva o jogo usando a estratégia maxmin. Como A pensa que B será o mais desagradável possível e por isso se escolher M, B escolherá Q, que é o pior para A. Se escolher N ou P, B escolherá R. Dentre os piores resultados de que dispõe o jogador A escolherá a estratégia M, que corresponde a recompensa 4, que é o máximo dos mínimos (maxmin). Como B pensa que A será o mais desagradável possível e por isso se escolher Q, A escolherá P, que é o pior para B. Se escolher R, A escolherá N. Então B prefere escolher Q, que corresponde a recompensa de 4, que é o máximo dos mínimos (maxmin) Quando se opta pelo maxmin diz-se que os jogadores estão utilizando o “nível de segurança” que significa que estão agindo com precaução, mas isso sugere muito pessimismo na análise. Vamos utilizar esta estratégia em um jogo de soma zero, onde é mais útil, por ser estritamente competitivo. A matriz a seguir contém apenas as recompensas do jogador das linhas. A solução pode ser encontrada escolhendo o maior entre os menores resultados das linhas (jogada do jogador das linhas) e o menor entre os maiores resultados das colunas (jogada do jogador das colunas). jogador B jogador A Q R M 4,5 5,9 N 3,6 2,3 P 2,4 1,10 Teoria dos Jogos | Fernando Mori 28 Exemplo 2: Resolva o jogo entre as empresas pela estratégia maxmin Dessa forma a empresa A escolherá a estratégia A2 enquanto que a empresa B escolherá a estratégia B2. Exemplo 3: O conceito de equilíbrio não descreve sempre o comportamento esperado dos jogadores racionais, mesmo em casos em que um ponto de equilíbrio existe e é único: Jogador 2 Jogador 1 Um equilíbrio de Nash neste jogo é (B,R) com prêmio (3,3). empresa B empresa A B1 B2 B3 B4 Min Linha A1 10 0 11 -1 -1 A2 8 7 8 10 7 A3 0 6 -7 7 -7 Max Coluna 10 7 11 10 L R T (2,1) (2,-20) M (3,0) (-10,1) B (-100,2) (3,3) Teoria dos Jogos | Fernando Mori 29 Este é um resultado provável, mas podemos imaginar o jogador hesitando para escolher B, se o jogador 2 escolher L? Se o resultado (B,L) for catastrófico para o jogador I ele pode escolher a estratégia T, garantindo um prêmio de somente 2 (comparando com o prêmio de equilíbrio de 3), mas também evitando que ele possa ter -100 ao invés. Se o jogador II estiver consciente desta hesitação, e acreditar que existe chance do jogador I escolher T para se proteger, ele também irá hesitar em escolher R ( e se arriscando a um prêmio de -20) e irá escolher L ao invés disso. Isto aumenta a chance do jogador I escolher T. O jogo com a estratégia maxmin e valores de segurança fica: Temos assim que o (2,0) é o pior caso possível. O valor maxmin do jogador I é 2 e a estratégia que garante este valor é L. Se os 2 jogadores escolherem suas estratégias maxmin, o resultado é (T,L) com prêmio (2,1) no qual o prêmio do jogador II é 1 que é maior do que seu valor maxmin. Um jogador pode ter várias estratégias maxmin. L R Min1 T (2,1) (2,-20) 2 M (3,0) (-10,1) -10 B (-100,2) (3,3) -100 Min2 0 -20 (2,0) Teoria dos Jogos | Fernando Mori 30 Exemplo 4: Considere o jogo Jogador 2 Jogador 1 L R Min1 T (3,1) (0,4) 0 B (2,3) (1,1) 1 Min2 1 1 (1,1) Teoria dos Jogos | Fernando Mori 31 Exemplo 5: Duas empresas A e B, fabricantes de computadores estão planejando comercializar sistemas de rede para processamento de informações administrativas. Cada empresa pode desenvolver tanto um sistema rápido e de alta qualidade (A) como um sistema mais lento e de baixaqualidade (B). Determine, de posse dos lucros resultantes de cada uma das estratégias, são aqueles que se encontram na seguinte matriz de prêmios: Firma B A B Firma A A 30 ;30 50 ;35 B 40 ; 60 20 ;20 a) Se ambas firmas tomarem decisões simultaneamente e usarem estratégias de maximin qual será o resultado? b) Suponha que as duas empresas estejam procurando maximizar os lucros, mas que a empresa A tenha iniciado antes o planejamento e tenha condições de se comprometer em primeiro lugar. Qual será a solução mais provável? Qual seria o resultado se a empresa B tivesse iniciado seu planejamento primeiro do que a empresa A. c) Considere agora o jogo em duas etapas, no qual, em primeiro lugar, cada uma das empresas terá que decidir qual valor que estará disposta a investir para acelerar seu planejamento e, em segundo, cada uma terá que anunciar qual produto (A ou B) produzirá. Qual das empresas investiria mais para acelerar seu planejamento? Quanto ela deveria investir? Será que a outra deve fazer algum investimento para acelerar seu planejamento? Explique. Teoria dos Jogos | Fernando Mori 32 Método da eliminação iterativa de estratégias estritamente dominadas Uma estratégia é dita estritamente dominada quando não possui nenhuma recompensa maior que as correspondentes de outra estratégia. O jogador sendo racional não escolherá uma estratégia dominada e portanto na análise do jogo podemos elimina-la. Este tipo de análise possibilita a resolução de um certo número de jogos. jogador B jogador A estratégia 3 estratégia 4 estratégia 1 2,3 3,1 estratégia 2 1,5 2,1 Equilíbrio de Nash É uma situação em que nenhum jogador poderia melhorar sua posição escolhendo uma estratégia alternativa disponível, sem que isso implique que a melhor escolha feita particularmente por cada pessoa levará a um resultado ótimo. Estando numa posição de equilíbrio de Nash nenhum jogador tem incentivo para mudar de estratégia, de forma que a situação é estável jogador B jogador A esquerda direita alto 2,3 0,1 baixo 1,2 3,0 A opção alto/esquerda corresponde a um equilíbrio de Nash pois o jogador A não tem incentivo a mudar de estratégia ( o que corresponde a trocar 2 por 1 ) e nem o jogador B ( o que corresponde a trocar 3 por 1). Teoria dos Jogos | Fernando Mori 33 Observe que este jogo não poderia ser resolvido por eliminação de estratégias dominadas Jogos de Soma Zero O equilíbrio de Nash e o max min são dois conceitos diferentes que refletem diferentes aspectos do comportamento: o primeiro é uma expressão de estabilidade e o segundo é uma noção de segurança. Apesar das raízes diferentes dos 2 conceitos existem casos em que ambos levam aos mesmos resultados. Um caso especial é no caso de jogos de 2 jogadores de soma zero. Exemplo: Jogador 2 Jogador 1 L C R Min1 T (3,-3) (-5,5) (-2,2) -5 M (1,-1) (4,-4) (1,-1) 1 B (6,-6) (-3,3) (-5,5) -5 Min2 -6 -4 -1 (1,-1) Teoria dos Jogos | Fernando Mori 34 Exemplo 6: Duas empresas AF1 e AF2 competem pelas vendas de duas linhas de produtos igualmente lucrativas. Em ambos os casos o volume o volume de vendas de AF2 é o triplo do volume de AF1. Devido a melhorias tecnológicas, os dois fabricantes podem realizar melhorias substanciais as duas linhas de produtos, mas eles não estão certos de qual desenvolvimento e estratégia de comercialização eles deverão adotar. Se as melhorias aos dois produtos forem feitas ao mesmo tempo, nenhum fabricante terá o produto pronto para a venda em menos de 12 meses. Uma alternativa é executar um programa intensivo para primeiro desenvolver um dos produtos e tentar comercializá-lo antes que o competidor o faça. Se este for o caso, AF2 pode ter o produto pronto para a venda em 9 meses, enquanto AF1 precisa de 10 meses (devido a contratos anteriores). Cada um deles pode ter o segundo produto pronto após outro período de 9 meses. Para cada linha de produto, se ambos os fabricantes comercializam o modelo melhorado, estima-se que AF1 aumenta sua porcentagem de vendas futuras deste produto em 8% do total (de 25% para 33%). Da mesma forma AF1 pode aumentar sua venda total em 20, 30 e 40% do total se comercializar o produto 2,6 e 8 meses antes de AF2 o fazer. Além disso AF1 pode perder 4, 10,12 e 14% do total se AF2 conseguir comercializar o produto 1,3,7 e 10 meses antes, respectivamente. Formule este problema como um jogo de soma zero com 2 jogadores e estabeleça a estratégia que as empresas devem adotar de acordo com o critério MinMax. AF2 AF1 Melhoria Simultânea Prod1-12meses Prod2- 12 meses Programa Intensivo Prod1- 9 meses Prod2-18 meses Programa Intensivo Prod1- 18 meses Prod2-9 meses Melhoria Simultânea Prod1-12meses Prod2- 12 meses Programa Intensivo Prod1- 10 meses Prod2-19 meses Programa intensivo Prod1-19 meses Prod2- 10 meses Teoria dos Jogos | Fernando Mori 35 Exemplo 7: Duas empresas comercializam produtos dividindo o mercado. Cada empresa atualmente detém 50% do mercado. Como recentemente os produtos passaram por modificações, ambas empresas pretendem lançar uma campanha de propaganda. Se nenhuma delas anunciar, a parcela de mercado entre elas permanece a mesma. Se uma lançar uma campanha mais poderosa que a outra, esta última perde uma porcentagem de seus clientes. Pesquisas de mercado indicam que é possível alcançar 50% dos potenciais consumidores pela TV, 30% por revistas e 20% pelo rádio. a)Construa a matriz de prêmios deste jogo e analise a estratégia Maxmin. b)Obtenha o valor do jogo se cada empresa operar com estratégia pura. Teoria dos Jogos | Fernando Mori 36 Exercícios Resolvidos Resolva os jogos a seguir: 1 – jogador B jogador A par ímpar par 2,3 0,1 ímpar 1,2 3,0 Usando a estratégia maxmin e supondo que A escolha primeiro, A escolherá impar e B escolherá par. Se B escolher primeiro, então ele escolhe par e A escolhe impar. 2 – jogador B jogador A esquerda centro direita alto 2,1 1,3 2,3 médio superior 4,1 3,2 3,2 médio inferior 5,0 4,1 1,4 baixo 2,2 3,4 2,3 Teoria dos Jogos | Fernando Mori 37 3 – Jog B jogador A B1 B2 B3 B4 A1 3,3 2,2 4,3 3,4 A2 2,0 1,3 0,2 2,0 A3 3,4 4,2 2,2 0,3 A4 4,3 2,1 3,1 4,2 4 – Duas lojas concorrentes, loja A e loja B estão analisando estratégias de preços, e tem a seguinte matriz de prêmios. Decida qual estratégia deve ser adotado pelos lojistas usando o critério maxmin, o critério cooperativo e verifique se existe equilíbrio de Nash. B A descontar 20% manter o preço aumentar 10% aumentar 20% descontar 10% 3,0 1,1 5,4 0,2 manter o preço 1,1 3,2 6,0 2,0 aumentar 10% 0,2 4,4 7,2 3,0 Teoria dos Jogos | Fernando Mori 38 5 – D C investe em propaganda reduz os preços não reage tenta acordo reduz os preços 3,2 3,2 0,3 0,4 tenta acordo 2,0 0,1 3,0 1,1 6 – bonito limpo aumentar gastos com publicidade não aumentar gasto com publicidade lançar o produto biodegradável 5,5 7,3 não lançar o produto biodegradável 2,4 2,7 7 – Teoria dos Jogos | Fernando Mori39 carro novo novo auto lançar nova versão manter o preço reduzir o preço lançar modelo próprio 1,4 4,1 1,3 importar da matriz 2,2 2,1 2,3 não competir 1,1 0,6 1,0 8 – comboio japonês forças aliadas rota sul rota norte busca na rota sul 3, – 3 1, – 1 busca na rota norte 2, – 2 2, – 2 Teoria dos Jogos | Fernando Mori 40 9 – Duas empresas operam no mercado de chocolate, podendo optar entre produzir um chocolate de alta qualidade (A) ou um de baixa qualidade (B). Os lucros resultantes de cada estratégia encontram-se apresentados na matriz de prêmios: Empresa 2 Empresa 1 a) Quais resultados (se houver) são equilíbrios de Nash? b) Se os administradores de ambas as empresas forem pessoas conservadoras e empregarem a estratégia maxmin, qual será o resultado? c) Qual é o resultado cooperativo? d) Qual das duas empresas seria mais beneficiada em decorrência de um resultado cooperativo? Quanto esta empresa estaria disposta a oferecer a outra para persuadi-la e entrar em conluio. Resposta: 10 – Duas importantes emissoras estão concorrendo entre si para obter índices de audiência no horário entre 20 e 21 horas e entre 21 e 22 horas em uma determinada noite da semana. Cada uma delas, preparando-se para a disputa, conta com dois programas para preencher este horário. Eles poderão veicular seu programa principal no primeiro horário (20-21h) ou no segundo horário (21-22h). As possíveis combinações de decisões levam aos seguintes resultados em termos de pontos de audiência: Emissora 2 Emissora 1 baixa alta baixa -20,-30 900,600 alta 100,800 50,50 Primeiro horário Segundo horário Primeiro horário 18,18 23,20 Segundo horário 4,23 16,16 Teoria dos Jogos | Fernando Mori 41 a) Encontre o equilíbrio de Nash supondo que ambas emissoras tomem suas decisões simultaneamente. b) Se as duas empresas forem avessas ao risco e decidirem empregar uma estratégia maxmin, qual será o equilíbrio resultante? c) Qual será o resultado se a emissora 1 fizer sua escolha antes da sua concorrente? E se a emissora 2 fizer sua escolha antes? d) Suponha que os administradores das duas empresas se reúnam para coordenar suas programações e a emissora 1 prometa apresentar seu programa principal no primeiro horário. Essa promessa é crível? Qual é o resultado mais provável? Teoria dos Jogos | Fernando Mori 42 JOGOS COM MAIS DE UM EQUILÍBRIO DE NASH Considere que duas empresas de tecnologia são concorrentes no mercado de programas para computador. A empresa Alfa possui um programa anti-vírus e a empresa Beta não possui. A empresa Beta está decidindo se desenvolve ou não um anti-vírus e a empresa Alfa está decidindo se investe em outra versão ou não. Consideremos que a matriz de recompensas seja a seguinte: JOGO DO PADRÃO TECNOLÓGICO Beta Alfa desenvolve não desenvolve investe 2, 1 – 1,– 2 não investe 0,– 1 1, 2 Existem dois equilíbrios de Nash: investe/desenvolve e não investe/não desenvolve. Nesse caso qual das duas situações irá se concretizar? A resposta não pode ser encontrada apenas com estes dados, vai depender da situação real em as empresas se encontram. Acomodar pode ser uma boa opção pois não há custos, mas esta opção incentiva possíveis concorrentes a entrarem no mercado, pois dá a impressão de que as empresas ou não possuem condições de investir ou que seus administradores são acomodados, sem visão. Quando a concorrência é muito acirrada, como tem sido atualmente, o mais provável é que ambas empresas invistam, ou seja, a solução ficaria sendo investe/desenvolve. Esta situação faz com que as empresas acabem investindo mais do que o necessário em alguns setores, como por exemplo em ativos específicos (máquinas, equipamentos de produção mas que não são facilmente utilizáveis em outros empreendimentos e por isso possuem valor de revenda baixo). Vamos ver outro jogo com dois equilíbrios de Nash. Imagine duas empresas, que dominam o mercado, decidindo se adotam campanhas publicitárias agressivas. Teoria dos Jogos | Fernando Mori 43 JOGO DA CAMPANHA PUBLICITÁRIA Ambev Schin adota campanha agressiva não adota campanha agressiva adota campanha agressiva – 5, – 5 2, – 2 não adota campanha agressiva – 2, 2 0, 0 Há dois equilíbrios de Nash: “adota/não adota” e “não adota/adota”. Ou seja, a melhor resposta diante do concorrente que investe em campanha agressiva é não responder e a melhor resposta diante do concorrente que não investe em campanha agressiva é investir. O problema é saber qual das empresas irá ceder a iniciativa da campanha agressiva para a outra e dada o risco de se perder espaço no mercado, inclusive pela entrada de outras concorrentes, corre-se o risco de que as duas empresas decidam adotar campanhas agressivas maximizando seus prejuízos. Nestes dois exemplos não se pode exigir que o equilíbrio de Nash corresponda realmente à solução da situação. Teoria dos Jogos | Fernando Mori 44 Estratégias Mistas 1) Considere o jogo de 2 jogadores conforme a matriz de prêmios dada a seguir: Jogador II Jogador I O nível de segurança do jogador I é 2, se ele jogar B ele garante um prêmio de pelo menos 2. A segurança do jogador II é 3, se ele jogar R ele garante um prêmio de no máximo 3. Não existem estratégias ótimas. Pode um jogador garantir um prêmio melhor? Supor que o jogador I jogue uma moeda de parâmetro ¼ (cara ¼ e coroa ¾ ). Supor que I joga T se o resultado for cara e B se o resultado for coroa. Esta é uma estratégia mista. Os prêmios agora deixam de ser determinísticos e passam a ser probabilísticos. Se esses prêmios forem utilidades de um jogador, então a função utilidade do jogador I a partir desta loteria é 1 3 5 (4) (2) 4 4 2 + = . Se o jogador II joga R o resultado da loteria é 1 3 (1), (3) 4 4 .Neste caso o prêmio será: 1 3 5 (1) (3) 4 4 2 + = . Se II joga L então 1 3 (4), (2) 4 4 Se II joga R então 1 3 (1), (2) 4 4 O prêmio (=utilidade) do jogador de uma loteria é o valor esperado do prêmio para aquela loteria. Com esta definição do prêmio, o jogador I pode garantir não importa o que aconteça seu prêmio esperado será pelo menos 5/2, ao invés de um prêmio de 2 se ele não basear sua estratégia no sorteio da moeda. L R min T 4 1 1 B 2 3 2 max 4 3 Teoria dos Jogos | Fernando Mori 45 2) Considere o jogo de par ou ímpar: Dois jogadores (linha e coluna) escolhem simultaneamente dois números de dedos (1 ou 2). Se a soma dos dedos dos jogadores é ímpar então o jogador linha ganha 1 de coluna. Se a soma dos dedos for par então o jogador da coluna ganha 1 de linha. Jogador colunas Jogador linhas 1 dedo 2 dedos 1 dedo 1 1 2 dedos 1 1 − + + − Se tivermos a probabilidade de um jogador escolher uma estratégia? 3) Considere o jogo a seguir e encontre o equilíbrio em estratégias mistas. Jogador II Jogador I 4) Uma moeda é jogada e o resultado é mostrado apenas ao jogador I. Ele deveentão decidir se aposta ou passa. Se ele decidir passar então ele paga $1,00 ao jogador II e o jogo termina. Se ele decidir apostar então o jogador II (que não conhece o resultado da moeda) pode passar ou pagar a aposta. Se o jogador II decidir passar então ele paga $1,00 ao jogador I e o jogo termina. Se ele decidir pagar a aposta então o jogador I deve mostrar o resultado do sorteio. Se o resultado for cara então o jogador II paga ao jogador I a quantia de $2,00, se o resultado for coroa então o jogador I paga ao jogador II a quantia de $2,00. L M R T 2 5 -1 B 1 -2 5 Teoria dos Jogos | Fernando Mori 46 As estratégias do jogador I são: Cara Coroa P P Passa em cara, passa em coroa A P Aposta em cara, passa em coroa P A Passa em cara, aposta em coroa A A Aposta em cara, aposta em coroa Podemos resumir as estratégias mistas da seguinte forma: As principais características de um jogo são: 1) Dois ou mais tomadores de decisão estão envolvidos. 2) As consequências (resultados) dependem das ações tomadas por todos os tomadores de decisão. 3) Os objetivos não coincidem. Existe uma característica importante em um jogo: todos os jogadores devem tomar uma decisão sem saber o que os outros estão decidindo. Toda vez que um movimento é realizado o resultado é que o jogador perde ou ganha. O jogo pode ser repetido ao gerarmos movimentos sucessivos. Um jogo tem características similares a um problema de decisão, mas a natureza e seus estados aleatórios são transformados em um outro jogador que toma decisões sempre pensando no que o oponente está decidindo. Um jogo de dois componentes pode ser representado na forma tabular 2 x 2. No caso de n jogadores seria uma matriz n x n. Jogador B Jogador A ( ) ( ) ( ) ( ) 1 2 1 11, 11 12 12 2 21 21 22 22 , , , b b a a b a b a a b a b O jogador A pode escolher entre as alternativas 1a e 2a enquanto o jogador B pode escolher entre 1b e 2b . Dependendo da escolha feita o resultado será uma das células da matriz. Se o jogador A escolhe a estratégia ia e o jogador B decide a estratégia jb o resultado será o pagamento ija para o jogador A e o pagamento ijb para o jogador B. Teoria dos Jogos | Fernando Mori 47 Se o jogo for de soma zero (um jogador ganha e o outro perde) é representado por: Jogador B Jogador A ( ) ( ) ( ) ( ) 1 2 1 11, 11 12 12 2 21 21 22 22 , , , b b a a a a a a a a a a − − − − Neste caso a tabela é simplificada supondo que os valores contidos nas células implicam em ganho para o jogador das linhas (jogador A) e perdas para o jogador das colunas (jogador B). Jogador B Jogador A 1 2 1 11 12 2 21 22 b b a a a a a a Se o jogo tem um ponto de equilíbrio ele pode ser resolvido pelo método minmax: cada jogador escolhe uma alternativa que fornece a melhor alternativa entre os possíveis resultados: Jogador B Jogador A 1 2 1 11 12 11 12 2 21 22 21 22 11 21 12 22 max , max , max , max , b b a a a a a a a a a a a a a a O jogador A escolhe 11 12 21 22max min , ;min ,a a a a . O jogador B escolhe 11 21 12 22min max , ;max ,a a a a . Se os dois jogadores escolhem o mesmo valor e vem da mesma célula, então temos um jogo de estratégia pura de soma zero, ou seja, existe um ponto de equilíbrio em que nenhum jogador tem interesse em deixar. Portanto o jogador mante sua decisão mesmo quando conhece qual decisão o oponente irá tomar. Se vários movimentos são feitos e os jogadores não modificam suas decisões então o valor do jogo (o pagamento médio por movimento) permanece constante e igual ao valor da célula selecionada. Teoria dos Jogos | Fernando Mori 48 Se o valor escolhido for diferente o jogo não tem ponto de equilíbrio porque o jogador tem interesse em mudar sus decisão ao tomar conhecimento da decisão de seu oponente. Neste caso eles devem adotar a estratégia mista definida como um conjunto de probabilidades de escolha para cada alternativa. Este conjunto pode ser resolvido algebricamente se a matriz for 2 x 2. No caso 3 x 3 já temos um modelo de programação linear. Considerando o caso 2 x 2: Jogador B Jogador A 1 2 1 11 12 2 21 22 1 1 b b a a a p a a a p q q − − Onde p é a probabilidade com a qual o jogador A deve escolher a alternativa 1a e q é a probabilidade do jogador B escolher a alternativa 1b . Se ambos os jogadores selecionam essas alternativas com essas probabilidades em momentos sucessivos, o valor do jogo (pagamento médio por movimento) é a soma dos valores de cada célula multiplicada pela probabilidade. ( ) ( ) ( )( )11 21 12 22. . 1 . . . 1 1 1V a p q a p q a p q a p q= + − + − + − − Para determinar sua estratégia o jogador A considera que a probabilidade p é tal que ela lhe assegura que o jogador obtenha um valor do jogo que não mude não importa o que seu oponente faça. Para resolver isso uma equação é obtida que iguala o valor do jogo não importando a escolha do oponente. Assim se o jogador B escolhe 1b o valor do jogo para o jogador A será ( )11 21. 1V a p a p= + − , se o jogador B escolher 2b o valor do jogo para o jogador A será ( )12 22. . 1V a p a p= + − . Queremos que haja estabilidade, ou seja não importando a escolha de B deveremos ter para o jogador A o mesmo prêmio: ( )11 21 12 221 (1 )V a p a p a p a p= + − = + − Resolvendo essa equação podemos encontrar o valor de p. O jogador B considera o mesmo para as escolhas de A que podem ser 1 2,a a : ( ) ( )11 12 21 221 1V a q a q a q a q= + − = + − Resolvendo essa equação encontramos o valor de q. Teoria dos Jogos | Fernando Mori 49 Se a dimensão do jogo for maior que 2 x 2 o problema se transforma em um problema de programação linear. Considerando um jogo 3 x 3: Jogador B Jogador A 1 2 3 1 11 12 13 1 2 21 22 23 2 3 31 32 33 3 1 2 3 b b b a a a a p a a a a p a a a a p q q q O jogador A pode construir um modelo de PL aplicando os mesmos conceitos que no caso 2 x 2, ou seja o jogador A deseja jogar com um conjunto de probabilidades de forma que o valor do jogo seja mentido, não importando o conjunto de probabilidades do jogador B. Os seguintes passos devem ser seguidos: 1) Eliminar valores negativos na matriz somando um valor K em todas as células. 2) Escreva as desigualdades e alternativas para o jogador A não importando a escolha do jogador B. 11 1 21 2 31 3 12 1 22 2 32 3 13 1 23 2 33 3 a p a p a p V a p a p a p V a p a p a p V + + + + + + 3) Dividir as desigualdades por V: 31 2 11 21 31 31 2 12 22 32 31 2 13 23 33 pp p V a a a V V V V pp p V a a a V V V V pp p V a a a V V V V + + + + + + 4) Mude a variável: i i p x V = Teoria dos Jogos | Fernando Mori 50 11 1 21 2 31 3 12 1 22 2 32 3 13 1 23 2 33 3 1 1 1 a x a x a x a x a x a x a x a x a x + + + + + + 5) Construímos a função objetivo usando a condição de soma de probabilidades: 1 2 3 1 2 3 1 1 p p p x x x V + + = + + = Como o jogador A quer maximizar seu prêmio, ele deve então minimizaro inverso: 1 2 3 1 min z V z x x x = = + + 6) Formule o problema de PL: 1 2 3 11 1 21 2 31 3 12 1 22 2 32 3 13 1 23 2 33 3 1 2 3 min 1 1 1 0, 0, 0 z x x x a x a x a x a x a x a x a x a x a x x x x = + + + + + + + + 7) Resolva o problema de PL encontrando os valores de 1 2 3, ,x x x . 8) Obtenha as probabilidades 1 2 3, ,p p p . 1 2 3 i i x p x x x = + + 9) Obtenha o valor do jogo (subtraído o valor somado nas células): 1 2 3 1 V K x x x = − + + O jogador B realiza calculo idêntico para 1 2 3, ,q q q e neste caso ele deve minimizar o valor do jogo. Exemplos: Teoria dos Jogos | Fernando Mori 51 1) Dois jogadores escolhem independentemente um número 1, 2 ou 3. Se os números forem os mesmos o jogador 1 paga ao jogador 2 esta quantia. Se não for o mesmo número então o jogador 2 paga ao jogador 1 uma quantia igual a que o jogador 1 escolhe. Determine o valor do jogo e as estratégias ótimas que ambos jogadores devem seguir. Matriz de prêmios Jogador 2 Jogador 1 1 2 3 1 1 1 1 2 2 2 2 3 3 3 3 − − − Não existe dominância neste jogo, sendo, portanto, um jogo de estratégia mista. 1 2 3 0,0641 0,1026 0,1154 y y y = = = Como temos 1 2 3 1 0,2821 3,5448 0,5448 y y y u u V u K + + = = → = = − = As probabilidades para o jogador 2 será: 1 1 2 2 3 3 . (0,0641).(3,5448) 0,23 . (0,1026).(3,5448) 0,36 . (0,1154).(3,5448) 0,41 p y u p y u p y u = = = = = = = = = A estratégia ótima para o jogador 2 será as seguintes probabilidades: 0,23(1);0,36(2);0,41(3) Prêmio esperado por jogada (perda): 0,5448V = . 2) Duas pessoas estão nos lados opostos de uma construção. Ambas estão interessadas em se encontrar de forma que elas caminham em direção a um dos cantos. Teoria dos Jogos | Fernando Mori 52 A B Os jogadores têm 3 possibilidades: mover para a direita (R), mover para a esquerda (L) ou permanecer no mesmo lugar. Consideremos que os jogadores se encontram se os seus movimentos os levam ao mesmo canto ou em cantos contíguos. Qual a melhor estratégia de forma a maximizar as probabilidades de se encontrarem? Jogador B Jogador A 1 2 3 1 2 3 0 1 1 1 0 1 1 1 0 R L O R p L p O p q q q 3) As equipes UA e DU estão estabelecendo suas estratégias para o campeonato nacional de basquete. Avaliando as forças de seus bancos de reservas cada um dos treinadores estabelece quatro estratégias para a troca dos jogadores durante o jogo. A capacidade da equipe em converter lances de 2 pontos, 3 pontos e lances livres é um fator determinante para o placar final do jogo. A matriz seguinte fornece o número liquido de pontos que a equipe UA marcará por posse de bola como função de diferentes estratégias disponíveis para cada equipe. Resolva o jogo e determine a estratégia para o campeonato. 1 2 3 4 1 3 2 1 2 2 2 3 3 0 3 1 2 2 2 4 1 2 4 1 DU DU DU DU UA UA UA UA − − − − − − Vamos usar K = 3 para eliminar os negativos. Teoria dos Jogos | Fernando Mori 53 1 2 3 4 1 2 3 4 1 6 1 4 5 2 5 6 0 3 3 2 5 1 5 4 2 1 7 4 DU DU DU DU UA p UA p UA p UA p Teoria dos Jogos | Fernando Mori 54 Exemplo: Jogo de Votação da Diretoria ESTRATÉGIAS Eliminação Iterativa de Estratégias Estritamente Dominadas CLASSIFICAÇÃO DOS JOGOS MÉTODOS DE SOLUÇÕES DE JOGOS 1 – Estratégia dominante 2 – Minimax e Maximin Método da eliminação iterativa de estratégias estritamente dominadas Equilíbrio de Nash Jogos de Soma Zero Exercícios Resolvidos JOGOS COM MAIS DE UM EQUILÍBRIO DE NASH JOGO DO PADRÃO TECNOLÓGICO JOGO DA CAMPANHA PUBLICITÁRIA
Compartilhar