Buscar

Resumo Teoria dos Jogos

Prévia do material em texto

Teoria dos Jogos
❖ Introdução:
A teoria dos Jogos pode ser definida como a teoria de modelos matemáticos que
estuda as decisões sob condições de conflito, ou seja, para explicar os mecanismos de
tomadas de decisões , observada quando dois ou mais “agentes de decisão” interagem
entre si, caracterizadas, assim como nos jogos, por conflitos de interesse.
Ela também se aplica em situações de conflitos da vida real onde estratégias
ações e regras, e é como se os mais diversos pontos de vista matemáticos pudessem ser
traduzidos por números a fim de prever com certo grau de precisão qual estratégia
seria tomada em ações comuns do dia a dia. A teoria dos jogos é muito usado em
relações internacionais e na economia para prever movimentos da oposição e estratégias
para ganhar uma negociação, assim como na economia para prever a melhor estratégia
para benefício próprio, no entanto John Nash acreditava que o melhor resultado viria
quando ambos os lados conseguem fazer o melhor para eles e para o grupo, ao contrário
do que jogos de soma zero representam, que um dos lados irá sempre perder para o
outro ganhar.
❖ História:
As primeiras evidências da teoria dos jogos datam de 1713, em correspondências
de James Waldegrave, diplomata britânico, porém, sem se aprofundar em uma
abordagem mais teórica.
O primeiro estudo formal que se tem registro é do ano de 1838, por Antoine
Augustin Cournot, um trabalho que visava entender as relações de duopólio no mercado.
Anos mais tarde, em 1913, surge o primeiro teorema matemático envolvendo o
tema, no trabalho, realizado por Ernst Zermelo, o xadrez é definido como um jogo
estritamente dominado, ou seja, em cada etapa pelo menos um dos dois jogadores tem
uma estratégia que ou levará o jogo para a vitória ou para um empate. Emile Borel foi
outro matemático que se dedicou ao estudo da teoria dos jogos, produzindo quatro
artigos sobre jogos estratégicos.
Mesmo com a dedicação de todos esses profissionais, a teoria dos jogos só
começou a ganhar notoriedade a partir dos trabalhos de de John Von Neumann, que
publicou uma série de artigos e provou, utilizando topologia e análise, a existência de
solução em estratégias mistas para jogos finitos de soma zero com dois jogadores.
Em 1944, John Von Neumann publicou, junto ao economista Oskar Morgenstern, a
obra "The theory of games and economic behavior", livro fundamental no
desenvolvimento do estudo da matemática aplicada e na teoria das decisões econômicas,
além de desenvolver a teoria do minimax para jogos de soma zero.
John Forbes Nash Jr., deu continuidade ao estudo da teoria dos jogos e publicou
uma série de estudos ao longo do ano de 1950, contribuindo de maneira definitiva com a
teoria. Dentre esses estudos, os de maior relevância foram "equilibrium points in
n-person games" e "non-cooperative games" onde comprovou a existência de equilíbrio
em jogos não cooperativos de estratégia mista.
Em 1994, John Nash recebeu o prêmio Nobel de economia por suas contribuições
à teoria dos jogos.
❖ Teoria Matemática:
Aprofundando no conceito de um jogo, considerando que o jogo é um conjunto de
jogadores, e cada jogador tem um conjunto de estratégias, cada um deles irá escolher
sua estratégia e com isso temos uma “situação” no espaço de todas as “situações”, sendo
que cada um tem preferência para uma situação no jogo. Matematicamente falando, um
jogo tem um conjunto finito de jogadores, representado por , e𝐺 = {𝑔
1
, 𝑔
2
, . . . , 𝑔
𝑛
}
cada jogador possui um conjunto finito de estratégias puras denominado 𝑔
𝑖
 ∊ 𝐺
. O vencedor pertence a , onde é a𝑆
𝑖
= {𝑠
𝑖1
, 𝑠
𝑖2
, . . . , 𝑠
𝑖𝑚
𝑖
} 𝑠 = (𝑠
1𝑗
1
, 𝑠
2𝑗
2
, . . . , 𝑠
𝑛𝑗
𝑛
) 𝑠
𝑖𝑗
𝑖
estratégia pura do jogador , denominado isto de perfil de estratégia pura. O conjunto𝑔
𝑖
de todos os perfis de estratégia pura formam o produto cartesiano denominado espaço
de estratégia pura do jogo. Para o jogador , existe uma função utilidade que associa o𝑔
𝑖
ganho (payoff) (s) do jogador para cada perfil de estratégia pura .𝑢
𝑖
𝑠 ∊ 𝑆
𝑢
𝑖
: 𝑆 → 𝑖 = 𝐼𝑅
𝑠 → 𝑢
𝑖
(𝑠)
Um bom exemplo é o Teorema dos Prisioneiros, formulado por Albert W. Tucker
em 1950. A situação é a seguinte, dois suspeitos, A e B, são presos pela polícia; a polícia
não tem provas suficientes para os condenar, então separa os prisioneiros em salas
diferentes e oferece o mesmo acordo: se um confessar e o outro ficar calado, o que
confessou sai livre e o cúmplice leva dez anos; se ambos ficarem em silêncio
(colaborarem), a polícia só pode condená-los a 1 ano cada; se ambos confessarem cada
um leva 5 anos.
Fazendo suposições racionais em ambas hipóteses, sendo o prisioneiro A:
suponha que o prisioneiro B escolha colaborar, se você escolher colaborar leva 1 ano de
prisão e se escolher trair sai livre, nesse caso a opção benéfica é trair; suponha que o
prisioneiro B escolha trair, se você escolher colaborar leva 10 anos de prisão, se
escolher trair leva cinco anos, então nesse caso a melhor opção seria trair. Nesse
contexto temos:
𝐺 = {𝐴, 𝐵} 𝑆
𝐴
= {𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝑛𝑒𝑔𝑎𝑟} 𝑆
𝐵
= {𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝑛𝑒𝑔𝑎𝑟}
𝑆 = {(𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟), (𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝑛𝑒𝑔𝑎𝑟), (𝑛𝑒𝑔𝑎𝑟, 𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟), (𝑛𝑒𝑔𝑎𝑟, 𝑛𝑒𝑔𝑎𝑟)}
As duas funções utilidade ( e ) são:𝑢
𝐴
: 𝑆 → 𝐼𝑅 𝑢
𝐵
: 𝑆 → 𝐼𝑅
,𝑢
𝐴
(𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟) =− 5 𝑢
𝐴
(𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝑛𝑒𝑔𝑎𝑟) = 0
,𝑢
𝐴
(𝑛𝑒𝑔𝑎𝑟, 𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟) =− 10 𝑢
𝐴
(𝑛𝑒𝑔𝑎𝑟, 𝑛𝑒𝑔𝑎𝑟) =− 1
(representando os payoffs de A), e
,𝑢
𝐵
(𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟) =− 5 𝑢
𝐵
(𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟, 𝑛𝑒𝑔𝑎𝑟) =− 10
𝑢
𝐵
(𝑛𝑒𝑔𝑎𝑟, 𝑐𝑜𝑛𝑓𝑒𝑠𝑠𝑎𝑟) = 0 𝑢
𝐵
(𝑛𝑒𝑔𝑎𝑟, 𝑛𝑒𝑔𝑎𝑟) =− 1
(representando os payoffs de B), e com isso é possível obter uma matriz denominada
“matriz de payoffs”. Nessa matriz os números de cada célula representa,
respectivamente, os payoffs de A e B para as escolhas deles correspondentes a célula:
B
confessar negar
A
confessar (-5,-5) (0,-10)
negar (-10,0) (-1,-1)
Na primeira linha, se o prisioneiro B confessar, ou prisioneiro A confessa e leva 5
anos ou negar e ficar 10 anos presos, e assim vale para o B, com isso a matriz dominante
é confessar. Se o B nega, o prisioneiro A ou confessa e sai livre, ou nega e fica 1 ano
preso, com isso a matriz dominante também é confessa. A partir disso pode-se concluir
que a estratégia dominante, a partir da lógica racional, o melhor resultado racional,
seria confessa-confessa, entretanto se ambos negarem haveria um benefício maior
coletivo e individual.
Aplicar esse conceito a exemplos do cotidiano não são tarefas tão difíceis,
primeiro se separa os “jogadores”, e com isso se lista as opções de cada um deles para a
mesma situação. Com esses dados disponíveis, cria-se a matriz de payoffs, ou para
coisas mundanas, uma matriz de cenários, onde mostra todas as possibilidades concretas
em um formato de tabela ou matriz. As células dentro da matriz representam os
cenários a serem reproduzidos, enquanto para terminar a matriz basta somente
preencher os nomes dos jogadores e possíveis escolhas.
Outro exemplo mais simples é o
❖ Teorema do Minimax:
O teorema foi feito por John Von Neumann, e segundo ele sempre há uma solução
racional para um conflito entre dois indivíduos com interesses opostos, ou seja, uma
situação de ganho e perda em que só existe um único ponto de equilíbrio. Esse exemplo é
chamado de Soma Zero, pois os ganhos dos jogadores somados são iguais a zero. Ele
utiliza de estratégias puras para definição da estratégia que maximize seu ganho mínimo
ou que minimize o ganho máximo do adversário.
Um exemplo de jogo de soma zero é o pôquer, pois o ganho de um é a perda dos
outros. No mercado financeiro ele é visto nos mercados futuros, por meio do ajuste
diário, ou seja, cada variação de preço gera um débito na conta do lado perdedor, cujo
valor serádepositado na conta do lado ganhador de uma ou mais posições. Entretanto,
não se aplica ao mercado de ações, pois os agentes se posicionam de maneira que os
resultados não são simétricos, nesse caso a perda de vários agentes no curto prazo pode
não beneficiar o investidor com visão de longo prazo.
❖ Equilíbrio de Nash:
Nash conheceu a teoria dos jogos através de John Von Neumann e Oskar
Morgenstern, que só haviam conseguido resolver jogos não cooperativos no caso de
rivalidades puras, lucro zero. O equilíbrio de Nash propôs resolver um jogo de soma zero
com base em um questionamento: se os participantes teriam incentivos para cooperar ou
cada um sempre decidir por um caminho cujo resultado final pode ser pior. Na época sua
visão iria contra a de Adam Smith, um economista que dizia “havendo competição, o
espírito de empreendedor individual beneficiaria a coletividade de um modo geral”.
O teorema de Nash é aplicado em qualquer jogo não cooperativo, de soma zero ou
não, no qual cada jogador dispõe de um número finito de estratégias puras e tem, pelo
menos, um conjunto de estratégias de equilíbrio. Um conjunto de estratégias constitui o
equilíbrio de Nash perfeito se a escolha de cada jogador for tanto benéfica para si
próprio quanto para o conjunto dos outros jogadores, no entanto nem sempre há a
cooperação em todos os jogos e o equilíbrio em si se dá apenas na jogada mais benéfica
visando o máximo de benefícios para ambos. Sua teoria de equilíbrio revolucionou a
economia e outras ciências, levando-o a receber o prêmio Nobel.
Utilizando o exemplo do dilema do prisioneiro, a escolha racional foi confessar e
trair o outro prisioneiro, sendo esse considerado a matriz dominante, ou o equilíbrio de
Nash, onde é a melhor das probabilidades levadas em consideração. No entanto, a
melhor solução para todos, visando uma hipótese de colaboração dos dois lados, seria se
os dois negassem e pegassem somente 1 ano de prisão ao invés de 5.
❖ Aplicação no Cotidiano:
➢ Biologia:
Todos os seres humanos evoluem através da seleção natural, proposta por
Charles Darwin e aceita como melhor explicação científica. Um gene sozinho não
constitui um ser, ele necessita da cooperação dos outros genes além do meio externo,
como fonte de alimentação. Cada espécie tem um número de descendentes onde o mais
adaptado ao meio ambiente será o que tem o maior êxito reprodutivo, eliminando as
espécies desvantajosas.
Os jogos na biologia são interpretados como uma medida de adaptação não tão
voltada para o equilíbrio, mas sim para o que será mantido durante o processo de
evolução. Este equilíbrio é a chamada Estratégia evolucionária estável (EEE), criada por
John Maynard Smith, onde ele afirma que é uma estratégia que será estável em relação
à seleção natural, e em que toda EEE será um equilíbrio de Nash. Através de
computadores eles chegaram a conclusão de que estratégias mais comuns de confronto
na natureza são menos valorizadas só que estratégias que hipoteticamente falando
seriam melhores por serem mais agressivas.
Um exemplo através da matriz de recompensa é “Sexual competition and
courtship disruption: why do male bowerbirds destroy each other bowers?” onde há
somente duas estratégias correspondendo cada uma a um conjunto de genes. Nesse
problema o autor diz a respeito do comportamento de destruição dos ninhos dos
bowerbirds, sendo um dos comportamentos característicos é a destruição e roubo de
decoração dos ninhos feita pelos machos. Dessa forma existe a estratégia
caracterizada de “saqueadores” e a “guardiões”, assim os saqueadores avistam os ninhos
de cima e os destroem, tornando o dono do ninho inapto para o acasalamento, com isso o
“saqueador” tem mais chances de passar seu genes adiantes pela diminuição da
competição pelas fêmeas, mas com isso ele também tem o tempo perdido no saque onde
poderia estar acasalando e seu ninho fica exposto e o risco de estragá-lo. Na estratégia
“guardiões”, os indivíduos passam o tempo todo no ninho, já que sua presença inibe a
atividade furtiva dos outros, no entanto apesar de ter mais tempo para acasalamento
ele não diminui a competição pela fêmea. A matriz pode ser resumida na imagem a
seguir:
Imagem 4 do artigo “Equilíbrio de Nash e Estratégias Evolutivamente Estáveis: A Teoria
dos Jogos na Ecologia de populações”
A matriz se assemelha ao dilema dos prisioneiros, saquear é a estratégia
individual mais benéfica independente da escolha do outro, com isso {saquear,saquear} é
o equilíbrio de Nash, além de ser uma estratégia evolutivamente estável pois caso uma
estratégia mutante surja, ela seria eliminada pelo baixo valor adaptativo na população.
➢ Economia:
A relação da economia com a teoria dos jogos foi desenvolvida por John von
Neumann e Oskar Morgenstern, referência no meio acadêmico “Teoria dos Jogos e
Comportamento Econômico”. Ela constituiu um avanço nas ciências econômicas, pois
através dela é possível examinar o comportamento dos agentes econômicos com os
demais agentes, e não somente de forma isolada. Além disso, os economistas utilizam
dessa teoria para analisar fenômenos econômicos através do equilíbrio de jogo baseado
na racionalidade. Essa estratégia se provou favorável no processo de concorrência
econômica de mercado, ajudando na indicação da maximização do benefício, levando em
conta todas as jogadas dos concorrentes.
Existem alguns modelos econômicos que surgiram a partir dessa teoria, como o
modelo de duopólio de Cournot, que diz que dois produtos fabricados por empresas
diferentes são homogêneos do princípio que os consumidores não percebem a diferença
na qualidade mas sim no preço do produto. A partir do princípio que a quantidade de
demanda do produto é igual à quantidade ofertada do mesmo, surgem uma função linear
do produto do mercado, que através dela se define o equilíbrio de estratégias de
marketing entre as concorrentes, em que se define o quanto irá produzir para que a
demanda alcance a oferta visando lucro para as empresas.
Outro modelo é o duopólio de Bertrand, onde ao invés de decidir o quanto
produzir, as empresas devem escolher o quanto cobrar pelo produto, com isso elas
entram em uma competição de preços,e sendo o produto homogêneo, os consumidores
optaram pelo mais barato. Seu modelo é considerado imperfeito, pois cada um dos
monopólios domina metade do mercado, e no entanto não irá existir uma cooperação
entre elas, pois cada empresa tem motivos racionais para quebrar o acordo, e o único
equilíbrio de Nash nesse modelo é não entrar em acordo e cobrar o “custo marginal”, que
seria basicamente o valor da última unidade produzida. Uma das implicações é se uma
empresa tem custo médio baixo, então ela cobrará um preço mais alto do que seu
próprio custo médio, e esse preço será mais baixo que o curso médio da segunda
empresa, de maneira que a primeira empresa visa capturar toda a demanda do mercado
para si.
Por fim, temos o modelo de duopólio de Stackelberg, que diferente do modelo de
Cournot onde cada empresa não sabe o nível de produção da concorrente, uma das
empresas (empresa líder) escolhe primeiro a sua produção para depois a outra empresa
(empresa seguidora) fazer sua própria escolha de produção. Nesse modelo, a empresa 1
tem mais poder no mercado, e está ganhando bem mais porque a empresa 2 está
ganhando bem menos.
➢ Ciências Políticas:
A ciência política tem usado bastante a teoria dos jogos para paz democrática,
onde o debate público e aberto envia informações claras e confiáveis a respeito da sua
opinião a outros estados, e em contrapartida , existe a dificuldade de se conhecer
líderes não democráticos, afetando as negociações a serem feitas e promessas a serem
mantidas. Ela também é utilizada na formação de alianças entre partidos políticos, e ao
contrário da biologia que se baseia em jogos de soma zero, a luta de classes leva ao
aumento da cooperação e da empatia.
Utilizando eleições como exemplo, onde cada candidato promove seu discurso
comintuito de oferecer ao eleitor a oportunidade de ouvir suas propostas e ver elas
sendo debatidas, exigindo preparação dos candidatos e estratégias bem definidas e com
bastante estudos em suas propostas, a fim de convencer o eleitor que sua estratégia é a
melhor. Essas estratégias podem ser propostas para o futuro e exaltação de feitos
anteriores como o ataque pessoal e aos partidos opositores a fim de queimar sua
imagem.
Além de estratégias eleitorais, também se encontra em corridas armamentistas,
realizadas durante a guerra fria, onde duas potências que se enfrentavam assumiram
duas alternativas, ou assumiram o desarmamento ou aumentaram o armamento. Essa é
vista como jogo de soma zero visando a estratégia racional pelo interesse comum, no
entanto surgiu um fator de confiança mútua, onde se considerava a opção se era possível
racionalizar a confiança mútua. O último tratado entre os Estados Unidos e a Rússia
mostrou que a decisão de ambos países em superar o dilema dos prisioneiros e adotar
uma estratégia racional de cooperação.
❖ Bibliografia:
-http://www.cienciadaestrategia.com.br/teoriadosjogos/capitulo.asp?cap=m6
-https://bdm.unb.br/bitstream/10483/19815/1/2017_MateusMedeirosFurquimMendon
ca_tcc.pdf
-https://www.ime.usp.br/~rvicente/IntroTeoriaDosJogos.pdf
-http://www.sscnet.ucla.edu/polisci/faculty/chwe/austen/nash1950.pdf
-https://www.scielo.br/j/gp/a/yBff7VZtFyVt8j7hDTL4WTd/?lang=pt
-https://docs.ufpr.br/~volmir/Jogos_0.pdf
-http://www.slinestorsantos.seed.pr.gov.br/redeescola/escolas/11/2590/17/arquivos/Fi
le/as_origens_e_os_fundamentos_da_teoria_dos_jogos.pdf
-http://arquivo.sbmac.org.br/eventos/cnmac/xxxiii_cnmac/pdf/664.pdf
-https://raqueldeneige.medium.com/teoria-dos-jogos-aplicada-na-tomada-de-decis%C3
%B5es-do-dia-a-dia-782ca0301562
-https://maisretorno.com/portal/termos/j/jogo-de-soma-zero
-http://www.professores.im-uff.mat.br/hjbortol/arquivo/2017.1/tdj/bgs-teoria-dos-jo
gos.pdf
http://www.cienciadaestrategia.com.br/teoriadosjogos/capitulo.asp?cap=m6
https://bdm.unb.br/bitstream/10483/19815/1/2017_MateusMedeirosFurquimMendonca_tcc.pdf
https://bdm.unb.br/bitstream/10483/19815/1/2017_MateusMedeirosFurquimMendonca_tcc.pdf
https://www.ime.usp.br/~rvicente/IntroTeoriaDosJogos.pdf
http://www.sscnet.ucla.edu/polisci/faculty/chwe/austen/nash1950.pdf
https://www.scielo.br/j/gp/a/yBff7VZtFyVt8j7hDTL4WTd/?lang=pt
https://docs.ufpr.br/~volmir/Jogos_0.pdf
http://www.slinestorsantos.seed.pr.gov.br/redeescola/escolas/11/2590/17/arquivos/File/as_origens_e_os_fundamentos_da_teoria_dos_jogos.pdf
http://www.slinestorsantos.seed.pr.gov.br/redeescola/escolas/11/2590/17/arquivos/File/as_origens_e_os_fundamentos_da_teoria_dos_jogos.pdf
http://arquivo.sbmac.org.br/eventos/cnmac/xxxiii_cnmac/pdf/664.pdf
https://raqueldeneige.medium.com/teoria-dos-jogos-aplicada-na-tomada-de-decis%C3%B5es-do-dia-a-dia-782ca0301562
https://raqueldeneige.medium.com/teoria-dos-jogos-aplicada-na-tomada-de-decis%C3%B5es-do-dia-a-dia-782ca0301562
https://maisretorno.com/portal/termos/j/jogo-de-soma-zero
-https://repositorio.ufpe.br/bitstream/123456789/1796/1/arquivo5034_1.pdf

Continue navegando