Trabalho de Pesquisa Operacional - Parte 2

Amanda Araujo

07/10/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 24 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Pesquisa Operacional I

17.877 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

UNIVERSIDADE VEIGA DE ALMEIDA
CURSO DE ADMINISTRAÇÃO
PESQUISA OPERACIONAL
Trabalho Acadêmico apresentado ao
curso de Administração da UVA como
Avaliação A1 da disciplina Pesquisa
Operacional
Por:
Amanda Araujo
Matrícula 20172102892
Carla Jemima
Matrícula 20152101956
Érica Cid
Matrícula 20132102980
Gabriel Batista
Matrícula 20191106397
Hellen Regina
Matrícula 20181107594
Mateus Pereira Artemenko
Matrícula 20172100604
Otávio Ramos
Matrícula 20181106018
Rio de Janeiro
Setembro/2021
1
Lista de Figuras
INTRODUÇÃO 3
O QUE É TEORIA DOS JOGOS? 3
MODALIDADES DA TEORIA DOS JOGOS 4
TERMOS CHAVES 4
EXERCÍCIOS 4
CONCLUSÃO 5
REFERÊNCIAS 6
2
Sumário
INTRODUÇÃO 3
O QUE É TEORIA DOS JOGOS? 5
O dilema do prisioneiro 5
O conceito 5
MODALIDADES DA TEORIA DOS JOGOS 6
Escolhas simultâneas 6
Escolhas sequenciais 6
TERMOS CHAVES 6
Estratégia dominada 6
Estratégia dominante 6
Opção de equilíbrio 6
Opção ótima 6
EXERCÍCIOS 6
CONCLUSÃO 6
REFERÊNCIAS 6
3
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.gjdgxs
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.3dy6vkm
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.1t3h5sf
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.4d34og8
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.2s8eyo1
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.2s8eyo1
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.17dp8vu
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.26in1rg
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.35nkun2
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.1ksv4uv
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.2jxsxqh
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.z337ya
https://docs.google.com/document/d/1LaWB75nmWnxb9u3iWVSRT_PnNjAHlQYxjiMrbV6AEc0/edit#heading=h.z337ya
INTRODUÇÃO
Neste trabalho, entenderemos um pouco do que é o conceito da teoria dos jogos e
alguns exemplos para melhor fixação e entendimento do tema. Citaremos Chiang
1982, que fala a sua visão sobre o jogo e situação dos participantes.
Falaremos dos termos chaves que abrangem as estratégias dominadas e
dominantes, analisando as ações, vantagens e desvantagens dos jogadores em
determinadas situações, e qual melhor atitudes poderão tomar.
Por último, citamos alguns tipos de soluções utilizadas por jogadores, como as
estratégias disponíveis, escolhas de melhores opções dadas às respostas de todos
os outros jogadores e os exercícios para melhor aprendizado e entendimento do
assunto.
4
1. O QUE É TEORIA DOS JOGOS?
1.1 O dilema do prisioneiro
Imagine que você e um conhecido são acusados de cometer um crime juntos
e são interrogados individualmente. As opções oferecidas são simples: Se você
delatar o seu suposto comparsa, será liberado, enquanto ele será preso.
Por outro lado, se nenhum dos dois falar nada ficarão alguns dias de prisão
preventiva, mas serão logo liberados. Porém, se ele te entregar enquanto você não
fala nada, quem pega a pena mais pesado é você, e ele sai livre. Finalmente, se os
dois decidirem passar a perna um no outro ao mesmo tempo, vão passar um tempo
um pouco menor na cadeia do que passariam no cenário em que se traíssem.
Existe uma solução matemática para resolver o dilema acima. E ela não é
nada simpática: sempre seja traíra. Como não têm como você e seu suposto
comparsa negociarem uma colaboração por estarem separados, você sempre vai
ganhar mais – ou, no mínimo, perder menos – entregando ele. O risco de ficar
calado e acabar sendo preso é alto demais.
O cenário que acabamos de ver é conhecido, por razões óbvias, como o
Dilema do Prisioneiro, e é um dos exemplos clássicos dos resultados trazidos pela
Teoria dos Jogos.
1.2 O conceito
A Teoria dos Jogos é o estudo de problemas de decisão interdependentes,
isto é, que envolvem vários agentes econômicos. De acordo com Chiang (1982) um
jogo é uma situação na qual dois ou mais participantes, os jogadores, confrontam-se
em busca de certos objetivos – conflitantes. Sendo conflitantes é óbvio que os
objetivos de todos os jogadores não podem ser simultaneamente alcançados. A
Teoria dos Jogos pode então ser definida como, a teoria dos modelos matemáticos
que estuda a escolha de decisões ótimas sob condições de conflito.
5
Ela ajuda o dono da empresa a saber quais os ganhos e perdas que suas
escolhas e a dos concorrentes podem gerar, ajudando a tomar a decisão que vai
deixar a sua empresa no melhor cenário, ou no menos pior.
A interdependência estratégica entre as empresas pode se dar de forma
simultânea ou sequencial (PIDD, 1998), existindo situações em que podem estar
presentes ambos os tipos de interdependência.
2. MODALIDADES DA TEORIA DOS JOGOS
2.1. Escolhas simultâneas
As escolhas serão simultâneas quando ocorrerem ao mesmo tempo.
Suponhamos que as preferências dos eleitores em uma matéria, como por exemplo,
a respeito da propriedade privada, podem representar-se por uma distribuição
uniforme em uma linha de comprimento 1; isto é, o mesmo número de eleitores se
encontra em 0, em 0,1, em 0,8, etc. Os eleitores que se encontram nos pontos 0 e 1
correspondem aos mais polarizados a favor da postura de “Esquerda” e de “Direita”,
respectivamente e os que se encontram no ponto 0,5 correspondem aos que se
encontram no centro destas tendências. Um eleitor no ponto 0,2 está mais para
Esquerda do que um eleitor no ponto 0,7. A identificação de um eleitor com os
partidos depende então da distância entre o discurso e sua posição.
Suponhamos a existência de somente dois candidatos ou coligações (E0 e
D0) que disputam uma eleição. Onde deveriam estar posicionados os candidatos
para aumentar sua probabilidade de sucesso? Para acharmos a resposta,
suponhamos inicialmente que a coligação de Esquerda simpatize com E0 e que a
6
Direita simpatize com D0. Neste caso, a coligação de Esquerda convencerá todos os
eleitores que se encontrem a esquerda da posição E0 e a coligação da Direita
convencerá todos os eleitores que se encontram à direita do ponto D0, enquanto
que os eleitores que encontram-se entre E0 e D0 repartiram-se em proporções
iguais entre ambas as coligações.
Assim, são E0 e D0 pontos de equilíbrio? A resposta é não, pois se a
coligação de direita espera que a coligação de esquerda estacione em E0, ela
desejará mudar sua posição para uma que se encontre mais à esquerda de D0 já
que assim obterá todos os votos dos eleitores que se encontrem entre sua posição e
a de E0, o que lhe entregará um maior número total de votos. Assim mesmo, a
coligação de esquerda, dada a posição de sua concorrente, também desejará
mover-se mais à direita do que o ponto E0 para aumentar seu número de votantes.
Seguindo com esta análise, dado que o objetivo de ambas as coligações é ganhar a
eleição, o único equilíbrio é que as duas coligações estacionem-se no centro do
espectro político. O ponto 0,5 representa um equilíbrio de Nash dado que, se ambas
se encontram no centro, uma junta à outra, nenhuma das coligações terá incentivos
para mudar, dada a posição escolhida pela outra parte. Este resultado, que mudaria
se os eleitores não se distribuíssem uniformemente, ou se existirem mais partidos,
permite entender a maior confluência que se observa em campanhas políticas
quando, em diversos países, existem somente dois candidatos relevantes. De fato, a
introdução de um terceiro participante mudaria fortemente a conclusão sobre a
posição dos partidos ao centro.
3.2. Escolhas sequenciais
As escolhassequenciais são jogos onde o atual jogador tem como
conhecimento a última jogada de outro jogador que antecedeu, isso não implica em
um conhecimento total de ações do jogador entendo o fato de que se necessita
poucas informações. Um exemplo disso é a possibilidade do jogador saber quais
ações não podem mais serem realizadas pelo jogador mas não conseguir prever
qual será o próximo movimento do adversário.
7
Em jogos sequenciais os jogadores tomam suas ações um de cada vez e
seus movimentos são possíveis de se imaginar.
Um exemplo de jogos sequenciais é quando uma empresa concorrente
espera o lançamento de um produto da outra empresa, tendo o conhecimento do
objetivo a ser alcançado pela rival e conseguindo analisar o que foi feito, é possível
tentar superar de alguma forma a concorrente, seja no marketing ou na qualidade do
produto.
3. TERMOS CHAVES
4.1. Estratégia dominada
As estratégias são tidas como dominadas quando uma ideia ou uma ação
sempre leva vantagem sobre as outras
Uma estratégia é considerada estritamente dominada quando ao se analisar
as possibilidade de se sobrepor sobre outra é considerada muito difícil ou quase
impossível, fazendo assim com que nenhum jogador opte por escolhê-la. Ao
considerar todas as possibilidades de estratégias a serem usadas por dois jogadores
e a conclusão mais correta dizer que um jogador vai sempre levar vantagem sobre
outro é considerada uma estratégia dominada.
Para se chegar a conclusão de dominância sobre a estratégia é feito uma
análise matricial entre as possibilidades de estratégias, comparando sempre a
possibilidade resultado entre elas e indo eliminando as ações menos prováveis de
serem feitas, chegando assim a apenas uma ação estratégica, e para isso deve se
levar em consideração que o jogo admite apenas uma solução.
8
4.2. Estratégia dominantes
As estratégias dominantes são aplicáveis em jogos estáticos de informação
completa, portanto, jogadores racionais não utilizam estratégias dominantes se eles
não tiverem certeza da estratégia adotada pelo outro jogador, um exemplo de
aplicação do conceito de estratégia dominante na solução de um jogo. Assim, no
setor de Tecnologia da Informação (TI), especificamente quando duas empresas
competem em um duopólio*, a necessidade de se inovar é latente, uma vez que
novas tecnologias são criadas com uma velocidade muito grande, e as empresas
que não se anteciparem ou não acompanharem essa situação estarão sujeitas ao
insucesso. Assim, considere duas empresas neste setor: a empresa Betacorp e a
empresa Daran que têm políticas distintas em relação à inovação. Enquanto a
primeira opta por meios morais e legais para se inovar, a segunda procura uma
atualização em sua tecnologia a qualquer preço, mesmo que isso lhe custe uma má
reputação. A empresa Betacorp tem duas possíveis estratégias, enquanto a Daran
possui três, portanto :
S1 = {Investe em P&D; Paga Ro yalties}
S2 = {Investe em P&D; Paga Royalties; Engenharia Reversa}
Assim, as duas empresas disputam a liderança no mercado bra-sileiro de
automação comercial. Visando um aumento na fatia de mercado, as empresas
podem optar por investir em pesquisa e desenvolvimento (P&D), pagar Royalties*
para a empresa concorrente ou se apropriar da pesquisa de terceiros, sem que
tenha havido o desembolso necessário, que denominaremos de Engenharia
Reversa*.Atente leitor, para a ilegalidade da última estratégia, que se configura em
uma situação sujeita a penalizações.A matriz de pay-off apresentada a seguir
(Quadro 2) representa os lucros advindos das diferentes combinações de estratégias
ligadas à busca por uma inovação das empresas anteriormente
apresentadas.Assim, as empresas Daran e Betacorp fazem o cálculo de seus
ganhos líquidos, em termos de fatia de mercado, depois de decidirem investir em
9
P&D, pagar royalties à empresa que desenvolveu a inovação ou realizar cópia da
inovação de outras empresas atuantes em outro mercado( engenharia reversa)
A Betacorp tem uma equipe de P&D mais eficiente que a Darane consegue
obter melhores resultados com os investimentos em P&D,chegando mais rápido no
mercado, assim, na combinação de estratégias {investir em P&D, Investir em P&D},
ela (Betacorp) é a única que ganha e vende um milhão de máquinas.No caso do
resultado {investir em P&D, Pagar Royalties}, a Betacorp continua com o mesmo
ganho anterior (um milhão de máquinas vendidas), já a Daran resolve pagar
royalties sobre os resultados obtidos pelo P&D da Betacorp e, como é mais eficiente
no marketing, acaba obtendo uma fatia maior (dois milhões de máquinas vendidas).
BETACORP Daran
Investir em
P&b
Pagar
Royalties
Engenharia
reversa
Investir em
P&D 1,0 1,2 0,1
Pagar
Royalties 0,3 0,1 2,0
Quadro 2 : Matriz de Play- offs - jogo de estratégia dominante .
Fonte: Elaborado pelo autor.
Concluímos que se a Betacorp sabe que a Daran age racionalmente, deve eliminar
{Engenharia Reversa} das estratégias possíveis a serem utilizadas, ficando o jogo os
possíveis resultados mostrados pelo Quadro 3.
BETACORP
DARAN
Investir em P&b Pagar Royalties
investir em P&D
1,0 1,2
10
Pagar Royalties 0,3 0,1
Quadro 3 : Matriz de play - offs - Estratégia estritamente dominante
Fonte: Elaborado pelo autor.
A partir dessa nova matriz (Quadro 3), verificamos que para Betacorp {pagar
Royalties } é estritamente dominada por {Investir em P & D}, (pois 1>0).
Se a empresa Betacorp agir com racionalidade e a Daran souber que a outra
empresa é racional e se a Daran agir com racionalidade e a Betacorp souber que a
outra empresa é racional, então {pagar Royalties} será eliminado da matriz. A matriz,
agora 1 x 2 (Quadro 4), apresenta-se da seguinte forma: podemos verificar ainda
que para a Betacorp a opção é {Investir em P & D}. Em relação às decisões da
Daran, {Investir em P & D}, é estritamente dominada por {pagar Royalties}, (pois
2>0).A matriz, agora 1 x 2 (Quadro 4), apresenta-se da seguinte foma: podemos
verificar ainda que para a Betacorp a opção é {Investir em P & D}. Em relação às
decisões da Daran, {Investir em P & D}, é estritamente dominada por {pagar
Royalties}, (pois 2>0).
BETACORP
DARAN
Investir em P&B Pagar Royalties
investir em P&D
1,0 1,2
Quadro 4 : Matriz de Play-offs - eliminação da estratégia investir em P&B
da empresa Daran - Fonte: Elaborado pelo autor.
Betacorp
A matriz, agora 1 x 1 (Quadro 5), apresenta-se da seguinte forma, sendo,
portanto, a solução do jogo. Podemos verificar que para a Belcorp é melhor {Investir
em P&D}, do que {pagar Royalties} para terceiros, independente da decisão
estratégica da empresa Daran de {Investir em P&D} ou {pagar Royalties}. Para a
11
Daran, {Engenharia Reversa} configura-se na pior estratégia a ser adotada,
possivelmente devido à possibilidade de perdas proporcionadas pela repercussão
negativa sofrida na imagem da empresa. A Daran, através da técnica da dominância
estrita iterada, deve então, decidir {pagar Royalties}.
BETACORP Daran
Pagar Royalties
investir em P&D
1,2
Quadro 5 : Matriz de play -offs - Resultado final do jogo
Fonte: Elaborado pelo autor.
O método, embora simples, é poderoso, mas apresenta uma gra-
ve limitação: nem todos os jogos apresentam estratégias dominantes e
dominadas. Para esses casos é necessário um método que engloba um
número de situações possíveis, maior do que o método de eliminação
iterativa de estratégias. É apresentado, então, o método do Equilíbrio
de Nash.
4.3. Opção de equilíbrio
EQUILÍBRIO DE NASH
O equilíbrio de Nash ou solução estratégica de um jogo ocorre quando, entre
todas as estratégias disponíveis para os jogadores, é escolhida a melhor opção
possível dada à resposta de todos os outros jogadores. Assim, não há incentivo para
mudar sua estratégia se os demais jogadores não o fizerem. Dizemos que uma
combinação de estratégias constitui um equilíbrio de Nash quando cada estratégia é
a melhor resposta possível às estratégias dos demais jogadores, sendo isso verdade
para todos os jogadores(FIANI, 2004).
12
O equilíbrio de Nash ocorre quando uma estratégia i do jogador J(Sᴶ1) já é
considerada a melhor resposta a uma dada estratégia i* disponível para outro
jogador j* (SᴶI* que produz uma recompensa mais elevada do que quando é
jogada. De acordo com Fiani (2004), o que essa definição do equilíbrio de Nash está
exigindo é que todas as estratégias adotadas por todos os jogadores sejam as
melhores respostas às estratégias dos demais. Se você teve dificuldade em
entender essa descrição matemática do equilíbrio de Nash, não se preocupe,pois a
seguir descreveremos um exemplo prático da ocorrência desse equilíbrio em um
jogo, considerando o exemplo de duas empresas do setor de Tecnologia da
Informação (TI).
Nesse caso, as empresas de TI são ALFA e BETA, esse jogo representa uma
situação de interação estratégica, em que uma empresa desenvolvedora de banco
de dados (BETA) tem de decidir se desenvolve ou não essa nova ferramenta e a
empresa que produz software(ALFA) tem de decidir se utiliza ou não o novo banco
de dados. Embora as empresas não mantenham contato para coordenar suas
deci-sões, ambas têm interesse em uma solução conjunta, contudo há possibilidade
de decisões divergentes: se BETA desenvolve o novo banco de dados e ALFA não
utiliza o seu software, ou se a BETA não desenvolve o novo banco de dados,
enquanto a ALFA utiliza (se prepara para utilizar o banco em seu software, nesses
casos, as combina-ções estratégicas trazem prejuízo para ambas, como mostrado
na matriz dos lucros e prejuízos obtidos pelas empresas nas diferentes combinações
de estratégias (Quadro 6). Podemos observar que na nova matriz não é possível
encontrar solução utilizando o processo de eliminação das estratégias estritamente
dominadas, é aplicado, então, o método de equilíbrio de Nash, por ser um método
mais geral de solução de um jogo.
As empresas ALFA e BETA possuem duas estratégias:
S¹ = {Desenvolver um Banco de dados; Não Desenvolver}
S² = {Utilizar o Banco de dados; Não Utilizar}
13
Alfa Beta
Desenvolver Não desenvolver
Utilizar 2,1 -1, -2
Não Utilizar 0,-1 1,2
Quadro 6: Matriz de play -offs - Identificação dos esquilibrios de Nash
Fonte : Elaborado pelo autor
4.4. Opção ótima
A solução ótima de um jogo seleciona uma ou mais estratégias misturadas de
acordo com probabilidades pré-determinadas para cada jogador tal que qualquer
mudança em uma estratégia escolhida não melhore o pay-off para o outro jogador.
O comportamento racional no jogo é encontrar a estratégia ótima, aquela que
diminui ao máximo a possibilidade de perda e, ao mesmo tempo, leva a maior
desvantagem possível para o adversário. Algum fator diferenciado, como um
comportamento eventualmente irracional por parte de um jogador, é previsível.
Estratégia ótima em resumo: estratégia que maximiza o pay-off esperado do
jogador.
Em certas situações os atributos da racionalidade individual não dão conta de
resolver determinados problemas de forma ótima, isso porque pode ocorrer um
conflito de vontades. No caso de ocorrência de um conflito de vontades não é
possível prever o resultado, mas em um jogo que tenha somente um ponto de
equilíbrio e estratégias dominantes para cada um dos jogadores é possível a
predição do resultado.
O paradoxo é retratado assim: ainda que do ponto de vista de cada jogador,
as suas estratégias escolhidas sejam as únicas racionais, ele não consegue obter
14
um resultado ótimo. Tal situação expõe a incompatibilidade entre a racionalidade
individual e a racionalidade em grupo.
4. EXERCÍCIOS
5.1. Aplicação
A utilização da teoria dos jogos no planejamento estratégico traz uma visão
ampla para a resolução de problemas reais. A possibilidade de enxergar os
caminhos possíveis para o seu adversário adotar promove a avaliação crítica das
consequências que devem ser evitadas e a busca pela melhor solução. Para
exemplificar o tema, podemos analisar as seguintes situações problema.
5.2. O dilema do prisioneiro
Dois suspeitos, A e B, foram presos pela polícia. Como não existem provas
suficientes para condená-los, eles são presos em celas diferentes e é oferecido a
ambos o mesmo acordo:
Se um deles confessar o crime (ou seja, trair o comparsa) e o outro
permanecer em silêncio, quem confessou sai livre enquanto o cúmplice silencioso
cumpre dez anos.
Se ambos ficarem em silêncio (colaborarem um com ou outro), a polícia só
pode condenar cada um dos suspeitos a um ano de prisão.
Se ambos confessarem (traírem o comparsa), cada um ficará cinco anos na
cadeia.
Cada prisioneiro toma a decisão sem saber da escolha do outro — eles não
podem conversar. Como os prisioneiros vão reagir? Existe alguma decisão racional
a tomar? Qual seria a sua decisão?
15
Uma forma esquemática para mostrar uma interação humana, ou seja, um
jogo, é usar uma matriz de resultados. Embora o enunciado do problema seja
simples e intuitivo, a representação gráfica nos oferece grande ajuda para visualizar
o cenário completo e entender as opções de cada jogador e suas respectivas
implicações.
Resolvendo o jogo:
Considerando os incentivos do jogo (os valores das penas de prisão para
cada combinação de decisões na matriz), existe uma única decisão racional a tomar,
que parece ser contrária à intuição: Trair. A explicação é a seguinte: imagine que
você é o Prisioneiro A. Assim, deve considerar duas hipóteses:
HIPÓTESE 1: Suponha que o Prisioneiro B escolha Colaborar. Então, se você
escolher colaborar, pega um ano de prisão. Se escolher trair, você sai livre. Nesse
caso, trair é a melhor opção.
16
HIPÓTESE 2: Suponha que o prisioneiro B escolha Trair. Então, se você
escolher colaborar, leva dez anos de prisão. Se escolher trair, fica com cinco anos.
Nesse caso, trair é a melhor opção.
Perceba que trair é a melhor opção em ambos os casos. Em outras palavras,
trair é a melhor opção, independentemente da decisão do outro.
Agora, imagine o que o Prisioneiro B está pensando. Se ele é racional como
você, provavelmente pensa a mesma coisa.
Ele supõe que você vai escolher colaborar. Então, se ele escolher colaborar,
leva 1 ano de prisão. Se escolher trair, sai livre. Nesse caso, trair é a melhor opção.
Ele supõe que você vai escolher trair. Então, se ele escolher colaborar, leva
dez anos de prisão. Se escolher trair, fica com cinco anos de prisão. Nesse caso,
trair é a melhor opção.
5.2. A guerra de preços
O conflito típico dos jogos da categoria Dilema dos Prisioneiros é aquele em
que cada jogador escolhe sua estratégia dominante e o resultado do jogo é pior para
o grupo como um todo — é o conflito entre o interesse individual e o coletivo. Na
17
prática, esse jogo-modelo é uma das metáforas mais poderosas da ciência do
comportamento humano, pois inúmeras interações sociais e econômicas têm a
mesma estrutura de incentivos (a matriz de resultados).
Imagine uma cidade com apenas dois postos de gasolina. Você é dono de um
deles, chamado GASOIL, que fica ao lado do posto do seu concorrente, o
AUTOGAS. Devido à proximidade dos dois, quando uma pessoa precisa abastecer o
carro, ela vai até eles, confere os preços e escolhe o menor. Embora existam outras
características que diferenciam os postos, como a cordialidade e a velocidade dos
frentistas, considere por um momento que o preço é o fator mais relevante.
Assim, se o critério é preço, alguns centavos a menos podem induzir parte
dos clientes a preferir o posto que cobra o menor valor. Por exemplo, quem abaixar
o preço em 5% ganha cerca de 30% dos clientes do concorrente. Esse aumento de
volume de clientes compensa o preço reduzido, melhorando a rentabilidade,
enquanto o outro perde faturamento. Por isso, você pensa: “Que tal abaixar o preço
do litro de $3 para $2,90?”. Isso fará com que os habituais clientes do AUTOGAS
(concorrente) passem a abastecer no GASOIL (o seu posto).
A vida empresarial seria mais fácil se as decisões fossem assim, isoladas.
Entretanto, como o seu concorrente vai reagir? Ao notar quevocê baixou o preço e
ele perdeu clientes, ele também vai baixar o preço para $2,90. Como resultado, os
dois postos terão preço igual ($2,90 no lugar de $3) e o mesmo volume de clientes,
como antes, mas ambas as empresas perdem faturamento e lucro. Essa é a
essência da guerra de preços, que prejudica o negócio dos dois postos.
18
Suponha que vocês tomem a decisão simultaneamente. Se hoje é domingo,
vocês vão decidir o preço da segunda-feira. Durante o dia não é possível alterar o
preço, mas apenas de um dia para outro. Vocês não conversam e não sabem qual
preço o outro vai adotar. Você ficará sabendo apenas no dia seguinte, e qualquer
arrependimento será tarde demais — você terá de esperar pelo menos um dia inteiro
para tomar qualquer providência, isto é, até o dia seguinte.
Considerando essa dinâmica de mercado com clientes sensíveis ao preço, os
dois postos têm incentivos para abaixar o preço e ganhar mais momentaneamente.
Entretanto, se os dois o fizerem, ambos saem perdendo. Assim, preventivamente,
você conversa com o dono do AUTOGAS, e vocês combinam de não abaixar os
preços. Ele concorda, mas você vai dormir com a dúvida: será que posso confiar
nele? Se ele abaixar o preço à noite, você perderá toda a clientela do dia seguinte.
Você está num dilema — o dilema da confiança, ou Dilema dos Prisioneiros.
Embora seja intuitivo, podemos representar, a seguir, a matriz de resultados
dos postos de gasolina. Em cada célula (combinação de escolhas), o valor da
esquerda refere-se aos ganhos do GASOIL, e o valor da direita aos ganhos do
AUTOGAS. O valor em si é meramente ilustrativo, mas a proporção entre eles é
relevante para a decisão.
Se ambos colaborarem (manterem o preço original), os dois ganham $50 por
dia. Se um deles abaixar o preço, recebe $60, enquanto o que mantém recebe
apenas $30. Já se ambos reduzirem o preço, o resultado para cada um será $40,
pois significa abaixar o preço sem aumentar o volume de clientes. De acordo com a
19
metodologia de análise no Dilema dos Prisioneiros, reduzir-reduzir é o ponto de
equilíbrio ($40, $40), pois abaixar o preço é a estratégia dominante em cada um,
resultando em valor pior se comparado àquele inicial.
Eles caíram na armadilha, e muitos chamam essas situações de dilema
social — o interesse individual e a análise estritamente matemática e racional
induzem a resultados piores do que opções que consideram o interesse coletivo.
Como já foi mencionado, é difícil sair dessa armadilha — quem vai arriscar a
colaborar (manter o preço), se há chance de o outro trair (reduzir o preço) e ganhar
sozinho?
5.3. O jogo de n-pessoas
O Jogo de N-Pessoas, tomando como característica básica o seu tamanho,
caracteriza-se como um jogo com mais de dois participantes, visto que os jogos
anteriores se apresentam com menos de três jogadores. Outro aspecto importante é
que no jogo de n-pessoas a concepção de poder não é de fácil apreensão, pois para
o jogador ter este poder é necessário que haja a cooperação de outros jogadores.
Porém, no jogo de n-pessoas, caso os demais jogadores deixem de colaborar, o
jogador desamparado não pode esperar nada além do lucro mínimo que possa obter
com seus próprios recursos. Por outro lado, no jogo de uma pessoa, o participante
determina o resultado por sua conta ou compartilha o controle com uma natureza
não hostil. No jogo de duas pessoas, soma-zero, o poder do jogador, isto é, seu
potencial de ação na situação de jogo dependente dos seus próprios recursos, é
exatamente o meio que ele pode contar para conseguir alcançar seu objetivo. Já o
jogo de duas pessoas, soma não-zero, é algo mais complicado. Em tal jogo, o
jogador está em condições de punir ou recompensar o outro jogador participante.
Visto que ele não pode ser manipulado pelo próprio jogador, seu valor não é
totalmente inteligível. Voltando ao jogo de n-pessoas, como já foi dito anteriormente,
o poder potencial a ser aplicado é de difícil apreensão, mais complicado que nos
outros jogos. No jogo de n-pessoas sempre haverá um ganho mínimo que o jogador
pode obter utilizando-se dos seus próprios recursos. Porém para obter mais, deve se
unir a outros jogadores. Entretanto, no jogo de n-pessoas, caso os outros jogadores
20
deixem de cooperar, não há recurso que o jogador possa recorrer. A princípio, tal
jogador ao querer alcançar ganho além do lucro mínimo, ele se vê desamparado.
Para melhor compreender como se dá o jogo de n-pessoas e o conceito de
poder, vamos ao seguinte exemplo:
Um agente de teatro escreve a três artistas, informando-os de que tem
trabalho para dois deles, para quaisquer dois. Os três artistas são de fama desigual
e, assim, o empregador se dispõe a pagar mais por algumas combinações do que
por outras. Especificamente, A e B podem conseguir R$6000,00; A e C podem
conseguir R$7000,00 e B e C podem conseguir R$9000,00. Os dois que obtiverem o
trabalho poderão dividir a soma recebida da maneira que mais lhes agrade, mas
devem decidi-la antes de aceitar o trabalho. Os dois que primeiro chegarem a um
acordo conseguirão o emprego. É possível prever que par conseguirá o emprego?
Como dividirão os lucros? (DAVIS, 1973, p. 150).
Foto: Cia Cangapé / Disponível em:
https://g1.globo.com/ap/amapa/noticia/2019/01/21/sesc-amapa-abre-chamada-para-
apresentacao-de-artistas-em-10-projetos-culturais.ghtml. Acesso em: 02 out. 2021.
Assim, vamos supor que um dos artistas procura uma alteração na situação
de jogo e, antes de se iniciarem as negociações, são oferecidos todos os possíveis
ganhos que vier a conseguir em troca de uma soma fixa que esse terceiro lhe pague
nesse momento. Nisto passará a atuar representando esse jogador nas
21
negociações; podendo oferecer e aceitar em nome do jogador quaisquer
circunstâncias, aceitando também o risco de ser repelido por completo, nada vindo a
ganhar. A quantia que o terceiro disponha a pagar pelo privilégio de agir pode ser a
indicação do poder do jogador no jogo. Tem-se aqui uma colocação mais
compreensível do problema de avaliar, assim como também demonstrar o
funcionamento do jogo de n-pessoas. Nisto examinaremos uma das abordagens
possíveis:
No jogo, em forma de esquema acima, a primeira reação é a de presumir que
B e C se unam, pois tem mais a ganhar: R$9000,00. Como dividirão o que ganham é
outra questão. É possível que o jogador A, que nem chega a estar incluído na união
de B e C, desempenhe importante influência de como será repartido o dinheiro, pois
pode haver falha em B e C de chegarem a um acordo. As quantias respectivas de B
e C devem estar, de alguma forma, relacionadas com o valor das associações A-B e
A-C. E como a união A-B tem valor menor que a A-C, a princípio é razoável concluir
que B obterá menos da metade dos R$9000,00. Esta é uma das abordagens do jogo
de n-pessoas.
22
CONCLUSÃO
Neste trabalho falamos sobre os usos de programação linear para a teoria de
jogos partindo do conceito do dilema do prisioneiro que nos demonstra, através de
uma solução matemática que ser sempre traíra te trará melhor resultado sempre,
para chegarmos ao conceito de teoria de jogos que estuda a escolha de decisões
ótimas sob condições de conflito.
Abordamos os estudos das modalidades de teoria de jogos - Escolhas
Simultâneas e Escolhas Sequenciais - e dos termos chaves - Estratégia Dominante
e Estratégia Dominada - chegando ao Método de Equilíbrio de Nash e, finalmente, a
solução ótima que maximiza o pay-off de cada jogador através uma seleção das
estratégias.
23
REFERÊNCIAS
INTRODUÇÃO à teoria dos jogos. explicando o dilema do prisioneiro.
Direção: KAH ADM. [S. l.]: KAH ADM, 2013. Disponível em:
https://www.youtube.com/watch?v=zR8fpfJiHdE. Acesso em: 29 set. 2021.
HEIN, Nelson et al. Sobre o uso da teoria dos jogos na tomada de decisões
estratégicas. XXIII Encontro Nac. de Eng. de Produção, Ouro Preto, ano 2003, p.
1-8, 21 out. 2003. Disponível em:
http://www.abepro.org.br/biblioteca/enegep2003_tr0605_1538.pdf. Acesso em:29
set. 2021.
Monteiro, Cláudia Servilha; A Decisão Racional na Teoria dos Jogos; Santa
Catarina, 2008.
BARRICHELO, Fernando. O que é o Dilema dos Prisioneiros. In:
BARRICHELO, Fernando. O que é o Dilema dos Prisioneiros. Disponível em:
http://estrategiasdedecisao.com/dilema-dos-prisioneiros/. Acesso em: 2 out. 2021.
DAVIS, M. D. Teoria dos jogos: uma introdução não técnica. São Paulo:
Cultrix, 1973.
A TEORIA DOS JOGOS E AS CIÊNCIAS SOCIAIS. 2002. Dissertação
(Mestre em Ciências Sociais) - Faculdade de Filosofia e Ciências da Universidade
Estadual Paulista “Júlio de Mesquita Filho”, Campus de Marília, [S. l.], 2003.
24
https://www.youtube.com/watch?v=zR8fpfJiHdE
http://www.abepro.org.br/biblioteca/enegep2003_tr0605_1538.pdf