Buscar

ok-A STUDY ON CONSTRUCTING FUZZY SYSTEMS en pt

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Um estudo sobre a construção de sistemas fuzzy
para tomada de decisão de alto nível em um jogo de corrida de carros
Seiya Fujii,Membro estudante, IEEE,Tomoharu Nakashima,Membro, IEEE,e Hisao Ishibuchi,Membro, IEEE
Abstrato-Neste artigo, examinamos o desempenho de sistemas baseados 
em regras fuzzy em um domínio de corrida de carros. Sistemas baseados em 
regras fuzzy são usados para tomada de decisão de alto nível de um agente 
de automóveis. Examinamos dois métodos que geram um conjunto de 
padrões de treinamento para a construção de sistemas baseados em regras 
fuzzy. Também examinamos o efeito da informação sensorial na tomada de 
decisão de alto nível.
O desempenho de quatro tipos de sistemas baseados em regras 
fuzzy é comparado em uma série de experimentos computacionais. A 
análise do uso de diferentes tipos de informações sensoriais e 
diferentes métodos para geração de padrões de treinamento também é 
realizada.
propõe um método coevolutivo para adquirir o comportamento 
dos agentes para o jogo.
Um grande número de métodos de inteligência computacional 
também foi proposto para jogos clássicos como go [14], [15], [16], 
othello [17], [18] e contract bridge[19]. Por outro lado, jogadores 
adversários para videogames são desenvolvidos por McFarlin e 
Todd [20]. Chen et al.[21] desenvolveram um simulador de um 
jogo de hóquei para que possam examinar o desempenho de seu 
método de inteligência computacional para robôs de hóquei reais.
Dentre esses jogos, um jogo de corrida de carros é uma das áreas em crescimento como 
domínio de aplicação da inteligência computacional. Por exemplo, Agapitos et al.[22] 
examina o desempenho de redes neurais e programação genética para o jogo de corrida de 
carros. Togelius e Lucas [23] investigam detalhadamente o desempenho de controladores de 
carros com diferentes arquiteturas e diferentes tipos de informações sensoriais. Além disso, 
Togelius [24] examinou o desempenho de vários métodos evolutivos para o aprendizado 
automático de controladores de carros. Eles também investigaram o efeito das funções de 
fitness no desempenho de controladores de carros no aprendizado padrão e coevolutivo. 
Controladores de carros especializados para uma determinada pista de corrida são 
adquiridos por inclinação evolutiva em [25]. Informações sensoriais de controladores de 
carros são previstas por redes neurais em [26]. As pistas de corrida também são obtidas por 
aprendizado evolutivo para que os jogadores humanos no jogo de corrida de carros sintam 
as pistas desafiadoras e atraentes em [27], [28]. Recentemente, um novo formato de jogo de 
corrida de carros foi proposto em [29] onde vários agentes de carros competem entre si por 
waypoints em um campo de corrida. Os waypoints no jogo de corrida de carros são rotulados 
com um número que representa a ordem para mirar. Neste artigo, aplicamos técnicas de 
inteligência computacional a esse tipo de jogo de corrida de carros com waypoints 
ordenados. Os waypoints no jogo de corrida de carros são rotulados com um número que 
representa a ordem para mirar. Neste artigo, aplicamos técnicas de inteligência 
computacional a esse tipo de jogo de corrida de carros com waypoints ordenados. Os 
waypoints no jogo de corrida de carros são rotulados com um número que representa a 
ordem para mirar. Neste artigo, aplicamos técnicas de inteligência computacional a esse tipo 
de jogo de corrida de carros com waypoints ordenados.
Uma das estratégias mais simples para o jogo de corrida de carros 
com waypoints ordenados é apenas mirar no primeiro waypoint. No 
entanto, existem muitos casos em que o agente do carro não consegue 
alcançar o primeiro waypoint antes de seu oponente. Por exemplo, se o 
agente do carro estiver longe do primeiro waypoint e o oponente 
estiver perto dele, será difícil para o agente do carro alcançar o 
primeiro waypoint antes do oponente. Nesta situação, o agente do 
carro deve desistir do primeiro waypoint e ir para o segundo waypoint. 
Assim, uma boa estratégia de seleção de waypoints é necessária para 
que um agente de carros seja competitivo contra os agentes de carros 
adversários.
Neste artigo, propomos sistemas baseados em regras fuzzy para a tomada 
de decisão do agente de carros no domínio das corridas de carros com 
waypoints ordenados. No sistema baseado em regras fuzzy, o
eu. euNTRODUÇÃO
S A aplicação bem-sucedida de técnicas de inteligência artificial em jogos tem sido feita principalmente para jogos de tabuleiro. Por 
exemplo, para o jogo de xadrez Deep Blue [1] venceu o campeão 
mundial humano em 1997. O algoritmo implementado no Deep Blue é 
uma técnica de força bruta onde um sistema de máquina paralela de 30 
nós foi usado para procurar o melhor lance que vence o jogador 
adversário. Recentemente a aplicação de técnicas de inteligência 
computacional a jogos é uma das áreas mais ativas na comunidade de 
inteligência computacional. Por exemplo, Quek et al.[2] investiga a 
diferença no desempenho entre aprendizagem evolutiva e incremental 
no contexto do dilema dos prisioneiros iterados (IPD). A cooperação 
entre jogadores é desenvolvida em Ashlock [3] onde os jogadores são 
colocados em nós dos chamados grafos combinatórios. Ghoneim et ai. 
[4] também investiga o efeito do compartilhamento de informações 
entre jogadores na evolução do comportamento dos jogadores. 
Wittkamp [5] compara o desempenho de estratégias obtidas por 
programação genética com aquelas representadas por uma tabela 
heurística para Spoof, que é semelhante ao IPD.
A inteligência computacional também foi aplicada ao domínio 
do futebol RoboCup. Riedmiller et al.[6] propõe um método de 
aprendizado por reforço baseado em redes neurais artificiais para 
habilidades de baixo nível e também para cooperação entre 
jogadores. Nakashima et al.[7], [8] propõem um método de 
aprendizado por reforço difuso para interceptar uma bola 
chutada. Eles também propuseram um método evolutivo que 
obtém automaticamente uma estratégia ofensiva contra uma 
equipe adversária fixa [9], [10], [11].
Leigh et al.[12] propõe um método tipo A* para planejamento 
de rotas em seu jogo original Lagoon. Miles et al.[13] Além disso
Seiya
( nakashi@cs.osakafu-u.ac.jp ) e Hisao Ishibuchi ( hisaoi@cs.osakafuu.ac.jp ) 
estão no Departamento de Ciência da Computação e Sistemas Inteligentes, 
Universidade da Prefeitura de Osaka, Gakuen-cho 1-1, Naka-ku, Sakai, Osaka 
599-8531, Japão.
Fujii ( fujii@ci.cs.osakafu-u.ac.jp ), Tomoharu Nakashima
2299
978-1-4244-1819-0/08/$25,00©c 2008 IEEE
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
Traduzido do Inglês para o Português - www.onlinedoctranslator.com
https://www.onlinedoctranslator.com/pt/?utm_source=onlinedoctranslator&utm_medium=pdf&utm_campaign=attribution
a informação sensorial do agente do carro é usada como entrada do sistema baseado em regras fuzzy. Como nossos sistemas 
baseados em regras fuzzy são categorizados como aprendizado supervisionado, um conjunto de padrões de treinamento com sinais 
alvo conhecidos é necessário para construir um sistema baseado em regras fuzzy. No entanto, nenhum padrão de treinamento está 
disponível na construção de sistemas baseados em regras fuzzy. Assim, eles devem ser gerados através de uma série de 
experimentos preliminares para acumular a experiência do agente do carro sobre o jogo. Consideramos dois métodos para gerar 
padrões de treinamento. Enquanto ambos os métodos geram padrões de treinamento a partir de uma série de experimentos 
preliminares, um método gera um padrão de treinamento a partir de uma posição pré-especificada dos agentes do carro e pontos 
de referência. Por outro lado, o outro método gera padrões de treinamento através de uma situação prática do jogo de corrida onde 
os waypoints são gerados aleatoriamente. Consideramos duas representações do vetor de entrada para sistemas baseados emregras fuzzy. Uma é a informação egocêntrica onde o oponente e os waypoints são representados por uma informação relativa ao 
agente do carro. A outra representação é a informação de terceira pessoa onde todos os objetos, incluindo agentes de carro e 
waypoints, são descritos no sistema de coordenadas absolutas. O desempenho das quatro combinações da representação de 
entrada e o método de geração de padrões de treinamento são examinados. Também discutimos o efeito de cada método no 
desempenho de sistemas baseados em regras fuzzy. Uma é a informação egocêntrica onde o oponente e os waypoints são 
representados por uma informação relativa ao agente do carro. A outra representação é a informação de terceira pessoa onde todos 
os objetos, incluindo agentes de carro e waypoints, são descritos no sistema de coordenadas absolutas. O desempenho das quatro 
combinações da representação de entrada e o método de geração de padrões de treinamento são examinados. Também discutimos 
o efeito de cada método no desempenho de sistemas baseados em regras fuzzy. Uma é a informação egocêntrica onde o oponente e 
os waypoints são representados por uma informação relativa ao agente do carro. A outra representação é a informação de terceira 
pessoa onde todos os objetos, incluindo agentes de carro e waypoints, são descritos no sistema de coordenadas absolutas. O 
desempenho das quatro combinações da representação de entrada e o método de geração de padrões de treinamento são 
examinados. Também discutimos o efeito de cada método no desempenho de sistemas baseados em regras fuzzy. O desempenho 
das quatro combinações da representação de entrada e o método de geração de padrões de treinamento são examinados. Também 
discutimos o efeito de cada método no desempenho de sistemas baseados em regras fuzzy. O desempenho das quatro combinações 
da representação de entrada e o método de geração de padrões de treinamento são examinados. Também discutimos o efeito de 
cada método no desempenho de sistemas baseados em regras fuzzy.
Figura 1. Instantâneo do jogo de corrida de carros.
O simulador mantém todas as informações sobre agentes de 
carros e waypoints. A simulação no jogo de corrida de carros é 
realizada em um estado contínuo em tempo discreto. Ou seja, a 
decisão dos agentes do carro é realizada de forma síncrona, e o 
próximo estado do agente do carro é calculado com base na física 
real com ruído. A simulação da corrida de carros é descrita da 
seguinte forma:
Passo 1: O jogo é inicializado. Os agentes de automóveis são colocados
em posições pré-especificadas. A velocidade dos agentes do 
carro também é definida como zero. Três waypoints são 
gerados aleatoriamente.
Passo 2: Cada agente do carro determina a direção e o
aceleração com base nas informações sensoriais, como o 
estado dos agentes do carro e a posição dos waypoints. A 
decisão determinada pelo agente do carro é enviada ao 
simulador.
Passo 3: O simulador calcula o próximo estado do carro
agentes. Se qualquer um dos agentes do carro atingir o primeiro 
waypoint, a pontuação desse agente do carro é incrementada em 
um. Se ambos os agentes de carro atingirem o primeiro waypoint 
ao mesmo tempo, a pontuação de ambos será incrementada. Se o 
primeiro waypoint for obtido por um ou ambos os agentes do 
carro, o segundo e o terceiro waypoints se tornarão o primeiro e o 
segundo waypoints, respectivamente. Um novo waypoint também 
é gerado em uma posição determinada aleatoriamente.
Etapa 4: se o número de iterações atingir um valor pré-especificado
número, encerre a simulação. Caso contrário, vá para a 
Etapa 2.
II. CRARACEGAME
A. Simulação de corrida de carros
Neste artigo, construímos sistemas fuzzy baseados em regras 
para tomada de decisão de alto nível em um jogo de corrida de 
carros desenvolvido por Togelius [29]. Esta seção explica o jogo de 
corrida de carros que usamos como domínio do problema. O 
instantâneo do jogo de corrida de carros é mostrado na Fig. 1. No 
jogo de corrida de carros, há um ou dois agentes de carros em um 
campo bidimensional. Há também três waypoints indexados no 
campo. Os índices atribuídos aos waypoints representam a ordem 
para a qual os agentes de carros devem mirar. A tarefa dos 
agentes de carros no jogo de corrida de carros é alcançar o 
waypoint na ordem crescente dos números atribuídos aos 
waypoints. Quando um ou ambos os agentes do carro atingem o 
primeiro waypoint, o primeiro waypoint desaparece. Neste caso, o 
segundo e o terceiro waypoints se tornam o primeiro e o segundo 
waypoint, respectivamente.
Um car agent é modelado como um sistema não holonômico 
que possui duas variáveis de entrada enquanto o estado do car 
agent é representado em um espaço de configuração de cinco 
dimensões. Um controlador de carro é responsável pela direção e 
aceleração para navegar no agente do carro. Com base no vetor 
de entrada e no estado atual do agente do carro, o simulador do 
jogo de corrida de carros calcula o próximo estado. O vetor de 
estado do agente carro no espaço de configuração consiste na 
posição física do agente carro em um campo bidimensional, 
direção e sua velocidade. Assume-se que a posição física e a 
velocidade do agente carro são representadas por um vetor 
euclidiano bidimensional.
Agora vamos considerar uma situação do jogo de corrida de carros na Fig. 
2. Na Fig. 2, três waypoints são mostrados com a ordem de partida. Na 
situação da Fig. 2, é difícil para o agente de carro 1 alcançar o primeiro 
waypoint antes do agente de carro 2. Assim, o agente de carro 1 deve desistir 
do primeiro waypoint e ir para o segundo waypoint para que o agente de 
carro 1 possa certamente alcançar o segundo ponto de passagem. Se o 
agente de carro 2 atingir o primeiro ponto de passagem antes do agente de 
carro 1 enquanto o agente de carro 1 atingir o segundo ponto de passagem 
antes do agente de carro 2, não haverá diferença na pontuação entre os dois 
agentes de carro. Se o agente de carro 1 atingir com sucesso o terceiro 
waypoint, a pontuação do agente de carro 1 é um ponto a mais
2300 2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008)
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
do que o Agente de carro 2 (2 para 1). Por outro lado, se o agente de 
carro 1 ainda tentar o primeiro waypoint e não conseguir pontuar, é 
possível, no pior caso, que o agente de carro 1 possa eventualmente 
não conseguir pontuar, mas, por outro lado, o agente de carro 2 
marque três. Tomemos outra situação em que o agente de carro 1 já 
tenha pontuado mais do que o agente de carro 2. Nesse caso, o agente 
de carro 1 não precisa correr para o primeiro waypoint e deve ir com 
segurança para o segundo waypoint porque existe o risco de perder 
todos os três se o agente de carro 1 visa o primeiro waypoint difícil, o 
que reduz a chance de alcançar o segundo waypoint antes do agente de 
carro 2. Assim, a seleção apropriada de waypoint é necessária para 
resultados bem-sucedidos no jogo de corrida de carros.
As informações que devem ser levadas em consideração para a 
seleção de waypoints são as pontuações atuais dos agentes de carros, a 
posição dos waypoints e a posição e velocidade dos agentes de carros. 
Neste artigo construímos sistemas baseados em regras fuzzy que 
realizam a seleção de waypoints com base em tais informações.
Fig. 3. Visão geral de um jogo de corrida de carros.
Fig. 4. Estrutura hierárquica de tomada de decisão em um controlador de carro.
Figura 2. Uma situação de exemplo do jogo de corrida de carros.
Posição do agente do carro, Velocidade 
do agente do carro, Direção do agente 
do carro, Posição do agente do carro 
oponente, Velocidade do agente do 
carro oponente, Direção do agente do 
carro oponente, Posição do primeiro 
waypoint, Posição do segundo 
waypoint , Posição do terceiro waypoint.
B. Controlador de carro
O controlador de um agente de carro determinao vetor de 
entrada (ou seja, a direção e a aceleração) para o agente de carro a 
partir do estado do carro. Ou seja, o papel do controlador é 
mapear do espaço sensorial para o espaço de controle. O 
simulador calcula o próximo estado do agente do carro, bem como 
o outro agente do carro e os waypoints, conforme descrito na 
Subseção II-A. Essa estrutura é mostrada na Fig. 3. A construção 
do controlador do carro na Fig. 3 é o foco deste artigo.
Observe que algumas partes das informações acima são 
representadas como um vetor bidimensional. Por exemplo, a 
coordenada x e a coordenada y são incluídas nas informações 
sobre a posição do agente do carro. Assim, o número máximo de 
variáveis que podem ser usadas pelos controladores do carro é 
16 ou 11, dependendo da existência do agente do carro oponente.
A ação dos agentes do carro consiste em determinar a direção e 
a aceleração. A direção especifica a direção que os agentes do 
carro devem seguir enquanto a velocidade é controlada pela 
aceleração. No jogo de corrida de carros que consideramos neste 
artigo, existem três opções para direção e aceleração. Assim, no 
total, nove ações candidatas estão disponíveis. A seleção de ação é 
realizada para selecionar uma das nove ações a cada passo de 
tempo. As oito setas na parte inferior da Fig. 4 mostram
Uma forma simples de tomada de decisão no controlador do 
carro é uma estrutura hierárquica, conforme mostrado na Fig. 4. 
Na Fig. 4, são mostrados dois níveis de tomada de decisão. Uma é 
uma tomada de decisão de alto nível, onde o waypoint para mirar 
é determinado. Por outro lado, a tomada de decisão de baixo nível 
diz respeito à ação final (ou seja, a direção e aceleração do agente 
do carro) com base na tomada de decisão de alto nível.
No jogo de corrida de carros deste artigo, as seguintes informações 
estão disponíveis para o controlador do carro:
2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008) 2301
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
as ações candidatas aos agentes do carro. A nona ação 
candidata é não acelerar sem especificação de direção. Ou 
seja, a próxima posição do agente do carro com a nona ação é 
determinada apenas pelo seu vetor de inércia atual.
III. FUZZYRULE-BASEDSSISTEMAS PARAHIGH-EUEVEL
DECISÃOMAKING
A. Visão Geral de Sistemas Baseados em Regras Fuzzy
Neste artigo, sistemas baseados em regras fuzzy são usados para a 
tomada de decisão de alto nível do controlador do carro no jogo de 
corrida de carros. Vamos supor que uma informação de entrada para o 
sistema baseado em regras fuzzy é representada como umn-vetor 
dimensional (ou seja, o valor denpode ser 16 ou 11 dependendo da 
existência do carro adversário). A saída do sistema baseado em regras 
fuzzy é a estratégia selecionada que especifica o waypoint alvo para 
mirar. Neste artigo, apenas o primeiro e o segundo waypoints são 
considerados como waypoints de destino candidatos porque o terceiro 
waypoint provavelmente não será selecionado como o waypoint de 
destino. Um sistema baseado em regras fuzzy consiste em um conjunto 
de regras fuzzy if-then da seguinte forma:
Fig. 5. Um exemplo de partição fuzzy (Devision of car racing field).
Em seguida, especificamos a estratégia consequente e o grau de 
certeza de cada regra fuzzy if-then dos padrões de treinamento dados 
como em [30]. No procedimento a seguir, assume-se que um conjunto 
de padrões de treinamento é dado para a construção de sistemas 
baseados em regras fuzzy.
RegraRj:Sex1éUMAj1e . . . exnéUMAJN
então EstratégiaCjcomFCj,
j =1, 2, . . . ,N,
(1)
[Procedimento de Geração da Regra Fuzzy Se-Então]
OndeRj,j =1, 2, . . . ,N,é o rótulo doj-a regra fuzzy ifthen,
UMAji,eu =1, 2, . . . ,né o conjunto fuzzy antecedente para
eu-º atributo,Cjé a estratégia consequente,FCjé o grau de 
certeza, eNé o número total de regras fuzzy se-então 
geradas.
Consideramos três estratégias como a estratégia conseqüente das 
regras fuzzy if-then em (1). A Tabela I mostra as três estratégias 
consequentes. Na Estratégia 1, os controladores do carro navegam o 
agente do carro até o primeiro waypoint até que um dos agentes do 
carro o alcance. A estratégia 2 é uma segunda estratégia em que o 
agente do carro efetivamente desiste do Waypoint 1 enquanto tenta 
alcançar o Waypoint 2. A estratégia 3 é a estratégia mais fraca entre as 
três. Embora as Estratégias 2 e 3 visem o Waypoint 2, a diferença entre 
elas está no prazo efetivo. A Estratégia 3 reconsidere a estratégia 
imediatamente após o agente do carro oponente atingir o Waypoint 1, 
enquanto o agente do carro consistentemente vai para o Waypoint 2 na 
Estratégia 2.
Etapa 1: Calcular βh(Rj)para Estratégiah (h =1, 2e 3) como
∑
βh(Rj) = μj1(xp1)· . . . · μJN(xpn), (2)
xp∈Classeh
onde βh(Rj)é a soma da compatibilidade dos padrões 
de treinamento com o rótulo de Estratégiahcom 
regra se-então difusaRj,e μji(·)é a função de 
pertinência do conjunto fuzzyUMAji.
Passo 2: Encontre a Estratégia ĥ que tem o valor máximo de
βh(Rj):
βĥ(Rj) = max{β1(Rj), β2(Rj), β3(Rj)}, (3)
Se o valor de βh(Rj)é o mesmo para estratégia 
múltipla, a estratégia consequenteCjda regraRj
não pode ser determinado exclusivamente. Neste caso, 
especificamosCjComoCj= φ.
Passo 3: Se uma única estratégia tomar o valor máximo (ou seja, se
Cj-= φ),deixarCjseja Estratégia ĥ e especifique o grau 
de certezaFCjComo
TABELA I
CESTRATÉGIAS SEQUENTES USADAS EM FUZZY IF-ENTÃO REGRAS.
Estratégia Ponto de referência alvo Prazo de vigência βĥ(Rj) − β̄1
2
3
1
2
2
1
2
1
FCj= , (4)
∑3
βh(Rj)
h=1
Vamos supor quempadrões de treinamentoxp
(xp1, xp2, . . . , xpn),p =1, 2, . . . ,m,são dadas com sua classe-alvotp
para a construção de um sistema baseado em regras fuzzy. 
Primeiro, a partição difusa do espaço de padrões é executada. No 
caso do domínio das corridas de carros neste artigo, dividimos 
cada atributo do vetor de entrada em cinco conjuntos fuzzy como 
mostrado na Fig. 5. Na Fig. 5, uma partição fuzzy para o caso do 
espaço de configuração bidimensional é mostrada.
= Onde 1∑
2
3
β = β (R)h j. (5)
h=1
h-=Cj
O número de regras fuzzy if-then depende do número de 
conjuntos fuzzy para cada atributo e do número de atributos de 
entrada. Por exemplo, se dividirmos cada atributo em cinco 
conjuntos fuzzy para uma classificação de padrão bidimensional
2302 2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008)
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
problema, o número total de regras difusas se-então é52=25. Por 
outro lado, o número de regras difusas se-então é58= 390625para 
um problema de oito dimensões. O número de regras fuzzy if-then 
aumenta exponencialmente quando o número de atributos de 
entrada e/ou o número de conjuntos fuzzy aumentam. Para evitar 
a explosão de regras fuzzy if-then, limitamos o número de 
conjuntos fuzzy que são usados em uma regra fuzzy if-then a 
quatro. Para cada combinação de quatro atributos de entrada, 
cinco conjuntos fuzzy são usados. Os outros atributos de entrada 
são ignorados. Usando esse truque, podemos reduzir o número de 
regras fuzzy se-então geradas para8C4×54=43750.
Para a representação em terceira pessoa, são usadas as seguintes 
informações:
coordenada x do agente do carro, coordenada 
y do agente do carro, coordenada x do agente 
do carro oponente, coordenada y do agente 
do carro oponente, coordenada x do primeiro 
waypoint, coordenada y do primeiro waypoint, 
coordenada x do segundo waypoint , 
coordenada y do segundo waypoint, 
coordenada x do terceiro waypoint, 
coordenada y do terceiro waypoint,
ângulo do agente do carro para o primeiro waypoint e ângulo do 
agente do carro oponente para o primeiro waypoint.
B. Raciocínio Difuso
Usando o procedimento de geração de regras descrito acima, 
geramos regras difusasse-então em (1). Depois tanto da 
estratégia conseqüenteCje o grau de certezaFCjsão determinados 
para todosNregras, um novo padrãoxé classificado pelo seguinte 
procedimento:
D. Gerando Padrões de Treinamento
Usar padrões de treinamento de boa qualidade é importante para a 
construção de sistemas baseados em regras fuzzy de bom desempenho, pois 
o sistema baseado em regras fuzzy se enquadra no aprendizado 
supervisionado. Como não há padrões de treinamento disponíveis de 
antemão, nós os geramos por meio de experimentos preliminares. Neste 
artigo, consideramos dois métodos para gerar padrões de treinamento. O 
primeiro método pré-especifica a posição inicial dos agentes de automóveis 
no campo das corridas de automóveis. Ou seja, os experimentos preliminares 
são realizados sob o controle
(7) configurações no primeiro método. A velocidade dos agentes do carro
[Procedimento de Raciocínio Fuzzy para Classificação] Etapa 
1: Calcular αh(x)para Estratégiah, h =1, 2e 3, como
αh(x) = max{μj(x)·FCj|Cj=Classeh}, Onde (6)
μj(x) = µj1(x1)· . . . · μJN(xn).
Etapa 2: encontrar a estratégiah′que tem o valor máximo de
αh(x):
e a posição dos waypoints são determinados aleatoriamente. 
Neste método, primeiro uma partição de grade é aplicada ao 
campo de corrida de carros para gerar subáreas. O centro do
(8) subáreas são usadas como a posição pré-especificada dos agentes de automóveis
αh′(x) = max{α1(x), α2(x), α3(x)}.
Se várias estratégias tomarem o mesmo valor máximo de 
αh(x), então a determinação da estratégia dexé rejeitado. 
Caso contrário, atribuaxpara Estratégiah′.
(ver Fig. 5). As informações sobre os agentes do carro e os waypoints são 
usadas como padrão de entrada. A partir da posição inicial, um jogo 
preliminar é realizado duas vezes. Na primeira tentativa, o agente do carro 
mira no primeiro waypoint. A segunda tentativa também começa exatamente 
com o mesmo status da primeira tentativa, mas com o segundo waypoint 
especificado como alvo. Se a primeira tentativa terminou com sucesso (ou 
seja, o agente do carro pode alcançar o primeiro waypoint antes do agente 
do carro oponente), a classe alvo do padrão de entrada é Estratégia 1. Ou 
seja, o primeiro waypoint é o alvo do agente do carro neste situação. Se a 
primeira tentativa não for bem-sucedida, mas o agente do carro puder 
alcançar o segundo waypoint antes do agente do carro oponente, a 
estratégia de destino do padrão de entrada é a Estratégia 2. Se a primeira e a 
segunda tentativa não forem bem-sucedidas, o alvo do padrão de entrada é 
especificado como Estratégia 3. Estratégia 3 significa que o agente do carro 
seleciona tentativamente a Estratégia 2 até que o primeiro waypoint seja 
obtido por qualquer um dos agentes do carro. Este processo é repetido até 
que todas as combinações das posições pré-especificadas sejam examinadas.
No segundo método, um padrão de treinamento é gerado durante o 
curso de situações de jogo preliminares não controladas. Primeiro, a 
posição dos agentes do carro e dos waypoints é especificada 
aleatoriamente. Em seguida, uma rodada preliminar do jogo é realizada 
da mesma maneira que a rodada real do jogo. Assim, espera-se que 
padrões de treinamento sejam gerados através de situações práticas do 
automobilismo. A classe alvo de cada padrão de treinamento neste 
método é determinada de acordo com os resultados das rodadas 
preliminares do jogo.
C. Representando vetores de entrada
Consideramos duas representações para vetores de entrada 
que são usados em sistemas baseados em regras fuzzy. Em 
experimentos computacionais examinamos se a representação da 
informação do sensor tem efeito sobre o desempenho de sistemas 
baseados em regras fuzzy. Uma representação é a representação 
egocêntrica e a outra é a representação em terceira pessoa. Na 
representação egocêntrica, o agente do carro oponente e os 
waypoints são descritos no sistema de coordenadas relativo ao 
agente do carro. Por outro lado, os agentes do carro e os 
waypoints são descritos no sistema de coordenadas absolutas na 
representação em terceira pessoa.
Na representação egocêntrica, são usadas as seguintes 
informações:
Distância para o primeiro waypoint, ângulo 
para o primeiro waypoint, distância para o 
segundo waypoint, ângulo para o segundo 
waypoint, distância para o terceiro waypoint, 
ângulo para o terceiro waypoint, distância para 
o agente do carro oponente, ângulo para o 
agente do carro oponente, e
ângulo do agente do carro adversário para o primeiro waypoint.
2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008) 2303
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
4. COMPUTACIONALEEXPERIMENTOS uma série de experimentos preliminares controlados. Uma vez que os outros 
três controladores têm um desempenho melhor do que o agente de carro 
oponente fixo em metade das 100 tentativas, examinamos estatisticamente a 
diferença entre os controladores baseados em regras difusas (ou seja, 
Controlador A – D) e o controlador oponente fixo pelo Mann-Whitney U teste. 
Os resultados do teste estatístico mostram que apenas o Controlador A é 
estatisticamente melhor que o controlador oponente fixo com o nível de 
significância de 5%.
A. Configurações Experimentais
Examinamos o desempenho de sistemas baseados em regras fuzzy 
para o jogo de corrida de carros nos experimentos computacionais 
deste artigo. Consideramos dois métodos de geração de dados e dois 
tipos de informações do sensor. Assim, no total, existem quatro 
controladores de alto nível do agente carro nestes experimentos 
computacionais. Resumimos os quatro controladores de alto nível na 
Tabela II. TABELA III
ERESULTADOS EXPERIMENTAIS.TABELA II
HIGH-CONTROLADORES DE NÍVEL NOS EXPERIMENTOS COMPUTACIONAIS. Controlador UMA B C D
Ganhar
Perdido
Desenhar
Valor P
60
27
13
8,81×10−5
52
34
14
0,14
52
37
11
0,18
48
44
8
0,56
Controlador Geração de padrões Sensor
UMA
B
C
D
Controlada
Descontrolado
Controlada
Descontrolado
Terceira pessoa
Terceira pessoa
Egocêntrico
Egocêntrico
V.DISCUSSÃO
Para o controle de baixo nível do agente carro (ou seja, seleção 
de ações entre as nove), usamos uma heurística simples. Na 
seleção de ação heurística, a direção é determinada para a direção 
do waypoint alvo. Por exemplo, se o waypoint alvo estiver à 
esquerda do agente do carro, a direção será determinada como 
esquerda. A aceleração é especificada de modo que a magnitude 
da velocidade seja um valor de referência pré-especificado. Por 
exemplo, se a magnitude da velocidade for menor que o valor de 
referência, uma aceleração positiva é aplicada ao agente do carro. 
O valor de referência é especificado manualmente como 7.0.
O agente de carro oponente tem exatamente o mesmo controlador de 
baixo nível que o agente de carro de aprendizado, de modo que o efeito da 
tomada de decisão de alto nível (ou seja, seleção de waypoint) no 
desempenho dos agentes de carro é claro. A tomada de decisão heurística de 
alto nível do agente do carro oponente sempre visa o primeiro waypoint em 
qualquer situação do agente do carro oponente. Cada agente de carro de 
aprendizagem jogou o jogo de corrida de carro por 100 vezes contra o agente 
de carro oponente.
Nos experimentos computacionais, primeiro uma rodada 
preliminar de jogos é realizada com as configurações controladas 
ou não controladas de experimentos preliminares para obter 
padrões de treinamento. Em seguida, um sistema baseado em 
regras fuzzy é construído de acordo com o procedimento descrito 
na Seção III. Cada atributo no sistema baseado em regras fuzzy é 
dividido em cinco subconjuntos fuzzy (veja a Fig. 5). Em seguida, o 
sistema baseado em regras fuzzy construído é usado como a 
tomada de decisão de alto nível do agente carro aprendiz na 
competição com o agente carro oponente. Observe que o agente 
do carro oponente na competição é o mesmo usado no 
procedimento de geração de padrões.Na seção anterior, examinamos o desempenho dos quatro sistemas 
baseados em regras fuzzy que são aplicados a controladores de carros. 
Também mostramos que o Controlador A na Tabela II é o melhor entre 
os quatro e estatisticamente melhor do que o controlador de carro 
oponente fixo com uma heurística simples. Como examinamos as 
quatro configurações do controlador (ou seja, dois tipos de 
informações sensoriais e geração de padrões), examinamos o efeito de 
cada uma dessas configurações do controlador separadamente nesta 
seção e discutimos a razão pela qual o Controlador A leva ao melhor 
desempenho na Seção IV.
A. Efeito da Geração de Padrão
Nesta subseção, examinamos o efeito de um método de 
geração de padrões no desempenho de controladores de carros. 
Examinamos dois métodos de geração de padrões na Seção IV. 
Um gera padrões de treinamento através de configurações 
controladas de experimentos onde uma situação inicial é 
especificada a partir da partição da grade do campo de corrida de 
carros. Por outro lado, o segundo método utiliza situações de jogo 
prático onde um padrão de treinamento é gerado a partir da 
experiência dos resultados da tomada de decisão.
A principal diferença entre os dois métodos é a frequência da 
Estratégia 3 (ou seja, ir para o segundo waypoint até que o primeiro 
waypoint seja tomado pelo agente do carro oponente). Mostramos a 
frequência de ações especificadas pelos dois sistemas baseados em 
regras fuzzy. Um sistema baseado em regras fuzzy é construído a partir 
de padrões de treinamento que são gerados a partir de experimentos 
preliminares controlados. Por outro lado, padrões de treinamento para 
o segundo sistema baseado em regras fuzzy são gerados através de 
uma série de experimentos não controlados. O agente de carro com 
cada um dos dois sistemas baseados em regras fuzzy competiu contra 
um agente de carro fixo com uma heurística simples. A frequência de 
cada estratégia nos experimentos computacionais é apresentada na 
Tabela IV.
A partir da Tabela IV, podemos ver que a Estratégia 3 foi selecionada em 
cerca de 20% da seleção de ações quando os padrões de treinamento são 
gerados através de uma série de experimentos não controlados. Como a 
Estratégia 3 não leva diretamente a uma pontuação (o agente do carro
B. Resultados Experimentais
Mostramos os resultados experimentais na Tabela III. A Tabela III mostra 
os resultados da competição contra um controlador oponente fixo com uma 
simples heurística de tomada de decisão de alto nível. A partir dos resultados 
experimentais, podemos ver que o melhor desempenho é obtido do 
Controlador A. Ou seja, sistemas baseados em regras fuzzy que usam 
informações sensoriais egocêntricas têm melhor desempenho quando os 
padrões de treinamento são gerados a partir de
2304 2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008)
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
TABELA IV
FREQUENCIA DAS AÇÕES SELECIONADAS.
Método
Rede Pré-jogo
Estratégia 1
Estratégia 2
Estratégia 3
837
824
0
530
859
328
desiste do primeiro waypoint e apenas se aproxima do segundo 
waypoint), a alta frequência da Ação 3 deteriora o desempenho dos 
agentes do carro. Por outro lado, a Ação 3 não foi selecionada quando 
os padrões de treinamento são gerados a partir de experimentos 
preliminares controlados. Ou seja, o agente de carros sempre mira em 
um determinado ponto de passagem durante o jogo de corrida de 
carros.
Fig. 6. Ações selecionadas (informações sensoriais de terceira pessoa).
TABELA V
B. Efeito da Informação Sensorial OAGENTES E ESTRATÉGIAS DE VEÍCULOS PPONENTES.
Dois tipos de informação sensorial foram usados na Seção IV. Uma 
informação sensorial é a informação egocêntrica onde os objetos no 
campo das corridas de carros são representados em relação ao próprio 
agente do carro. A outra informação sensorial contém a informação de 
terceira pessoa onde os objetos no campo de corrida de carros são 
representados usando as coordenadas absolutas. Examinamos o efeito 
da informação sensorial no desempenho do agente de corrida de 
carros nesta subseção.
A principal diferença entre os dois tipos de informação 
sensorial é se a posição do próprio agente do carro está 
incluída ou não. Ou seja, a informação está incluída na 
informação sensorial de terceira pessoa enquanto não está 
incluída na informação egocêntrica.
Na Fig. 6, mostramos as ações selecionadas pelos sistemas 
baseados em regras fuzzy com a informação de terceira pessoa 
quando apenas a posição do agente do carro é dada. As outras 
informações, como a posição dos waypoints e a posição e 
velocidade do agente do carro oponente, são removidas. 
Podemos ver na Fig. 6 que várias ações são selecionadas quando 
a informação de terceira pessoa é usada. Por outro lado, a seleção 
de ações não pode ser realizada quando informações 
egocêntricas são utilizadas em sistemas baseados em regras 
fuzzy, pois a tomada de decisão não é definida nesta situação. A 
conclusão pode ser tirada desta análise que a informação de 
terceira pessoa ajuda a realizar a tomada de decisão adequada e 
fina em comparação com a informação egocêntrica.
Agente de carro Estratégia
OpA
OpB
Sempre vá para o Waypoint 1 
Sempre vá para o Waypoint 2
os padrões de treinamento são examinados na fase de avaliação contra os 
dois agentes do carro adversário. A representação em terceira pessoa para o 
vetor de entrada foi usada no controlador do carro e os padrões de 
treinamento são gerados por meio de experimentos preliminares 
controlados.
Mostramos os resultados experimentais na Tabela VI. Na Tabela VI, os 
resultados das partidas contra os dois agentes de carros adversários (ou seja, 
OppA e OppB) são mostrados com seus valores estatísticos. Assim como na 
Subseção IV-B, o teste U de Mann-Whitney com nível de significância de 5% 
foi utilizado para avaliar o desempenho dos sistemas baseados em regras 
fuzzy.
TABELA VI
ERESULTADOS EXPERIMENTAIS COM DIFERENTES AGENTES DE CARRO OPONENTES.
Treinamento OpA OpA OpB OpB
Avaliação OpA OpB OpA OpB
Ganhar
Perdido
Desenhar
Valor P
60
27
13
8,81×10−5
38
6
56
1,93×10−4
46
46
8
0,94
85
3
12
9,88×10−16
A partir dos resultados experimentais, podemos ver que os sistemas 
baseados em regras fuzzy funcionam com sucesso quando o mesmo 
agente de carro oponente da fase de treinamento é usado na fase de 
avaliação (ver Colunas 2 e 5). Quando OppA é usado na fase de 
treinamento e OppB é usado na fase de avaliação (Coluna 3), um 
grande número de jogos resulta em empate (56 vezes em 100). Isso 
porque se a estratégia determinada pelos sistemas baseados em 
regras fuzzy for a Estratégia 2 (ou seja, ir para o Waypoint 2), nenhum 
dos dois carros do agente não irá para o Waypoint 1, o que 
eventualmente causa um deadlock.
Outra constatação é que quando o OppB é usado nas fases de 
treinamento e avaliação, os sistemas baseados em regras fuzzy têm melhor 
desempenho. Isso ocorre porque os sistemas baseados em regras fuzzy 
aprendem com sucesso a executar a Estratégia A em qualquer situação em 
que o agente oponente é OppB. Como OppB sempre vai para
C. Efeito do Agente Oponente
Nos métodos propostos, os padrões de chuva são gerados 
através de experimentos preliminares contra um oponente fixo. 
Assim, os sistemas baseados em regras fuzzy gerados são eficazes 
contra o oponente fixo. Nesta subseção, examinamos o 
desempenho dos sistemas baseados em regras fuzzy contra 
oponentes desconhecidos.
Para isso, dois agentes de carro são usados nos experimentos 
desta subseção. A Tabela V mostra os dois agentes de carros 
adversários.
Nos experimentos, primeiro geramos padrões de treinamento por 
meio de um dos dois agentes de carro. Em seguida, o desempenho de 
sistemas baseados em regras fuzzy construídos a partir das
2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008) 2305
Uso licenciado autorizado limitadoa: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
Waypoint 2, a melhor estratégia neste caso é sempre ir para o 
Waypoint 1. Nos experimentos, apenas a Estratégia 1 é 
selecionada na fase de avaliação quando OppB é utilizado na fase 
de treinamento.
[7] T. Nakashima, M. Udo e H. Ishibuchi. Um aprendizado por reforço difuso para 
um problema de interceptação de bola. páginas em CD–ROM (8 páginas), 
Pádua, Itália, 2003.
[8] T. Nakashima, M. Udo e H. Ishibuchi. Implementação de q-learning fuzzy 
para um agente de futebol. páginas 533–536, St. Louis, EUA, 2003.
[9] T. Nakashima, M. Takatani, M. Udo e H. Ishibuchi. Uma abordagem evolutiva 
para o aprendizado de estratégia no futebol robocup. páginas 2023–2028, Den 
Hague, Holanda, 2004.
[10] T. Nakashima, M. Takatani, M. Udo, H. Ishibuchi e M. Nii. Avaliação de 
desempenho de um método evolutivo para estratégias de futebol de 
robocup. páginas em CR–ROM (8 páginas), Osaka, Japão, 2005.
[11] T. Nakashima, M. Takatani, H. Ishibuchi e M. Nii. O efeito do uso do 
histórico de partidas na evolução das estratégias do time de futebol 
robocup. páginas 60–66, Reno/Lake Tahoe, Nevada, EUA, 2006.
[12] R. Leigh, SJ Louis e C. Miles. Usando um algoritmo genético para explorar algoritmos de 
busca de caminhos do tipo a*. DentroInteligência Computacional e Jogos, 2007. CIG 
2007. Simpósio IEEE sobre,páginas 72–79, 2007.
[13] C. Miles, J. Quiroz, R. Leigh e SJ Louis. Jogadores de jogos de estratégia baseados em 
árvore de mapas de influência em co-evolução. DentroInteligência Computacional e 
Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 88-95, 2007.
[14] Y. Wang e S. Gelly. Modificações de simulações uct e sequenciais 
para monte-carlo go. DentroInteligência Computacional e Jogos, 
2007. CIG 2007. Simpósio IEEE sobre,páginas 175–182, 2007.
[15] HA Mayer. Representações de tabuleiro para jogadores neurais que aprendem 
por diferença temporal. DentroInteligência Computacional e Jogos, 2007. CIG 
2007. Simpósio IEEE sobre,páginas 183-188, 2007.
[16] N. Araki, K. Yoshida, Y. Tsuruoka e J. Tsujii. Mova a previsão em 
andamento com o método de entropia máxima. DentroInteligência 
Computacional e Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 
189-195, 2007.
[17] K.-J. Kim, H. Choi e S.‑B. Cho. Híbrido de aprendizado de evolução e 
reforço para jogadores de othello. DentroInteligência Computacional e 
Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 203-209, 2007.
[18] TP Runarsson e EO Jonsson. Efeito da profundidade de busca antecipada na 
aprendizagem de funções de avaliação de posição para otelo usando 
exploração -greedy. DentroInteligência Computacional e Jogos, 2007. CIG 
2007. Simpósio IEEE sobre,páginas 210-215, 2007.
[19] LL DeLooze e J. Downey. Lances de ponte com informações imperfeitas. 
DentroInteligência Computacional e Jogos, 2007. CIG 2007. Simpósio 
IEEE sobre,páginas 368–373, 2007.
[20] DS McFarlin e PM Todd. Evoluindo um adversário melhor: Um estudo de caso em 
um castelo alemão. DentroVida Artificial, 2007. ALIFE '07. Simpósio IEEE sobre,
páginas 229–235, 2007.
[21] W.-Y. Chen e S. Payandeh. Simulador de hóquei de micro robô - design de 
mecanismo de jogo. DentroInteligência Computacional e Jogos, 2007. CIG 
2007. Simpósio IEEE sobre,páginas 9-16, 2007.
[22] A. Agapitos, J. Togelius e SM Lucas. Controladores em evolução para corridas de 
carros simuladas usando programação genética orientada a objetos. Dentro a 
9ª Conferência Anual de Computação Genética e Evolutiva, páginas 1543–1550, 
Londres, Inglaterra, 2007. ACM.
[23] J. Togelius, SM Lucas e RD Nardi.Inteligência Computacional em Jogos de 
Corrida,volume 71/2007 deEstudos em Inteligência Computacional,
páginas 39-69. Springer, Berlim/Heidelberg, junho de 2007.
[24] J. Togelius. Evolução de um neurocontrolador de arquitetura de subsunção.
J. Intel. Sistema Fuzzy,15:15–20, 2004.
[25] J. Togelius e SM Lucas. Evoluindo habilidades de corrida de carros robustas e 
especializadas. DentroComputação Evolucionária, 2006. CEC 2006. Congresso IEEE 
sobre,páginas 1187-1194, 2006.
[26] H. Marques, J. Togelius, M. Kogutowska, O. Holland e SM Lucas. Sensorless, mas 
não sem sentido: Previsão em corridas de carros evolucionárias. Dentro Vida 
Artificial, 2007. ALIFE '07. Simpósio IEEE sobre,páginas 370–377, 2007.
[27] J. Togelius, RD Nardi e SM Lucas. Tornando as corridas divertidas através da modelagem 
do jogador e da evolução da pista. DentroWorkshop da SAB sobre abordagens 
adaptativas para otimizar a satisfação do jogador.,2006.
[28] J. Togelius, R. De Nardi e SM Lucas. criação de 
conteúdo personalizado para jogos de corrida.
Inteligência e Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 252–
259, 2007.
[29] Julian Togelius.Otimização, Imitação e Inovação: Inteligência Computacional e 
Jogos.Tese de doutorado, Departamento de Ciência da Computação, 
Universidade de Essex, setembro de 2007.
[30] H. Ishibuchi, K. Nozaki e H. Tanaka. Representação distribuída de regras 
fuzzy e sua aplicação à classificação de padrões.Conjuntos e Sistemas 
Fuzzy,52:21-32, 1992.
VI. CINCLUSÃO
Neste artigo, propusemos um sistema fuzzy baseado em regras para 
tomada de decisão de alto nível para o jogo de corrida de carros. A tomada de 
decisão de baixo nível de agentes automotivos é fixada nos experimentos 
computacionais deste artigo à medida que o desempenho de sistemas 
baseados em regras fuzzy para tomada de decisão de alto nível é examinado.
Consideramos quatro sistemas baseados em regras fuzzy 
nos experimentos computacionais. A diferença entre os 
quatro sistemas baseados em regras fuzzy é o tipo de 
informação sensorial e a forma como os padrões de 
treinamento são gerados. Ou seja, usamos informações 
sensoriais egocêntricas e de terceira pessoa para a entrada de 
sistemas baseados em regras difusas. Também geramos 
padrões de treinamento para a construção de sistemas 
baseados em regras fuzzy, tanto para experimentos 
preliminares controlados quanto para uma série de 
experimentos não controlados. Os resultados de 
experimentos computacionais mostraram que informações de 
terceira pessoa devem ser usadas para tomada de decisão de 
alto nível e que padrões de treinamento devem ser gerados a 
partir de experimentos preliminares controlados onde uma 
situação inicial é gerada usando a partição de grade do campo 
de corrida. Após os experimentos computacionais,
Trabalhos futuros incluem o ajuste adaptativo de sistemas baseados 
em regras fuzzy durante o decorrer dos jogos. A implementação atual 
dos sistemas baseados em regras fuzzy considerava apenas um agente 
carro oponente fixo. Assim, não é robusto contra os diferentes tipos de 
agentes de corrida de carros. Outra direção de trabalho futuro é a 
evolução dos controladores. Os sistemas baseados em regras fuzzy que 
são construídos a partir de um determinado conjunto de padrões de 
treinamento neste artigo podem ser usados como indivíduos iniciais 
nos algoritmos evolutivos.
REFERÊNCIAS
[1] M. Recém-nascido e M. Recém-nascido.Kasparov Versus Deep Blue: O xadrez de 
computador atinge a maioridade.Springer-Verlag New York Inc (C), dezembro de 1996.
[2] H.-Y. Quek e C.‑K. Puxa. Adaptação de estratégias iteradas do dilema do 
prisioneiro por evolução e aprendizado. DentroInteligência Computacional e 
Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 40-47, 2007.
[3] DA Ashlock. Cooperação no dilema do prisioneiro em gráficos. Dentro
Inteligência Computacional e Jogos, 2007. CIG 2007. Simpósio IEEE 
sobre,páginas 48–55, 2007.
[4] A. Ghoneim, H. Abbass e M. Barlow. Compartilhamento de informações no jogo 
iterado do dilema do prisioneiro. DentroInteligência Computacional e Jogos, 
2007. CIG 2007. Simpósio IEEE sobre,páginas 56–62, 2007.
[5] M. Wittkamp, L. Barone e L. While. Uma comparação de programação 
genética e aprendizado de tabela de consulta para o jogo de spoof.
DentroInteligência Computacional e Jogos, 2007. CIG 2007. SimpósioIEEE sobre,páginas 63-71, 2007.
[6] M. Riedmiller e T. Gabel. Sobre experiências em um domínio de jogo 
complexo e competitivo: o aprendizado por reforço encontra o robocup.
DentroInteligência Computacional e Jogos, 2007. CIG 2007. Simpósio 
IEEE sobre,páginas 17–23, 2007.
Para automático
DentroComputacional
2306 2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008)
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
<<
 /ASCII85EncodePages false
 /AllowTransparency false
 /AutoPositionEPSFiles false
 /AutoRotatePages /None
 /Binding /Left
 /CalGrayProfile (None)
 /CalRGBProfile (None)
 /CalCMYKProfile (None)
 /sRGBProfile (sRGB IEC61966-2.1)
 /CannotEmbedFontPolicy /Error
 /CompatibilityLevel 1.6
 /CompressObjects /Off
 /CompressPages true
 /ConvertImagesToIndexed true
 /PassThroughJPEGImages true
 /CreateJDFFile false
 /CreateJobTicket false
 /DefaultRenderingIntent /Default
 /DetectBlends true
 /DetectCurves 0.1000
 /ColorConversionStrategy /LeaveColorUnchanged
 /DoThumbnails true
 /EmbedAllFonts true
 /EmbedOpenType false
 /ParseICCProfilesInComments true
 /EmbedJobOptions true
 /DSCReportingLevel 0
 /EmitDSCWarnings false
 /EndPage -1
 /ImageMemory 1048576
 /LockDistillerParams true
 /MaxSubsetPct 100
 /Optimize true
 /OPM 0
 /ParseDSCComments false
 /ParseDSCCommentsForDocInfo false
 /PreserveCopyPage true
 /PreserveDICMYKValues true
 /PreserveEPSInfo false
 /PreserveFlatness true
 /PreserveHalftoneInfo true
 /PreserveOPIComments false
 /PreserveOverprintSettings true
 /StartPage 1
 /SubsetFonts true
 /TransferFunctionInfo /Remove
 /UCRandBGInfo /Preserve
 /UsePrologue false
 /ColorSettingsFile ()
 /AlwaysEmbed [ true
 ]
 /NeverEmbed [ true
 ]
 /AntiAliasColorImages false
 /CropColorImages true
 /ColorImageMinResolution 36
 /ColorImageMinResolutionPolicy /Warning
 /DownsampleColorImages true
 /ColorImageDownsampleType /Bicubic
 /ColorImageResolution 300
 /ColorImageDepth -1
 /ColorImageMinDownsampleDepth 1
 /ColorImageDownsampleThreshold 2.00333
 /EncodeColorImages true
 /ColorImageFilter /DCTEncode
 /AutoFilterColorImages false
 /ColorImageAutoFilterStrategy /JPEG
 /ColorACSImageDict <<
 /QFactor 0.76
 /HSamples [2 1 1 2] /VSamples [2 1 1 2]
 >>
 /ColorImageDict <<
 /QFactor 0.76
 /HSamples [2 1 1 2] /VSamples [2 1 1 2]
 >>
 /JPEG2000ColorACSImageDict <<
 /TileWidth 256
 /TileHeight 256
 /Quality 15
 >>
 /JPEG2000ColorImageDict <<
 /TileWidth 256
 /TileHeight 256
 /Quality 15
 >>
 /AntiAliasGrayImages false
 /CropGrayImages true
 /GrayImageMinResolution 36
 /GrayImageMinResolutionPolicy /Warning
 /DownsampleGrayImages true
 /GrayImageDownsampleType /Bicubic
 /GrayImageResolution 300
 /GrayImageDepth -1
 /GrayImageMinDownsampleDepth 2
 /GrayImageDownsampleThreshold 2.00333
 /EncodeGrayImages true
 /GrayImageFilter /DCTEncode
 /AutoFilterGrayImages false
 /GrayImageAutoFilterStrategy /JPEG
 /GrayACSImageDict <<
 /QFactor 0.76
 /HSamples [2 1 1 2] /VSamples [2 1 1 2]
 >>
 /GrayImageDict <<
 /QFactor 0.76
 /HSamples [2 1 1 2] /VSamples [2 1 1 2]
 >>
 /JPEG2000GrayACSImageDict <<
 /TileWidth 256
 /TileHeight 256
 /Quality 15
 >>
 /JPEG2000GrayImageDict <<
 /TileWidth 256
 /TileHeight 256
 /Quality 15
 >>
 /AntiAliasMonoImages false
 /CropMonoImages true
 /MonoImageMinResolution 36
 /MonoImageMinResolutionPolicy /Warning
 /DownsampleMonoImages true
 /MonoImageDownsampleType /Bicubic
 /MonoImageResolution 600
 /MonoImageDepth -1
 /MonoImageDownsampleThreshold 1.00167
 /EncodeMonoImages true
 /MonoImageFilter /CCITTFaxEncode
 /MonoImageDict <<
 /K -1
 >>
 /AllowPSXObjects false
 /CheckCompliance [
 /None
 ]
 /PDFX1aCheck false
 /PDFX3Check false
 /PDFXCompliantPDFOnly false
 /PDFXNoTrimBoxError true
 /PDFXTrimBoxToMediaBoxOffset [
 0.00000
 0.00000
 0.00000
 0.00000
 ]
 /PDFXSetBleedBoxToMediaBox true
 /PDFXBleedBoxToTrimBoxOffset [
 0.00000
 0.00000
 0.00000
 0.00000
 ]
 /PDFXOutputIntentProfile (None)
 /PDFXOutputConditionIdentifier ()
 /PDFXOutputCondition ()
 /PDFXRegistryName (http://www.color.org)
 /PDFXTrapped /False
 /Description <<
 /JPN <FEFF3053306e8a2d5b9a306f300130d330b830cd30b9658766f8306e8868793a304a3088307353705237306b90693057305f00200050004400460020658766f830924f5c62103059308b3068304d306b4f7f75283057307e305930023053306e8a2d5b9a30674f5c62103057305f00200050004400460020658766f8306f0020004100630072006f0062006100740020304a30883073002000520065006100640065007200200035002e003000204ee5964d30678868793a3067304d307e30593002>
 /DEU <FEFF00560065007200770065006e00640065006e0020005300690065002000640069006500730065002000450069006e007300740065006c006c0075006e00670065006e0020007a0075006d002000450072007300740065006c006c0065006e00200076006f006e0020005000440046002d0044006f006b0075006d0065006e00740065006e002c00200075006d002000650069006e00650020007a0075007600650072006c00e40073007300690067006500200041006e007a006500690067006500200075006e00640020004100750073006700610062006500200076006f006e00200047006500730063006800e40066007400730064006f006b0075006d0065006e00740065006e0020007a0075002000650072007a00690065006c0065006e002e00200044006900650020005000440046002d0044006f006b0075006d0065006e007400650020006b00f6006e006e0065006e0020006d006900740020004100630072006f0062006100740020006f0064006500720020006d00690074002000640065006d002000520065006100640065007200200035002e003000200075006e00640020006800f600680065007200200067006500f600660066006e00650074002000770065007200640065006e002e>
 /FRA <FEFF004f007000740069006f006e00730020007000650072006d0065007400740061006e007400200064006500200063007200e900650072002000640065007300200064006f00630075006d0065006e007400730020005000440046002000700072006f00660065007300730069006f006e006e0065006c007300200066006900610062006c0065007300200070006f007500720020006c0061002000760069007300750061006c00690073006100740069006f006e0020006500740020006c00270069006d007000720065007300730069006f006e002e00200049006c002000650073007400200070006f0073007300690062006c0065002000640027006f00750076007200690072002000630065007300200064006f00630075006d0065006e007400730020005000440046002000640061006e00730020004100630072006f0062006100740020006500740020005200650061006400650072002c002000760065007200730069006f006e002000200035002e00300020006f007500200075006c007400e9007200690065007500720065002e>
 /PTB <FEFF005500740069006c0069007a006500200065007300740061007300200063006f006e00660069006700750072006100e700f5006500730020007000610072006100200063007200690061007200200064006f00630075006d0065006e0074006f0073002000500044004600200063006f006d00200075006d0061002000760069007300750061006c0069007a006100e700e3006f0020006500200069006d0070007200650073007300e3006f00200061006400650071007500610064006100730020007000610072006100200064006f00630075006d0065006e0074006f007300200063006f006d0065007200630069006100690073002e0020004f007300200064006f00630075006d0065006e0074006f0073002000500044004600200070006f00640065006d0020007300650072002000610062006500720074006f007300200063006f006d0020006f0020004100630072006f006200610074002c002000520065006100640065007200200035002e00300020006500200070006f00730074006500720069006f0072002e>
 /DAN <FEFF004200720075006700200064006900730073006500200069006e0064007300740069006c006c0069006e006700650072002000740069006c0020006100740020006f0070007200650074007400650020005000440046002d0064006f006b0075006d0065006e007400650072002c0020006400650072002000650072002000650067006e006500640065002000740069006c0020007000e5006c006900640065006c006900670020007600690073006e0069006e00670020006f00670020007500640073006b007200690076006e0069006e006700200061006600200066006f0072007200650074006e0069006e006700730064006f006b0075006d0065006e007400650072002e0020005000440046002d0064006f006b0075006d0065006e007400650072006e00650020006b0061006e002000e50062006e006500730020006d006500640020004100630072006f0062006100740020006f0067002000520065006100640065007200200035002e00300020006f00670020006e0079006500720065002e>/NLD <FEFF004700650062007200750069006b002000640065007a006500200069006e007300740065006c006c0069006e00670065006e0020006f006d0020005000440046002d0064006f00630075006d0065006e00740065006e0020007400650020006d0061006b0065006e00200064006900650020006700650073006300680069006b00740020007a0069006a006e0020006f006d0020007a0061006b0065006c0069006a006b006500200064006f00630075006d0065006e00740065006e00200062006500740072006f0075007700620061006100720020007700650065007200200074006500200067006500760065006e00200065006e0020006100660020007400650020006400720075006b006b0065006e002e0020004400650020005000440046002d0064006f00630075006d0065006e00740065006e0020006b0075006e006e0065006e00200077006f007200640065006e002000670065006f00700065006e00640020006d006500740020004100630072006f00620061007400200065006e002000520065006100640065007200200035002e003000200065006e00200068006f006700650072002e>
 /ESP <FEFF0055007300650020006500730074006100730020006f007000630069006f006e006500730020007000610072006100200063007200650061007200200064006f00630075006d0065006e0074006f0073002000500044004600200071007500650020007000650072006d006900740061006e002000760069007300750061006c0069007a006100720020006500200069006d007000720069006d0069007200200063006f007200720065006300740061006d0065006e0074006500200064006f00630075006d0065006e0074006f007300200065006d00700072006500730061007200690061006c00650073002e0020004c006f007300200064006f00630075006d0065006e0074006f00730020005000440046002000730065002000700075006500640065006e00200061006200720069007200200063006f006e0020004100630072006f00620061007400200079002000520065006100640065007200200035002e003000200079002000760065007200730069006f006e0065007300200070006f00730074006500720069006f007200650073002e>
 /SUO <FEFF004e00e4006900640065006e002000610073006500740075007300740065006e0020006100760075006c006c006100200076006f006900740020006c0075006f006400610020006a0061002000740075006c006f00730074006100610020005000440046002d0061007300690061006b00690072006a006f006a0061002c0020006a006f006900640065006e0020006500730069006b0061007400730065006c00750020006e00e400790074007400e400e40020006c0075006f00740065007400740061007600610073007400690020006c006f00700070007500740075006c006f006b00730065006e002e0020005000440046002d0061007300690061006b00690072006a0061007400200076006f0069006400610061006e0020006100760061007400610020004100630072006f006200610074002d0020006a0061002000520065006100640065007200200035002e00300020002d006f0068006a0065006c006d0061006c006c0061002000740061006900200075007500640065006d006d0061006c006c0061002000760065007200730069006f006c006c0061002e>
 /ITA <FEFF00550073006100720065002000710075006500730074006500200069006d0070006f007300740061007a0069006f006e00690020007000650072002000630072006500610072006500200064006f00630075006d0065006e007400690020005000440046002000610064006100740074006900200070006500720020006c00610020007300740061006d00700061002000650020006c0061002000760069007300750061006c0069007a007a0061007a0069006f006e006500200064006900200064006f00630075006d0065006e0074006900200061007a00690065006e00640061006c0069002e0020004900200064006f00630075006d0065006e00740069002000500044004600200070006f00730073006f006e006f0020006500730073006500720065002000610070006500720074006900200063006f006e0020004100630072006f00620061007400200065002000520065006100640065007200200035002e003000200065002000760065007200730069006f006e006900200073007500630063006500730073006900760065002e>
 /NOR <FEFF004200720075006b00200064006900730073006500200069006e006e007300740069006c006c0069006e00670065006e0065002000740069006c002000e50020006f00700070007200650074007400650020005000440046002d0064006f006b0075006d0065006e00740065007200200073006f006d002000700061007300730065007200200066006f00720020007000e5006c006900740065006c006900670020007600690073006e0069006e00670020006f00670020007500740073006b007200690066007400200061007600200066006f0072007200650074006e0069006e006700730064006f006b0075006d0065006e007400650072002e0020005000440046002d0064006f006b0075006d0065006e00740065006e00650020006b0061006e002000e50070006e006500730020006d006500640020004100630072006f0062006100740020006f0067002000520065006100640065007200200035002e00300020006f0067002000730065006e006500720065002e>
 /SVE <FEFF0041006e007600e4006e00640020006400650020006800e4007200200069006e0073007400e4006c006c006e0069006e006700610072006e00610020006e00e40072002000640075002000760069006c006c00200073006b0061007000610020005000440046002d0064006f006b0075006d0065006e007400200073006f006d00200070006100730073006100720020006600f600720020007000e5006c00690074006c006900670020007600690073006e0069006e00670020006f006300680020007500740073006b0072006900660074002000610076002000610066006600e4007200730064006f006b0075006d0065006e0074002e0020005000440046002d0064006f006b0075006d0065006e00740065006e0020006b0061006e002000f600700070006e006100730020006d006500640020004100630072006f0062006100740020006f00630068002000520065006100640065007200200035002e003000200065006c006c00650072002000730065006e006100720065002e>
 /ENU (Use these settings with Distiller 7.0 or equivalent to create PDF documents suitable for IEEE Xplore. Created 29 November 2005. ****Preliminary version. NOT FOR GENERAL RELEASE***)
 >>
>> setdistillerparams
<<
 /HWResolution [600 600]
 /PageSize [612.000 792.000]
>> setpagedevice

Outros materiais