ok-A STUDY ON CONSTRUCTING FUZZY SYSTEMS en pt

•

UFRGS

Wagner Cunha

07/06/2023

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Instrumentação

3.680 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Um estudo sobre a construção de sistemas fuzzy
para tomada de decisão de alto nível em um jogo de corrida de carros
Seiya Fujii,Membro estudante, IEEE,Tomoharu Nakashima,Membro, IEEE,e Hisao Ishibuchi,Membro, IEEE
Abstrato-Neste artigo, examinamos o desempenho de sistemas baseados
em regras fuzzy em um domínio de corrida de carros. Sistemas baseados em
regras fuzzy são usados para tomada de decisão de alto nível de um agente
de automóveis. Examinamos dois métodos que geram um conjunto de
padrões de treinamento para a construção de sistemas baseados em regras
fuzzy. Também examinamos o efeito da informação sensorial na tomada de
decisão de alto nível.
O desempenho de quatro tipos de sistemas baseados em regras
fuzzy é comparado em uma série de experimentos computacionais. A
análise do uso de diferentes tipos de informações sensoriais e
diferentes métodos para geração de padrões de treinamento também é
realizada.
propõe um método coevolutivo para adquirir o comportamento
dos agentes para o jogo.
Um grande número de métodos de inteligência computacional
também foi proposto para jogos clássicos como go [14], [15], [16],
othello [17], [18] e contract bridge[19]. Por outro lado, jogadores
adversários para videogames são desenvolvidos por McFarlin e
Todd [20]. Chen et al.[21] desenvolveram um simulador de um
jogo de hóquei para que possam examinar o desempenho de seu
método de inteligência computacional para robôs de hóquei reais.
Dentre esses jogos, um jogo de corrida de carros é uma das áreas em crescimento como
domínio de aplicação da inteligência computacional. Por exemplo, Agapitos et al.[22]
examina o desempenho de redes neurais e programação genética para o jogo de corrida de
carros. Togelius e Lucas [23] investigam detalhadamente o desempenho de controladores de
carros com diferentes arquiteturas e diferentes tipos de informações sensoriais. Além disso,
Togelius [24] examinou o desempenho de vários métodos evolutivos para o aprendizado
automático de controladores de carros. Eles também investigaram o efeito das funções de
fitness no desempenho de controladores de carros no aprendizado padrão e coevolutivo.
Controladores de carros especializados para uma determinada pista de corrida são
adquiridos por inclinação evolutiva em [25]. Informações sensoriais de controladores de
carros são previstas por redes neurais em [26]. As pistas de corrida também são obtidas por
aprendizado evolutivo para que os jogadores humanos no jogo de corrida de carros sintam
as pistas desafiadoras e atraentes em [27], [28]. Recentemente, um novo formato de jogo de
corrida de carros foi proposto em [29] onde vários agentes de carros competem entre si por
waypoints em um campo de corrida. Os waypoints no jogo de corrida de carros são rotulados
com um número que representa a ordem para mirar. Neste artigo, aplicamos técnicas de
inteligência computacional a esse tipo de jogo de corrida de carros com waypoints
ordenados. Os waypoints no jogo de corrida de carros são rotulados com um número que
representa a ordem para mirar. Neste artigo, aplicamos técnicas de inteligência
computacional a esse tipo de jogo de corrida de carros com waypoints ordenados. Os
waypoints no jogo de corrida de carros são rotulados com um número que representa a
ordem para mirar. Neste artigo, aplicamos técnicas de inteligência computacional a esse tipo
de jogo de corrida de carros com waypoints ordenados.
Uma das estratégias mais simples para o jogo de corrida de carros
com waypoints ordenados é apenas mirar no primeiro waypoint. No
entanto, existem muitos casos em que o agente do carro não consegue
alcançar o primeiro waypoint antes de seu oponente. Por exemplo, se o
agente do carro estiver longe do primeiro waypoint e o oponente
estiver perto dele, será difícil para o agente do carro alcançar o
primeiro waypoint antes do oponente. Nesta situação, o agente do
carro deve desistir do primeiro waypoint e ir para o segundo waypoint.
Assim, uma boa estratégia de seleção de waypoints é necessária para
que um agente de carros seja competitivo contra os agentes de carros
adversários.
Neste artigo, propomos sistemas baseados em regras fuzzy para a tomada
de decisão do agente de carros no domínio das corridas de carros com
waypoints ordenados. No sistema baseado em regras fuzzy, o
eu. euNTRODUÇÃO
S A aplicação bem-sucedida de técnicas de inteligência artificial em jogos tem sido feita principalmente para jogos de tabuleiro. Por
exemplo, para o jogo de xadrez Deep Blue [1] venceu o campeão
mundial humano em 1997. O algoritmo implementado no Deep Blue é
uma técnica de força bruta onde um sistema de máquina paralela de 30
nós foi usado para procurar o melhor lance que vence o jogador
adversário. Recentemente a aplicação de técnicas de inteligência
computacional a jogos é uma das áreas mais ativas na comunidade de
inteligência computacional. Por exemplo, Quek et al.[2] investiga a
diferença no desempenho entre aprendizagem evolutiva e incremental
no contexto do dilema dos prisioneiros iterados (IPD). A cooperação
entre jogadores é desenvolvida em Ashlock [3] onde os jogadores são
colocados em nós dos chamados grafos combinatórios. Ghoneim et ai.
[4] também investiga o efeito do compartilhamento de informações
entre jogadores na evolução do comportamento dos jogadores.
Wittkamp [5] compara o desempenho de estratégias obtidas por
programação genética com aquelas representadas por uma tabela
heurística para Spoof, que é semelhante ao IPD.
A inteligência computacional também foi aplicada ao domínio
do futebol RoboCup. Riedmiller et al.[6] propõe um método de
aprendizado por reforço baseado em redes neurais artificiais para
habilidades de baixo nível e também para cooperação entre
jogadores. Nakashima et al.[7], [8] propõem um método de
aprendizado por reforço difuso para interceptar uma bola
chutada. Eles também propuseram um método evolutivo que
obtém automaticamente uma estratégia ofensiva contra uma
equipe adversária fixa [9], [10], [11].
Leigh et al.[12] propõe um método tipo A* para planejamento
de rotas em seu jogo original Lagoon. Miles et al.[13] Além disso
Seiya
( nakashi@cs.osakafu-u.ac.jp ) e Hisao Ishibuchi ( hisaoi@cs.osakafuu.ac.jp )
estão no Departamento de Ciência da Computação e Sistemas Inteligentes,
Universidade da Prefeitura de Osaka, Gakuen-cho 1-1, Naka-ku, Sakai, Osaka
599-8531, Japão.
Fujii ( fujii@ci.cs.osakafu-u.ac.jp ), Tomoharu Nakashima
2299
978-1-4244-1819-0/08/$25,00©c 2008 IEEE
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
Traduzido do Inglês para o Português - www.onlinedoctranslator.com
https://www.onlinedoctranslator.com/pt/?utm_source=onlinedoctranslator&utm_medium=pdf&utm_campaign=attribution
a informação sensorial do agente do carro é usada como entrada do sistema baseado em regras fuzzy. Como nossos sistemas
baseados em regras fuzzy são categorizados como aprendizado supervisionado, um conjunto de padrões de treinamento com sinais
alvo conhecidos é necessário para construir um sistema baseado em regras fuzzy. No entanto, nenhum padrão de treinamento está
disponível na construção de sistemas baseados em regras fuzzy. Assim, eles devem ser gerados através de uma série de
experimentos preliminares para acumular a experiência do agente do carro sobre o jogo. Consideramos dois métodos para gerar
padrões de treinamento. Enquanto ambos os métodos geram padrões de treinamento a partir de uma série de experimentos
preliminares, um método gera um padrão de treinamento a partir de uma posição pré-especificada dos agentes do carro e pontos
de referência. Por outro lado, o outro método gera padrões de treinamento através de uma situação prática do jogo de corrida onde
os waypoints são gerados aleatoriamente. Consideramos duas representações do vetor de entrada para sistemas baseados emregras fuzzy. Uma é a informação egocêntrica onde o oponente e os waypoints são representados por uma informação relativa ao
agente do carro. A outra representação é a informação de terceira pessoa onde todos os objetos, incluindo agentes de carro e
waypoints, são descritos no sistema de coordenadas absolutas. O desempenho das quatro combinações da representação de
entrada e o método de geração de padrões de treinamento são examinados. Também discutimos o efeito de cada método no
desempenho de sistemas baseados em regras fuzzy. Uma é a informação egocêntrica onde o oponente e os waypoints são
representados por uma informação relativa ao agente do carro. A outra representação é a informação de terceira pessoa onde todos
os objetos, incluindo agentes de carro e waypoints, são descritos no sistema de coordenadas absolutas. O desempenho das quatro
combinações da representação de entrada e o método de geração de padrões de treinamento são examinados. Também discutimos
o efeito de cada método no desempenho de sistemas baseados em regras fuzzy. Uma é a informação egocêntrica onde o oponente e
os waypoints são representados por uma informação relativa ao agente do carro. A outra representação é a informação de terceira
pessoa onde todos os objetos, incluindo agentes de carro e waypoints, são descritos no sistema de coordenadas absolutas. O
desempenho das quatro combinações da representação de entrada e o método de geração de padrões de treinamento são
examinados. Também discutimos o efeito de cada método no desempenho de sistemas baseados em regras fuzzy. O desempenho
das quatro combinações da representação de entrada e o método de geração de padrões de treinamento são examinados. Também
discutimos o efeito de cada método no desempenho de sistemas baseados em regras fuzzy. O desempenho das quatro combinações
da representação de entrada e o método de geração de padrões de treinamento são examinados. Também discutimos o efeito de
cada método no desempenho de sistemas baseados em regras fuzzy.
Figura 1. Instantâneo do jogo de corrida de carros.
O simulador mantém todas as informações sobre agentes de
carros e waypoints. A simulação no jogo de corrida de carros é
realizada em um estado contínuo em tempo discreto. Ou seja, a
decisão dos agentes do carro é realizada de forma síncrona, e o
próximo estado do agente do carro é calculado com base na física
real com ruído. A simulação da corrida de carros é descrita da
seguinte forma:
Passo 1: O jogo é inicializado. Os agentes de automóveis são colocados
em posições pré-especificadas. A velocidade dos agentes do
carro também é definida como zero. Três waypoints são
gerados aleatoriamente.
Passo 2: Cada agente do carro determina a direção e o
aceleração com base nas informações sensoriais, como o
estado dos agentes do carro e a posição dos waypoints. A
decisão determinada pelo agente do carro é enviada ao
simulador.
Passo 3: O simulador calcula o próximo estado do carro
agentes. Se qualquer um dos agentes do carro atingir o primeiro
waypoint, a pontuação desse agente do carro é incrementada em
um. Se ambos os agentes de carro atingirem o primeiro waypoint
ao mesmo tempo, a pontuação de ambos será incrementada. Se o
primeiro waypoint for obtido por um ou ambos os agentes do
carro, o segundo e o terceiro waypoints se tornarão o primeiro e o
segundo waypoints, respectivamente. Um novo waypoint também
é gerado em uma posição determinada aleatoriamente.
Etapa 4: se o número de iterações atingir um valor pré-especificado
número, encerre a simulação. Caso contrário, vá para a
Etapa 2.
II. CRARACEGAME
A. Simulação de corrida de carros
Neste artigo, construímos sistemas fuzzy baseados em regras
para tomada de decisão de alto nível em um jogo de corrida de
carros desenvolvido por Togelius [29]. Esta seção explica o jogo de
corrida de carros que usamos como domínio do problema. O
instantâneo do jogo de corrida de carros é mostrado na Fig. 1. No
jogo de corrida de carros, há um ou dois agentes de carros em um
campo bidimensional. Há também três waypoints indexados no
campo. Os índices atribuídos aos waypoints representam a ordem
para a qual os agentes de carros devem mirar. A tarefa dos
agentes de carros no jogo de corrida de carros é alcançar o
waypoint na ordem crescente dos números atribuídos aos
waypoints. Quando um ou ambos os agentes do carro atingem o
primeiro waypoint, o primeiro waypoint desaparece. Neste caso, o
segundo e o terceiro waypoints se tornam o primeiro e o segundo
waypoint, respectivamente.
Um car agent é modelado como um sistema não holonômico
que possui duas variáveis de entrada enquanto o estado do car
agent é representado em um espaço de configuração de cinco
dimensões. Um controlador de carro é responsável pela direção e
aceleração para navegar no agente do carro. Com base no vetor
de entrada e no estado atual do agente do carro, o simulador do
jogo de corrida de carros calcula o próximo estado. O vetor de
estado do agente carro no espaço de configuração consiste na
posição física do agente carro em um campo bidimensional,
direção e sua velocidade. Assume-se que a posição física e a
velocidade do agente carro são representadas por um vetor
euclidiano bidimensional.
Agora vamos considerar uma situação do jogo de corrida de carros na Fig.
2. Na Fig. 2, três waypoints são mostrados com a ordem de partida. Na
situação da Fig. 2, é difícil para o agente de carro 1 alcançar o primeiro
waypoint antes do agente de carro 2. Assim, o agente de carro 1 deve desistir
do primeiro waypoint e ir para o segundo waypoint para que o agente de
carro 1 possa certamente alcançar o segundo ponto de passagem. Se o
agente de carro 2 atingir o primeiro ponto de passagem antes do agente de
carro 1 enquanto o agente de carro 1 atingir o segundo ponto de passagem
antes do agente de carro 2, não haverá diferença na pontuação entre os dois
agentes de carro. Se o agente de carro 1 atingir com sucesso o terceiro
waypoint, a pontuação do agente de carro 1 é um ponto a mais
2300 2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008)
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
do que o Agente de carro 2 (2 para 1). Por outro lado, se o agente de
carro 1 ainda tentar o primeiro waypoint e não conseguir pontuar, é
possível, no pior caso, que o agente de carro 1 possa eventualmente
não conseguir pontuar, mas, por outro lado, o agente de carro 2
marque três. Tomemos outra situação em que o agente de carro 1 já
tenha pontuado mais do que o agente de carro 2. Nesse caso, o agente
de carro 1 não precisa correr para o primeiro waypoint e deve ir com
segurança para o segundo waypoint porque existe o risco de perder
todos os três se o agente de carro 1 visa o primeiro waypoint difícil, o
que reduz a chance de alcançar o segundo waypoint antes do agente de
carro 2. Assim, a seleção apropriada de waypoint é necessária para
resultados bem-sucedidos no jogo de corrida de carros.
As informações que devem ser levadas em consideração para a
seleção de waypoints são as pontuações atuais dos agentes de carros, a
posição dos waypoints e a posição e velocidade dos agentes de carros.
Neste artigo construímos sistemas baseados em regras fuzzy que
realizam a seleção de waypoints com base em tais informações.
Fig. 3. Visão geral de um jogo de corrida de carros.
Fig. 4. Estrutura hierárquica de tomada de decisão em um controlador de carro.
Figura 2. Uma situação de exemplo do jogo de corrida de carros.
Posição do agente do carro, Velocidade
do agente do carro, Direção do agente
do carro, Posição do agente do carro
oponente, Velocidade do agente do
carro oponente, Direção do agente do
carro oponente, Posição do primeiro
waypoint, Posição do segundo
waypoint , Posição do terceiro waypoint.
B. Controlador de carro
O controlador de um agente de carro determinao vetor de
entrada (ou seja, a direção e a aceleração) para o agente de carro a
partir do estado do carro. Ou seja, o papel do controlador é
mapear do espaço sensorial para o espaço de controle. O
simulador calcula o próximo estado do agente do carro, bem como
o outro agente do carro e os waypoints, conforme descrito na
Subseção II-A. Essa estrutura é mostrada na Fig. 3. A construção
do controlador do carro na Fig. 3 é o foco deste artigo.
Observe que algumas partes das informações acima são
representadas como um vetor bidimensional. Por exemplo, a
coordenada x e a coordenada y são incluídas nas informações
sobre a posição do agente do carro. Assim, o número máximo de
variáveis que podem ser usadas pelos controladores do carro é
16 ou 11, dependendo da existência do agente do carro oponente.
A ação dos agentes do carro consiste em determinar a direção e
a aceleração. A direção especifica a direção que os agentes do
carro devem seguir enquanto a velocidade é controlada pela
aceleração. No jogo de corrida de carros que consideramos neste
artigo, existem três opções para direção e aceleração. Assim, no
total, nove ações candidatas estão disponíveis. A seleção de ação é
realizada para selecionar uma das nove ações a cada passo de
tempo. As oito setas na parte inferior da Fig. 4 mostram
Uma forma simples de tomada de decisão no controlador do
carro é uma estrutura hierárquica, conforme mostrado na Fig. 4.
Na Fig. 4, são mostrados dois níveis de tomada de decisão. Uma é
uma tomada de decisão de alto nível, onde o waypoint para mirar
é determinado. Por outro lado, a tomada de decisão de baixo nível
diz respeito à ação final (ou seja, a direção e aceleração do agente
do carro) com base na tomada de decisão de alto nível.
No jogo de corrida de carros deste artigo, as seguintes informações
estão disponíveis para o controlador do carro:
2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008) 2301
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
as ações candidatas aos agentes do carro. A nona ação
candidata é não acelerar sem especificação de direção. Ou
seja, a próxima posição do agente do carro com a nona ação é
determinada apenas pelo seu vetor de inércia atual.
III. FUZZYRULE-BASEDSSISTEMAS PARAHIGH-EUEVEL
DECISÃOMAKING
A. Visão Geral de Sistemas Baseados em Regras Fuzzy
Neste artigo, sistemas baseados em regras fuzzy são usados para a
tomada de decisão de alto nível do controlador do carro no jogo de
corrida de carros. Vamos supor que uma informação de entrada para o
sistema baseado em regras fuzzy é representada como umn-vetor
dimensional (ou seja, o valor denpode ser 16 ou 11 dependendo da
existência do carro adversário). A saída do sistema baseado em regras
fuzzy é a estratégia selecionada que especifica o waypoint alvo para
mirar. Neste artigo, apenas o primeiro e o segundo waypoints são
considerados como waypoints de destino candidatos porque o terceiro
waypoint provavelmente não será selecionado como o waypoint de
destino. Um sistema baseado em regras fuzzy consiste em um conjunto
de regras fuzzy if-then da seguinte forma:
Fig. 5. Um exemplo de partição fuzzy (Devision of car racing field).
Em seguida, especificamos a estratégia consequente e o grau de
certeza de cada regra fuzzy if-then dos padrões de treinamento dados
como em [30]. No procedimento a seguir, assume-se que um conjunto
de padrões de treinamento é dado para a construção de sistemas
baseados em regras fuzzy.
RegraRj:Sex1éUMAj1e . . . exnéUMAJN
então EstratégiaCjcomFCj,
j =1, 2, . . . ,N,
(1)
[Procedimento de Geração da Regra Fuzzy Se-Então]
OndeRj,j =1, 2, . . . ,N,é o rótulo doj-a regra fuzzy ifthen,
UMAji,eu =1, 2, . . . ,né o conjunto fuzzy antecedente para
eu-º atributo,Cjé a estratégia consequente,FCjé o grau de
certeza, eNé o número total de regras fuzzy se-então
geradas.
Consideramos três estratégias como a estratégia conseqüente das
regras fuzzy if-then em (1). A Tabela I mostra as três estratégias
consequentes. Na Estratégia 1, os controladores do carro navegam o
agente do carro até o primeiro waypoint até que um dos agentes do
carro o alcance. A estratégia 2 é uma segunda estratégia em que o
agente do carro efetivamente desiste do Waypoint 1 enquanto tenta
alcançar o Waypoint 2. A estratégia 3 é a estratégia mais fraca entre as
três. Embora as Estratégias 2 e 3 visem o Waypoint 2, a diferença entre
elas está no prazo efetivo. A Estratégia 3 reconsidere a estratégia
imediatamente após o agente do carro oponente atingir o Waypoint 1,
enquanto o agente do carro consistentemente vai para o Waypoint 2 na
Estratégia 2.
Etapa 1: Calcular βh(Rj)para Estratégiah (h =1, 2e 3) como
∑
βh(Rj) = μj1(xp1)· . . . · μJN(xpn), (2)
xp∈Classeh
onde βh(Rj)é a soma da compatibilidade dos padrões
de treinamento com o rótulo de Estratégiahcom
regra se-então difusaRj,e μji(·)é a função de
pertinência do conjunto fuzzyUMAji.
Passo 2: Encontre a Estratégia ĥ que tem o valor máximo de
βh(Rj):
βĥ(Rj) = max{β1(Rj), β2(Rj), β3(Rj)}, (3)
Se o valor de βh(Rj)é o mesmo para estratégia
múltipla, a estratégia consequenteCjda regraRj
não pode ser determinado exclusivamente. Neste caso,
especificamosCjComoCj= φ.
Passo 3: Se uma única estratégia tomar o valor máximo (ou seja, se
Cj-= φ),deixarCjseja Estratégia ĥ e especifique o grau
de certezaFCjComo
TABELA I
CESTRATÉGIAS SEQUENTES USADAS EM FUZZY IF-ENTÃO REGRAS.
Estratégia Ponto de referência alvo Prazo de vigência βĥ(Rj) − β̄1
2
3
1
2
2
1
2
1
FCj= , (4)
∑3
βh(Rj)
h=1
Vamos supor quempadrões de treinamentoxp
(xp1, xp2, . . . , xpn),p =1, 2, . . . ,m,são dadas com sua classe-alvotp
para a construção de um sistema baseado em regras fuzzy.
Primeiro, a partição difusa do espaço de padrões é executada. No
caso do domínio das corridas de carros neste artigo, dividimos
cada atributo do vetor de entrada em cinco conjuntos fuzzy como
mostrado na Fig. 5. Na Fig. 5, uma partição fuzzy para o caso do
espaço de configuração bidimensional é mostrada.
= Onde 1∑
2
3
β = β (R)h j. (5)
h=1
h-=Cj
O número de regras fuzzy if-then depende do número de
conjuntos fuzzy para cada atributo e do número de atributos de
entrada. Por exemplo, se dividirmos cada atributo em cinco
conjuntos fuzzy para uma classificação de padrão bidimensional
2302 2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008)
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
problema, o número total de regras difusas se-então é52=25. Por
outro lado, o número de regras difusas se-então é58= 390625para
um problema de oito dimensões. O número de regras fuzzy if-then
aumenta exponencialmente quando o número de atributos de
entrada e/ou o número de conjuntos fuzzy aumentam. Para evitar
a explosão de regras fuzzy if-then, limitamos o número de
conjuntos fuzzy que são usados em uma regra fuzzy if-then a
quatro. Para cada combinação de quatro atributos de entrada,
cinco conjuntos fuzzy são usados. Os outros atributos de entrada
são ignorados. Usando esse truque, podemos reduzir o número de
regras fuzzy se-então geradas para8C4×54=43750.
Para a representação em terceira pessoa, são usadas as seguintes
informações:
coordenada x do agente do carro, coordenada
y do agente do carro, coordenada x do agente
do carro oponente, coordenada y do agente
do carro oponente, coordenada x do primeiro
waypoint, coordenada y do primeiro waypoint,
coordenada x do segundo waypoint ,
coordenada y do segundo waypoint,
coordenada x do terceiro waypoint,
coordenada y do terceiro waypoint,
ângulo do agente do carro para o primeiro waypoint e ângulo do
agente do carro oponente para o primeiro waypoint.
B. Raciocínio Difuso
Usando o procedimento de geração de regras descrito acima,
geramos regras difusasse-então em (1). Depois tanto da
estratégia conseqüenteCje o grau de certezaFCjsão determinados
para todosNregras, um novo padrãoxé classificado pelo seguinte
procedimento:
D. Gerando Padrões de Treinamento
Usar padrões de treinamento de boa qualidade é importante para a
construção de sistemas baseados em regras fuzzy de bom desempenho, pois
o sistema baseado em regras fuzzy se enquadra no aprendizado
supervisionado. Como não há padrões de treinamento disponíveis de
antemão, nós os geramos por meio de experimentos preliminares. Neste
artigo, consideramos dois métodos para gerar padrões de treinamento. O
primeiro método pré-especifica a posição inicial dos agentes de automóveis
no campo das corridas de automóveis. Ou seja, os experimentos preliminares
são realizados sob o controle
(7) configurações no primeiro método. A velocidade dos agentes do carro
[Procedimento de Raciocínio Fuzzy para Classificação] Etapa
1: Calcular αh(x)para Estratégiah, h =1, 2e 3, como
αh(x) = max{μj(x)·FCj|Cj=Classeh}, Onde (6)
μj(x) = µj1(x1)· . . . · μJN(xn).
Etapa 2: encontrar a estratégiah′que tem o valor máximo de
αh(x):
e a posição dos waypoints são determinados aleatoriamente.
Neste método, primeiro uma partição de grade é aplicada ao
campo de corrida de carros para gerar subáreas. O centro do
(8) subáreas são usadas como a posição pré-especificada dos agentes de automóveis
αh′(x) = max{α1(x), α2(x), α3(x)}.
Se várias estratégias tomarem o mesmo valor máximo de
αh(x), então a determinação da estratégia dexé rejeitado.
Caso contrário, atribuaxpara Estratégiah′.
(ver Fig. 5). As informações sobre os agentes do carro e os waypoints são
usadas como padrão de entrada. A partir da posição inicial, um jogo
preliminar é realizado duas vezes. Na primeira tentativa, o agente do carro
mira no primeiro waypoint. A segunda tentativa também começa exatamente
com o mesmo status da primeira tentativa, mas com o segundo waypoint
especificado como alvo. Se a primeira tentativa terminou com sucesso (ou
seja, o agente do carro pode alcançar o primeiro waypoint antes do agente
do carro oponente), a classe alvo do padrão de entrada é Estratégia 1. Ou
seja, o primeiro waypoint é o alvo do agente do carro neste situação. Se a
primeira tentativa não for bem-sucedida, mas o agente do carro puder
alcançar o segundo waypoint antes do agente do carro oponente, a
estratégia de destino do padrão de entrada é a Estratégia 2. Se a primeira e a
segunda tentativa não forem bem-sucedidas, o alvo do padrão de entrada é
especificado como Estratégia 3. Estratégia 3 significa que o agente do carro
seleciona tentativamente a Estratégia 2 até que o primeiro waypoint seja
obtido por qualquer um dos agentes do carro. Este processo é repetido até
que todas as combinações das posições pré-especificadas sejam examinadas.
No segundo método, um padrão de treinamento é gerado durante o
curso de situações de jogo preliminares não controladas. Primeiro, a
posição dos agentes do carro e dos waypoints é especificada
aleatoriamente. Em seguida, uma rodada preliminar do jogo é realizada
da mesma maneira que a rodada real do jogo. Assim, espera-se que
padrões de treinamento sejam gerados através de situações práticas do
automobilismo. A classe alvo de cada padrão de treinamento neste
método é determinada de acordo com os resultados das rodadas
preliminares do jogo.
C. Representando vetores de entrada
Consideramos duas representações para vetores de entrada
que são usados em sistemas baseados em regras fuzzy. Em
experimentos computacionais examinamos se a representação da
informação do sensor tem efeito sobre o desempenho de sistemas
baseados em regras fuzzy. Uma representação é a representação
egocêntrica e a outra é a representação em terceira pessoa. Na
representação egocêntrica, o agente do carro oponente e os
waypoints são descritos no sistema de coordenadas relativo ao
agente do carro. Por outro lado, os agentes do carro e os
waypoints são descritos no sistema de coordenadas absolutas na
representação em terceira pessoa.
Na representação egocêntrica, são usadas as seguintes
informações:
Distância para o primeiro waypoint, ângulo
para o primeiro waypoint, distância para o
segundo waypoint, ângulo para o segundo
waypoint, distância para o terceiro waypoint,
ângulo para o terceiro waypoint, distância para
o agente do carro oponente, ângulo para o
agente do carro oponente, e
ângulo do agente do carro adversário para o primeiro waypoint.
2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008) 2303
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
4. COMPUTACIONALEEXPERIMENTOS uma série de experimentos preliminares controlados. Uma vez que os outros
três controladores têm um desempenho melhor do que o agente de carro
oponente fixo em metade das 100 tentativas, examinamos estatisticamente a
diferença entre os controladores baseados em regras difusas (ou seja,
Controlador A – D) e o controlador oponente fixo pelo Mann-Whitney U teste.
Os resultados do teste estatístico mostram que apenas o Controlador A é
estatisticamente melhor que o controlador oponente fixo com o nível de
significância de 5%.
A. Configurações Experimentais
Examinamos o desempenho de sistemas baseados em regras fuzzy
para o jogo de corrida de carros nos experimentos computacionais
deste artigo. Consideramos dois métodos de geração de dados e dois
tipos de informações do sensor. Assim, no total, existem quatro
controladores de alto nível do agente carro nestes experimentos
computacionais. Resumimos os quatro controladores de alto nível na
Tabela II. TABELA III
ERESULTADOS EXPERIMENTAIS.TABELA II
HIGH-CONTROLADORES DE NÍVEL NOS EXPERIMENTOS COMPUTACIONAIS. Controlador UMA B C D
Ganhar
Perdido
Desenhar
Valor P
60
27
13
8,81×10−5
52
34
14
0,14
52
37
11
0,18
48
44
8
0,56
Controlador Geração de padrões Sensor
UMA
B
C
D
Controlada
Descontrolado
Controlada
Descontrolado
Terceira pessoa
Terceira pessoa
Egocêntrico
Egocêntrico
V.DISCUSSÃO
Para o controle de baixo nível do agente carro (ou seja, seleção
de ações entre as nove), usamos uma heurística simples. Na
seleção de ação heurística, a direção é determinada para a direção
do waypoint alvo. Por exemplo, se o waypoint alvo estiver à
esquerda do agente do carro, a direção será determinada como
esquerda. A aceleração é especificada de modo que a magnitude
da velocidade seja um valor de referência pré-especificado. Por
exemplo, se a magnitude da velocidade for menor que o valor de
referência, uma aceleração positiva é aplicada ao agente do carro.
O valor de referência é especificado manualmente como 7.0.
O agente de carro oponente tem exatamente o mesmo controlador de
baixo nível que o agente de carro de aprendizado, de modo que o efeito da
tomada de decisão de alto nível (ou seja, seleção de waypoint) no
desempenho dos agentes de carro é claro. A tomada de decisão heurística de
alto nível do agente do carro oponente sempre visa o primeiro waypoint em
qualquer situação do agente do carro oponente. Cada agente de carro de
aprendizagem jogou o jogo de corrida de carro por 100 vezes contra o agente
de carro oponente.
Nos experimentos computacionais, primeiro uma rodada
preliminar de jogos é realizada com as configurações controladas
ou não controladas de experimentos preliminares para obter
padrões de treinamento. Em seguida, um sistema baseado em
regras fuzzy é construído de acordo com o procedimento descrito
na Seção III. Cada atributo no sistema baseado em regras fuzzy é
dividido em cinco subconjuntos fuzzy (veja a Fig. 5). Em seguida, o
sistema baseado em regras fuzzy construído é usado como a
tomada de decisão de alto nível do agente carro aprendiz na
competição com o agente carro oponente. Observe que o agente
do carro oponente na competição é o mesmo usado no
procedimento de geração de padrões.Na seção anterior, examinamos o desempenho dos quatro sistemas
baseados em regras fuzzy que são aplicados a controladores de carros.
Também mostramos que o Controlador A na Tabela II é o melhor entre
os quatro e estatisticamente melhor do que o controlador de carro
oponente fixo com uma heurística simples. Como examinamos as
quatro configurações do controlador (ou seja, dois tipos de
informações sensoriais e geração de padrões), examinamos o efeito de
cada uma dessas configurações do controlador separadamente nesta
seção e discutimos a razão pela qual o Controlador A leva ao melhor
desempenho na Seção IV.
A. Efeito da Geração de Padrão
Nesta subseção, examinamos o efeito de um método de
geração de padrões no desempenho de controladores de carros.
Examinamos dois métodos de geração de padrões na Seção IV.
Um gera padrões de treinamento através de configurações
controladas de experimentos onde uma situação inicial é
especificada a partir da partição da grade do campo de corrida de
carros. Por outro lado, o segundo método utiliza situações de jogo
prático onde um padrão de treinamento é gerado a partir da
experiência dos resultados da tomada de decisão.
A principal diferença entre os dois métodos é a frequência da
Estratégia 3 (ou seja, ir para o segundo waypoint até que o primeiro
waypoint seja tomado pelo agente do carro oponente). Mostramos a
frequência de ações especificadas pelos dois sistemas baseados em
regras fuzzy. Um sistema baseado em regras fuzzy é construído a partir
de padrões de treinamento que são gerados a partir de experimentos
preliminares controlados. Por outro lado, padrões de treinamento para
o segundo sistema baseado em regras fuzzy são gerados através de
uma série de experimentos não controlados. O agente de carro com
cada um dos dois sistemas baseados em regras fuzzy competiu contra
um agente de carro fixo com uma heurística simples. A frequência de
cada estratégia nos experimentos computacionais é apresentada na
Tabela IV.
A partir da Tabela IV, podemos ver que a Estratégia 3 foi selecionada em
cerca de 20% da seleção de ações quando os padrões de treinamento são
gerados através de uma série de experimentos não controlados. Como a
Estratégia 3 não leva diretamente a uma pontuação (o agente do carro
B. Resultados Experimentais
Mostramos os resultados experimentais na Tabela III. A Tabela III mostra
os resultados da competição contra um controlador oponente fixo com uma
simples heurística de tomada de decisão de alto nível. A partir dos resultados
experimentais, podemos ver que o melhor desempenho é obtido do
Controlador A. Ou seja, sistemas baseados em regras fuzzy que usam
informações sensoriais egocêntricas têm melhor desempenho quando os
padrões de treinamento são gerados a partir de
2304 2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008)
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
TABELA IV
FREQUENCIA DAS AÇÕES SELECIONADAS.
Método
Rede Pré-jogo
Estratégia 1
Estratégia 2
Estratégia 3
837
824
0
530
859
328
desiste do primeiro waypoint e apenas se aproxima do segundo
waypoint), a alta frequência da Ação 3 deteriora o desempenho dos
agentes do carro. Por outro lado, a Ação 3 não foi selecionada quando
os padrões de treinamento são gerados a partir de experimentos
preliminares controlados. Ou seja, o agente de carros sempre mira em
um determinado ponto de passagem durante o jogo de corrida de
carros.
Fig. 6. Ações selecionadas (informações sensoriais de terceira pessoa).
TABELA V
B. Efeito da Informação Sensorial OAGENTES E ESTRATÉGIAS DE VEÍCULOS PPONENTES.
Dois tipos de informação sensorial foram usados na Seção IV. Uma
informação sensorial é a informação egocêntrica onde os objetos no
campo das corridas de carros são representados em relação ao próprio
agente do carro. A outra informação sensorial contém a informação de
terceira pessoa onde os objetos no campo de corrida de carros são
representados usando as coordenadas absolutas. Examinamos o efeito
da informação sensorial no desempenho do agente de corrida de
carros nesta subseção.
A principal diferença entre os dois tipos de informação
sensorial é se a posição do próprio agente do carro está
incluída ou não. Ou seja, a informação está incluída na
informação sensorial de terceira pessoa enquanto não está
incluída na informação egocêntrica.
Na Fig. 6, mostramos as ações selecionadas pelos sistemas
baseados em regras fuzzy com a informação de terceira pessoa
quando apenas a posição do agente do carro é dada. As outras
informações, como a posição dos waypoints e a posição e
velocidade do agente do carro oponente, são removidas.
Podemos ver na Fig. 6 que várias ações são selecionadas quando
a informação de terceira pessoa é usada. Por outro lado, a seleção
de ações não pode ser realizada quando informações
egocêntricas são utilizadas em sistemas baseados em regras
fuzzy, pois a tomada de decisão não é definida nesta situação. A
conclusão pode ser tirada desta análise que a informação de
terceira pessoa ajuda a realizar a tomada de decisão adequada e
fina em comparação com a informação egocêntrica.
Agente de carro Estratégia
OpA
OpB
Sempre vá para o Waypoint 1
Sempre vá para o Waypoint 2
os padrões de treinamento são examinados na fase de avaliação contra os
dois agentes do carro adversário. A representação em terceira pessoa para o
vetor de entrada foi usada no controlador do carro e os padrões de
treinamento são gerados por meio de experimentos preliminares
controlados.
Mostramos os resultados experimentais na Tabela VI. Na Tabela VI, os
resultados das partidas contra os dois agentes de carros adversários (ou seja,
OppA e OppB) são mostrados com seus valores estatísticos. Assim como na
Subseção IV-B, o teste U de Mann-Whitney com nível de significância de 5%
foi utilizado para avaliar o desempenho dos sistemas baseados em regras
fuzzy.
TABELA VI
ERESULTADOS EXPERIMENTAIS COM DIFERENTES AGENTES DE CARRO OPONENTES.
Treinamento OpA OpA OpB OpB
Avaliação OpA OpB OpA OpB
Ganhar
Perdido
Desenhar
Valor P
60
27
13
8,81×10−5
38
6
56
1,93×10−4
46
46
8
0,94
85
3
12
9,88×10−16
A partir dos resultados experimentais, podemos ver que os sistemas
baseados em regras fuzzy funcionam com sucesso quando o mesmo
agente de carro oponente da fase de treinamento é usado na fase de
avaliação (ver Colunas 2 e 5). Quando OppA é usado na fase de
treinamento e OppB é usado na fase de avaliação (Coluna 3), um
grande número de jogos resulta em empate (56 vezes em 100). Isso
porque se a estratégia determinada pelos sistemas baseados em
regras fuzzy for a Estratégia 2 (ou seja, ir para o Waypoint 2), nenhum
dos dois carros do agente não irá para o Waypoint 1, o que
eventualmente causa um deadlock.
Outra constatação é que quando o OppB é usado nas fases de
treinamento e avaliação, os sistemas baseados em regras fuzzy têm melhor
desempenho. Isso ocorre porque os sistemas baseados em regras fuzzy
aprendem com sucesso a executar a Estratégia A em qualquer situação em
que o agente oponente é OppB. Como OppB sempre vai para
C. Efeito do Agente Oponente
Nos métodos propostos, os padrões de chuva são gerados
através de experimentos preliminares contra um oponente fixo.
Assim, os sistemas baseados em regras fuzzy gerados são eficazes
contra o oponente fixo. Nesta subseção, examinamos o
desempenho dos sistemas baseados em regras fuzzy contra
oponentes desconhecidos.
Para isso, dois agentes de carro são usados nos experimentos
desta subseção. A Tabela V mostra os dois agentes de carros
adversários.
Nos experimentos, primeiro geramos padrões de treinamento por
meio de um dos dois agentes de carro. Em seguida, o desempenho de
sistemas baseados em regras fuzzy construídos a partir das
2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008) 2305
Uso licenciado autorizado limitadoa: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
Waypoint 2, a melhor estratégia neste caso é sempre ir para o
Waypoint 1. Nos experimentos, apenas a Estratégia 1 é
selecionada na fase de avaliação quando OppB é utilizado na fase
de treinamento.
[7] T. Nakashima, M. Udo e H. Ishibuchi. Um aprendizado por reforço difuso para
um problema de interceptação de bola. páginas em CD–ROM (8 páginas),
Pádua, Itália, 2003.
[8] T. Nakashima, M. Udo e H. Ishibuchi. Implementação de q-learning fuzzy
para um agente de futebol. páginas 533–536, St. Louis, EUA, 2003.
[9] T. Nakashima, M. Takatani, M. Udo e H. Ishibuchi. Uma abordagem evolutiva
para o aprendizado de estratégia no futebol robocup. páginas 2023–2028, Den
Hague, Holanda, 2004.
[10] T. Nakashima, M. Takatani, M. Udo, H. Ishibuchi e M. Nii. Avaliação de
desempenho de um método evolutivo para estratégias de futebol de
robocup. páginas em CR–ROM (8 páginas), Osaka, Japão, 2005.
[11] T. Nakashima, M. Takatani, H. Ishibuchi e M. Nii. O efeito do uso do
histórico de partidas na evolução das estratégias do time de futebol
robocup. páginas 60–66, Reno/Lake Tahoe, Nevada, EUA, 2006.
[12] R. Leigh, SJ Louis e C. Miles. Usando um algoritmo genético para explorar algoritmos de
busca de caminhos do tipo a*. DentroInteligência Computacional e Jogos, 2007. CIG
2007. Simpósio IEEE sobre,páginas 72–79, 2007.
[13] C. Miles, J. Quiroz, R. Leigh e SJ Louis. Jogadores de jogos de estratégia baseados em
árvore de mapas de influência em co-evolução. DentroInteligência Computacional e
Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 88-95, 2007.
[14] Y. Wang e S. Gelly. Modificações de simulações uct e sequenciais
para monte-carlo go. DentroInteligência Computacional e Jogos,
2007. CIG 2007. Simpósio IEEE sobre,páginas 175–182, 2007.
[15] HA Mayer. Representações de tabuleiro para jogadores neurais que aprendem
por diferença temporal. DentroInteligência Computacional e Jogos, 2007. CIG
2007. Simpósio IEEE sobre,páginas 183-188, 2007.
[16] N. Araki, K. Yoshida, Y. Tsuruoka e J. Tsujii. Mova a previsão em
andamento com o método de entropia máxima. DentroInteligência
Computacional e Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas
189-195, 2007.
[17] K.-J. Kim, H. Choi e S.‑B. Cho. Híbrido de aprendizado de evolução e
reforço para jogadores de othello. DentroInteligência Computacional e
Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 203-209, 2007.
[18] TP Runarsson e EO Jonsson. Efeito da profundidade de busca antecipada na
aprendizagem de funções de avaliação de posição para otelo usando
exploração -greedy. DentroInteligência Computacional e Jogos, 2007. CIG
2007. Simpósio IEEE sobre,páginas 210-215, 2007.
[19] LL DeLooze e J. Downey. Lances de ponte com informações imperfeitas.
DentroInteligência Computacional e Jogos, 2007. CIG 2007. Simpósio
IEEE sobre,páginas 368–373, 2007.
[20] DS McFarlin e PM Todd. Evoluindo um adversário melhor: Um estudo de caso em
um castelo alemão. DentroVida Artificial, 2007. ALIFE '07. Simpósio IEEE sobre,
páginas 229–235, 2007.
[21] W.-Y. Chen e S. Payandeh. Simulador de hóquei de micro robô - design de
mecanismo de jogo. DentroInteligência Computacional e Jogos, 2007. CIG
2007. Simpósio IEEE sobre,páginas 9-16, 2007.
[22] A. Agapitos, J. Togelius e SM Lucas. Controladores em evolução para corridas de
carros simuladas usando programação genética orientada a objetos. Dentro a
9ª Conferência Anual de Computação Genética e Evolutiva, páginas 1543–1550,
Londres, Inglaterra, 2007. ACM.
[23] J. Togelius, SM Lucas e RD Nardi.Inteligência Computacional em Jogos de
Corrida,volume 71/2007 deEstudos em Inteligência Computacional,
páginas 39-69. Springer, Berlim/Heidelberg, junho de 2007.
[24] J. Togelius. Evolução de um neurocontrolador de arquitetura de subsunção.
J. Intel. Sistema Fuzzy,15:15–20, 2004.
[25] J. Togelius e SM Lucas. Evoluindo habilidades de corrida de carros robustas e
especializadas. DentroComputação Evolucionária, 2006. CEC 2006. Congresso IEEE
sobre,páginas 1187-1194, 2006.
[26] H. Marques, J. Togelius, M. Kogutowska, O. Holland e SM Lucas. Sensorless, mas
não sem sentido: Previsão em corridas de carros evolucionárias. Dentro Vida
Artificial, 2007. ALIFE '07. Simpósio IEEE sobre,páginas 370–377, 2007.
[27] J. Togelius, RD Nardi e SM Lucas. Tornando as corridas divertidas através da modelagem
do jogador e da evolução da pista. DentroWorkshop da SAB sobre abordagens
adaptativas para otimizar a satisfação do jogador.,2006.
[28] J. Togelius, R. De Nardi e SM Lucas. criação de
conteúdo personalizado para jogos de corrida.
Inteligência e Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 252–
259, 2007.
[29] Julian Togelius.Otimização, Imitação e Inovação: Inteligência Computacional e
Jogos.Tese de doutorado, Departamento de Ciência da Computação,
Universidade de Essex, setembro de 2007.
[30] H. Ishibuchi, K. Nozaki e H. Tanaka. Representação distribuída de regras
fuzzy e sua aplicação à classificação de padrões.Conjuntos e Sistemas
Fuzzy,52:21-32, 1992.
VI. CINCLUSÃO
Neste artigo, propusemos um sistema fuzzy baseado em regras para
tomada de decisão de alto nível para o jogo de corrida de carros. A tomada de
decisão de baixo nível de agentes automotivos é fixada nos experimentos
computacionais deste artigo à medida que o desempenho de sistemas
baseados em regras fuzzy para tomada de decisão de alto nível é examinado.
Consideramos quatro sistemas baseados em regras fuzzy
nos experimentos computacionais. A diferença entre os
quatro sistemas baseados em regras fuzzy é o tipo de
informação sensorial e a forma como os padrões de
treinamento são gerados. Ou seja, usamos informações
sensoriais egocêntricas e de terceira pessoa para a entrada de
sistemas baseados em regras difusas. Também geramos
padrões de treinamento para a construção de sistemas
baseados em regras fuzzy, tanto para experimentos
preliminares controlados quanto para uma série de
experimentos não controlados. Os resultados de
experimentos computacionais mostraram que informações de
terceira pessoa devem ser usadas para tomada de decisão de
alto nível e que padrões de treinamento devem ser gerados a
partir de experimentos preliminares controlados onde uma
situação inicial é gerada usando a partição de grade do campo
de corrida. Após os experimentos computacionais,
Trabalhos futuros incluem o ajuste adaptativo de sistemas baseados
em regras fuzzy durante o decorrer dos jogos. A implementação atual
dos sistemas baseados em regras fuzzy considerava apenas um agente
carro oponente fixo. Assim, não é robusto contra os diferentes tipos de
agentes de corrida de carros. Outra direção de trabalho futuro é a
evolução dos controladores. Os sistemas baseados em regras fuzzy que
são construídos a partir de um determinado conjunto de padrões de
treinamento neste artigo podem ser usados como indivíduos iniciais
nos algoritmos evolutivos.
REFERÊNCIAS
[1] M. Recém-nascido e M. Recém-nascido.Kasparov Versus Deep Blue: O xadrez de
computador atinge a maioridade.Springer-Verlag New York Inc (C), dezembro de 1996.
[2] H.-Y. Quek e C.‑K. Puxa. Adaptação de estratégias iteradas do dilema do
prisioneiro por evolução e aprendizado. DentroInteligência Computacional e
Jogos, 2007. CIG 2007. Simpósio IEEE sobre,páginas 40-47, 2007.
[3] DA Ashlock. Cooperação no dilema do prisioneiro em gráficos. Dentro
Inteligência Computacional e Jogos, 2007. CIG 2007. Simpósio IEEE
sobre,páginas 48–55, 2007.
[4] A. Ghoneim, H. Abbass e M. Barlow. Compartilhamento de informações no jogo
iterado do dilema do prisioneiro. DentroInteligência Computacional e Jogos,
2007. CIG 2007. Simpósio IEEE sobre,páginas 56–62, 2007.
[5] M. Wittkamp, L. Barone e L. While. Uma comparação de programação
genética e aprendizado de tabela de consulta para o jogo de spoof.
DentroInteligência Computacional e Jogos, 2007. CIG 2007. SimpósioIEEE sobre,páginas 63-71, 2007.
[6] M. Riedmiller e T. Gabel. Sobre experiências em um domínio de jogo
complexo e competitivo: o aprendizado por reforço encontra o robocup.
DentroInteligência Computacional e Jogos, 2007. CIG 2007. Simpósio
IEEE sobre,páginas 17–23, 2007.
Para automático
DentroComputacional
2306 2008 IEEE International Conference on Fuzzy Systems (FUZZ 2008)
Uso licenciado autorizado limitado a: UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL. Baixado em 30 de janeiro de 2022 às 13:44:30 UTC do IEEE Xplore. Restrições aplicadas.
<<
/ASCII85EncodePages false
/AllowTransparency false
/AutoPositionEPSFiles false
/AutoRotatePages /None
/Binding /Left
/CalGrayProfile (None)
/CalRGBProfile (None)
/CalCMYKProfile (None)
/sRGBProfile (sRGB IEC61966-2.1)
/CannotEmbedFontPolicy /Error
/CompatibilityLevel 1.6
/CompressObjects /Off
/CompressPages true
/ConvertImagesToIndexed true
/PassThroughJPEGImages true
/CreateJDFFile false
/CreateJobTicket false
/DefaultRenderingIntent /Default
/DetectBlends true
/DetectCurves 0.1000
/ColorConversionStrategy /LeaveColorUnchanged
/DoThumbnails true
/EmbedAllFonts true
/EmbedOpenType false
/ParseICCProfilesInComments true
/EmbedJobOptions true
/DSCReportingLevel 0
/EmitDSCWarnings false
/EndPage -1
/ImageMemory 1048576
/LockDistillerParams true
/MaxSubsetPct 100
/Optimize true
/OPM 0
/ParseDSCComments false
/ParseDSCCommentsForDocInfo false
/PreserveCopyPage true
/PreserveDICMYKValues true
/PreserveEPSInfo false
/PreserveFlatness true
/PreserveHalftoneInfo true
/PreserveOPIComments false
/PreserveOverprintSettings true
/StartPage 1
/SubsetFonts true
/TransferFunctionInfo /Remove
/UCRandBGInfo /Preserve
/UsePrologue false
/ColorSettingsFile ()
/AlwaysEmbed [ true
]
/NeverEmbed [ true
]
/AntiAliasColorImages false
/CropColorImages true
/ColorImageMinResolution 36
/ColorImageMinResolutionPolicy /Warning
/DownsampleColorImages true
/ColorImageDownsampleType /Bicubic
/ColorImageResolution 300
/ColorImageDepth -1
/ColorImageMinDownsampleDepth 1
/ColorImageDownsampleThreshold 2.00333
/EncodeColorImages true
/ColorImageFilter /DCTEncode
/AutoFilterColorImages false
/ColorImageAutoFilterStrategy /JPEG
/ColorACSImageDict <<
/QFactor 0.76
/HSamples [2 1 1 2] /VSamples [2 1 1 2]
>>
/ColorImageDict <<
/QFactor 0.76
/HSamples [2 1 1 2] /VSamples [2 1 1 2]
>>
/JPEG2000ColorACSImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 15
>>
/JPEG2000ColorImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 15
>>
/AntiAliasGrayImages false
/CropGrayImages true
/GrayImageMinResolution 36
/GrayImageMinResolutionPolicy /Warning
/DownsampleGrayImages true
/GrayImageDownsampleType /Bicubic
/GrayImageResolution 300
/GrayImageDepth -1
/GrayImageMinDownsampleDepth 2
/GrayImageDownsampleThreshold 2.00333
/EncodeGrayImages true
/GrayImageFilter /DCTEncode
/AutoFilterGrayImages false
/GrayImageAutoFilterStrategy /JPEG
/GrayACSImageDict <<
/QFactor 0.76
/HSamples [2 1 1 2] /VSamples [2 1 1 2]
>>
/GrayImageDict <<
/QFactor 0.76
/HSamples [2 1 1 2] /VSamples [2 1 1 2]
>>
/JPEG2000GrayACSImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 15
>>
/JPEG2000GrayImageDict <<
/TileWidth 256
/TileHeight 256
/Quality 15
>>
/AntiAliasMonoImages false
/CropMonoImages true
/MonoImageMinResolution 36
/MonoImageMinResolutionPolicy /Warning
/DownsampleMonoImages true
/MonoImageDownsampleType /Bicubic
/MonoImageResolution 600
/MonoImageDepth -1
/MonoImageDownsampleThreshold 1.00167
/EncodeMonoImages true
/MonoImageFilter /CCITTFaxEncode
/MonoImageDict <<
/K -1
>>
/AllowPSXObjects false
/CheckCompliance [
/None
]
/PDFX1aCheck false
/PDFX3Check false
/PDFXCompliantPDFOnly false
/PDFXNoTrimBoxError true
/PDFXTrimBoxToMediaBoxOffset [
0.00000
0.00000
0.00000
0.00000
]
/PDFXSetBleedBoxToMediaBox true
/PDFXBleedBoxToTrimBoxOffset [
0.00000
0.00000
0.00000
0.00000
]
/PDFXOutputIntentProfile (None)
/PDFXOutputConditionIdentifier ()
/PDFXOutputCondition ()
/PDFXRegistryName (http://www.color.org)
/PDFXTrapped /False
/Description <<
/JPN <FEFF3053306e8a2d5b9a306f300130d330b830cd30b9658766f8306e8868793a304a3088307353705237306b90693057305f00200050004400460020658766f830924f5c62103059308b3068304d306b4f7f75283057307e305930023053306e8a2d5b9a30674f5c62103057305f00200050004400460020658766f8306f0020004100630072006f0062006100740020304a30883073002000520065006100640065007200200035002e003000204ee5964d30678868793a3067304d307e30593002>
/DEU <FEFF00560065007200770065006e00640065006e0020005300690065002000640069006500730065002000450069006e007300740065006c006c0075006e00670065006e0020007a0075006d002000450072007300740065006c006c0065006e00200076006f006e0020005000440046002d0044006f006b0075006d0065006e00740065006e002c00200075006d002000650069006e00650020007a0075007600650072006c00e40073007300690067006500200041006e007a006500690067006500200075006e00640020004100750073006700610062006500200076006f006e00200047006500730063006800e40066007400730064006f006b0075006d0065006e00740065006e0020007a0075002000650072007a00690065006c0065006e002e00200044006900650020005000440046002d0044006f006b0075006d0065006e007400650020006b00f6006e006e0065006e0020006d006900740020004100630072006f0062006100740020006f0064006500720020006d00690074002000640065006d002000520065006100640065007200200035002e003000200075006e00640020006800f600680065007200200067006500f600660066006e00650074002000770065007200640065006e002e>
/FRA <FEFF004f007000740069006f006e00730020007000650072006d0065007400740061006e007400200064006500200063007200e900650072002000640065007300200064006f00630075006d0065006e007400730020005000440046002000700072006f00660065007300730069006f006e006e0065006c007300200066006900610062006c0065007300200070006f007500720020006c0061002000760069007300750061006c00690073006100740069006f006e0020006500740020006c00270069006d007000720065007300730069006f006e002e00200049006c002000650073007400200070006f0073007300690062006c0065002000640027006f00750076007200690072002000630065007300200064006f00630075006d0065006e007400730020005000440046002000640061006e00730020004100630072006f0062006100740020006500740020005200650061006400650072002c002000760065007200730069006f006e002000200035002e00300020006f007500200075006c007400e9007200690065007500720065002e>
/PTB <FEFF005500740069006c0069007a006500200065007300740061007300200063006f006e00660069006700750072006100e700f5006500730020007000610072006100200063007200690061007200200064006f00630075006d0065006e0074006f0073002000500044004600200063006f006d00200075006d0061002000760069007300750061006c0069007a006100e700e3006f0020006500200069006d0070007200650073007300e3006f00200061006400650071007500610064006100730020007000610072006100200064006f00630075006d0065006e0074006f007300200063006f006d0065007200630069006100690073002e0020004f007300200064006f00630075006d0065006e0074006f0073002000500044004600200070006f00640065006d0020007300650072002000610062006500720074006f007300200063006f006d0020006f0020004100630072006f006200610074002c002000520065006100640065007200200035002e00300020006500200070006f00730074006500720069006f0072002e>
/DAN <FEFF004200720075006700200064006900730073006500200069006e0064007300740069006c006c0069006e006700650072002000740069006c0020006100740020006f0070007200650074007400650020005000440046002d0064006f006b0075006d0065006e007400650072002c0020006400650072002000650072002000650067006e006500640065002000740069006c0020007000e5006c006900640065006c006900670020007600690073006e0069006e00670020006f00670020007500640073006b007200690076006e0069006e006700200061006600200066006f0072007200650074006e0069006e006700730064006f006b0075006d0065006e007400650072002e0020005000440046002d0064006f006b0075006d0065006e007400650072006e00650020006b0061006e002000e50062006e006500730020006d006500640020004100630072006f0062006100740020006f0067002000520065006100640065007200200035002e00300020006f00670020006e0079006500720065002e>/NLD <FEFF004700650062007200750069006b002000640065007a006500200069006e007300740065006c006c0069006e00670065006e0020006f006d0020005000440046002d0064006f00630075006d0065006e00740065006e0020007400650020006d0061006b0065006e00200064006900650020006700650073006300680069006b00740020007a0069006a006e0020006f006d0020007a0061006b0065006c0069006a006b006500200064006f00630075006d0065006e00740065006e00200062006500740072006f0075007700620061006100720020007700650065007200200074006500200067006500760065006e00200065006e0020006100660020007400650020006400720075006b006b0065006e002e0020004400650020005000440046002d0064006f00630075006d0065006e00740065006e0020006b0075006e006e0065006e00200077006f007200640065006e002000670065006f00700065006e00640020006d006500740020004100630072006f00620061007400200065006e002000520065006100640065007200200035002e003000200065006e00200068006f006700650072002e>
/ESP <FEFF0055007300650020006500730074006100730020006f007000630069006f006e006500730020007000610072006100200063007200650061007200200064006f00630075006d0065006e0074006f0073002000500044004600200071007500650020007000650072006d006900740061006e002000760069007300750061006c0069007a006100720020006500200069006d007000720069006d0069007200200063006f007200720065006300740061006d0065006e0074006500200064006f00630075006d0065006e0074006f007300200065006d00700072006500730061007200690061006c00650073002e0020004c006f007300200064006f00630075006d0065006e0074006f00730020005000440046002000730065002000700075006500640065006e00200061006200720069007200200063006f006e0020004100630072006f00620061007400200079002000520065006100640065007200200035002e003000200079002000760065007200730069006f006e0065007300200070006f00730074006500720069006f007200650073002e>
/SUO <FEFF004e00e4006900640065006e002000610073006500740075007300740065006e0020006100760075006c006c006100200076006f006900740020006c0075006f006400610020006a0061002000740075006c006f00730074006100610020005000440046002d0061007300690061006b00690072006a006f006a0061002c0020006a006f006900640065006e0020006500730069006b0061007400730065006c00750020006e00e400790074007400e400e40020006c0075006f00740065007400740061007600610073007400690020006c006f00700070007500740075006c006f006b00730065006e002e0020005000440046002d0061007300690061006b00690072006a0061007400200076006f0069006400610061006e0020006100760061007400610020004100630072006f006200610074002d0020006a0061002000520065006100640065007200200035002e00300020002d006f0068006a0065006c006d0061006c006c0061002000740061006900200075007500640065006d006d0061006c006c0061002000760065007200730069006f006c006c0061002e>
/ITA <FEFF00550073006100720065002000710075006500730074006500200069006d0070006f007300740061007a0069006f006e00690020007000650072002000630072006500610072006500200064006f00630075006d0065006e007400690020005000440046002000610064006100740074006900200070006500720020006c00610020007300740061006d00700061002000650020006c0061002000760069007300750061006c0069007a007a0061007a0069006f006e006500200064006900200064006f00630075006d0065006e0074006900200061007a00690065006e00640061006c0069002e0020004900200064006f00630075006d0065006e00740069002000500044004600200070006f00730073006f006e006f0020006500730073006500720065002000610070006500720074006900200063006f006e0020004100630072006f00620061007400200065002000520065006100640065007200200035002e003000200065002000760065007200730069006f006e006900200073007500630063006500730073006900760065002e>
/NOR <FEFF004200720075006b00200064006900730073006500200069006e006e007300740069006c006c0069006e00670065006e0065002000740069006c002000e50020006f00700070007200650074007400650020005000440046002d0064006f006b0075006d0065006e00740065007200200073006f006d002000700061007300730065007200200066006f00720020007000e5006c006900740065006c006900670020007600690073006e0069006e00670020006f00670020007500740073006b007200690066007400200061007600200066006f0072007200650074006e0069006e006700730064006f006b0075006d0065006e007400650072002e0020005000440046002d0064006f006b0075006d0065006e00740065006e00650020006b0061006e002000e50070006e006500730020006d006500640020004100630072006f0062006100740020006f0067002000520065006100640065007200200035002e00300020006f0067002000730065006e006500720065002e>
/SVE <FEFF0041006e007600e4006e00640020006400650020006800e4007200200069006e0073007400e4006c006c006e0069006e006700610072006e00610020006e00e40072002000640075002000760069006c006c00200073006b0061007000610020005000440046002d0064006f006b0075006d0065006e007400200073006f006d00200070006100730073006100720020006600f600720020007000e5006c00690074006c006900670020007600690073006e0069006e00670020006f006300680020007500740073006b0072006900660074002000610076002000610066006600e4007200730064006f006b0075006d0065006e0074002e0020005000440046002d0064006f006b0075006d0065006e00740065006e0020006b0061006e002000f600700070006e006100730020006d006500640020004100630072006f0062006100740020006f00630068002000520065006100640065007200200035002e003000200065006c006c00650072002000730065006e006100720065002e>
/ENU (Use these settings with Distiller 7.0 or equivalent to create PDF documents suitable for IEEE Xplore. Created 29 November 2005. ****Preliminary version. NOT FOR GENERAL RELEASE***)
>>
>> setdistillerparams
<<
/HWResolution [600 600]
/PageSize [612.000 792.000]
>> setpagedevice