Redes Semânticas e Frames

PUC-MINAS

Sheila Carvalho

em 21/03/2022

Conteúdos escolhidos para você

18 pág.

Inteligência Artificial - Exercícios - Estácio

ESTÁCIO

17 pág.

TESTE DE INTELIGÊNCIA ARTIFICIAL

ESTÁCIO

33 pág.

Inteligencia-Artificial simulado brtt

ESTÁCIO

160 pág.

Perguntas dessa disciplina

Pergunta 3 Sobre as provas operatórias à construção de estruturas cognitivas em psicopedagogia, leia atentamente as informações contidas nas colunas A

CSV

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

Questão 1 | MATEMATICA INSTRUMENTAL - DIGITAL A vantagem de utilizar um gráfico ao invés de uma tabela está na possibilidade de uma rápida impressão v

FAEL

QUESTIONÁRIO – FUNDAMENTOS DE ÁLGEBRA – SEGUNDA GRADUAÇÃO 2 A lógica de Aristóteles – cujas estruturas, como os silogismos, eram formuladas com palavr

FMU

A Teoria da Atividade sugere que a tecnologia deve ser projetada para apoiar as práticas sociais existentes, em vez de forçar o usuário a se adapta...

Material

Conteúdos escolhidos para você

18 pág.

Inteligência Artificial - Exercícios - Estácio

ESTÁCIO

17 pág.

TESTE DE INTELIGÊNCIA ARTIFICIAL

ESTÁCIO

33 pág.

Inteligencia-Artificial simulado brtt

ESTÁCIO

160 pág.

Perguntas dessa disciplina

Pergunta 3 Sobre as provas operatórias à construção de estruturas cognitivas em psicopedagogia, leia atentamente as informações contidas nas colunas A

CSV

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

Questão 1 | MATEMATICA INSTRUMENTAL - DIGITAL A vantagem de utilizar um gráfico ao invés de uma tabela está na possibilidade de uma rápida impressão v

FAEL

QUESTIONÁRIO – FUNDAMENTOS DE ÁLGEBRA – SEGUNDA GRADUAÇÃO 2 A lógica de Aristóteles – cujas estruturas, como os silogismos, eram formuladas com palavr

FMU

A Teoria da Atividade sugere que a tecnologia deve ser projetada para apoiar as práticas sociais existentes, em vez de forçar o usuário a se adapta...

Prévia do material em texto

Unidade 05 – Objetos Estruturados (Redes Semânticas e Frames) e
Tratamento de Incerteza
1. REDES SEMÂNTICAS
Historicamente, as redes semânticas foram propostas em 1913 por Selz como uma
tentativa de explicação aos fenômenos psicológicos. A ideia era de que o processo humano de
resolver problemas era considerado como um processo de preenchimento de espaços vazios de
uma descrição parcialmente completa. Em 1968, Quillian [Quillian, 1968] implementou essas
redes e demonstrou que o conhecimento semântico poderia ser representado como um
relacionamento entre dois objetos, afinal, a ideia fundamental deste modelo é que o significado
de um conceito está ligado diretamente à forma como ele é conectado a outros conceitos [Rich,
1994].
A partir disso, uma rede semântica é uma representação em que:
• As informações são representadas como um conjunto de nós que representam as
entidades e links (slots) que representam relacionamentos entre essas entidades;
• Cada link conecta um nó origem a um nó destino e estabelece uma ligação;
• Normalmente, os nós e links denotam entidades de um domínio bem específico.
As redes semânticas estão na origem da programação orientada a objetos e permitem
uma considerável redução no tempo de pesquisa já que os nós estão diretamente aos nós
vizinhos com maior significância.
Um fragmento de uma rede semântica típica é mostrado na Figura 01.

Título: Unidade 5
Profª. M. Sc. Luciana De Nardin

Figura 01 – Fragmento de uma rede semântica

Na Figura 01 é possível extrair as seguintes relações entre os nós:
1) Ana is-a pessoa;
2) Cadeira ako mobília;
3) Cadeira-27 is-a cadeira;
4) Cadeira-27 tem um dono que é Ana;
5) Cadeira-27 tem o preto como cor;
6) Cadeira-27 has-a assento;
7) Assento tem estofamento de couro.
Além das relações extraídas na Figura 01, tem-se ainda a relação part-of. As diferenças
entre elas são:
• Ako (a kind of): estabelece relações entre classes (exemplo: classe cadeira e classe
mobília);
• Is-a (é um): estabelece relações entre classes e instâncias (exemplo: Ana é uma
instância da classe pessoa e Cadeira-27 é uma instância da classe cadeira);
• Has-a (tem um): identifica herança de propriedades das entidades (exemplo:
Cadeira-27 tem um assento);
• Part-of (parte de): identifica herança de propriedades das entidades (com a seta no
sentido poderíamos ter a seguinte relação: Assento é parte de Cadeira);
• Variados: os demais arcos (dono, cor, estofamento) também chamados de traços
são específicos para este domínio e representam propriedades de conceitos.
Como citado anteriormente, as redes semânticas permitem herança de propriedades.
Esse tipo de herança acontece quando as propriedades de um nó são especificadas apenas uma
vez no mais alto nível da hierarquia e são herdadas por todos os conceitos derivados, o que
acarreta em economia de memória. Porém, não são permitidas heranças múltiplas! Um
problema derivado da herança é o tratamento do exceções. A Figura 02 ilustra uma dessas
exceções.

Figura 02 - Herança de propriedades
Sobre a Figura 02 pergunta-se:
1) Qual a cor de Clyde?
2) Clyde deve ser considerado cinza por ser um elefante?
Em casos como esse, vale sempre a regra de dar prioridade ao atributo mais específico,
ou seja, se Clyde tem um atributo cor será assumido o valor deste atributo, caso ele não tenha, aí
sim irá valer o atributo herdado.
A rede semântica para representar a Figura 02 é:
> (snet-store '(color (clyde real e-um)
(real elefante e-um)
(elefante cinza e-um)
(clyde elefante e-um)
(real cinza (not . e-um))))
t

Em redes semânticas têm-se: snet-store – que serve para armazenar uma rede – e snet-
query – que serve para consultar informações em uma rede.
Dessa forma, a base de conhecimento de uma rede semântica está armazenada em seus
nós e arcos. Enquanto que o mecanismo de inferência realiza a busca e casamento de padrões, e
essa busca acontece “navegando” para frente e para trás através dos arcos.
Neste caso, a busca pode ser usada de várias maneiras para extrair informações, sendo:
- como uma ferramenta explicativa;
- para explorar exaustivamente um tópico;
- para encontrar o relacionamento entre dois objetos.
A Figura 03, apresentada a seguir, será utilizada para mostrar algumas formas de
extração de informações de uma rede semântica.
É um É um É um
Clyde Elefante Real Elefante Cinza
Não é um

Figura 03 – Exemplo de uma rede semântica
Várias informações podem ser buscadas dentro dessa rede semântica, por exemplo:
como provar a declaração “Cães comem”?
Para isso, percorre-se a rede iniciando a partir do nó “cão”, sendo assim:
• Cão é um tipo de mamífero;
• Mamífero é um tipo de animal;
• Animal faz comer, portanto, cães comem!
Além disso, é possível derivar todo o conhecimento sobre “cães” utilizando a busca em
largura a partir do nó cão, sendo elas:
• Cães são mamíferos;
• Cães têm pelos;
• Cães são animais;
• Cães comem.
Para verificar se cães e pássaros estão relacionados, pode-se executar uma busca em
largura a partir de ambos, de forma que uma ativação é iniciada nos dois nós separadamente, e
se observa onde eles se encontram. Este ponto nos dá uma pista sobre o relacionamento entre
ambos. Esse processo é chamado de ativação distribuída ou intersecção de busca e explora
uma das mais importantes vantagens que as redes semânticas têm sobre as estruturas
puramente lógicas, o aproveitamento da organização do conhecimento.
Para o caso de cães e pássaros realizando a intersecção de busca, é possível perceber que
o relacionamento mais próximo entre eles é o de que ambos são animais.
Outras vantagens das redes semânticas, que valem ser destacadas, são:
• Representação visual fácil de entender;
• Flexibilidade na manipulação de nós e links com relação à adição, deleção e/ou
modificação;
• Economia através da herança representada por relações do tipo is-a; e,
• Capta “senso-comum”, ou seja, funciona de maneira semelhante ao armazenamento
de informações no cérebro.
Como desvantagens podem-se citar o fato de:
• Permitirem realizar inferências inválidas;
• Não ter uma norma de interpretação, pois a interpretação depende dos programas
que a manipulam.
Além destas, conhecendo a representação de redes semânticas, pergunta-se: é possível
dizer tudo com redes semânticas? Mas, como usar quantificadores? Como escrever, por exemplo,
∀x ∀y pessoa (x) ∧ porta (y) ⇒ abriu (x, y)?
Por não conseguir representar “tudo”, houve tentativas de estender as redes semânticas,
porém, o resultado não foi intuitivo, ferindo a principal vantagem deste modelo de
representação de conhecimento.
Como ferramenta de implementação de redes semânticas, merece destaque:
• KNOB: plugin (que estende o JGraphPad) com ambiente de produção de bases de
conhecimento em linguagem lógica para sistemas especialistas utilizando redes
semânticas;
• JGraphPad é uma ferramenta de edição de grafos construída pela comunidade de
software livre com base no componente JGraph que implementa um codec para
processar redes semânticas e a partir destas gerar código Prolog.

2. FRAMES

O frame é considerado uma evolução das redes semânticas e sua ideia fundamental foi
introduzida por Marvin Minsky [Minsky, 1975]. As aplicações propostas por Minsky para o novo
método foram: análise de cenas, modelagem da percepção visual e compreensão de linguagem
natural. Entretanto, Minsky não propôs nenhuma metodologia de implementação nem definição
formal do método, tais conceitos só foram propostos posteriormente.
Um frame é uma coleção de atributos, em geral, chamados de slots e valores associados a
eles que descrevem alguma entidade complexa do mundo. Algumas vezes, um frame descreve
uma entidade em termos absolutos e, raramente, um frame sozinho tem utilidade.
Um sistema de frames é um conjuntode frames organizados hierarquicamente e é muito
parecido com uma rede semântica exceto pelo fato de que:
• Nós são substituídos por frames;
• Arcos ou links são substituídos por atributos (slots);
• Procedimentos podem ser associados a um frame (procedimentos demons).
Os frames possuem, pelo menos, dois atributos que são nome e a relação. O nome é o
próprio nome do frame e a relação é utilizada com o intuito de melhorar a estruturação
(hierarquia/herança). Neste caso, são privilegiados dois tipos: ako (relação entre classes) e is-a
(relação entre instância e classe).
A Figura 04 ilustra um fragmento de um sistema de frames. Esse sistema é semelhante à
rede semântica ilustrada na Figura 03.

Figura 04 – Fragmento de um sistema de frames

Na Figura 04 é possível perceber que, quando a relação é do tipo ako ou is-a, o frame está
ligado ao seu “pai” e não tem informações de atributos dentro dele. Diferente do que acontece
em relações chamadas de “variadas” como no caso do “tem” que a informação “pelos” está
representada dentro do frame.
Cada atributo aponta para outro frame ou para um tipo primitivo e consiste de um
conjunto de facetas (atributos de atributos).
As facetas contêm informações que descrevem os slots (ou frames). Tais informações
podem definir claramente os valores que o slot pode assumir ou podem indicar de que forma
calcular ou deduzir o seu valor [Ávila & Monard, 1991].
As facetas descrevem conhecimento ou algum procedimento relativo ao atributo e
permitem expressar restrições semânticas referentes aos slots. Dessa forma, as facetas são
utilizadas para garantir a coerência dos frames dentro de sua taxonomia. Os principais tipos de
facetas que podem ser utilizados dentro dos slots são:
• Tipo: indica o tipo de dado (inteiro, símbolo, real etc.);
• Domínio: descreve os valores possíveis para o slot (por exemplo: de 0 a 10);
• Valor: especifica o único valor possível (número de lados de um retângulo);
• Valor default: especifica o valor que será assumido pelo slot caso não haja nenhuma
informação a seu respeito;
• Procedimentos demons: são procedimentos anexados aos frames disparados por
consultas ou atualizações. Maiores detalhes serão apresentados na próxima seção.
A Figura 05 apresenta a representação abstrata genérica de um frame.

Figura 05 – Representação abstrata de um frame
Os frames integram conhecimento declarativo sobre objetos e eventos e conhecimento
procedimental sobre a forma com que as informações serão recuperadas ou os valores serão
calculados.

2.1 Procedimentos demons

Os procedimentos demons são semelhantes aos triggers disparados em banco de dados
quando determinadas solicitações acontecem. São procedimentos demons:
• When-requested: é disparado quando um valor é solicitado, mas, ele ainda não
existe;
• When-read: é disparado quando um valor é lido;
• When-written: é disparado sempre que um valor é modificado;
• When-deleted: é disparado quando um valor é eliminado.
A Figura 06 apresenta um exemplo de frames que utilizam procedimentos demons.

Figura 06 – Exemplo de frames utilizando procedimentos demons

Na Figura 06 é possível perceber que uma requisição do tipo when-read será disparada,
se quisermos saber qual o tipo de formato que o frame cômodo tem. Uma requisição do tipo
when-written será disparada, se quisermos alterar o valor da área do frame sala (que herda
atributos e características do frame cômodo que, por sua vez, herda do frame lugar_coberto).
O frame ilustrado na Figura 06 poderá ser escrito como:

> (frame-store '(lugar-coberto root))
t
> (frame-store '(comodo lugar-coberto
(numero-de-paredes 4)
(formato retangular)
(altura 3)
(area nil)
(volume (lambda (f s)
(*(get-slot f ( quote altura))
(get-slot f (quote area))))
if-necessary)))
t
> (frame-store '(sala comodo
(mobiliario (sofa mesa cadeiras))
(finalidade convivencia)))
(area 25)
t

Quando um sistema de frames não utiliza procedimentos demons ele se torna
equivalente a uma rede semântica.
Com relação à POO, os procedimentos demons são equivalentes aos métodos com
exceção de que:
• Em frames, os procedimentos demons estão associados a um atributo e só são
disparados (gatilho de banco de dados) mediante consulta ou modificações sobre o
atributo. Não existe o conceito de “mensagens”!
• Em POO, os métodos estão associados à classe, e os objetos podem receber
mensagens.
A partir disso, é possível perceber que a POO é mais flexível.

2.2 Herança

Classes são inseridas em uma hierarquia de especialização, em que uma classe mais
especializada pode herdar propriedades da classe mais geral. Neste contexto, a classe mais geral
é denominada superclasse e a mais específica subclasse [Ávila & Monard, 1991].
Em um sistema de frames, a herança pode acontecer de pelo menos três maneiras:
• Herança de valor: conceito similar à herança de atributos em programação orientada
a objetos (POO) em que o frame hierarquicamente subordinado herda diretamente da
superclasse;
• Herança de procedimentos: conceito similar à herança de métodos em POO. Neste
caso, o simples preenchimento de um slot com certo valor pode, por exemplo,
disparar um procedimento para verificar a consistência do preenchimento;
• Herança de valor por default: neste caso, se o valor de um atributo não for definido
na subclasse e este atributo existir na superclasse, então, a subclasse herda o valor
default definido na superclasse.
São possíveis dois tipos de herança: simples (existe uma única superclasse para cada
classe) e múltipla (uma classe pode ter mais de uma superclasse, podendo herdar propriedades
ao longo de diversos caminhos). No caso da herança múltipla é comum acontecerem problemas
de conflitos que deverão ser tratados. A Figura 07 ilustra um tipo de conflito que pode acontecer
quando se utiliza herança múltipla.

Figura 07 – Exemplo de conflito com herança múltipla

Na Figura 07 é possível perceber que a superclasse é Pantera (que tem cor preta) e
Pantera Cor-de-rosa herda atributos e métodos de Pantera (relação classe-classe, por isso a
relação é do tipo ako). A classe Félix herda atributos e métodos da Pantera Cor-de-Rosa, pois,
Félix é uma instância da classe Pantera Cor-de-rosa (relação instância-classe por isso a relação é
do tipo is-a). Sabendo disso, pergunta-se: qual a cor de Félix? Félix será cor-de-rosa, pois, mesmo
herdando também da classe pantera, vale sempre a informação mais específica!!!
A herança de valores default para atributos em uma subclasse funcionará da seguinte
maneira:
• Se a subclasse não sabe o valor e suas superclasses também não, assume o seu
próprio valor default;
• Se a subclasse não sabe o valor, as superclasses também não e ela não tem seu próprio
valor default, então, herda o valor default das superclasses.
Conflitos na herança múltipla acontecerão quando:
• Existe mais de um slot is-a a partir de uma instância;
• Existe mais de um slot ako a partir de uma classe.
Nestes casos, será necessário escolher um procedimento para criar uma lista de
precedência de classes, ordenada por prioridade na herança de propriedades, da mais
especializada para as mais gerais.

2.3 Aplicações com sistemas de frames

Algumas aplicações merecem destaque, pois podem ser resolvidas muito bem com a
utilização de sistemas de frames. São elas:
• Reconhecer que uma dada situação pertence a certa categoria (matching): por
exemplo, reconhecimento visual de uma sala de aula;
Pantera
Cor: preta
Pantera Cor-de-Rosa
Cor: rosa
Félix
Cor: ?
ako
is-a
• Interpretar uma situação e/ou prever o que surgirá em termos da categoria
reconhecida (matching):por exemplo, uma pessoa com um revólver na mão implica
em perigo, uma vez que um revólver é uma arma e armas são perigosas;
• Capturar propriedades de senso comum sobre pessoas, eventos e ações: por
exemplo, a partir de um conjunto de características de uma pessoa, identificá-la como
potencial criminoso.

3. AMBIENTES PARA DESENVOLVIMENTO DE APLICAÇÕES UTILIZANDO FRAMES

Existem vários protótipos implementados para explorar a ideia de processamento
baseado em frames. Em [Ávila & Monard, 1991] estão descritas as seguintes ferramentas:
• FRL: é uma linguagem baseada em frames adaptada diretamente da proposta original
de Minsky [Minsky, 1975] e fornece um mecanismo de inferência não explícito. As
inferências devem ser codificadas nos procedimentos associados aos slots;
• KRL: é outra linguagem de representação de conhecimento baseada em frames. Ao
contrário da FRL, a KRL oferece um mecanismo de inferência na forma de casamento
de padrões (ou matching);
• KL-ONE: faz uma parte da relação de especialização. Embora não exista classificação,
existe a distinção entre conceitos descrevendo conjuntos de objetos e conceitos
descrevendo indivíduos;
• GUS: foi projetado como um protótipo de um sistema automático para reservas de
viagens – desempenha um agente de viagens em uma conversação com um cliente que
deseja fazer uma viagem a uma cidade da Califórnia;
• NUDGE: é um sistema baseado em frames que foi utilizado para o entendimento de
solicitações, possivelmente incompletas e inconsistentes, para planejamento das
atividades administrativas e foi desenvolvido em FRL;
• STAR-PLAN: serve como uma ajuda inteligente à operação, diagnóstico e correções
de mau funcionamento de satélites. É capaz de atuar sozinho como um simulador para
treinamento de operadores e peritos em diagnósticos.

4. SISTEMAS HÍBRIDOS

Os chamados sistemas híbridos tentam incorporar as vantagens dos formalismos
existentes para representação de conhecimento. Pode-se, por exemplo, associar a dedução da
lógica com o conceito de herança inerente aos frames e redes semânticas.
A tendência é se usar objetos (POO) no lugar de frames, por exemplo: lógica + objetos ou
regras + objetos.

5. CONCLUSÕES SOBRE OBJETOS ESTRUTURADOS

No decorrer da Unidade 03, estudamos os sistemas baseados em conhecimento. Nesta
unidade, foram apresentadas duas tabelas (Tabela 04 e Tabela 05) com as vantagens e
desvantagens de cada uma das diferentes formas de representação do conhecimento que seriam
estudadas nas Unidades 04 e 05. Ao término desta unidade e conhecidas as quatro formas de
representação, é interessante retornar a Unidade 03 e observar novamente ambas as tabelas
procurando identificar tais vantagens e desvantagens.
Entre as principais vantagens encontradas na utilização de frames podem-se destacar: a
possibilidade de capturar a maneira que os especialistas pensam a respeito de seu
conhecimento, a capacidade de fornecer uma representação estrutural concisa de relações, além
de suportar uma técnica de definição por especialização que é fácil de ser utilizada pela maioria
dos especialistas.
Como principal desvantagem pode-se destacar a considerável dificuldade de
implementação.
6. RACIOCÍNIO PROBABILÍSTICO
No decorrer da Unidade 04 e das seções 1 a 5 desta unidade, foram estudadas diferentes
formas de se representar o conhecimento, porém, nenhuma delas é capaz de representar
problemas de incerteza. Essa característica é natural ao ser humano, pois, ele é capaz de tratar
informações incompletas, inexatas e/ou incertas. Esse tratamento se deve especialmente ao fato
dos seres humanos usarem generalizações e aproximações quando há alguma “falta” ou
“incompletude” de informação, o que lhes permite, sumarizar experiências, fazer previsões e
principalmente tomar decisões.
O campo do Raciocínio Probabilístico (RP) é amplo e engloba:
• Teoria da probabilidade: representa o estudo matemático das probabilidades que
podem ser demonstrados a partir dos axiomas das probabilidades e da teoria dos
conjuntos;
• Teoria da decisão: que é formada por um conjunto de técnicas quantitativas cujo
objetivo principal é ajudar o tomador de decisão a sintetizar o problema e, também, a
solucioná-lo.
A junção destas técnicas aliada ao acúmulo de evidências faz com que se tenham
informações suficientes para se obter decisões de boa qualidade, que são fundamentais em
sistemas baseados em conhecimento. O esquema mostrado na Figura 08 ilustra essa situação.

Figura 08 – Esquema de associação das áreas para auxílio no processo de tomada de decisão
O tratamento de incerteza torna-se necessário quando existe falta de conhecimento ou
conhecimento impreciso, com isso, tornam-se necessárias técnicas que ajudam a minimizar
riscos no processo de tomada de decisão, gerando os chamados sistemas de apoio à decisão.
Esse tipo de sistema coleta evidências e modifica seu comportamento baseado nas evidências
coletadas.
6.1 Aplicações

Inúmeras aplicações podem ser destacadas em Sistemas de Apoio à Decisão, entre elas
vale citar:
• Previsão do tempo;
• Diagnósticos médicos;
• Mercado financeiro;
• Agricultura;
• Geologia, entre outras.
A seguir será descrito um exemplo de uma aplicação utilizando RP.
Teoria da Probabilidade
Teoria da Decisão
Acúmulo de Evidências
+
Decisões de Boa Qualidade
Fundamental em Sistemas
Baseados em Conhecimento
Imagine que exista interesse em examinar as evidências geológicas de uma região em
particular, para determinar se aquela região seria um bom ponto de perfuração para encontrar
petróleo. Para isso, o espaço a ser examinado é dividido em áreas denominadas: E1, E2, E3, E4 e
E5 como mostra a Figura 02.

Figura 08 – Áreas para exploração
A partir disso deseja-se saber: será que existe petróleo na região acima dadas as
evidências encontradas em E1, E2, E3, E4 e E5 de determinados minerais? Vale a pena explorar a
região X?
Responder a estas perguntas significa tomar decisões a partir de um conjunto de
evidências e, essas decisões são importantes, pois influenciam diretamente nos valores a serem
gastos na busca do petróleo. Não vale a pena perfurar uma região que não tem nenhuma
evidência de que possa haver petróleo nela.

6.2 Regra de Bayes

Uma importante meta de muitos sistemas de solução de problemas é coletar evidências
no decorrer do sistema e modificar o comportamento deste com base nestas evidências. Com o
intuito de moldar este comportamento, é necessária uma teoria estatística baseada em
evidências. A estatística bayesiana é uma destas teorias, e sua noção fundamental é a
probabilidade condicional representada por P(H/E), ou seja, a probabilidade de que a hipótese H
seja verdadeira dada à evidência E. Para calculá-la, é preciso levar em consideração a
probabilidade prévia de H (independente de qualquer evidência) e até que ponto E fornece
evidências de H. Dessa forma, temos:
• P(H/E): probabilidade do evento H ocorrer uma vez que E ocorreu;
• P(H): probabilidade do evento E ocorrer independente de qualquer outro (também
chamado de probabilidade a priori);
• P(E/H): probabilidade do evento E ocorrer uma vez que H ocorreu (também chamado
de probabilidade a posteriori).
O Teorema de Bayes data de 1973 e é resumido pela seguinte fórmula:

Onde: P(E) = P(E/H) * P(H) + P(E/~H) * P(~H)

Para ilustrar a aplicação da fórmula, utilizaremos o seguinte exemplo: Qual a
probabilidade de fazer calor hoje em Poços de Caldas (P(E)) e qual a probabilidade de chover
amanhã em Poços de Caldas sabendo que hoje está calor (P(H/E))?
Sabendo que:
• A probabilidade a priori de chover amanhã em Poços de Caldas é 0.6 � P(H) = 0.6;
• A probabilidade de fazer calor hoje dado que vai chover amanhã em Poços de Caldas é
0.95 � P(E/H) = 0.95;
• A probabilidade de fazer calorhoje dado que não vai chover amanhã em Poços de
Caldas é 0.2 � P(E/~H) = 0.2
Dessa forma:
• E é a evidência e é representada por: vai fazer calor;
• H é a hipótese e é representada por: vai chover amanhã (?)
Dessa forma, utilizando-se a(s) evidência(s), tenta-se provar a hipótese conforme pode
ser visto na Figura 09.

Figura 09 – Esquema de prova da hipótese
Substituindo na fórmula temos:
P(H/E) = P(E/H) * P(H)/ P(E)
P(H/E) = (0.95 * 0.6) / P(E)
Como não sabemos P(E) é necessário calcular. Assim, teremos:
P(E) = P(E/H) * P(H) + P(E/~H) * P(~H)
P(E) = 0.95 * 0.6 + 0.2 * 0.4
P(E) = 0.57 + 0.08
P(E) = 0.65 ou P(E) = 65%
Voltando a fórmula anterior teremos:
P(H/E) = (0.95 * 0.6) / P(E)
Evidência Hipótese
P(H/E) = (0.95 * 0.6) / 0.65
P(H/E) = 0.8769 ou P(H/E) = 87.69%
Ou seja, a probabilidade de fazer calor hoje é de 65% e a probabilidade de chover
amanhã, uma vez que hoje está calor, é de 87.69%.

7. LÓGICA FUZZY

Aristóteles foi o fundador da lógica e estabeleceu um conjunto de regras rígidas para que
as conclusões pudessem ser aceitas como logicamente válidas. A lógica de Aristóteles levava a
uma linha de raciocínio baseado em premissas tais como: se todo homem é mortal (premissa 1)
e João é homem (premissa 2) então, obrigatoriamente, João é mortal (conclusão). Esse tipo de
lógica é conhecido como lógica binária (0 ou 1), ou seja, uma declaração só pode ser verdadeira
ou falsa e, não pode ser, ao mesmo tempo, “parcialmente verdadeira e parcialmente falsa”. A
lógica fuzzy viola estas suposições, pois, um sim ou um não são respostas, muitas vezes,
incompletas. Assim, entre a certeza de ser e a certeza de não ser existem inúmeras
possibilidades.
Dessa forma, a lógica fuzzy tem se mostrado mais adequada para tratar imperfeições da
informação do que a teoria das probabilidades vistas na seção 1.
A lógica fuzzy é uma teoria bem recente da IA e foi introduzida por Lofti A. Zadeh da
Universidade da Califórnia em 1965, com o objetivo de modelar a incerteza inerente à linguagem
natural. De acordo com Zadeh, deve-se considerar a lógica fuzzy não como uma simples teoria,
mas, como uma metodologia para generalizar qualquer teoria específica de um estado discreto
(0 ou 1 – sim ou não) a um estado contínuo [0...1] através do processo de fuzzificação, de forma
que, uma premissa possui um grau de verdade de acordo com um grau de pertinência entre 0 e
1, incluindo 0 e 1.
O objetivo principal da lógica fuzzy é gerar uma saída lógica a partir de um conjunto de
entradas não precisas, com ruídos ou até mesmo incompletas.
Considerando um conjunto da lógica convencional onde 0 significa não pertence e 1
significa pertence, na lógica fuzzy, o valor 0 é utilizado para representar a não pertinência total
(∉) e o 1 para representar a pertinência total (∈). A partir disso, determinado elemento pode
pertencer a um conjunto com qualquer grau, como 0.3 ou 0.9, por exemplo.
Para ilustrar a aplicação deste modelo, suponha o seguinte exemplo: quando considerar
uma pessoa x alta?
Sabendo que o conjunto S (universo do discurso) é o conjunto de pessoas e ALTA é uma
variável linguística que representa uma característica cognitiva, para cada pessoa no universo
do discurso deve-se atribuir um grau de pertinência referente ao subconjunto fuzzy alto. Assim,
o modo mais simples é determinar uma função de pertinência como a mostrada na Figura 10
baseada na altura das pessoas.

Figura 10 – Função de pertinência para o conjunto ALTO
Isso significa que:
• Se a altura da pessoa for menor do que 1,50 m a pessoa não é alta (µalta = 0);
• Se a altura da pessoa for um valor entre 1,50 m e 1,70 m ela é alta com certo grau de
pertinência (0 < µalta < 1), ou seja, ela não é 100% alta;
• Se a altura da pessoa for maior do que 1,70 a pessoa é alta (µalta = 1).
Graficamente, podemos representar essa situação como mostrado na Figura 11.

Figura 11 – Gráfico da função de pertinência referente ao conceito ALTO
Através do gráfico, é possível perceber que quanto mais próxima a altura estiver de 1,70
m mais próximo de 1 será o grau de pertinência; e, quanto mais próxima de 1,50 m for a altura,
menor será o grau de pertinência tendendo a 0.
Portanto, expressões do tipo “A é alta” podem ser interpretadas conforme os graus de
pertinência, isto é, “A é alta = 0.34”.
As funções de pertinência usadas na maioria das aplicações, geralmente, são mais
complexas do que a mostrada anteriormente. As mais simples são funções triangulares
conforme pode ser observado na Figura 11, mas, também se devem considerar situações onde as
proposições envolvem mais de um critério, por exemplo, a função de pertinência para altura
pode ter uma relação direta com a idade da pessoa. Nestes casos, diz-se haver uma função
bidimensional, ou até mesmo, n-dimensional quando existirem n critérios.

7.1 Aplicações

Inúmeras são as aplicações em que se pode utilizar lógica fuzzy. Especialmente, em
sistemas baseados em conhecimento usa-se lógica fuzzy no tratamento da imprecisão referente à
descrição de variáveis linguísticas, tais como: predicados, expressões do tipo alto, grande,
cansado, triste etc., quantificadores tais como: maioria, minoria, muitos, alguns, poucos etc.,
modificadores de predicados: mais ou menos, extremamente, entre outros.
A primeira aplicação bem sucedida foi no desenvolvimento de controladores industriais.
Estes controladores tratam igualmente sistemas lineares e não lineares, além de não requererem
modelagem matemática do processo a ser controlado, o que se torna um grande atrativo em
sistemas fuzzy.
Estes sistemas têm se mostrado de grande utilidade em uma variedade de operações de
controle industrial e em tarefas de reconhecimento de padrões que vão desde o reconhecimento
de manuscritos até a avaliação de crédito financeiro. Além destes, vale ainda citar aplicações em:
pesquisa operacional, análise de dados, automação e controle, entre outros.
No Japão, a lógica fuzzy se faz presente no dia a dia do setor industrial, e muitos produtos
comerciais já estão disponíveis no mercado.

8. CONCLUSÕES SOBRE TRATAMENTOS DE INCERTEZA

Uma das principais potencialidades da lógica fuzzy quando comparada a outros
esquemas como, por exemplo, redes neurais que tratam com dados imprecisos, é o fato de que
suas bases de conhecimento estão em um formato de regras de produção, são simples de
examinar e de entender. Este formato de regra também torna fácil a manutenção e a atualização
da base de conhecimento.
Muitas pessoas confundem lógica fuzzy com raciocínio probabilístico, mas, é
fundamental frisar que o raciocínio probabilístico (visto na seção 7) trata o raciocínio incerto
sobre eventos ou conceitos bem definidos, enquanto, que a lógica fuzzy trata o raciocínio sobre
eventos ou conceitos nebulosos (ou fuzzy’s), tratando a incerteza referente à descrição de
variáveis linguísticas.

9. BIBLIOGRAFIA

[Ávila & Monard, 1991] Ávila, B. C. & Monard, M. C. Representação de Conhecimento
utilizando frames. Dissertação de Mestrado. Universidade de São Paulo, 1991.

[De Nardin, 2009] De Nardin, L. Objetos Estruturados. Notas de aula. 2009.

[De Nardin, 2009] De Nardin, L. Tratamento de Incerteza. Notas de aula. 2009.
[Junges, 2006] Junges, L. C. D. Introdução a Lógica Fuzzy. Notas de Aula. Departamento de
Automação de Sistemas – Universidade Federal de Santa Catarina. 2006.
[Luger, 2013] Luger, G. F. Inteligência Artificial. Porto Alegre: Bookman, 2004. xvi, 774p.
[Luger, 2004] Luger, G. F. Inteligência artificial: estruturas e estratégias para a resolução de
problemas complexos. Porto Alegre: Bookman, 2004. xvi, 774 p.
[Minsky, 1975] Minsky, M. A framework to represent knowledge. In The Psychology of
Computer Vision, págs. 211-277. McGraw-Hill, 1975.

[Quillian, 1968] Quillian, M. R. Semantic Memory.In M. Minsky, editor. Semantic Information
Processing, págs. 216-270. MIT Press, Cambridge, MA, 1968.
[Rezende, 2005] Rezende, S. O. Sistemas Inteligentes: Fundamentos e Aplicações. Barueri, SP:
Manole, 2005.
[Rich & Knight, 1994] Rich, E.; Knight, K. Inteligência Artificial. 2ª Ed., São Paulo: McGraw-Hill,
1994.
[Russell & Norvig, 2004] Russell, S.; Norvig, Peter. Inteligência Artificial. Rio de Janeiro:
Elsevier, 2013.
[Tanimoto, 1995] Tanimoto, S. L. Elements of Artificial Intelligence. 2ª Ed., Computer Science
Press, New York, 823 págs., 1995.

Redes Semânticas e Frames

PUC-MINAS

Ferramentas de estudo

Conteúdos escolhidos para você

Inteligência Artificial - Exercícios - Estácio

SIMULADO IA

TESTE DE INTELIGÊNCIA ARTIFICIAL

Inteligencia-Artificial simulado brtt

Inteligencia Artificial

Perguntas dessa disciplina

Pergunta 3 Sobre as provas operatórias à construção de estruturas cognitivas em psicopedagogia, leia atentamente as informações contidas nas colunas A

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

Questão 1 | MATEMATICA INSTRUMENTAL - DIGITAL A vantagem de utilizar um gráfico ao invés de uma tabela está na possibilidade de uma rápida impressão v

QUESTIONÁRIO – FUNDAMENTOS DE ÁLGEBRA – SEGUNDA GRADUAÇÃO 2 A lógica de Aristóteles – cujas estruturas, como os silogismos, eram formuladas com palavr

A Teoria da Atividade sugere que a tecnologia deve ser projetada para apoiar as práticas sociais existentes, em vez de forçar o usuário a se adapta...

Conteúdos escolhidos para você

Inteligência Artificial - Exercícios - Estácio

SIMULADO IA

TESTE DE INTELIGÊNCIA ARTIFICIAL

Inteligencia-Artificial simulado brtt

Inteligencia Artificial

Perguntas dessa disciplina

Pergunta 3 Sobre as provas operatórias à construção de estruturas cognitivas em psicopedagogia, leia atentamente as informações contidas nas colunas A

Pergunta 1 A Engenharia de Prompt transforma a interação com as IAs Generativas de um simples diálogo para uma colaboração cocriativa. Os prompts mais

Questão 1 | MATEMATICA INSTRUMENTAL - DIGITAL A vantagem de utilizar um gráfico ao invés de uma tabela está na possibilidade de uma rápida impressão v

QUESTIONÁRIO – FUNDAMENTOS DE ÁLGEBRA – SEGUNDA GRADUAÇÃO 2 A lógica de Aristóteles – cujas estruturas, como os silogismos, eram formuladas com palavr

A Teoria da Atividade sugere que a tecnologia deve ser projetada para apoiar as práticas sociais existentes, em vez de forçar o usuário a se adapta...

Mais conteúdos dessa disciplina