Buscar

Redes Semânticas e Frames

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Unidade 05 – Objetos Estruturados (Redes Semânticas e Frames) e 
Tratamento de Incerteza 
1. REDES SEMÂNTICAS 
 Historicamente, as redes semânticas foram propostas em 1913 por Selz como uma 
tentativa de explicação aos fenômenos psicológicos. A ideia era de que o processo humano de 
resolver problemas era considerado como um processo de preenchimento de espaços vazios de 
uma descrição parcialmente completa. Em 1968, Quillian [Quillian, 1968] implementou essas 
redes e demonstrou que o conhecimento semântico poderia ser representado como um 
relacionamento entre dois objetos, afinal, a ideia fundamental deste modelo é que o significado 
de um conceito está ligado diretamente à forma como ele é conectado a outros conceitos [Rich, 
1994]. 
 A partir disso, uma rede semântica é uma representação em que: 
• As informações são representadas como um conjunto de nós que representam as 
entidades e links (slots) que representam relacionamentos entre essas entidades; 
• Cada link conecta um nó origem a um nó destino e estabelece uma ligação; 
• Normalmente, os nós e links denotam entidades de um domínio bem específico. 
 As redes semânticas estão na origem da programação orientada a objetos e permitem 
uma considerável redução no tempo de pesquisa já que os nós estão diretamente aos nós 
vizinhos com maior significância. 
 Um fragmento de uma rede semântica típica é mostrado na Figura 01. 
 
Título: Unidade 5 
Profª. M. Sc. Luciana De Nardin 
 
Figura 01 – Fragmento de uma rede semântica 
 
 Na Figura 01 é possível extrair as seguintes relações entre os nós: 
1) Ana is-a pessoa; 
2) Cadeira ako mobília; 
3) Cadeira-27 is-a cadeira; 
4) Cadeira-27 tem um dono que é Ana; 
5) Cadeira-27 tem o preto como cor; 
6) Cadeira-27 has-a assento; 
7) Assento tem estofamento de couro. 
 Além das relações extraídas na Figura 01, tem-se ainda a relação part-of. As diferenças 
entre elas são: 
• Ako (a kind of): estabelece relações entre classes (exemplo: classe cadeira e classe 
mobília); 
• Is-a (é um): estabelece relações entre classes e instâncias (exemplo: Ana é uma 
instância da classe pessoa e Cadeira-27 é uma instância da classe cadeira); 
• Has-a (tem um): identifica herança de propriedades das entidades (exemplo: 
Cadeira-27 tem um assento); 
• Part-of (parte de): identifica herança de propriedades das entidades (com a seta no 
sentido poderíamos ter a seguinte relação: Assento é parte de Cadeira); 
• Variados: os demais arcos (dono, cor, estofamento) também chamados de traços 
são específicos para este domínio e representam propriedades de conceitos. 
 Como citado anteriormente, as redes semânticas permitem herança de propriedades. 
Esse tipo de herança acontece quando as propriedades de um nó são especificadas apenas uma 
vez no mais alto nível da hierarquia e são herdadas por todos os conceitos derivados, o que 
acarreta em economia de memória. Porém, não são permitidas heranças múltiplas! Um 
problema derivado da herança é o tratamento do exceções. A Figura 02 ilustra uma dessas 
exceções. 
 
 
 
 
Figura 02 - Herança de propriedades 
 Sobre a Figura 02 pergunta-se: 
1) Qual a cor de Clyde? 
2) Clyde deve ser considerado cinza por ser um elefante? 
 Em casos como esse, vale sempre a regra de dar prioridade ao atributo mais específico, 
ou seja, se Clyde tem um atributo cor será assumido o valor deste atributo, caso ele não tenha, aí 
sim irá valer o atributo herdado. 
 A rede semântica para representar a Figura 02 é: 
> (snet-store '(color (clyde real e-um) 
(real elefante e-um) 
(elefante cinza e-um) 
(clyde elefante e-um) 
(real cinza (not . e-um)))) 
t 
 
 Em redes semânticas têm-se: snet-store – que serve para armazenar uma rede – e snet-
query – que serve para consultar informações em uma rede. 
 Dessa forma, a base de conhecimento de uma rede semântica está armazenada em seus 
nós e arcos. Enquanto que o mecanismo de inferência realiza a busca e casamento de padrões, e 
essa busca acontece “navegando” para frente e para trás através dos arcos. 
 Neste caso, a busca pode ser usada de várias maneiras para extrair informações, sendo: 
 - como uma ferramenta explicativa; 
 - para explorar exaustivamente um tópico; 
 - para encontrar o relacionamento entre dois objetos. 
 A Figura 03, apresentada a seguir, será utilizada para mostrar algumas formas de 
extração de informações de uma rede semântica. 
É um É um É um 
Clyde Elefante Real Elefante Cinza 
Não é um 
 
Figura 03 – Exemplo de uma rede semântica 
 Várias informações podem ser buscadas dentro dessa rede semântica, por exemplo: 
como provar a declaração “Cães comem”? 
 Para isso, percorre-se a rede iniciando a partir do nó “cão”, sendo assim: 
• Cão é um tipo de mamífero; 
• Mamífero é um tipo de animal; 
• Animal faz comer, portanto, cães comem! 
 Além disso, é possível derivar todo o conhecimento sobre “cães” utilizando a busca em 
largura a partir do nó cão, sendo elas: 
• Cães são mamíferos; 
• Cães têm pelos; 
• Cães são animais; 
• Cães comem. 
 Para verificar se cães e pássaros estão relacionados, pode-se executar uma busca em 
largura a partir de ambos, de forma que uma ativação é iniciada nos dois nós separadamente, e 
se observa onde eles se encontram. Este ponto nos dá uma pista sobre o relacionamento entre 
ambos. Esse processo é chamado de ativação distribuída ou intersecção de busca e explora 
uma das mais importantes vantagens que as redes semânticas têm sobre as estruturas 
puramente lógicas, o aproveitamento da organização do conhecimento. 
 Para o caso de cães e pássaros realizando a intersecção de busca, é possível perceber que 
o relacionamento mais próximo entre eles é o de que ambos são animais. 
 Outras vantagens das redes semânticas, que valem ser destacadas, são: 
• Representação visual fácil de entender; 
• Flexibilidade na manipulação de nós e links com relação à adição, deleção e/ou 
modificação; 
• Economia através da herança representada por relações do tipo is-a; e, 
• Capta “senso-comum”, ou seja, funciona de maneira semelhante ao armazenamento 
de informações no cérebro. 
 Como desvantagens podem-se citar o fato de: 
• Permitirem realizar inferências inválidas; 
• Não ter uma norma de interpretação, pois a interpretação depende dos programas 
que a manipulam. 
 Além destas, conhecendo a representação de redes semânticas, pergunta-se: é possível 
dizer tudo com redes semânticas? Mas, como usar quantificadores? Como escrever, por exemplo, 
∀x ∀y pessoa (x) ∧ porta (y) ⇒ abriu (x, y)? 
 Por não conseguir representar “tudo”, houve tentativas de estender as redes semânticas, 
porém, o resultado não foi intuitivo, ferindo a principal vantagem deste modelo de 
representação de conhecimento. 
 Como ferramenta de implementação de redes semânticas, merece destaque: 
• KNOB: plugin (que estende o JGraphPad) com ambiente de produção de bases de 
conhecimento em linguagem lógica para sistemas especialistas utilizando redes 
semânticas; 
• JGraphPad é uma ferramenta de edição de grafos construída pela comunidade de 
software livre com base no componente JGraph que implementa um codec para 
processar redes semânticas e a partir destas gerar código Prolog. 
 
2. FRAMES 
 
 O frame é considerado uma evolução das redes semânticas e sua ideia fundamental foi 
introduzida por Marvin Minsky [Minsky, 1975]. As aplicações propostas por Minsky para o novo 
método foram: análise de cenas, modelagem da percepção visual e compreensão de linguagem 
natural. Entretanto, Minsky não propôs nenhuma metodologia de implementação nem definição 
formal do método, tais conceitos só foram propostos posteriormente. 
 Um frame é uma coleção de atributos, em geral, chamados de slots e valores associados a 
eles que descrevem alguma entidade complexa do mundo. Algumas vezes, um frame descreve 
uma entidade em termos absolutos e, raramente, um frame sozinho tem utilidade. 
 Um sistema de frames é um conjuntode frames organizados hierarquicamente e é muito 
parecido com uma rede semântica exceto pelo fato de que: 
• Nós são substituídos por frames; 
• Arcos ou links são substituídos por atributos (slots); 
• Procedimentos podem ser associados a um frame (procedimentos demons). 
 Os frames possuem, pelo menos, dois atributos que são nome e a relação. O nome é o 
próprio nome do frame e a relação é utilizada com o intuito de melhorar a estruturação 
(hierarquia/herança). Neste caso, são privilegiados dois tipos: ako (relação entre classes) e is-a 
(relação entre instância e classe). 
 A Figura 04 ilustra um fragmento de um sistema de frames. Esse sistema é semelhante à 
rede semântica ilustrada na Figura 03. 
 
Figura 04 – Fragmento de um sistema de frames 
 
 Na Figura 04 é possível perceber que, quando a relação é do tipo ako ou is-a, o frame está 
ligado ao seu “pai” e não tem informações de atributos dentro dele. Diferente do que acontece 
em relações chamadas de “variadas” como no caso do “tem” que a informação “pelos” está 
representada dentro do frame. 
 Cada atributo aponta para outro frame ou para um tipo primitivo e consiste de um 
conjunto de facetas (atributos de atributos). 
 As facetas contêm informações que descrevem os slots (ou frames). Tais informações 
podem definir claramente os valores que o slot pode assumir ou podem indicar de que forma 
calcular ou deduzir o seu valor [Ávila & Monard, 1991]. 
 As facetas descrevem conhecimento ou algum procedimento relativo ao atributo e 
permitem expressar restrições semânticas referentes aos slots. Dessa forma, as facetas são 
utilizadas para garantir a coerência dos frames dentro de sua taxonomia. Os principais tipos de 
facetas que podem ser utilizados dentro dos slots são: 
• Tipo: indica o tipo de dado (inteiro, símbolo, real etc.); 
• Domínio: descreve os valores possíveis para o slot (por exemplo: de 0 a 10); 
• Valor: especifica o único valor possível (número de lados de um retângulo); 
• Valor default: especifica o valor que será assumido pelo slot caso não haja nenhuma 
informação a seu respeito; 
• Procedimentos demons: são procedimentos anexados aos frames disparados por 
consultas ou atualizações. Maiores detalhes serão apresentados na próxima seção. 
 A Figura 05 apresenta a representação abstrata genérica de um frame. 
 
Figura 05 – Representação abstrata de um frame 
 Os frames integram conhecimento declarativo sobre objetos e eventos e conhecimento 
procedimental sobre a forma com que as informações serão recuperadas ou os valores serão 
calculados. 
 
2.1 Procedimentos demons 
 
 Os procedimentos demons são semelhantes aos triggers disparados em banco de dados 
quando determinadas solicitações acontecem. São procedimentos demons: 
• When-requested: é disparado quando um valor é solicitado, mas, ele ainda não 
existe; 
• When-read: é disparado quando um valor é lido; 
• When-written: é disparado sempre que um valor é modificado; 
• When-deleted: é disparado quando um valor é eliminado. 
A Figura 06 apresenta um exemplo de frames que utilizam procedimentos demons. 
 
Figura 06 – Exemplo de frames utilizando procedimentos demons 
 
 Na Figura 06 é possível perceber que uma requisição do tipo when-read será disparada, 
se quisermos saber qual o tipo de formato que o frame cômodo tem. Uma requisição do tipo 
when-written será disparada, se quisermos alterar o valor da área do frame sala (que herda 
atributos e características do frame cômodo que, por sua vez, herda do frame lugar_coberto). 
 O frame ilustrado na Figura 06 poderá ser escrito como: 
 
> (frame-store '(lugar-coberto root)) 
 t 
> (frame-store '(comodo lugar-coberto 
 (numero-de-paredes 4) 
 (formato retangular) 
 (altura 3) 
 (area nil) 
 (volume (lambda (f s) 
 (*(get-slot f ( quote altura)) 
 (get-slot f (quote area)))) 
 if-necessary))) 
 t 
> (frame-store '(sala comodo 
 (mobiliario (sofa mesa cadeiras)) 
 (finalidade convivencia))) 
 (area 25) 
 t 
 
 Quando um sistema de frames não utiliza procedimentos demons ele se torna 
equivalente a uma rede semântica. 
 Com relação à POO, os procedimentos demons são equivalentes aos métodos com 
exceção de que: 
• Em frames, os procedimentos demons estão associados a um atributo e só são 
disparados (gatilho de banco de dados) mediante consulta ou modificações sobre o 
atributo. Não existe o conceito de “mensagens”! 
• Em POO, os métodos estão associados à classe, e os objetos podem receber 
mensagens. 
A partir disso, é possível perceber que a POO é mais flexível. 
 
2.2 Herança 
 
 Classes são inseridas em uma hierarquia de especialização, em que uma classe mais 
especializada pode herdar propriedades da classe mais geral. Neste contexto, a classe mais geral 
é denominada superclasse e a mais específica subclasse [Ávila & Monard, 1991]. 
 Em um sistema de frames, a herança pode acontecer de pelo menos três maneiras: 
• Herança de valor: conceito similar à herança de atributos em programação orientada 
a objetos (POO) em que o frame hierarquicamente subordinado herda diretamente da 
superclasse; 
• Herança de procedimentos: conceito similar à herança de métodos em POO. Neste 
caso, o simples preenchimento de um slot com certo valor pode, por exemplo, 
disparar um procedimento para verificar a consistência do preenchimento; 
• Herança de valor por default: neste caso, se o valor de um atributo não for definido 
na subclasse e este atributo existir na superclasse, então, a subclasse herda o valor 
default definido na superclasse. 
 São possíveis dois tipos de herança: simples (existe uma única superclasse para cada 
classe) e múltipla (uma classe pode ter mais de uma superclasse, podendo herdar propriedades 
ao longo de diversos caminhos). No caso da herança múltipla é comum acontecerem problemas 
de conflitos que deverão ser tratados. A Figura 07 ilustra um tipo de conflito que pode acontecer 
quando se utiliza herança múltipla. 
 
 
 
 
 
 
 
 
Figura 07 – Exemplo de conflito com herança múltipla 
 
 Na Figura 07 é possível perceber que a superclasse é Pantera (que tem cor preta) e 
Pantera Cor-de-rosa herda atributos e métodos de Pantera (relação classe-classe, por isso a 
relação é do tipo ako). A classe Félix herda atributos e métodos da Pantera Cor-de-Rosa, pois, 
Félix é uma instância da classe Pantera Cor-de-rosa (relação instância-classe por isso a relação é 
do tipo is-a). Sabendo disso, pergunta-se: qual a cor de Félix? Félix será cor-de-rosa, pois, mesmo 
herdando também da classe pantera, vale sempre a informação mais específica!!! 
 A herança de valores default para atributos em uma subclasse funcionará da seguinte 
maneira: 
• Se a subclasse não sabe o valor e suas superclasses também não, assume o seu 
próprio valor default; 
• Se a subclasse não sabe o valor, as superclasses também não e ela não tem seu próprio 
valor default, então, herda o valor default das superclasses. 
 Conflitos na herança múltipla acontecerão quando: 
• Existe mais de um slot is-a a partir de uma instância; 
• Existe mais de um slot ako a partir de uma classe. 
 Nestes casos, será necessário escolher um procedimento para criar uma lista de 
precedência de classes, ordenada por prioridade na herança de propriedades, da mais 
especializada para as mais gerais. 
 
2.3 Aplicações com sistemas de frames 
 
 Algumas aplicações merecem destaque, pois podem ser resolvidas muito bem com a 
utilização de sistemas de frames. São elas: 
• Reconhecer que uma dada situação pertence a certa categoria (matching): por 
exemplo, reconhecimento visual de uma sala de aula; 
Pantera 
Cor: preta 
Pantera Cor-de-Rosa 
Cor: rosa 
Félix 
Cor: ? 
ako 
is-a 
• Interpretar uma situação e/ou prever o que surgirá em termos da categoria 
reconhecida (matching):por exemplo, uma pessoa com um revólver na mão implica 
em perigo, uma vez que um revólver é uma arma e armas são perigosas; 
• Capturar propriedades de senso comum sobre pessoas, eventos e ações: por 
exemplo, a partir de um conjunto de características de uma pessoa, identificá-la como 
potencial criminoso. 
 
3. AMBIENTES PARA DESENVOLVIMENTO DE APLICAÇÕES UTILIZANDO FRAMES 
 
 Existem vários protótipos implementados para explorar a ideia de processamento 
baseado em frames. Em [Ávila & Monard, 1991] estão descritas as seguintes ferramentas: 
• FRL: é uma linguagem baseada em frames adaptada diretamente da proposta original 
de Minsky [Minsky, 1975] e fornece um mecanismo de inferência não explícito. As 
inferências devem ser codificadas nos procedimentos associados aos slots; 
• KRL: é outra linguagem de representação de conhecimento baseada em frames. Ao 
contrário da FRL, a KRL oferece um mecanismo de inferência na forma de casamento 
de padrões (ou matching); 
• KL-ONE: faz uma parte da relação de especialização. Embora não exista classificação, 
existe a distinção entre conceitos descrevendo conjuntos de objetos e conceitos 
descrevendo indivíduos; 
• GUS: foi projetado como um protótipo de um sistema automático para reservas de 
viagens – desempenha um agente de viagens em uma conversação com um cliente que 
deseja fazer uma viagem a uma cidade da Califórnia; 
• NUDGE: é um sistema baseado em frames que foi utilizado para o entendimento de 
solicitações, possivelmente incompletas e inconsistentes, para planejamento das 
atividades administrativas e foi desenvolvido em FRL; 
• STAR-PLAN: serve como uma ajuda inteligente à operação, diagnóstico e correções 
de mau funcionamento de satélites. É capaz de atuar sozinho como um simulador para 
treinamento de operadores e peritos em diagnósticos. 
 
4. SISTEMAS HÍBRIDOS 
 
 Os chamados sistemas híbridos tentam incorporar as vantagens dos formalismos 
existentes para representação de conhecimento. Pode-se, por exemplo, associar a dedução da 
lógica com o conceito de herança inerente aos frames e redes semânticas. 
 A tendência é se usar objetos (POO) no lugar de frames, por exemplo: lógica + objetos ou 
regras + objetos. 
 
5. CONCLUSÕES SOBRE OBJETOS ESTRUTURADOS 
 
 No decorrer da Unidade 03, estudamos os sistemas baseados em conhecimento. Nesta 
unidade, foram apresentadas duas tabelas (Tabela 04 e Tabela 05) com as vantagens e 
desvantagens de cada uma das diferentes formas de representação do conhecimento que seriam 
estudadas nas Unidades 04 e 05. Ao término desta unidade e conhecidas as quatro formas de 
representação, é interessante retornar a Unidade 03 e observar novamente ambas as tabelas 
procurando identificar tais vantagens e desvantagens. 
 Entre as principais vantagens encontradas na utilização de frames podem-se destacar: a 
possibilidade de capturar a maneira que os especialistas pensam a respeito de seu 
conhecimento, a capacidade de fornecer uma representação estrutural concisa de relações, além 
de suportar uma técnica de definição por especialização que é fácil de ser utilizada pela maioria 
dos especialistas. 
 Como principal desvantagem pode-se destacar a considerável dificuldade de 
implementação. 
6. RACIOCÍNIO PROBABILÍSTICO 
 No decorrer da Unidade 04 e das seções 1 a 5 desta unidade, foram estudadas diferentes 
formas de se representar o conhecimento, porém, nenhuma delas é capaz de representar 
problemas de incerteza. Essa característica é natural ao ser humano, pois, ele é capaz de tratar 
informações incompletas, inexatas e/ou incertas. Esse tratamento se deve especialmente ao fato 
dos seres humanos usarem generalizações e aproximações quando há alguma “falta” ou 
“incompletude” de informação, o que lhes permite, sumarizar experiências, fazer previsões e 
principalmente tomar decisões. 
 O campo do Raciocínio Probabilístico (RP) é amplo e engloba: 
• Teoria da probabilidade: representa o estudo matemático das probabilidades que 
podem ser demonstrados a partir dos axiomas das probabilidades e da teoria dos 
conjuntos; 
• Teoria da decisão: que é formada por um conjunto de técnicas quantitativas cujo 
objetivo principal é ajudar o tomador de decisão a sintetizar o problema e, também, a 
solucioná-lo. 
 A junção destas técnicas aliada ao acúmulo de evidências faz com que se tenham 
informações suficientes para se obter decisões de boa qualidade, que são fundamentais em 
sistemas baseados em conhecimento. O esquema mostrado na Figura 08 ilustra essa situação. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Figura 08 – Esquema de associação das áreas para auxílio no processo de tomada de decisão 
 O tratamento de incerteza torna-se necessário quando existe falta de conhecimento ou 
conhecimento impreciso, com isso, tornam-se necessárias técnicas que ajudam a minimizar 
riscos no processo de tomada de decisão, gerando os chamados sistemas de apoio à decisão. 
Esse tipo de sistema coleta evidências e modifica seu comportamento baseado nas evidências 
coletadas. 
6.1 Aplicações 
 
 Inúmeras aplicações podem ser destacadas em Sistemas de Apoio à Decisão, entre elas 
vale citar: 
• Previsão do tempo; 
• Diagnósticos médicos; 
• Mercado financeiro; 
• Agricultura; 
• Geologia, entre outras. 
A seguir será descrito um exemplo de uma aplicação utilizando RP. 
Teoria da Probabilidade 
Teoria da Decisão 
Acúmulo de Evidências 
+ 
Decisões de Boa Qualidade 
Fundamental em Sistemas 
Baseados em Conhecimento 
Imagine que exista interesse em examinar as evidências geológicas de uma região em 
particular, para determinar se aquela região seria um bom ponto de perfuração para encontrar 
petróleo. Para isso, o espaço a ser examinado é dividido em áreas denominadas: E1, E2, E3, E4 e 
E5 como mostra a Figura 02. 
 
Figura 08 – Áreas para exploração 
 A partir disso deseja-se saber: será que existe petróleo na região acima dadas as 
evidências encontradas em E1, E2, E3, E4 e E5 de determinados minerais? Vale a pena explorar a 
região X? 
 Responder a estas perguntas significa tomar decisões a partir de um conjunto de 
evidências e, essas decisões são importantes, pois influenciam diretamente nos valores a serem 
gastos na busca do petróleo. Não vale a pena perfurar uma região que não tem nenhuma 
evidência de que possa haver petróleo nela. 
 
6.2 Regra de Bayes 
 
 Uma importante meta de muitos sistemas de solução de problemas é coletar evidências 
no decorrer do sistema e modificar o comportamento deste com base nestas evidências. Com o 
intuito de moldar este comportamento, é necessária uma teoria estatística baseada em 
evidências. A estatística bayesiana é uma destas teorias, e sua noção fundamental é a 
probabilidade condicional representada por P(H/E), ou seja, a probabilidade de que a hipótese H 
seja verdadeira dada à evidência E. Para calculá-la, é preciso levar em consideração a 
probabilidade prévia de H (independente de qualquer evidência) e até que ponto E fornece 
evidências de H. Dessa forma, temos: 
• P(H/E): probabilidade do evento H ocorrer uma vez que E ocorreu; 
• P(H): probabilidade do evento E ocorrer independente de qualquer outro (também 
chamado de probabilidade a priori); 
• P(E/H): probabilidade do evento E ocorrer uma vez que H ocorreu (também chamado 
de probabilidade a posteriori). 
O Teorema de Bayes data de 1973 e é resumido pela seguinte fórmula: 
 
Onde: P(E) = P(E/H) * P(H) + P(E/~H) * P(~H) 
 
 Para ilustrar a aplicação da fórmula, utilizaremos o seguinte exemplo: Qual a 
probabilidade de fazer calor hoje em Poços de Caldas (P(E)) e qual a probabilidade de chover 
amanhã em Poços de Caldas sabendo que hoje está calor (P(H/E))? 
 Sabendo que: 
• A probabilidade a priori de chover amanhã em Poços de Caldas é 0.6 � P(H) = 0.6; 
• A probabilidade de fazer calor hoje dado que vai chover amanhã em Poços de Caldas é 
0.95 � P(E/H) = 0.95; 
• A probabilidade de fazer calorhoje dado que não vai chover amanhã em Poços de 
Caldas é 0.2 � P(E/~H) = 0.2 
Dessa forma: 
• E é a evidência e é representada por: vai fazer calor; 
• H é a hipótese e é representada por: vai chover amanhã (?) 
Dessa forma, utilizando-se a(s) evidência(s), tenta-se provar a hipótese conforme pode 
ser visto na Figura 09. 
 
 
 
 
 
Figura 09 – Esquema de prova da hipótese 
 Substituindo na fórmula temos: 
P(H/E) = P(E/H) * P(H)/ P(E) 
P(H/E) = (0.95 * 0.6) / P(E) 
 Como não sabemos P(E) é necessário calcular. Assim, teremos: 
P(E) = P(E/H) * P(H) + P(E/~H) * P(~H) 
P(E) = 0.95 * 0.6 + 0.2 * 0.4 
P(E) = 0.57 + 0.08 
P(E) = 0.65 ou P(E) = 65% 
 Voltando a fórmula anterior teremos: 
P(H/E) = (0.95 * 0.6) / P(E) 
Evidência Hipótese 
P(H/E) = (0.95 * 0.6) / 0.65 
P(H/E) = 0.8769 ou P(H/E) = 87.69% 
 Ou seja, a probabilidade de fazer calor hoje é de 65% e a probabilidade de chover 
amanhã, uma vez que hoje está calor, é de 87.69%. 
 
7. LÓGICA FUZZY 
 
 Aristóteles foi o fundador da lógica e estabeleceu um conjunto de regras rígidas para que 
as conclusões pudessem ser aceitas como logicamente válidas. A lógica de Aristóteles levava a 
uma linha de raciocínio baseado em premissas tais como: se todo homem é mortal (premissa 1) 
e João é homem (premissa 2) então, obrigatoriamente, João é mortal (conclusão). Esse tipo de 
lógica é conhecido como lógica binária (0 ou 1), ou seja, uma declaração só pode ser verdadeira 
ou falsa e, não pode ser, ao mesmo tempo, “parcialmente verdadeira e parcialmente falsa”. A 
lógica fuzzy viola estas suposições, pois, um sim ou um não são respostas, muitas vezes, 
incompletas. Assim, entre a certeza de ser e a certeza de não ser existem inúmeras 
possibilidades. 
 Dessa forma, a lógica fuzzy tem se mostrado mais adequada para tratar imperfeições da 
informação do que a teoria das probabilidades vistas na seção 1. 
 A lógica fuzzy é uma teoria bem recente da IA e foi introduzida por Lofti A. Zadeh da 
Universidade da Califórnia em 1965, com o objetivo de modelar a incerteza inerente à linguagem 
natural. De acordo com Zadeh, deve-se considerar a lógica fuzzy não como uma simples teoria, 
mas, como uma metodologia para generalizar qualquer teoria específica de um estado discreto 
(0 ou 1 – sim ou não) a um estado contínuo [0...1] através do processo de fuzzificação, de forma 
que, uma premissa possui um grau de verdade de acordo com um grau de pertinência entre 0 e 
1, incluindo 0 e 1. 
 O objetivo principal da lógica fuzzy é gerar uma saída lógica a partir de um conjunto de 
entradas não precisas, com ruídos ou até mesmo incompletas. 
 Considerando um conjunto da lógica convencional onde 0 significa não pertence e 1 
significa pertence, na lógica fuzzy, o valor 0 é utilizado para representar a não pertinência total 
(∉) e o 1 para representar a pertinência total (∈). A partir disso, determinado elemento pode 
pertencer a um conjunto com qualquer grau, como 0.3 ou 0.9, por exemplo. 
 Para ilustrar a aplicação deste modelo, suponha o seguinte exemplo: quando considerar 
uma pessoa x alta? 
 Sabendo que o conjunto S (universo do discurso) é o conjunto de pessoas e ALTA é uma 
variável linguística que representa uma característica cognitiva, para cada pessoa no universo 
do discurso deve-se atribuir um grau de pertinência referente ao subconjunto fuzzy alto. Assim, 
o modo mais simples é determinar uma função de pertinência como a mostrada na Figura 10 
baseada na altura das pessoas. 
 
Figura 10 – Função de pertinência para o conjunto ALTO 
 Isso significa que: 
• Se a altura da pessoa for menor do que 1,50 m a pessoa não é alta (µalta = 0); 
• Se a altura da pessoa for um valor entre 1,50 m e 1,70 m ela é alta com certo grau de 
pertinência (0 < µalta < 1), ou seja, ela não é 100% alta; 
• Se a altura da pessoa for maior do que 1,70 a pessoa é alta (µalta = 1). 
 Graficamente, podemos representar essa situação como mostrado na Figura 11. 
 
Figura 11 – Gráfico da função de pertinência referente ao conceito ALTO 
 Através do gráfico, é possível perceber que quanto mais próxima a altura estiver de 1,70 
m mais próximo de 1 será o grau de pertinência; e, quanto mais próxima de 1,50 m for a altura, 
menor será o grau de pertinência tendendo a 0. 
 Portanto, expressões do tipo “A é alta” podem ser interpretadas conforme os graus de 
pertinência, isto é, “A é alta = 0.34”. 
 As funções de pertinência usadas na maioria das aplicações, geralmente, são mais 
complexas do que a mostrada anteriormente. As mais simples são funções triangulares 
conforme pode ser observado na Figura 11, mas, também se devem considerar situações onde as 
proposições envolvem mais de um critério, por exemplo, a função de pertinência para altura 
pode ter uma relação direta com a idade da pessoa. Nestes casos, diz-se haver uma função 
bidimensional, ou até mesmo, n-dimensional quando existirem n critérios. 
 
7.1 Aplicações 
 
 Inúmeras são as aplicações em que se pode utilizar lógica fuzzy. Especialmente, em 
sistemas baseados em conhecimento usa-se lógica fuzzy no tratamento da imprecisão referente à 
descrição de variáveis linguísticas, tais como: predicados, expressões do tipo alto, grande, 
cansado, triste etc., quantificadores tais como: maioria, minoria, muitos, alguns, poucos etc., 
modificadores de predicados: mais ou menos, extremamente, entre outros. 
 A primeira aplicação bem sucedida foi no desenvolvimento de controladores industriais. 
Estes controladores tratam igualmente sistemas lineares e não lineares, além de não requererem 
modelagem matemática do processo a ser controlado, o que se torna um grande atrativo em 
sistemas fuzzy. 
 Estes sistemas têm se mostrado de grande utilidade em uma variedade de operações de 
controle industrial e em tarefas de reconhecimento de padrões que vão desde o reconhecimento 
de manuscritos até a avaliação de crédito financeiro. Além destes, vale ainda citar aplicações em: 
pesquisa operacional, análise de dados, automação e controle, entre outros. 
 No Japão, a lógica fuzzy se faz presente no dia a dia do setor industrial, e muitos produtos 
comerciais já estão disponíveis no mercado. 
 
8. CONCLUSÕES SOBRE TRATAMENTOS DE INCERTEZA 
 
 Uma das principais potencialidades da lógica fuzzy quando comparada a outros 
esquemas como, por exemplo, redes neurais que tratam com dados imprecisos, é o fato de que 
suas bases de conhecimento estão em um formato de regras de produção, são simples de 
examinar e de entender. Este formato de regra também torna fácil a manutenção e a atualização 
da base de conhecimento. 
 Muitas pessoas confundem lógica fuzzy com raciocínio probabilístico, mas, é 
fundamental frisar que o raciocínio probabilístico (visto na seção 7) trata o raciocínio incerto 
sobre eventos ou conceitos bem definidos, enquanto, que a lógica fuzzy trata o raciocínio sobre 
eventos ou conceitos nebulosos (ou fuzzy’s), tratando a incerteza referente à descrição de 
variáveis linguísticas. 
 
9. BIBLIOGRAFIA 
 
[Ávila & Monard, 1991] Ávila, B. C. & Monard, M. C. Representação de Conhecimento 
utilizando frames. Dissertação de Mestrado. Universidade de São Paulo, 1991. 
 
[De Nardin, 2009] De Nardin, L. Objetos Estruturados. Notas de aula. 2009. 
 
[De Nardin, 2009] De Nardin, L. Tratamento de Incerteza. Notas de aula. 2009. 
[Junges, 2006] Junges, L. C. D. Introdução a Lógica Fuzzy. Notas de Aula. Departamento de 
Automação de Sistemas – Universidade Federal de Santa Catarina. 2006. 
[Luger, 2013] Luger, G. F. Inteligência Artificial. Porto Alegre: Bookman, 2004. xvi, 774p. 
[Luger, 2004] Luger, G. F. Inteligência artificial: estruturas e estratégias para a resolução de 
problemas complexos. Porto Alegre: Bookman, 2004. xvi, 774 p. 
[Minsky, 1975] Minsky, M. A framework to represent knowledge. In The Psychology of 
Computer Vision, págs. 211-277. McGraw-Hill, 1975. 
 
[Quillian, 1968] Quillian, M. R. Semantic Memory.In M. Minsky, editor. Semantic Information 
Processing, págs. 216-270. MIT Press, Cambridge, MA, 1968. 
[Rezende, 2005] Rezende, S. O. Sistemas Inteligentes: Fundamentos e Aplicações. Barueri, SP: 
Manole, 2005. 
[Rich & Knight, 1994] Rich, E.; Knight, K. Inteligência Artificial. 2ª Ed., São Paulo: McGraw-Hill, 
1994. 
[Russell & Norvig, 2004] Russell, S.; Norvig, Peter. Inteligência Artificial. Rio de Janeiro: 
Elsevier, 2013. 
 [Tanimoto, 1995] Tanimoto, S. L. Elements of Artificial Intelligence. 2ª Ed., Computer Science 
Press, New York, 823 págs., 1995.

Continue navegando