A maior rede de estudos do Brasil

Grátis
183 pág.
Ebook Ferramentas Digitais Para Jornalistas

Pré-visualização | Página 36 de 43

Em outras palavras, facilita a localização de documentos, visto que determinados processos 
de rastreamento em bases de dados deixam de ser manuais e passam a funcionar dentro de 
programas que fazem esse trabalho para nós.
A Web Semântica tem sido impulsionada por Tim Berners-Lee, o criador da World Wide Web. 
Em 2000, Berners-Lee deu uma palestra na qual ele propôs que as novas informações devem 
ser reunidas de forma que um buscador possa “entendê-la” ao invés de simplesmente colocá-la 
em uma “lista”. 
A Web Semântica seria uma rede de documentos “mais inteligentes” para permite pesquisas 
mais inteligentes. Não é uma nova Web, mas uma extensão da Web existente. Em maio de 
2001, Tim Berners Lee, James Hendler e Ora Lassila popularizaram a ideia da Web Semântica, 
publicando um artigo na revista Scientific American, intitulado “The Semantic Web: a new form 
of Web content that is meaninful to computers will unleash a revolution of new possibilities”, 
que está acessível, em inglês, no seguinte link: http://www.scientificamerican.com/article.
cfm?id=the-semantic-web&page=1. No texto, os autores explicam o conceito e oferecem 
maneiras possíveis de realizá-lo.
A diferença entre a Web que conhecemos para a Web Semântica parte de dois conceitos 
diferentes: sintaxe e semântica. Se durante um teste vocacional um estudante pré-universitário 
diz: “De todas as profissões, a que eu mais gosto é o jornalismo”, a sintaxe tem a ver com as 
palavras e os sinais utilizados na construção da frase. A semântica é o que a frase realmente 
significa. Nesse caso, o significado se refere a uma escolha particular dentro de uma vasta gama 
de opções. Se mudarmos o verbo: “De todas as profissões, a que mais me atrai é o jornalismo”, 
a sintaxe mudou, mas o significado é o mesmo. Se ele disser que “De todas as profissões, a que 
mais me incomoda é o jornalismo”, a sintaxe mudou, mas o significado também foi alterado.
a WEB SEMÂNtICa 
• • • 142 • • •
capítulo 7
Os metadados (dados que descrevem outros dados) foram projetados para que se interprete 
“a semântica” dos documentos. Eles poderiam ser visualizados com rótulos que permitem uma 
melhor clareza de onde estão determinadas informações.
As chamadas ontologias também servem para isso. Eles são responsáveis por definir os termos 
utilizados para descrever e representar uma área do conhecimento e são utilizados pelos usuários. 
As bases de dados e aplicativos necessários para compartilhar informações específicas. Ontologias 
incluem definições de conceitos básicos em um determinado campo e a relação entre eles.
A Web Semântica utiliza, essencialmente, os mecanismos que ajudam a converter a Web em 
uma infra-estrutura global onde é possível compartilhar e reutilizar dados entre os diferentes 
tipos de usuários. Entre eles estão:
1- RDF: Fornece informações descritivas sobre os recursos encontrados na Web. É usado 
em catálogos de livros, listas, coleções, etc.
2- SPARQL: A linguagem de consulta sobre o RDF, que permite fazer consultas sobre os 
recursos da Web Semântica usando várias fontes de dados.
3- OWL: linguagem para definir ontologias estruturadas que podem ser utilizadas em 
sistemas diferentes. As ontologias são utilizadas pelos usuários, as bases de dados e os 
aplicativos que são necessários para compartilhar informações específicas, como esporte, 
arquitetura ou biologia.
Quando fazemos uma pesquisa na Internet, basicamente o que fazemos é comunicar um 
computador com outro computador através da linguagem HTML, que tem a capacidade de 
estabelecer diferenças de sintaxe, mas não de semântica.
Quando os buscadores começam a utilizar o conceito semântico, tornam-se mais precisos, 
porque, antes, não podiam distinguir entre coisas, pessoas, objetos, eventos, etc. Por exemplo, 
Lima pode significar muitas coisas: a capital do Peru, um objeto com o qual forma as unhas ou 
uma fruta ácida.
Então, ao procurar por “Lima” não se distingue semanticamente entre os seus diversos 
significados. No entanto, nas páginas onde estará hospedada a palavra “Lima”, há informações 
semânticas que podem fazer essa distinção, separando diferentes conceitos.
Alguns acreditam que a Web Semântica terá um efeito profundo em todos os níveis de 
consumo de informação.
Você pode testar alguns complementos do Firefox, de download gratuito, que trabalham com o 
conceito semântico. Entre eles:
a WEB SEMÂNtICa 
• • • 143 • • •
capítulo 7
1- Operator: https://addons.mozilla.org/pt-BR/firefox/addon/4106
 Aproveita os dados disponíveis em várias páginas e dá ao Firefox a capacidade de 
detectar informações em microformatos. Ou seja, se em um site existe informação 
pessoal, lista de contatos, localização geográfica, etc., o Operator apresenta esses dados 
de forma organizada, permitindo “operar” essas informações. Se houver informações 
sobre um evento, você poderá adicioná-lo ao seu calendário ou, se houver informações 
geográficas, você poderá localizá-lo no mapa.
2- Semantic Radar: https://addons.mozilla.org/en-US/firefox/addon/3886
 Exibe um ícone na barra do navegador para indicar a presença de dados da Web 
Semântica em um site.
Buscadores Semânticos
Tecnicamente, um buscador semântico é um aplicativo que pode entender as pesquisas de cada 
usuário, assim como os documentos contidos na Web, usando as listas de operações, ordenadas 
e finitas, que permitem encontrar a solução para um problema. Essas listas são chamadas de 
algoritmos.
A chave é encontrar o que é solicitado dentro do contexto apropriado. Às vezes, me 
perguntam por que os buscadores que usamos normalmente não são semânticos (ainda), e 
a resposta é que sua estratégia é baseada em algoritmos que geram estatísticas a partir de 
palavras e links, e não em algoritmos capazes de entender o significado das palavras em um 
determinado contexto.
Por exemplo, se alguém precisa viajar para a cidade de La Paz, capital da Bolívia, e pesquisa por 
“como chegar a La Paz”, talvez um dos primeiros resultados estejam relacionados a “viver e 
trabalhar em paz”, que não tem nada a ver com a informação solicitada.
Hoje a maioria dos buscadores semânticos respondem a perguntas formuladas em inglês e é 
precário o desenvolvimento para o espanhol, português e outros. Alguns foram concebidos 
com características visuais, próprias da Web 2.0 e foram incluídos na lista dos buscadores visuais 
do capítulo 1, mas funcionam para o conceito semântico em questão.
1- WolframAlpha: http://www.wolframalpha.com/
 É talvez um dos mais interessantes neste momento. Não funciona como buscador, mas 
se define como “motor de inteligência computacional”. Ele é descartado por muitos 
jornalistas, mas eles deveriam tentar fazer novas buscas. Não é fácil entender como 
ele funciona. Demora um pouco mais para ser compreendido do que um buscador 
convencional. Por exemplo, ao digitar o termo “Cadmium”, que é um poluente de metais 
pesados, ele responde com as características do metal e a sua localização na tabela 
a WEB SEMÂNtICa 
• • • 144 • • •
capítulo 7
periódica de elementos químicos, algo que o Google não resolve de forma tão eficiente, 
porque geralmente aponta para a Wikipédia. O mesmo acontece quando temos pressa 
para encontrar a data do “Watergate”. Ele não dá uma lista de links, e sim uma síntese de 
informações relevantes, como se fosse uma enciclopédia.
 
2- Twine: http://www.twine.com/
 Com o formato de uma rede social, permite encontrar pessoas com interesses comuns, 
de uma forma muito eficiente. O mesmo aplica-se a temas específicos. Ele pode 
armazenar, organizar e compartilhar informações de forma seletiva, com a semântica que 
agrega mais do que a maioria das outras redes de conhecimento. Eu sugiro a inscrição na 
lista do Top 10 Twines.
 
a WEB SEMÂNtICa 
• • • 145 • • •
capítulo 7
3- Bing: www.bing.com
 Usa ontologias para identificar