Buscar

SRI - sistema de recuperação de informação

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

SISTEMA DE RECUPERAÇÃO DE INFORMAÇÕES
Organização do Conhecimento 
Prof.ª Deise Sabbag
Sistema de Recuperação de Informações
Como organizar informação para que o conhecimento fique visível e possa ser acessado e fruído?
Para responder essa questão precisamos caracterizar os Sistemas de Recuperação da informações (SRIs)
É no interior dos SRIs que são utilizadas as linguagens documentárias 
Sistema de Recuperação de Informações
 Um Sistema de Recuperação da Informação (SRI) é uma “organização” para armazenar e tornar disponível informação, explorando-a de modo positivo, com um índice de assunto dos documentos existentes na coleção, permitindo recuperar as referências
Sistema de Recuperação de Informações
“Os SRIs organizam e viabilizam o acesso aos itens informacionais, através das atividades de (OLIVEIRA, 2008)”:
 
representação das informações contidas nos documentos;
do armazenamento e gestão física dos documentos e seus representações; e 
recuperação das informações e documentos armazenados. 
Sistema de Recuperação de Informações
Os SRIs possuem vários subsistemas (DIAS; NAVES, 2007):
Entrada: desenvolvimento de coleções, tratamento da informação e armazenagem;
Saída: análise e negociação de questões, estratégia de busca, busca e disseminação;
Administração: administra o sistema. 
Sistema de Recuperação de Informações
(SOUZA, 2006)
Os modelos de Recuperação se dividem em:
CLÁSSICOS: cada documento é descrito por um conjunto de palavras-chave representativas (também chamadas de termos de indexação) que buscam representar o assunto do documento e sumarizar seu conteúdo de forma significativa;
ESTRUTURADOS: além das palavras-chaves, algumas informações acerca da estrutura do texto (seções a serem pesquisadas, fontes de letras, proximidade das palavras, etc.
Sistema de Recuperação de Informações
	
	Neste contexto, os OPACs (Online Public Access Catalogue) são uma das categorias do Sistema de Recuperação da Informação.
	Para Fiuza (1980) o catálogo exerce diversas funções: localizadora, bibliográfica e instrutiva.
	De acordo com a Declaração dos Princípios Internacionais de Catalogação (2009) o catálogo deve permitir:
Encontrar recursos bibliográficos numa coleção ( real ou virtual) como resultado de uma pesquisa;
Localizar um determinado recurso;
Localizar conjuntos de recursos representando todos os recursos de uma mesma obra, mesma expressão, mesma manifestação, mesma assunto, etc.;
Identificar um recurso bibliográfico ou agente;
Selecionar um recurso bibliográfico que seja apropriado às necessidades do utilizador;
Adquirir ou obter acesso a um item descrito;
Navegar num catálogo.
Sistema de Recuperação de Informações
Sistema de Recuperação de Informações
Os OPACs mudam as rotina dos catálogos em ficha: usuário fisicamente na biblioteca; a pesquisa permitia um usuário por vez.
Sistema de Recuperação de Informações
Os OPACs são variadamente chamados de:
Catálogos de computador (computer catalogs);
Catálogos online (online catalogs);
Catálogos de fichas automatizados (automated card catalogs);
Catálogos de acesso de cliente (patron access catalogs); e
Catálogo em linha de acesso público (online público access catalogs).
E conhecidos pelas siglas: OLC, PAC e OPAC.
Sistema de Recuperação de Informações
Os OPACs tornam possível a utilização de vários recursos por muitos usuários ao mesma tempo.
Sistema de Recuperação de Informações
“A História dos Catálogo online difere amplamente da história dos sistemas de recuperação da informação em três aspectos : origem, conteúdo do arquivo e usuários (OLIVEIRA, 2008 apud HILDRETH, 1985). 
Desenvolvimento dos OPACs (BALBY, 2002):
1ª Geração: Considerada como um catálogo de ficha automatizado. Pontos de acesso somente par. Combinação exata de palavra/frase a partir dos seus primeiros caracteres significativos. Tinha o formato de registro contendo pouca informação bibliográfica. Não existia qualquer meio de refinamento de buscas através dos resultados iniciais;
2ª Geração: Índices definidos por tabela de parametrização. Visualização de relações entre termos pelo usuário final. Lista topográfica. Registro bibliográfico em formato completo, com links que possibilitam a expansão da busca. Agrupamentos de registros em bases lógicas. Ligações hierárquicas e horizontais entre registros. Ordenação ad hod de resultados de busca;
Acesso a banco de dados comerciais através de OPAC. Melhoramento do registro bibliográfico. Relação do registro bibliográfico com os arquivos digitais. Relação dos registros bibliográficos a mecanismos de busca.
Origem
Existência de computadores
Implementação de catálogos online/coletivos online; bases de dados;
Software para manter e pesquisar a informação;
Armazenamento e RI: pesquisa de documentos
Necessidade sentida nas bibliotecas nos anos 50;
Reforço: proliferação de documentos eletrônicos;
A criação da www.
 
Sistema de Recuperação de Informações
BOCCATO, 2007
O Online Public Access Catalog (OPAC) é uma parte essencial dos sistemas de automatização de bibliotecas.
Historicamente OPACs
1ª Geração: 1960 e 1970 a partir de catálogos manuais. Primeiro projeto foi o INTREX (Information Transfer Experiments), Massachusetts Institute of Technology (MIT). Não possuia critérios de descrição bibliográfica. Recuperação feita por cabeçalhos de assunto pré-coordenados e a interface dificultava a interatividade do usuários com o sistema;
2ª Geração: possibilitou a recuperação da informação por meio de palavras-chaves (operadores boleanos AND, OR, NOT). A Pós-coordenação dos termos possibilitou uma recuperação mais satisfatória ao usuário com interface mais amigável;
3ª Geração: filosofia de cooperação e compartilhamentos de serviços e produtos. Permite o uso de linguagem natural associada a linguagem documentárias na R.I. 
4ª Geração: a partir de 1993, fase experimental marcada pelo uso da metodologia hipertexto, possibilitando a importação e exportação integradas de registros, acentuando a interporabilidade.
Sistema de Recuperação de Informações
BOCCATO, 2007
Sistemas de Recuperação da Informação
(KOBASHI, 2007)
1) Sistemas Abertos: o equilíbrio é dependente de mecanismos de regulação de diferentes naturezas
2) O conhecimento e suas representações se expressam pela linguagem.
Linguagens que operam em contextos:
PRODUÇAO E BUSCA DE INFOR.
A análise e produção em LD comportam abordagens de perspectivas : políticas, ideológicas teóricas e 
metodológicas adotadas
3) A LD faz a comunicação e os fluxos de mensagens entre: CONTEXTO e PÚBLICO ou SISTEMA e USUÁRIO
Estas perguntam determinam a construção de LDs
O PORQUÊ?
PARA QUÊ?
PARA QUEM?
AS LINGUAGENS DOCUMENTÁRIAS
Representam o conhecimento registrado
Promove a interação entre dispositivos e usuários
ORTEGA, (S.D.)
“Um sistema de recuperação de informação (SRI) pode ser como um conjunto de dados padronizados, armazenados em meio eletrônico, utilizados para identificar a informação e fornecer sua localização.”
USUÁRIO DOCUMENTO 
INFORMAÇÃO SUBSTÍTUTOS
 Necessário operações que 
 fabriquem substítutos.
REPRESENTAÇÕES REPRESENTAÇÕES DOCUMETÁRIAS
O SRI possui S (Saída): lista ordenada de substitutos de documentos que satisfaçam algumas condições
a) Descrição bibliográfica;
b) Registro por Símbolos;
c) Ordenação em sequência universalmente conhecida;
d) Estada de equilíbrio.
Sistema de Recuperação de Informações
ORTEGA, (S.D.)
Processos de um SRI:
Representação descritiva;
Representação temática;
Representação da informação;
Arranjo sequêncial;
Função de exploração do sistema.
RECUPERAÇÃO DA INFORMAÇÃO
 CONTROLE BIBLIOGRÁFICO
Sistema de Recuperação de Informações
(BARITÉ, 2007)
Sistema de Informação
Aquele que tem por finalidade exclusiva o armazenamento, processamento, recuperação e difusão da informação contida em documentos de qualquer espécie.
Sistema de Recuperação de Informações
(SOUZA, 2006)
Interface entre uma coleção de recursos de informação, em meio impresso ou não, e uma população de usuários. 
Desempenham as seguintes tarefas: 
aquisição e armazenamento de documentos; 
organização e controle desses; 
e distribuição e disseminação aos usuários.
Sistema de Recuperação de Informações
(SOUZA, 2006)
Os SRIs ORGANIZAM e VIABILIZAM o acesso aos itens de informação, desempenhando as atividades de:
Representação das informações contidas nos documentos (indexação e descrição dos documentos);
Armazenamento e gestão física e/ou lógica desses documentos e de suas representações;
Sistema de Recuperação de Informações
Recuperação das informações representadas e dos próprios documentos armazenados, de forma a satisfazer as necessidades de informação dos usuários. Para isso é necessário que haja uma interface na qual os usuários possam descrever suas necessidades e questões, e através da qual possam também examinar os documentos atinentes recuperados e/ou suas representações. 
Sistema de Recuperação de Informações
 Associação 
 REGISTROS CONTEÚDOS INFORMACIONAIS
Problemas podem ocorrer nessa associação acarretando problemas nas respostas a questões específicas.
 
Índices que o SRI deve buscar estabelecer com qualidade
REVOCAÇÃO: mede a proporção de documentos relevantes recuperados;
PRECISÃO: mede quantos documentos relevantes foram recuperados. 
Sistema de Recuperação de Informações
Sistema de Recuperação de Informações
 REVOCAÇÃO:
O QUE É? - capacidade do SRI de oferecer, em resposta a uma questão, todas as referências relevantes do catálogo e/ou base de dados
COMO É MEDIDA? - coeficiente de revocação =
nº de referências relevantes recuperadas 6x100= 54% no total de referências relevantes no SRI 11	
Sistema de Recuperação de Informações
 PRECISÃO:
 O QUE É? - Capacidade do SRI em fornecer somente referências relevantes, evitando referências 
inúteis	
COMO É MEDIDA? - coeficiente de precisão =
nº de referências relevantes recuperadas 6 x 100= 10% 
nº total de referências na busca 60
Sistema de Recuperação de Informações
 Revocação = capacidade de recuperar documentos úteis 
Precisão = capacidade de evitar documentos inúteis
Temos um grande DESAFIO.......
Como REPRESENTAR ...
Resumo: The Affair explora os efeitos emocionais de uma relação extra-conjugal entre Noah Solloway e Alison Bailey depois de se conhecerem na vila costeira de Montauk emLong Island. Noah é um professor em Nova Iorque e ex-aluno da Williams College que conseguiu publicar um romance e está a ter dificuldades a escrever o segundo. Tem um casamento feliz e quatro filhos, mas ressente o facto de estar dependente do dinheiro do seu sogro rico. Alison é uma jovem empregada de mesa que está a tentar juntar os cacos da sua vida e do seu casamento após a morte do seu filho. A história do caso é contada separadamente e as memórias mudam consoante as perspetivas.
Fonte: http://pt.wikipedia.org/wiki/The_Affair 
http://www.seriesonlinehd.org/assistir-the-affair-dublado-e-legendado-online-2/ 
Seriado “The Affair”
REFERÊNCIAS
BALBY, C. N. Estudos de uso de catálogos online (OPACs): revisão metodológica e aplicação da técnica de análise de log de transações a um OPAC de biblioteca. 2002. 137 f. Tese (Doutorado em Ciências da Comunicação) – Escola de Comunicação e Artes, Universidade de São Paulo, 2002.
BARITÉ, M. Diccionario de organización y representación del conocimiento. Clasificación, indización, terminologia. Disponível em: < 164.73.14.9/kod/portugues/creditos.php >. Acesso em: 19 nov. 2012.
BOCCATO, V. R. C. Avaliação do uso de linguagem documentária em catálogos coletivos de bibliotecas universitárias: um estudo sociocognitivo com protocolo verbal. 301 f. Tese (Doutorado em Ciência da Informação) – Faculdade de Filosofia e Ciências, Universidade Estadual Paulista, 2009. 
DIAS, E. W.; NAVES, M. M. L. Análise de assunto: teoria e prática. Brasília: Tesauros, 2007. 116 p.
FIUZA, M. M. Estudo das funções do catálogo da biblioteca central do SESC. 1980. 102 f. Dissertação (Mestrado em Administração de Bibliotecas) – Escola de Biblioteconomia, Universidade Federal de Minas Gerais, Belo Horizonte, 1980.
IFLA Cataloguing Section. Statement of International Cataloguing Principles. Versão 2009. Disponível em: < www.ifla.org/publications/statemente-of-international-cataloguing-principles> . Acesso em: 19 de nov. 2012. 
KOBASHI, N. Y. A elaboração de informações documentárias em busca de uma metodologia. Tese (Doutorado em Ciências da Comunicação) - Faculdade de Comunicação e Artes, Universidade de São Paulo, 1994.
OLIVEIRA, C. C. V. A interação dos usuários da UFMG com o Catálogo online do Sistema Pergamum. 2008. 200 f. Dissertação (Mestrado em Ciência da Informação) – Universidade Federal de Minas Gerais, Belo Horizonte, 2008. Disponível em: < www.gercinalima.com/mhtx/pages/prototipo-btdeci/dissertacoes/oliveira-ccv/folha-de-rosto.php > . Acesso em: 12 nov. 2012. 
SOUZA, R. R. Sistemas de recuperação da informações e mecanismos de busca na Web. Perspectivas em Ciência da Informação, Belo Horizonte, v. 11, n. 2, p. 161-173, maio/ago. 2006.

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando