Buscar

The Vantage Point - Usos e funcionamento

Prévia do material em texto

SOBRE O VANTAGE POINT
VantagePoint é uma ferramenta de mineração de texto para extrair informações em bancos de dados. Além disso, permite a compreensão rapida e navegação por grandes volumes de informações baseadas em texto, dando-lhe uma maneira melhor de visualizar seus dados e transformar suas informações em conhecimento. A perspectiva fornecida pelo software auxilia nos conceitos e dados significativos em seus resultados de pesquisa, permitindo o esclarecimento entre os relacionamentos dos elementos e encontre padrões de referência. Essas ligações são possíveis pela capacidade de importação de dados de diversos banco de dados on-line e formulação de filtros de exportação, permitindo o manejo e criação de um banco de dados próprio. 
COMO O SOFTWARE MANEJA OS DADOS
Um arquivo VantagePoint (*.vpt) contém todos os dados para um determinado conjunto de documentos. A criação e a utilização de um arquivo VantagePoint está ilustrada no diagrama a seguir:
Figura 1: Diagrama do fluxo de dados do software. (VantagePoint User's Guide, 2017) 
O usuário consulta uma base de dados bibliográfica (de qualquer tipo, inclusive on-line) e recebe dados bibliográficos brutos. Quando um arquivo de dados bibliográficos bruto é importado para o VantagePoint, o pré-processador analisa o texto da seguinte maneira:
1. Inicialmente, o texto é dividido em registros individuais. Um registro é o maior segmento individual de informações no arquivo. Um arquivo de dados brutos consiste em vários registros (dezenas, centenas, ou talvez milhares), cada um deles com uma estrutura semelhante.
2. Em seguida, o pré-processador divide cada registro em campos. Para a maior parte, cada registro contém a mesma estrutura de campo (por exemplo, título, autores, palavras-chave, resumo, etc.). Em raras ocasiões, um campo pode estar ausente de um registro.
3. Por seguinte, o pré-processador divide os campos de texto (por exemplo, o resumo e o título) em palavras ou frases e cria um novo campo para eles (por exemplo, palavras abstratas, palavras de título e frases abstratas).
4. Finalmente, o pré-processador cria um banco de dados relacionando todo o conteúdo dos campos a todos os registros. Por exemplo, se a palavra "química" for encontrada em pelo menos um registro, então a palavra "química" é inserida no banco de dados e essa palavra está ligada a cada registro que contém a palavra "química".
O arquivo VantagePoint consiste dessa base de dados relacionando as palavras aos registros. Como o usuário define grupos de itens de lista, as informações de associação de grupo são armazenadas no arquivo VantagePoint. Além disso, como o usuário cria modos de exibição dos dados (também chamados de folhas), essas folhas são salvas no arquivo VantagePoint.
A forma mais básica de dados brutos do VantagePoint é feita por meio de um registro bibliográfico. Nas bases de dados bibliográficas, um registro consiste em um único resumo de um artigo científico ou documento técnico, juntamente com as informações associadas (por exemplo, o título, os nomes dos autores, a afiliação do autor principal, as datas, etc.). Cada tipo de informação no registro é um campo. A figura a seguir ilustra a quantidade de informação presente em um único registro bibliográfico. Neste registro, os campos são Autores, Universidade, Título, Palavras-Chave, Data, Resumo, etc. Em muitos casos, os campos entregues pelo mecanismo de pesquisa bibliográfico contêm mais informações do que simplesmente ser considerado um "pedaço" de dados. As áreas de texto em destaque (amarelo) ilustram como o VantagePoint analisa alguns dos campos do registro para um nível maior de detalhes, extraindo dados de maior relevância. 
Figura 2: Exemplo do tipo de registro bibliográfico analisado pelo Software. (VantagePoint User's Guide, 2017)

Continue navegando