Os modelos de recuperação de informação mais utilizados são três: modelo booleano, modelo vetorial e modelo probabilístico. Sobre os modelos de rec...
Os modelos de recuperação de informação mais utilizados são três: modelo booleano, modelo vetorial e modelo probabilístico. Sobre os modelos de recuperação de informação, assinale a alternativa CORRETA.
A O modelo Booleano é baseado em estatística de palavras e compões a maior parte dos sistemas de RI. Estes modelos utilizam contagem de palavras para geração de dados estatísticos. B O modelo Vetorial utiliza vetores de palavras chaves interligados por expressões lógicas como E, OU e NÃO para realizar uma busca de palavras nos textos e assim retornar um valor positivo ou negativo resultante da busca. C O modelo Probabilístico é baseado em estatística de palavras ao gerá-las através da contagem de palavras. Neste modelo os pesos utilizados para cada termo não são binários, possibilitando a geração de um grau de similaridade entre documentos. D O modelo Vetorial é baseado em um framework de probabilidades de termos de indexação nos documentos. Neste caso, dada a consulta de um usuário, não existirá nenhum documento que não pertencerá ao conjunto de documentos que contenham exatamente os documentos relevantes ao usuário. E O modelo Booleano por palavra-chave é característico dos sistemas mais antigos de RI e é baseado em busca simples de palavras dentro dos documentos. Se a palavra buscada aparecer no documento, ele será apresentado, caso contrário, não.
A alternativa correta é a letra C. O modelo probabilístico é baseado em estatística de palavras ao gerá-las através da contagem de palavras. Neste modelo, os pesos utilizados para cada termo não são binários, possibilitando a geração de um grau de similaridade entre documentos.
0
0
Faça como milhares de estudantes: teste grátis o Passei Direto
Compartilhar