Questão 6/10 - Natural Language Processing Os modelos de recuperação de informação mais utilizados são três: modelo booleano, modelo vetorial e mod...
Questão 6/10 - Natural Language Processing Os modelos de recuperação de informação mais utilizados são três: modelo booleano, modelo vetorial e modelo probabilístico. Sobre os modelos de recuperação de informação, assinale a alternativa CORRETA.
a) O modelo Booleano é baseado em estatística de palavras e compões a maior parte dos sistemas de RI. Estes modelos utilizam contagem de palavras para geração de dados estatísticos. b) O modelo Vetorial utiliza vetores de palavras chaves interligados por expressões lógicas como E, OU e NÃO para realizar uma busca de palavras nos textos e assim retornar um valor positivo ou negativo resultante da busca. c) O modelo Probabilístico é baseado em estatística de palavras ao gerá-las através da contagem de palavras. Neste modelo os pesos utilizados para cada termo não são binários, possibilitando a geração de um grau de similaridade entre documentos. d) O modelo Vetorial é baseado em um framework de probabilidades de termos de indexação nos documentos. Neste caso, dada a consulta de um usuário, não existirá nenhum documento que não pertencerá ao conjunto de documentos que contenham exatamente os documentos relevantes ao usuário. e) O modelo Booleano por palavra-chave é característico dos sistemas mais antigos de RI e é baseado em busca simples de palavras dentro dos documentos. Se a palavra buscada aparecer no documento, ele será apresentado, caso contrário, não.
A alternativa correta é a letra c) O modelo Probabilístico é baseado em estatística de palavras ao gerá-las através da contagem de palavras. Neste modelo os pesos utilizados para cada termo não são binários, possibilitando a geração de um grau de similaridade entre documentos.
0
0
Faça como milhares de estudantes: teste grátis o Passei Direto
Compartilhar