Buscar

PROVA ON-LINE_ 13 - Recuperação da Informação na Web e Redes Sociais (2023)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023)
https://pucminas.instructure.com/courses/145873/quizzes/381708 1/5
PROVA ON-LINE
Entrega Sem prazo
Pontos 40
Perguntas 10
Limite de tempo 60 Minutos
Tentativas permitidas 2
Instruções
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 10 minutos 40 de 40
Pontuação desta tentativa: 40 de 40
Enviado 21 abr em 13:24
Esta tentativa levou 10 minutos.

Pergunta 1
4 / 4 pts
 Ajuda a descobrir a soma dos menores caminhos no grafo.
INSTRUÇÕES DA AVALIAÇÃO ON-LINE
- A prova tem a duração de 60 minutos. 
- Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. Ao acessar a página com as
questões, o tempo começa a ser contado.
- A prova é composta de 10 (dez) questões objetivas, sendo 04 (quatro) pontos cada.
- Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize esse
botão quando tiver finalizado a avaliação.
- Se necessário, durante a prova, entre em contato pelo link “Atendimento”.
- Você terá 02 (duas) tentativas e, caso necessite de uma nova, será preciso solicitar a prova extra,
que requer pagamento de taxa adicional.
Atenção: Todas as provas iniciadas e que não houverem sido submetidas serão automaticamente
encerradas pelo sistema transcorridos os 60 minutos de duração.
Boa prova!
Fazer o teste novamente
O PageRank é:
https://pucminas.instructure.com/courses/145873/quizzes/381708/history?version=1
https://pucminas.instructure.com/courses/145873/quizzes/381708/take?user_id=250441
21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023)
https://pucminas.instructure.com/courses/145873/quizzes/381708 2/5
 Calcula o quanto um vértice está próximo dos demais em um grafo.
Correto!
 
Uma medida de importância que procura expressar a probabilidade de um caminhante aleatório no grafo chegar a
um vértice P.
 
Uma medida de importância que procura destacar um vértice no grafo, através da soma do número de links ou
arestas de entrada nesse vértice.

Pergunta 2
4 / 4 pts
Correto!
 /table//td[1]
Outra opção correta seria colocar o caminho completo e barras simples /table/tr/td[1] .
 /html/get("Conteudo A")
 //table[@class=’tabelaX’]
 /XPATH/<td>[1]

Pergunta 3
4 / 4 pts
 
Fizemos um grafo não direcional baseado em curtidas. Vértices são os usuários e arestas são os likes entre eles.
 
Fizemos um grafo não direcional baseado no total de termos do assunto. Vértices são os usuários e arestas são o
IDF de termos utilizados em cada retweet.
Correto!
 
Fizemos um grafo direcional baseado em retweets. Vértices são os usuários e arestas são os retweets entre eles.
Qual regra XPATH você utilizaria para extrair apenas a linha "<td>Conteúdo A</td>" na tabela
HTML abaixo?
 
<table>
<tr>
 <td>Conteúdo A</td>
 <td>Conteúdo B</td>
</tr>
</table>
Nos exercícios práticos, qual foi a medida que utilizamos para detectar influenciadores?
21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023)
https://pucminas.instructure.com/courses/145873/quizzes/381708 3/5
 
Fizemos um grafo direcional baseado no total de seguidores. Vértices são os usuários e arestas são o número de
seguidores que os usuários têm.

Pergunta 4
4 / 4 pts
 Palavras-chave.
Correto!
 Stopwords.
 Crowdsourcing.
 Bag of Words.

Pergunta 5
4 / 4 pts
 Bag of Words.
 Crawling.
Correto!
 Stemming.
 Stopwords.

Pergunta 6
4 / 4 pts
 Mixed Qualities Reference - MQR.
Correto!
 HITS - Hubs e Autoridades.
 PageRank.
 Qualidade de Referências.

Pergunta 7
4 / 4 pts
Como são chamados os termos ou palavras que contribuem pouco com a análise do texto, também
pouco ajudam a discriminar um documento relevante entre os demais da coleção a partir de uma
consulta textual?
A técnica que nos ajuda a reduzir variações (gerúndio, plural...) de palavras que possuem a mesma
semântica, reduzindo esses termos ao seu respectivo radical é:
Medida de importância dada a um vértice P que considera a qualidade dos vértices que apontam
para P assim como a qualidade dos vértices em que P aponta. 
O IDF (inverse document frequency - inverso da frequência nos documentos) mede o grau de
raridade de uma palavra.
21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023)
https://pucminas.instructure.com/courses/145873/quizzes/381708 4/5
Correto!
 True
 False

Pergunta 8
4 / 4 pts
 
Softwares que “varrem” a internet buscando e armazenando informações. Nosso interesse é em baixar o conteúdo
HTML de websites.
 
API é o acrônimo de Application Processing Information ou, em português, Interface de Processamento de
Informações de Aplicativos; É um padrão RSS desenvolvido em linguagem XML que nos permite coletar
informações em sites e blogs de notícias.
 
API é o acrônimo de Application Programming Interface ou, em português, Interface de Programação de
Aplicativos; É uma linguagem de consulta (Query Language) que nos permite selecionar nós de um documento
XML. Pode ser usada para computar valores (por exemplo, strings, números ou valores booleanos) do conteúdo de
um documento XML.
Correto!
 
API é o acrônimo de Application Programming Interface ou, em português, Interface de Programação de
Aplicativos; Um exemplo popular é a utilização para leitura e publicação de mensagens (por exemplo no Twitter).
No nosso caso queremos coletar dados de aplicações da Web como as mídias sociais.

Pergunta 9
4 / 4 pts
 
Excluir termos com mais de 4 caracteres. Palavras com 5 ou mais caracteres geralmente não tem importância no
texto.
 
Excluir termos com menos de 4 caracteres. Palavras com até 3 caracteres geralmente não tem importância no
texto.
Correto!
O que é uma API, e qual o nosso interesse nesse tipo de recurso ?
Em uma análise textual, por exemplo uma nuvem de palavras.
Entre as alternativas abaixo, qual critério de exclusão seria mais indicado para remover da base os
termos menos relevantes, ou seja aqueles que contribuem pouco na interpretação dos padrões? 
Dica: Sempre é possível testar processamentos diversos e adaptar ao tipo de análise desejada. Mas
alguns deles são conhecidos por trazerem melhores resultados e menores perdas de informação.
 
21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023)
https://pucminas.instructure.com/courses/145873/quizzes/381708 5/5
 
Excluir termos muito comuns no idioma analisado e que agregam pouco significado individualmente. Tais termos
são naturalmente muito frequentes de um modo genérico na linguagem, podendo ter um destaque significativo e
encobrir padrões relevantes no texto.
Stopwords :D
 
Excluir termos muito frequentes no dataset. Tais termos são naturalmente muito frequentes, podendo ter um
destaque significativo e encobrir padrões relevantes no texto.

Pergunta 10
4 / 4 pts
 True
Correto!
 False
Pontuação do teste: 40 de 40
O TF (Term Frequency - Frequência do Termo) mede o grau de raridade de uma palavra em relação
ao tamanho da coleção.

Continue navegando