Baixe o app para aproveitar ainda mais
Prévia do material em texto
21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023) https://pucminas.instructure.com/courses/145873/quizzes/381708 1/5 PROVA ON-LINE Entrega Sem prazo Pontos 40 Perguntas 10 Limite de tempo 60 Minutos Tentativas permitidas 2 Instruções Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 10 minutos 40 de 40 Pontuação desta tentativa: 40 de 40 Enviado 21 abr em 13:24 Esta tentativa levou 10 minutos. Pergunta 1 4 / 4 pts Ajuda a descobrir a soma dos menores caminhos no grafo. INSTRUÇÕES DA AVALIAÇÃO ON-LINE - A prova tem a duração de 60 minutos. - Ao clicar em PROVA ON-LINE, no menu “Testes” você iniciará a prova. Ao acessar a página com as questões, o tempo começa a ser contado. - A prova é composta de 10 (dez) questões objetivas, sendo 04 (quatro) pontos cada. - Ao final do teste não se esqueça de enviá-lo, clicando no botão “ENVIAR TESTE”. Só utilize esse botão quando tiver finalizado a avaliação. - Se necessário, durante a prova, entre em contato pelo link “Atendimento”. - Você terá 02 (duas) tentativas e, caso necessite de uma nova, será preciso solicitar a prova extra, que requer pagamento de taxa adicional. Atenção: Todas as provas iniciadas e que não houverem sido submetidas serão automaticamente encerradas pelo sistema transcorridos os 60 minutos de duração. Boa prova! Fazer o teste novamente O PageRank é: https://pucminas.instructure.com/courses/145873/quizzes/381708/history?version=1 https://pucminas.instructure.com/courses/145873/quizzes/381708/take?user_id=250441 21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023) https://pucminas.instructure.com/courses/145873/quizzes/381708 2/5 Calcula o quanto um vértice está próximo dos demais em um grafo. Correto! Uma medida de importância que procura expressar a probabilidade de um caminhante aleatório no grafo chegar a um vértice P. Uma medida de importância que procura destacar um vértice no grafo, através da soma do número de links ou arestas de entrada nesse vértice. Pergunta 2 4 / 4 pts Correto! /table//td[1] Outra opção correta seria colocar o caminho completo e barras simples /table/tr/td[1] . /html/get("Conteudo A") //table[@class=’tabelaX’] /XPATH/<td>[1] Pergunta 3 4 / 4 pts Fizemos um grafo não direcional baseado em curtidas. Vértices são os usuários e arestas são os likes entre eles. Fizemos um grafo não direcional baseado no total de termos do assunto. Vértices são os usuários e arestas são o IDF de termos utilizados em cada retweet. Correto! Fizemos um grafo direcional baseado em retweets. Vértices são os usuários e arestas são os retweets entre eles. Qual regra XPATH você utilizaria para extrair apenas a linha "<td>Conteúdo A</td>" na tabela HTML abaixo? <table> <tr> <td>Conteúdo A</td> <td>Conteúdo B</td> </tr> </table> Nos exercícios práticos, qual foi a medida que utilizamos para detectar influenciadores? 21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023) https://pucminas.instructure.com/courses/145873/quizzes/381708 3/5 Fizemos um grafo direcional baseado no total de seguidores. Vértices são os usuários e arestas são o número de seguidores que os usuários têm. Pergunta 4 4 / 4 pts Palavras-chave. Correto! Stopwords. Crowdsourcing. Bag of Words. Pergunta 5 4 / 4 pts Bag of Words. Crawling. Correto! Stemming. Stopwords. Pergunta 6 4 / 4 pts Mixed Qualities Reference - MQR. Correto! HITS - Hubs e Autoridades. PageRank. Qualidade de Referências. Pergunta 7 4 / 4 pts Como são chamados os termos ou palavras que contribuem pouco com a análise do texto, também pouco ajudam a discriminar um documento relevante entre os demais da coleção a partir de uma consulta textual? A técnica que nos ajuda a reduzir variações (gerúndio, plural...) de palavras que possuem a mesma semântica, reduzindo esses termos ao seu respectivo radical é: Medida de importância dada a um vértice P que considera a qualidade dos vértices que apontam para P assim como a qualidade dos vértices em que P aponta. O IDF (inverse document frequency - inverso da frequência nos documentos) mede o grau de raridade de uma palavra. 21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023) https://pucminas.instructure.com/courses/145873/quizzes/381708 4/5 Correto! True False Pergunta 8 4 / 4 pts Softwares que “varrem” a internet buscando e armazenando informações. Nosso interesse é em baixar o conteúdo HTML de websites. API é o acrônimo de Application Processing Information ou, em português, Interface de Processamento de Informações de Aplicativos; É um padrão RSS desenvolvido em linguagem XML que nos permite coletar informações em sites e blogs de notícias. API é o acrônimo de Application Programming Interface ou, em português, Interface de Programação de Aplicativos; É uma linguagem de consulta (Query Language) que nos permite selecionar nós de um documento XML. Pode ser usada para computar valores (por exemplo, strings, números ou valores booleanos) do conteúdo de um documento XML. Correto! API é o acrônimo de Application Programming Interface ou, em português, Interface de Programação de Aplicativos; Um exemplo popular é a utilização para leitura e publicação de mensagens (por exemplo no Twitter). No nosso caso queremos coletar dados de aplicações da Web como as mídias sociais. Pergunta 9 4 / 4 pts Excluir termos com mais de 4 caracteres. Palavras com 5 ou mais caracteres geralmente não tem importância no texto. Excluir termos com menos de 4 caracteres. Palavras com até 3 caracteres geralmente não tem importância no texto. Correto! O que é uma API, e qual o nosso interesse nesse tipo de recurso ? Em uma análise textual, por exemplo uma nuvem de palavras. Entre as alternativas abaixo, qual critério de exclusão seria mais indicado para remover da base os termos menos relevantes, ou seja aqueles que contribuem pouco na interpretação dos padrões? Dica: Sempre é possível testar processamentos diversos e adaptar ao tipo de análise desejada. Mas alguns deles são conhecidos por trazerem melhores resultados e menores perdas de informação. 21/04/2024, 13:24 PROVA ON-LINE: 13 - Recuperação da Informação na Web e Redes Sociais (2023) https://pucminas.instructure.com/courses/145873/quizzes/381708 5/5 Excluir termos muito comuns no idioma analisado e que agregam pouco significado individualmente. Tais termos são naturalmente muito frequentes de um modo genérico na linguagem, podendo ter um destaque significativo e encobrir padrões relevantes no texto. Stopwords :D Excluir termos muito frequentes no dataset. Tais termos são naturalmente muito frequentes, podendo ter um destaque significativo e encobrir padrões relevantes no texto. Pergunta 10 4 / 4 pts True Correto! False Pontuação do teste: 40 de 40 O TF (Term Frequency - Frequência do Termo) mede o grau de raridade de uma palavra em relação ao tamanho da coleção.
Compartilhar