Prévia do material em texto
Avaliação virtual (Quiz Nº3): Google crawler • Entrega 5 jun em 23:59 • Pontos 2 • Perguntas 4 • Disponível 2 jun em 13:30 - 5 jun em 23:59 • Limite de tempo Nenhum Instruções Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 12 minutos 2 de 2 As respostas corretas estarão disponíveis em 6 jun em 0:00. Pontuação deste teste: 2 de 2 Enviado 2 jun em 18:03 Esta tentativa levou 12 minutos. Pergunta 1 0,5 / 0,5 pts Leia com atenção os enunciados de cada questão. Os conteúdos abordados se referem ao Google Crawler, visto na Unidade III. Sobre os Tipos de rastreadores utilizados pela Google, associe a 2ª coluna de acordo com a primeira: Tipos de rastreadores A. Google Storebot B. Google- InspectionTool C. Googlebot- News D. AdSense Características ( ) Rastreador utilizado sobre um site para identificar seu conteúdo e fornecer anúncios relevantes. ( ) Rastreador utilizado por ferramentas de teste como a inspeção de URL adotada no Search Console. ( ) Rastreador utilizado para páginas específicas como as que apresentam detalhes de um produto, do carrinho e de finalização de compra. Avaliação virtual (Quiz Nº3): Google crawler: Recuperação de Informa... https://pucminas.instructure.com/courses/188109/quizzes/478414 1 of 3 02/06/2024, 18:03 https://pucminas.instructure.com/courses/188109/quizzes/478414/history?version=1 https://pucminas.instructure.com/courses/188109/quizzes/478414/history?version=1 A, D, B, C C, B, D, A B, D, A, C D, B, A, C Pergunta 2 0,5 / 0,5 pts Todas as alternativas estão corretas. ii e III. I e II. I e III. Pergunta 3 0,5 / 0,5 pts ( ) Rastreador utilizado para rastrear notícias. Assinale a alternativa que apresenta a associação que você estabeleceu na 2a coluna. Leia atentamente as assertivas a seguir: I. Um arquivo robots.txt estabelece regras de acesso para rastreadores sobre um determinado site, mas não limita a indexação da página para os resultados de pesquisa do Google. II. Um arquivo robots.txt estabelece regras de acesso para rastreadores sobre um determinado site sem no entanto limitar o comportamento do rastreador no site. Para tanto, deve-se utilizar outros métodos de bloqueio como a proteção por senha de arquivos particulares no servidor. III. Cada site pode ter mais de um arquivo robots.txt para proteger sua hierarquia de páginas (estrutura de diretórios) mas deve manter uma codificação padronizada de texto em UTF-8. Os arquivos devem ser do tipo texto simples. Assinale a alternativa que indica apenas as alternativas CORRETAS: Leia atentamente as regras permitidas para a criação de um arquivo robots.txt exibidas abaixo: I. User-agent: Googlebot Disallow: /*.gif$ II. User-agent: Googlebot-Image Disallow: /images/dogs.jpg III. User-agent: * Allow: /*.png$ IV. User-agent: * Allow: /images/dogs.jpg Avaliação virtual (Quiz Nº3): Google crawler: Recuperação de Informa... https://pucminas.instructure.com/courses/188109/quizzes/478414 2 of 3 02/06/2024, 18:03 I. III. II. IV. Pergunta 4 0,5 / 0,5 pts II. III. IV. I. Pontuação do teste: 2 de 2 A regra adotada no arquivo robots.txt para bloquear arquivos de um determinado tipo é exibida na alternativa: Sobre as regras de formato e localização de arquivos robots.txt, é correto afirmar, EXCETO: I. Os arquivos robots.txt podem ser postados em subdomínios ou em portas de acesso que não sejam padrão de acesso no site que será rastreado. II. Para controlar o rastreamento das URLs abaixo do Site do Jornal Local da cidade de Piracicaba, disponível na URL https://jornaldacidadeprcb.com/ (https://jornaldacidade.com/) , o arquivo robots.txt deverá ser acessado a partir da URL https://jornaldacidadeprcb.com/acess/ robots.txt (https://jornaldacidade.com/acess/robots.txt) . III. Ser um arquivo de texto simples codificado em UTF-8 é uma regra obrigatória para a implementação de um arquivo robots.txt, lembrando que, o padrão UTF-8 inclui o formato ASCII. IV. Um arquivo de controle de rastreadores em sites na web deve ser obrigatoriamente nomeado de robots.txt. Avaliação virtual (Quiz Nº3): Google crawler: Recuperação de Informa... https://pucminas.instructure.com/courses/188109/quizzes/478414 3 of 3 02/06/2024, 18:03 https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/ https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt https://jornaldacidade.com/acess/robots.txt