Logo Passei Direto
Buscar

Quiz Google Crawler

Ferramentas de estudo

Questões resolvidas

Sobre os Tipos de rastreadores utilizados pela Google, associe a 2ª coluna de acordo com a primeira:

A, D, B, C
C, B, D, A
B, D, A, C
D, B, A, C

( ) Rastreador utilizado para rastrear notícias. Assinale a alternativa que apresenta a associação que você estabeleceu na 2a coluna.
I. Um arquivo robots.txt estabelece regras de acesso para rastreadores sobre um determinado site, mas não limita a indexação da página para os resultados de pesquisa do Google.
II. Um arquivo robots.txt estabelece regras de acesso para rastreadores sobre um determinado site sem no entanto limitar o comportamento do rastreador no site. Para tanto, deve-se utilizar outros métodos de bloqueio como a proteção por senha de arquivos particulares no servidor.
III. Cada site pode ter mais de um arquivo robots.txt para proteger sua hierarquia de páginas (estrutura de diretórios) mas deve manter uma codificação padronizada de texto em UTF-8. Os arquivos devem ser do tipo texto simples.
I.
III.
II.
IV.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

left-side-bubbles-backgroundright-side-bubbles-background

Experimente o Premium!star struck emoji

Acesse conteúdos dessa e de diversas outras disciplinas.

Libere conteúdos
sem pagar

Ajude estudantes e ganhe conteúdos liberados!

Questões resolvidas

Sobre os Tipos de rastreadores utilizados pela Google, associe a 2ª coluna de acordo com a primeira:

A, D, B, C
C, B, D, A
B, D, A, C
D, B, A, C

( ) Rastreador utilizado para rastrear notícias. Assinale a alternativa que apresenta a associação que você estabeleceu na 2a coluna.
I. Um arquivo robots.txt estabelece regras de acesso para rastreadores sobre um determinado site, mas não limita a indexação da página para os resultados de pesquisa do Google.
II. Um arquivo robots.txt estabelece regras de acesso para rastreadores sobre um determinado site sem no entanto limitar o comportamento do rastreador no site. Para tanto, deve-se utilizar outros métodos de bloqueio como a proteção por senha de arquivos particulares no servidor.
III. Cada site pode ter mais de um arquivo robots.txt para proteger sua hierarquia de páginas (estrutura de diretórios) mas deve manter uma codificação padronizada de texto em UTF-8. Os arquivos devem ser do tipo texto simples.
I.
III.
II.
IV.

Prévia do material em texto

Avaliação virtual (Quiz Nº3): Google crawler
• Entrega 5 jun em 23:59
• Pontos 2
• Perguntas 4
• Disponível 2 jun em 13:30 - 5 jun em 23:59
• Limite de tempo Nenhum
Instruções
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 12 minutos 2 de 2
 As respostas corretas estarão disponíveis em 6 jun em 0:00.
Pontuação deste teste: 2 de 2
Enviado 2 jun em 18:03
Esta tentativa levou 12 minutos.

Pergunta 1
0,5 / 0,5 pts
Leia com atenção os enunciados de cada questão. Os conteúdos abordados se referem ao Google
Crawler, visto na Unidade III.
Sobre os Tipos de rastreadores utilizados pela Google, associe a 2ª coluna de acordo com a
primeira:
Tipos de
rastreadores
A. Google
Storebot
B. Google-
InspectionTool
C. Googlebot-
News
D. AdSense
Características
( ) Rastreador utilizado sobre um site para identificar
seu conteúdo e fornecer anúncios relevantes.
( ) Rastreador utilizado por ferramentas de teste
como a inspeção de URL adotada no Search Console.
( ) Rastreador utilizado para páginas específicas
como as que apresentam detalhes de um produto, do
carrinho e de finalização de compra.
Avaliação virtual (Quiz Nº3): Google crawler: Recuperação de Informa... https://pucminas.instructure.com/courses/188109/quizzes/478414
1 of 3 02/06/2024, 18:03
https://pucminas.instructure.com/courses/188109/quizzes/478414/history?version=1
https://pucminas.instructure.com/courses/188109/quizzes/478414/history?version=1
A, D, B, C
C, B, D, A
B, D, A, C
D, B, A, C

Pergunta 2
0,5 / 0,5 pts
Todas as alternativas estão corretas.
ii e III.
I e II.
I e III.

Pergunta 3
0,5 / 0,5 pts
( ) Rastreador utilizado para rastrear notícias.
Assinale a alternativa que apresenta a associação que você estabeleceu na 2a coluna.
Leia atentamente as assertivas a seguir:
I. Um arquivo robots.txt estabelece regras de acesso para rastreadores sobre um determinado site,
mas não limita a indexação da página para os resultados de pesquisa do Google.
II. Um arquivo robots.txt estabelece regras de acesso para rastreadores sobre um determinado site
sem no entanto limitar o comportamento do rastreador no site. Para tanto, deve-se utilizar outros
métodos de bloqueio como a proteção por senha de arquivos particulares no servidor.
III. Cada site pode ter mais de um arquivo robots.txt para proteger sua hierarquia de páginas
(estrutura de diretórios) mas deve manter uma codificação padronizada de texto em UTF-8. Os
arquivos devem ser do tipo texto simples.
Assinale a alternativa que indica apenas as alternativas CORRETAS:
Leia atentamente as regras permitidas para a criação de um arquivo robots.txt exibidas abaixo:
I. User-agent: Googlebot Disallow: /*.gif$
II. User-agent: Googlebot-Image Disallow: /images/dogs.jpg
III. User-agent: * Allow: /*.png$
IV. User-agent: * Allow: /images/dogs.jpg
Avaliação virtual (Quiz Nº3): Google crawler: Recuperação de Informa... https://pucminas.instructure.com/courses/188109/quizzes/478414
2 of 3 02/06/2024, 18:03
I.
III.
II.
IV.

Pergunta 4
0,5 / 0,5 pts
II.
III.
IV.
I.
Pontuação do teste: 2 de 2
A regra adotada no arquivo robots.txt para bloquear arquivos de um determinado tipo é exibida na
alternativa:
Sobre as regras de formato e localização de arquivos robots.txt, é correto afirmar, EXCETO:
I. Os arquivos robots.txt podem ser postados em subdomínios ou em portas de acesso que não
sejam padrão de acesso no site que será rastreado.
II. Para controlar o rastreamento das URLs abaixo do Site do Jornal Local da cidade de Piracicaba,
disponível na URL https://jornaldacidadeprcb.com/ (https://jornaldacidade.com/) , o arquivo
robots.txt deverá ser acessado a partir da URL https://jornaldacidadeprcb.com/acess/
robots.txt (https://jornaldacidade.com/acess/robots.txt) .
III. Ser um arquivo de texto simples codificado em UTF-8 é uma regra obrigatória para a
implementação de um arquivo robots.txt, lembrando que, o padrão UTF-8 inclui o formato ASCII.
IV. Um arquivo de controle de rastreadores em sites na web deve ser obrigatoriamente nomeado de
robots.txt.
Avaliação virtual (Quiz Nº3): Google crawler: Recuperação de Informa... https://pucminas.instructure.com/courses/188109/quizzes/478414
3 of 3 02/06/2024, 18:03
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt
https://jornaldacidade.com/acess/robots.txt

Mais conteúdos dessa disciplina