Buscar

GRA0691 ENGENHARIA DE DADOS GR0837202 - 202020 ead Ativ 4

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

03/12/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 1/6
Curso GRA0691 ENGENHARIA DE DADOS GR0837202 - 202020.ead-29774744.06
Teste ATIVIDADE 4 (A4)
Iniciado 02/12/20 17:52
Enviado 03/12/20 15:03
Status Completada
Resultado da tentativa 5 em 10 pontos 
Tempo decorrido 21 horas, 11 minutos
Resultados exibidos Respostas enviadas, Respostas corretas, Comentários
Pergunta 1
Resposta Selecionada:
e. 
Resposta Correta:
e. 
Feedback
da
resposta:
O dado pode ser armazenado de diversas formas. Essas diferentes formas impactam
mais ou menos no esforço de extração e consumo desse dado. Um exemplo disso é a
simples demanda de obtenção de todos os comentários relativos a um assunto em uma
rede social, pois a diversidade de como o dado será armazenado torna essa atividade
complexa.
 
Da mesma maneira que existem formas de armazenamento complexas, temos outros
modelos bem mais fáceis de serem consumidos, tipificados como estruturados. Dessa
forma, um modelo de armazenamento de dado estruturado pode ser:
uma tabela de banco de dados relacional.
uma tabela de banco de dados relacional.
Muito bem! Os dados armazenados em uma tabela de banco de dados
seguem uma estrutura definida sem flexibilidade quanto ao layout acordado.
Pergunta 2
Resposta Selecionada: c. 
Com a expansão da Internet e o aparecimento de soluções que se utilizam desse
mesmo meio para sua sobrevivência, a geração de dados se tornou algo incontrolável.
Dados são continuamente gerados a partir de redes sociais, de aplicativos de
mensagens, de transações do comércio eletrônico e de diversas outras fontes.
 
Nessa diversificação de fontes e tipos de dados, Avro e Parquet são modelos de
armazenamentos de dados que podem atender a essa diversificação e variedade de
estruturas atuais. Diante desse contexto, os dados em Avro ou Parquet podem ser
caracterizados diante desses cenários como:
não estruturados.
1 em 1 pontos
1 em 1 pontos
03/12/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 2/6
Resposta Correta: c. 
Feedback
da
resposta:
não estruturados.
Muito bem! Avro e Parquet são modelos de armazenamento que se
caracterizam por não ter necessariamente uma estrutura ou layout rígido,
possibilitando a criação de estruturas diversas em aderência a como os
dados oriundos de redes sociais ou aplicativos muitas vezes são gerados.
Pergunta 3
Resposta
Selecionada:
a. 
Resposta Correta:
d. 
Feedback
da
resposta:
Um arquivo de texto é a forma mais simples de se armazenar dados. Entretanto, essa
simplicidade tem um custo que é representado, por exemplo, no esforço necessário para
uma consulta ou atualização, visto que não há recurso que indexe ou acelere o acesso
aos dados.
 
Existem diversas maneiras de armazenamento no modelo em texto, algumas mais
simplificadas, como em dados delimitados, e outras mais organizadas com dados
semiestruturados em marcações como o XML, por exemplo. Com base nessas
informações e no que foi estudado na unidade, qual o papel das marcações no XML?
É o meio de inserção dos dados formado por caracteres e valores.
Fornecer informações sobre a estrutura do documento.
Resposta incorreta. A XML é utilizada na representação de dados sendo
formada por estruturas que descrevem as propriedades e características dos
dados que serão armazenados.
Pergunta 4
Resposta Selecionada:
a. 
Resposta Correta:
A etapa de transformação é uma das principais de um ETL, principalmente por adicionar
mais valor aos dados através de ajustes essenciais. As outras etapas de extração e
carga são necessárias, mas eles essencialmente movem dados.
 
Muitas são as tarefas que podem ser realizadas na transformação em um ETL. Com
base nessas informações e no conteúdo estudado, qual tarefa é realizada nessa etapa?
Selecionar atributos necessários.
0 em 1 pontos
0 em 1 pontos
03/12/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 3/6
e. 
Feedback
da
resposta:
Tratar ausência de valores.
Resposta incorreta. Durante a transformação, é importante a avaliação de
cenários que impactam na análise do negócio seja ajustada, considerando as
regras e as necessidades identificadas.
Pergunta 5
Resposta
Selecionada:
b.
Resposta
Correta:
b.
Feedback
da
resposta:
A definição de um requisito pode ser: “Uma condição ou capacidade que deve ser
alcançada ou possuída por um sistema, produto, serviço, resultado ou componente para
satisfazer um contrato, padrão, especificação ou outro documento formalmente imposto.
Requisitos incluem as necessidades quantificadas e documentadas, desejos e
expectativas do patrocinador, clientes e outras partes interessadas.”
Fonte: VAZQUEZ, Carlos; SIMÕES, Guilherme. Engenharia de requisitos: software orientado ao
negócio. São Paulo: Brasport, 2016, p. 30.
 
Sobre a perspectiva dos gestores, os requisitos de questões estratégicas envolvem
muitas vezes o cruzamento de informações que a organização transita. Com base
nessas informações e no conteúdo estudado, pode-se afirmar que a solução de Data
Warehouse possibilita a visualização desse cruzamento de dados obtido a partir de:
um processo de ETL que tem a capacidade de extrair dados de
diversas fontes e tipos.
um processo de ETL que tem a capacidade de extrair dados de
diversas fontes e tipos.
Exatamente! Com o ETL, na etapa de extração é possível capturarmos os
dados de diferentes fontes e nos processos seguintes realizar a combinação
e disponibilização no Data Warehouse.
Pergunta 6
“Engenheiros de dados são o elo entre as estratégias de gerenciamento do Big Data e
os cientistas de dados que precisam trabalhar com dados. O que eles fazem é construir
as plataformas que permitem aos cientistas de dados fazerem sua mágica.”
Fonte: KRETZ, Andreas. The Data Engineering Cookbook. Github, 2019. Disponível em: <https://github.
com/andkret/Cookbook>. Acesso em: 27/08/2020. p. 12.
 
A engenharia de dados é responsável pela realização de algumas atividades
fundamentais para que os gestores consigam ter acesso a dados qualificados e que
possam ser fontes para extração de conhecimento. Com base nessas informações e no
1 em 1 pontos
0 em 1 pontos
03/12/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 4/6
Resposta Selecionada:
a. 
Resposta Correta:
d. 
Feedback
da
resposta:
conteúdo estudado, uma das atividades que contribuem para essa qualificação dos
dados é a:
seleção de atributos nos dados de origem.
coleta e transformação de dados.
Resposta incorreta. A qualificação dos dados passa por etapas que o
engenheiro de dados realiza, se preocupando com o estado dos dados,
valores equivocados, dados faltantes, enfim, situações que precisarão ser
tratadas de alguma maneira para serem confiáveis.
Pergunta 7
Resposta Selecionada:
e. 
Resposta Correta:
e. 
Feedback
da
resposta:
As ferramentas de Extração, Transformação e Carga (ETL) se propõem à realização de
diversas tarefas que aceleram o trabalho do analista de dados. Dentre essas tarefas,
podemos citar a existência de recursos, como a integração com linguagens de
programação, funções de tratamento, além de scripts pré-compilados para manipulação
dos dados.
 
As soluções de ETL existentes no mercado evoluem cada vez mais, fornecendo recursos
que acompanham as tendências de tecnologias, como o armazenamento na nuvem, Big
Data, fluxos de dados, entre outros. Com base nessas informações e no conteúdo
estudado, qual solução de ETL fornece conectores que atendam a essas novas
tecnologias?
Talend Data Integration.
Talend Data Integration.
Exatamente! O Talend Data Integration é uma ferramenta open source que
constantemente tem conectores atualizados seguindo as novas tecnologias, a
exemplo de conectores para o Parquet, o Hive, o JSON, entre outros.
Pergunta 8
“Dados semiestruturados costumam ser uma combinação de diferentes tipos de dados
quetêm algum padrão ou estrutura que não é tão estritamente definida como
1 em 1 pontos
1 em 1 pontos
03/12/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 5/6
Resposta Selecionada:
d. 
Resposta Correta:
d. 
Feedback
da
resposta:
estruturada. Por exemplo, os registros da central de atendimento podem conter o nome
do cliente + data da ligação + reclamação, em que a informação da reclamação não é
estruturada e não é de fácil manipulação em um armazenamento de dados.”
Fonte: MINELI, M.; CHAMBERS, M.; DHIRAJ, A. Big data, big analytics: emerging business intelligence
and analytic trends for today's businesses. New Jersey: John Wiley & Sons, 2013, p. 32.
 
As características do dado, quanto seu formato e armazenamento, são elementos
importantes a serem considerados para sua extração e consumo de algum repositório.
Com base nessas informações e no conteúdo estudado, um modelo de armazenamento
qualificado como semiestruturado é:
JSON.
JSON.
Exatamente. Os dados no formato JSON (JavaScript Object Notation)
seguem um modelo de armazenamento flexível, apresentando uma estrutura
mínima, contudo, sem rigidez.
Pergunta 9
Resposta Selecionada:
c. 
Resposta Correta:
d. 
Feedback
da
resposta:
As organizações já perceberam a importância que os dados podem representar ao
crescimento de seus negócios. Essa importância também pode ser percebida com a
quantidade de soluções de mercado que surgiram prometendo a célere extração e
descoberta de valor sobre estes dados.
 
O acesso aos dados envolve a participação da Engenharia de Dados na inteligência
para extração, carga e organização das estruturas onde serão armazenados. Conforme
estudado, há uma solução de repositório que se propõe a armazenar os dados em
estado bruto, independentemente de sua origem e estrutura, com o propósito de
fornecer à organização uma fonte centralizada e controlado a dados diversos. Que
solução é essa?
Data Warehouse.
Data Lake.
Resposta incorreta. Apesar da abundância de dados existentes e que
circundam as organizações, identificou-se como necessária a construção de
um repositório em que dados externos e internos, ainda em formato bruto,
0 em 1 pontos
03/12/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 6/6
estejam inseridos para rápido consumo pela organização de maneira mais
independente.
Pergunta 10
Resposta Selecionada:
e. 
Resposta Correta:
b. 
Feedback
da
resposta:
O processo de Extração, Transformação e Carga de dados (ETL) envolve o
entendimento das necessidades de negócio para que assim as devidas fontes de dados
sejam selecionadas e consultadas, eventuais tratamentos sejam aplicados e a inserção
qualificada no repositório de destino seja realizado.
 
A execução completa do fluxo de ETL resulta em um conjunto de dados que pode ser
fonte para outras ações na busca de conhecimento ou para a exploração direta pelo
gestor na busca de respostas. Entre as alternativas a seguir, quais representam outros
resultados que podem ser alcançados com o ETL?
 
I. Mineração de dados.
II. Migração de dados.
III. Visualização de dados.
IV. Integração de dados.
V. Qualificação de dados.
 
Está correto apenas o que se afirma em:
I, III e IV.
II, IV e V.
Pensando no ETL e em suas características, pode-se perceber a
possibilidade de envolver na sua execução bases de diferentes fornecedores,
além combinar dados de fontes distintas e aplicar tratamentos aos dados.
0 em 1 pontos

Continue navegando