Baixe o app para aproveitar ainda mais
Prévia do material em texto
03/12/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 1/6 Curso GRA0691 ENGENHARIA DE DADOS GR0837202 - 202020.ead-29774744.06 Teste ATIVIDADE 4 (A4) Iniciado 02/12/20 17:52 Enviado 03/12/20 15:03 Status Completada Resultado da tentativa 5 em 10 pontos Tempo decorrido 21 horas, 11 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: e. Resposta Correta: e. Feedback da resposta: O dado pode ser armazenado de diversas formas. Essas diferentes formas impactam mais ou menos no esforço de extração e consumo desse dado. Um exemplo disso é a simples demanda de obtenção de todos os comentários relativos a um assunto em uma rede social, pois a diversidade de como o dado será armazenado torna essa atividade complexa. Da mesma maneira que existem formas de armazenamento complexas, temos outros modelos bem mais fáceis de serem consumidos, tipificados como estruturados. Dessa forma, um modelo de armazenamento de dado estruturado pode ser: uma tabela de banco de dados relacional. uma tabela de banco de dados relacional. Muito bem! Os dados armazenados em uma tabela de banco de dados seguem uma estrutura definida sem flexibilidade quanto ao layout acordado. Pergunta 2 Resposta Selecionada: c. Com a expansão da Internet e o aparecimento de soluções que se utilizam desse mesmo meio para sua sobrevivência, a geração de dados se tornou algo incontrolável. Dados são continuamente gerados a partir de redes sociais, de aplicativos de mensagens, de transações do comércio eletrônico e de diversas outras fontes. Nessa diversificação de fontes e tipos de dados, Avro e Parquet são modelos de armazenamentos de dados que podem atender a essa diversificação e variedade de estruturas atuais. Diante desse contexto, os dados em Avro ou Parquet podem ser caracterizados diante desses cenários como: não estruturados. 1 em 1 pontos 1 em 1 pontos 03/12/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 2/6 Resposta Correta: c. Feedback da resposta: não estruturados. Muito bem! Avro e Parquet são modelos de armazenamento que se caracterizam por não ter necessariamente uma estrutura ou layout rígido, possibilitando a criação de estruturas diversas em aderência a como os dados oriundos de redes sociais ou aplicativos muitas vezes são gerados. Pergunta 3 Resposta Selecionada: a. Resposta Correta: d. Feedback da resposta: Um arquivo de texto é a forma mais simples de se armazenar dados. Entretanto, essa simplicidade tem um custo que é representado, por exemplo, no esforço necessário para uma consulta ou atualização, visto que não há recurso que indexe ou acelere o acesso aos dados. Existem diversas maneiras de armazenamento no modelo em texto, algumas mais simplificadas, como em dados delimitados, e outras mais organizadas com dados semiestruturados em marcações como o XML, por exemplo. Com base nessas informações e no que foi estudado na unidade, qual o papel das marcações no XML? É o meio de inserção dos dados formado por caracteres e valores. Fornecer informações sobre a estrutura do documento. Resposta incorreta. A XML é utilizada na representação de dados sendo formada por estruturas que descrevem as propriedades e características dos dados que serão armazenados. Pergunta 4 Resposta Selecionada: a. Resposta Correta: A etapa de transformação é uma das principais de um ETL, principalmente por adicionar mais valor aos dados através de ajustes essenciais. As outras etapas de extração e carga são necessárias, mas eles essencialmente movem dados. Muitas são as tarefas que podem ser realizadas na transformação em um ETL. Com base nessas informações e no conteúdo estudado, qual tarefa é realizada nessa etapa? Selecionar atributos necessários. 0 em 1 pontos 0 em 1 pontos 03/12/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 3/6 e. Feedback da resposta: Tratar ausência de valores. Resposta incorreta. Durante a transformação, é importante a avaliação de cenários que impactam na análise do negócio seja ajustada, considerando as regras e as necessidades identificadas. Pergunta 5 Resposta Selecionada: b. Resposta Correta: b. Feedback da resposta: A definição de um requisito pode ser: “Uma condição ou capacidade que deve ser alcançada ou possuída por um sistema, produto, serviço, resultado ou componente para satisfazer um contrato, padrão, especificação ou outro documento formalmente imposto. Requisitos incluem as necessidades quantificadas e documentadas, desejos e expectativas do patrocinador, clientes e outras partes interessadas.” Fonte: VAZQUEZ, Carlos; SIMÕES, Guilherme. Engenharia de requisitos: software orientado ao negócio. São Paulo: Brasport, 2016, p. 30. Sobre a perspectiva dos gestores, os requisitos de questões estratégicas envolvem muitas vezes o cruzamento de informações que a organização transita. Com base nessas informações e no conteúdo estudado, pode-se afirmar que a solução de Data Warehouse possibilita a visualização desse cruzamento de dados obtido a partir de: um processo de ETL que tem a capacidade de extrair dados de diversas fontes e tipos. um processo de ETL que tem a capacidade de extrair dados de diversas fontes e tipos. Exatamente! Com o ETL, na etapa de extração é possível capturarmos os dados de diferentes fontes e nos processos seguintes realizar a combinação e disponibilização no Data Warehouse. Pergunta 6 “Engenheiros de dados são o elo entre as estratégias de gerenciamento do Big Data e os cientistas de dados que precisam trabalhar com dados. O que eles fazem é construir as plataformas que permitem aos cientistas de dados fazerem sua mágica.” Fonte: KRETZ, Andreas. The Data Engineering Cookbook. Github, 2019. Disponível em: <https://github. com/andkret/Cookbook>. Acesso em: 27/08/2020. p. 12. A engenharia de dados é responsável pela realização de algumas atividades fundamentais para que os gestores consigam ter acesso a dados qualificados e que possam ser fontes para extração de conhecimento. Com base nessas informações e no 1 em 1 pontos 0 em 1 pontos 03/12/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 4/6 Resposta Selecionada: a. Resposta Correta: d. Feedback da resposta: conteúdo estudado, uma das atividades que contribuem para essa qualificação dos dados é a: seleção de atributos nos dados de origem. coleta e transformação de dados. Resposta incorreta. A qualificação dos dados passa por etapas que o engenheiro de dados realiza, se preocupando com o estado dos dados, valores equivocados, dados faltantes, enfim, situações que precisarão ser tratadas de alguma maneira para serem confiáveis. Pergunta 7 Resposta Selecionada: e. Resposta Correta: e. Feedback da resposta: As ferramentas de Extração, Transformação e Carga (ETL) se propõem à realização de diversas tarefas que aceleram o trabalho do analista de dados. Dentre essas tarefas, podemos citar a existência de recursos, como a integração com linguagens de programação, funções de tratamento, além de scripts pré-compilados para manipulação dos dados. As soluções de ETL existentes no mercado evoluem cada vez mais, fornecendo recursos que acompanham as tendências de tecnologias, como o armazenamento na nuvem, Big Data, fluxos de dados, entre outros. Com base nessas informações e no conteúdo estudado, qual solução de ETL fornece conectores que atendam a essas novas tecnologias? Talend Data Integration. Talend Data Integration. Exatamente! O Talend Data Integration é uma ferramenta open source que constantemente tem conectores atualizados seguindo as novas tecnologias, a exemplo de conectores para o Parquet, o Hive, o JSON, entre outros. Pergunta 8 “Dados semiestruturados costumam ser uma combinação de diferentes tipos de dados quetêm algum padrão ou estrutura que não é tão estritamente definida como 1 em 1 pontos 1 em 1 pontos 03/12/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 5/6 Resposta Selecionada: d. Resposta Correta: d. Feedback da resposta: estruturada. Por exemplo, os registros da central de atendimento podem conter o nome do cliente + data da ligação + reclamação, em que a informação da reclamação não é estruturada e não é de fácil manipulação em um armazenamento de dados.” Fonte: MINELI, M.; CHAMBERS, M.; DHIRAJ, A. Big data, big analytics: emerging business intelligence and analytic trends for today's businesses. New Jersey: John Wiley & Sons, 2013, p. 32. As características do dado, quanto seu formato e armazenamento, são elementos importantes a serem considerados para sua extração e consumo de algum repositório. Com base nessas informações e no conteúdo estudado, um modelo de armazenamento qualificado como semiestruturado é: JSON. JSON. Exatamente. Os dados no formato JSON (JavaScript Object Notation) seguem um modelo de armazenamento flexível, apresentando uma estrutura mínima, contudo, sem rigidez. Pergunta 9 Resposta Selecionada: c. Resposta Correta: d. Feedback da resposta: As organizações já perceberam a importância que os dados podem representar ao crescimento de seus negócios. Essa importância também pode ser percebida com a quantidade de soluções de mercado que surgiram prometendo a célere extração e descoberta de valor sobre estes dados. O acesso aos dados envolve a participação da Engenharia de Dados na inteligência para extração, carga e organização das estruturas onde serão armazenados. Conforme estudado, há uma solução de repositório que se propõe a armazenar os dados em estado bruto, independentemente de sua origem e estrutura, com o propósito de fornecer à organização uma fonte centralizada e controlado a dados diversos. Que solução é essa? Data Warehouse. Data Lake. Resposta incorreta. Apesar da abundância de dados existentes e que circundam as organizações, identificou-se como necessária a construção de um repositório em que dados externos e internos, ainda em formato bruto, 0 em 1 pontos 03/12/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 6/6 estejam inseridos para rápido consumo pela organização de maneira mais independente. Pergunta 10 Resposta Selecionada: e. Resposta Correta: b. Feedback da resposta: O processo de Extração, Transformação e Carga de dados (ETL) envolve o entendimento das necessidades de negócio para que assim as devidas fontes de dados sejam selecionadas e consultadas, eventuais tratamentos sejam aplicados e a inserção qualificada no repositório de destino seja realizado. A execução completa do fluxo de ETL resulta em um conjunto de dados que pode ser fonte para outras ações na busca de conhecimento ou para a exploração direta pelo gestor na busca de respostas. Entre as alternativas a seguir, quais representam outros resultados que podem ser alcançados com o ETL? I. Mineração de dados. II. Migração de dados. III. Visualização de dados. IV. Integração de dados. V. Qualificação de dados. Está correto apenas o que se afirma em: I, III e IV. II, IV e V. Pensando no ETL e em suas características, pode-se perceber a possibilidade de envolver na sua execução bases de diferentes fornecedores, além combinar dados de fontes distintas e aplicar tratamentos aos dados. 0 em 1 pontos
Compartilhar