Baixe o app para aproveitar ainda mais
Prévia do material em texto
12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ... https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 1/6 Curso GRA0691 ENGENHARIA DE DADOS GR0837202 - 202020.ead-29774744.06 Teste 20202 - PROVA N2 (A5) Iniciado 08/12/20 16:11 Enviado 08/12/20 17:27 Status Completada Resultado da tentativa 8 em 10 pontos Tempo decorrido 1 hora, 15 minutos Instruções Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Caso necessite a utilização do "EXCEL" clique no link ao lado -----------> excel.xlsx Pergunta 1 Resposta Selecionada: b. Resposta Correta: b. Feedback da resposta: As ferramentas de Extração, Transformação e Carga (ETL) se propõem à realização de diversas tarefas que aceleram o trabalho do analista de dados. Dentre essas tarefas, podemos citar a existência de recursos, como a integração com linguagens de programação, funções de tratamento, além de scripts pré- compilados para manipulação dos dados. As soluções de ETL existentes no mercado evoluem cada vez mais, fornecendo recursos que acompanham as tendências de tecnologias, como o armazenamento na nuvem, Big Data, fluxos de dados, entre outros. Com base nessas informações e no conteúdo estudado, qual solução de ETL fornece conectores que atendam a essas novas tecnologias? Talend Data Integration. Talend Data Integration. Exatamente! O Talend Data Integration é uma ferramenta open source que constantemente tem conectores atualizados seguindo as novas tecnologias, a exemplo de conectores para o Parquet, o Hive, o JSON, entre outros. Pergunta 2 Os problemas de segurança encontrados na nuvem são objeto de preocupação em organizações e provedores dos mais diversos tamanhos, ainda que pesquisas possam evidenciar que o ambiente em nuvem tende a ser mais seguro que uma rede privada. Considerando as dificuldades de implantação da Cloud Computing em uma organização, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) Muitas empresas preferem manter os dados apenas em suas redes privadas, devido à cultura interna. II. ( ) É comum haver resistência por parte dos profissionais de tecnologia da informação por medo de perderem seu espaço e importância dentro da organização. III. ( ) Largura de banda será uma preocupação do passado, uma vez que quem irá executar todo o trabalho será o Cloud Provider. IV. ( ) Falta de conhecimento e capacitação de profissionais para o trabalho em projetos de Cloud Computing é algo superado, uma vez que o mercado de profissionais da área está se tornando cada vez mais saturado. 1 em 1 pontos 1 em 1 pontos https://fmu.blackboard.com/bbcswebdav/pid-15038170-dt-content-rid-114062409_1/xid-114062409_1 12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ... https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 2/6 Resposta Selecionada: Resposta Correta: Feedback da resposta: V, V, F, F. V, V, F, F. Está correto! Cultura, resistência, largura de banda e conhecimento são apenas alguns dos desafios enfrentados na implantação da Cloud Computing. Pergunta 3 Resposta Selecionada: Resposta Correta: Feedback da resposta: Dadas as suas peculiaridades, os sistemas distribuídos podem ser classificados em cinco paradigmas. Um destes paradigmas é caracterizado pela disposição de vários processadores, organizados em árvore, de modo que a capacidade computacional seja maior, à medida que os nós forem mais próximos à raiz. Além disso, estes devem ter funções distribuídas de acordo com a capacidade de processamento de cada nó. Considerando essas informações e o conteúdo estudado, pode-se afirmar que o paradigma descrito no elemento-base é: Hierárquico. Hierárquico. Resposta Correta. Quando o elemento-base fala em “árvore” e distribuição de tarefas levando em conta capacidade computacional e proximidade da raiz, são apresentadas duas características básicas do Paradigma Hierárquico. Pergunta 4 Resposta Selecionada: Resposta Correta: Feedback da resposta: É possível afirmar que os sistemas distribuídos são diferentes de sistemas centralizados por, entre outros fatores, possuírem componentes espalhados geograficamente, com características bastantes heterogêneas entre si, como diferentes sistemas operacionais, capacidades de processamento, hardware, etc. Dadas as inúmeras diferenças possíveis entre os componentes de um sistema distribuído, é possível citar como desafios inerentes a estes sistemas: Concorrência, inexistência de relógio global e falhas independentes. Concorrência, inexistência de relógio global e falhas independentes. Resposta Correta. A conexão concorrente de programas, fusos horários diferentes e falhas de rede são grandes desafios, quando se trata de computação distribuída. Pergunta 5 “Com grandes quantidades de dados agora disponíveis, as empresas em quase todos os setores estão focadas sobre a exploração de dados para obter vantagem competitiva”. Essa definição traduz a importância de encontrar relevância sobre os dados, não esquecendo do desafio de encontrar meios de processar essa grande massa. Fonte: MINELI, M.; CHAMBERS, M.; DHIRAJ, A. Big data, big analytics: emerging business intelligence and analytic trends for today's businesses. New Jersey: John Wiley & Sons, 2013, p. 1. A depender do volume de dados apresentado, a percepção de valor não é algo trivial de ser alcançado, exigindo esforço multidisciplinar de conhecimento para essa descoberta. A partir desse contexto, quais áreas de conhecimento a seguir estão envolvidas? 1 em 1 pontos 1 em 1 pontos 0 em 1 pontos 12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ... https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 3/6 Resposta Selecionada: e. Resposta Correta: a. Feedback da resposta: I. Tecnologia e Computação. II. Matemática e Estatística. III. Suporte de Dados. IV. Ciência e Administração. V. Áreas de negócio. Está correto apenas o que se afirma em: I, II, III e IV. I, II e V. Resposta incorreta. O grande volume de dados disponíveis nas organizações exige a participação de áreas e pessoas que entendam do assunto e dos problemas apresentados, de maneira a auxiliar outros que poderão propor a melhor solução com uso da tecnologia e, ao mesmo tempo, utilizar-se de meios que permitam embasar e validar o resultado encontrado. Pergunta 6 Resposta Selecionada: Resposta Correta: Feedback da resposta: Para que dois ou mais dispositivos possam estabelecer uma comunicação, é necessário que haja uma maneira em comum de comunicação. Por exemplo, quando desejamos transmitir ou receber uma mensagem de alguém, precisamos compreender, minimamente, o idioma utilizado. No contexto computacional, para que dois ou mais dispositivos possam estabelecer uma comunicação, é necessário que eles: Utilizem um mesmo protocolo. Utilizem um mesmo protocolo. A resposta está correta. Assim como em nosso contexto, emissor e receptor devem falar o mesmo idioma para estabelecer uma comunicação, no contexto computacional, é necessário que utilizem um mesmo protocolo. Pergunta 7 As organizações já perceberam a importância que os dados podem representar ao crescimento de seus negócios. Essa importância também pode ser percebida com a quantidade de soluções de mercado que surgiram prometendo a célere extração e descoberta de valor sobre estes dados. 1 em 1 pontos 1 em 1 pontos 12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ... https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 4/6 Resposta Selecionada: d. Resposta Correta: d. Feedback da resposta: O acesso aos dados envolve a participação da Engenharia de Dados na inteligênciapara extração, carga e organização das estruturas onde serão armazenados. Conforme estudado, há uma solução de repositório que se propõe a armazenar os dados em estado bruto, independentemente de sua origem e estrutura, com o propósito de fornecer à organização uma fonte centralizada e controlado a dados diversos. Que solução é essa? Data Lake. Data Lake. Muito bem! Data Lake ou Lago de dados é o conceito proposto para construção de uma estrutura central armazenando dados em seu formato original, estando disponível para organização fazer uso a qualquer instante, de forma independente. Pergunta 8 Resposta Selecionada: c. Resposta Correta: c. Feedback O processo de Extração, Transformação e Carga de dados (ETL) envolve o entendimento das necessidades de negócio para que assim as devidas fontes de dados sejam selecionadas e consultadas, eventuais tratamentos sejam aplicados e a inserção qualificada no repositório de destino seja realizado. A execução completa do fluxo de ETL resulta em um conjunto de dados que pode ser fonte para outras ações na busca de conhecimento ou para a exploração direta pelo gestor na busca de respostas. Entre as alternativas a seguir, quais representam outros resultados que podem ser alcançados com o ETL? I. Mineração de dados. II. Migração de dados. III. Visualização de dados. IV. Integração de dados. V. Qualificação de dados. Está correto apenas o que se afirma em: II, IV e V. II, IV e V. 1 em 1 pontos 12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ... https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 5/6 da resposta: Muito bem. Com o ETL é possível migrar bases de dados, sejam homogêneas ou heterogêneas. Pode-se também realizar a integração, combinando dados de fontes diversas, além de utilizar o ETL para realizar a qualificação, aplicando tratamentos para limpeza dados, por exemplo. Pergunta 9 Resposta Selecionada: a. Resposta Correta: a. Feedback da resposta: Segundo Schönberger-Mayer e Cukier (2013), para que seja possível extrair valor dos dados, é importante que os profissionais responsáveis pelo trabalho com dados estejam atentos ao modo mais adequado para sua coleta, armazenagem e processamento. Fonte: MAYER-SCHÖNBERGER, V.; CUKIER, K. Big Data: como extrair volume, variedade, velocidade e valor da avalanche de informação cotidiana. Rio de Janeiro: Elsevier, 2013. Considerando essas informações, pode-se afirmar que são exemplos práticos do uso de ciência de dados: Algoritmos de leitura, análise automatizada de imagens e sons, classificação, segmentação e identificação de tendências com base em dados históricos. Algoritmos de leitura, análise automatizada de imagens e sons, classificação, segmentação e identificação de tendências com base em dados históricos. Resposta correta. É importante ter em mente que exemplos práticos do uso de ciência de dados estarão, em grande medida, relacionados à extração de valor, praticamente, qualquer tipo de dado. Pergunta 10 A ciência de dados tem conquistado destaque cada vez maior no setor corporativo na última década, sendo parte integrante das estratégias de negócio de algumas das empresas mais bem-sucedidas do mundo. Conforme o escopo da ciência de dados de uma empresa muda, mudam também as ferramentas que os cientistas de dados utilizam para resolver problemas complexos. Acerca do uso de ferramentas em Data Science, analise as afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) A maturidade das soluções existentes no mercado possibilita que soluções de código aberto sejam integradas facilmente a qualquer fluxo de trabalho de ciência de dados existente. II. ( ) Uma dos principais vantagens de empresas orientadas a dados é a possibilidade de trabalhar com várias ferramentas desconexas, aumentando a capacidade da sua equipe em agregar valor. III. ( ) A adoção de software de código aberto traz alguns desafios, como o licenciamento de suas próprias versões modificadas das ferramentas de código aberto, por exemplo. IV. ( ) Provedores de software de banco de dados e de ciência de dados estão adotando o movimento de código aberto em vez de combater seu crescimento. Agora, assinale a alternativa que apresenta a sequência correta: 1 em 1 pontos 0 em 1 pontos 12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ... https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 6/6 Resposta Selecionada: Resposta Correta: V, F, V, F. F, V, V, V.
Compartilhar