Buscar

PROVA N2 (A5) ENGENHARIA DE DADOS GR0837202 - 202020 ead

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 1/6
Curso GRA0691 ENGENHARIA DE DADOS GR0837202 - 202020.ead-29774744.06
Teste 20202 - PROVA N2 (A5)
Iniciado 08/12/20 16:11
Enviado 08/12/20 17:27
Status Completada
Resultado da tentativa 8 em 10 pontos 
Tempo decorrido 1 hora, 15 minutos
Instruções
Resultados exibidos Respostas enviadas, Respostas corretas, Comentários
Caso necessite a utilização do "EXCEL" clique no link ao lado -----------> excel.xlsx
Pergunta 1
Resposta Selecionada:
b. 
Resposta Correta:
b. 
Feedback
da
resposta:
As ferramentas de Extração, Transformação e Carga (ETL) se propõem à
realização de diversas tarefas que aceleram o trabalho do analista de dados.
Dentre essas tarefas, podemos citar a existência de recursos, como a integração
com linguagens de programação, funções de tratamento, além de scripts pré-
compilados para manipulação dos dados.
 
As soluções de ETL existentes no mercado evoluem cada vez mais, fornecendo
recursos que acompanham as tendências de tecnologias, como o armazenamento
na nuvem, Big Data, fluxos de dados, entre outros. Com base nessas informações
e no conteúdo estudado, qual solução de ETL fornece conectores que atendam a
essas novas tecnologias?
Talend Data Integration.
 
Talend Data Integration.
 
Exatamente! O Talend Data Integration é uma ferramenta open source
que constantemente tem conectores atualizados seguindo as novas
tecnologias, a exemplo de conectores para o Parquet, o Hive, o JSON,
entre outros.
Pergunta 2
Os problemas de segurança encontrados na nuvem são objeto de preocupação em organizações e
provedores dos mais diversos tamanhos, ainda que pesquisas possam evidenciar que o ambiente em
nuvem tende a ser mais seguro que uma rede privada.
 
Considerando as dificuldades de implantação da Cloud Computing em uma organização, analise as
afirmativas a seguir e assinale V para a(s) verdadeira(s) e F para a(s) falsa(s). 
 
I. ( ) Muitas empresas preferem manter os dados apenas em suas redes privadas, devido à cultura
interna.
II. ( ) É comum haver resistência por parte dos profissionais de tecnologia da informação por medo de
perderem seu espaço e importância dentro da organização.
III. ( ) Largura de banda será uma preocupação do passado, uma vez que quem irá executar todo o
trabalho será o Cloud Provider. 
IV. ( ) Falta de conhecimento e capacitação de profissionais para o trabalho em projetos de Cloud
Computing é algo superado, uma vez que o mercado de profissionais da área está se tornando cada
vez mais saturado.
1 em 1 pontos
1 em 1 pontos
https://fmu.blackboard.com/bbcswebdav/pid-15038170-dt-content-rid-114062409_1/xid-114062409_1
12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 2/6
Resposta Selecionada: 
Resposta Correta: 
Feedback
da resposta:
V, V, F, F.
V, V, F, F.
Está correto! Cultura, resistência, largura de banda e conhecimento são apenas alguns
dos desafios enfrentados na implantação da Cloud Computing.
Pergunta 3
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Dadas as suas peculiaridades, os sistemas distribuídos podem ser classificados em cinco paradigmas.
Um destes paradigmas é caracterizado pela disposição de vários processadores, organizados em
árvore, de modo que a capacidade computacional seja maior, à medida que os nós forem mais
próximos à raiz. Além disso, estes devem ter funções distribuídas de acordo com a capacidade de
processamento de cada nó.
 
Considerando essas informações e o conteúdo estudado, pode-se afirmar que o paradigma descrito
no elemento-base é:
Hierárquico.
Hierárquico.
Resposta Correta. Quando o elemento-base fala em “árvore” e distribuição de tarefas
levando em conta capacidade computacional e proximidade da raiz, são apresentadas
duas características básicas do Paradigma Hierárquico.
Pergunta 4
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
É possível afirmar que os sistemas distribuídos são diferentes de sistemas centralizados por, entre
outros fatores, possuírem componentes espalhados geograficamente, com características bastantes
heterogêneas entre si, como diferentes sistemas operacionais, capacidades de processamento,
hardware, etc. 
 
Dadas as inúmeras diferenças possíveis entre os componentes de um sistema distribuído, é possível
citar como desafios inerentes a estes sistemas:
Concorrência, inexistência de relógio global e falhas independentes.
Concorrência, inexistência de relógio global e falhas independentes.
Resposta Correta. A conexão concorrente de programas, fusos horários diferentes e
falhas de rede são grandes desafios, quando se trata de computação distribuída.
Pergunta 5
“Com grandes quantidades de dados agora disponíveis, as empresas em quase
todos os setores estão focadas sobre a exploração de dados para obter vantagem
competitiva”. Essa definição traduz a importância de encontrar relevância sobre os
dados, não esquecendo do desafio de encontrar meios de processar essa grande
massa.
Fonte: MINELI, M.; CHAMBERS, M.; DHIRAJ, A. Big data, big analytics: emerging business
intelligence and analytic trends for today's businesses. New Jersey: John Wiley & Sons, 2013, p. 1.
 
A depender do volume de dados apresentado, a percepção de valor não é algo
trivial de ser alcançado, exigindo esforço multidisciplinar de conhecimento para
essa descoberta. A partir desse contexto, quais áreas de conhecimento a seguir
estão envolvidas?
1 em 1 pontos
1 em 1 pontos
0 em 1 pontos
12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 3/6
Resposta Selecionada:
e. 
Resposta Correta: a. 
Feedback
da
resposta:
 
I. Tecnologia e Computação.
II. Matemática e Estatística.
III. Suporte de Dados.
IV. Ciência e Administração.
V. Áreas de negócio.
 
Está correto apenas o que se afirma em:
I, II, III e IV.
 
I, II e V.
Resposta incorreta. O grande volume de dados disponíveis nas
organizações exige a participação de áreas e pessoas que entendam do
assunto e dos problemas apresentados, de maneira a auxiliar outros que
poderão propor a melhor solução com uso da tecnologia e, ao mesmo
tempo, utilizar-se de meios que permitam embasar e validar o resultado
encontrado.
Pergunta 6
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Para que dois ou mais dispositivos possam estabelecer uma comunicação, é necessário que haja uma
maneira em comum de comunicação. Por exemplo, quando desejamos transmitir ou receber uma
mensagem de alguém, precisamos compreender, minimamente, o idioma utilizado.
 
No contexto computacional, para que dois ou mais dispositivos possam estabelecer uma
comunicação, é necessário que eles:
Utilizem um mesmo protocolo.
Utilizem um mesmo protocolo.
A resposta está correta. Assim como em nosso contexto, emissor e receptor devem falar
o mesmo idioma para estabelecer uma comunicação, no contexto computacional, é
necessário que utilizem um mesmo protocolo.
Pergunta 7
As organizações já perceberam a importância que os dados podem representar ao
crescimento de seus negócios. Essa importância também pode ser percebida com
a quantidade de soluções de mercado que surgiram prometendo a célere extração
e descoberta de valor sobre estes dados.
 
1 em 1 pontos
1 em 1 pontos
12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 4/6
Resposta Selecionada:
d. 
Resposta Correta:
d. 
Feedback
da
resposta:
O acesso aos dados envolve a participação da Engenharia de Dados na
inteligênciapara extração, carga e organização das estruturas onde serão
armazenados. Conforme estudado, há uma solução de repositório que se propõe a
armazenar os dados em estado bruto, independentemente de sua origem e
estrutura, com o propósito de fornecer à organização uma fonte centralizada e
controlado a dados diversos. Que solução é essa?
Data Lake.
 
Data Lake.
 
Muito bem! Data Lake ou Lago de dados é o conceito proposto para
construção de uma estrutura central armazenando dados em seu
formato original, estando disponível para organização fazer uso a
qualquer instante, de forma independente.
Pergunta 8
Resposta Selecionada:
c. 
Resposta Correta:
c. 
Feedback
O processo de Extração, Transformação e Carga de dados (ETL) envolve o
entendimento das necessidades de negócio para que assim as devidas fontes de
dados sejam selecionadas e consultadas, eventuais tratamentos sejam aplicados e
a inserção qualificada no repositório de destino seja realizado.
 
A execução completa do fluxo de ETL resulta em um conjunto de dados que pode
ser fonte para outras ações na busca de conhecimento ou para a exploração direta
pelo gestor na busca de respostas. Entre as alternativas a seguir, quais
representam outros resultados que podem ser alcançados com o ETL?
 
I. Mineração de dados.
II. Migração de dados.
III. Visualização de dados.
IV. Integração de dados.
V. Qualificação de dados.
 
Está correto apenas o que se afirma em:
II, IV e V.
 
II, IV e V.
 
1 em 1 pontos
12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 5/6
da
resposta:
Muito bem. Com o ETL é possível migrar bases de dados, sejam
homogêneas ou heterogêneas. Pode-se também realizar a integração,
combinando dados de fontes diversas, além de utilizar o ETL para
realizar a qualificação, aplicando tratamentos para limpeza dados, por
exemplo.
Pergunta 9
Resposta
Selecionada:
a.
Resposta
Correta:
a.
Feedback
da
resposta:
Segundo Schönberger-Mayer e Cukier (2013), para que seja possível extrair valor dos dados, é
importante que os profissionais responsáveis pelo trabalho com dados estejam atentos ao modo mais
adequado para sua coleta, armazenagem e processamento.
Fonte: MAYER-SCHÖNBERGER, V.; CUKIER, K. Big Data: como extrair volume, variedade,
velocidade e valor da avalanche de informação cotidiana. Rio de Janeiro: Elsevier, 2013.
 
Considerando essas informações, pode-se afirmar que são exemplos práticos do uso de ciência de
dados:
Algoritmos de leitura, análise automatizada de imagens e sons, classificação,
segmentação e identificação de tendências com base em dados históricos.
Algoritmos de leitura, análise automatizada de imagens e sons, classificação,
segmentação e identificação de tendências com base em dados históricos.
Resposta correta. É importante ter em mente que exemplos práticos do uso de
ciência de dados estarão, em grande medida, relacionados à extração de valor,
praticamente, qualquer tipo de dado.
Pergunta 10
A ciência de dados tem conquistado destaque cada vez maior no setor corporativo na última década,
sendo parte integrante das estratégias de negócio de algumas das empresas mais bem-sucedidas do
mundo. Conforme o escopo da ciência de dados de uma empresa muda, mudam também as
ferramentas que os cientistas de dados utilizam para resolver problemas complexos.
 
Acerca do uso de ferramentas em Data Science, analise as afirmativas a seguir e assinale V para a(s)
verdadeira(s) e F para a(s) falsa(s).
 
I. ( ) A maturidade das soluções existentes no mercado possibilita que soluções de código aberto
sejam integradas facilmente a qualquer fluxo de trabalho de ciência de dados existente.
II. ( ) Uma dos principais vantagens de empresas orientadas a dados é a possibilidade de trabalhar
com várias ferramentas desconexas, aumentando a capacidade da sua equipe em agregar valor.
III. ( ) A adoção de software de código aberto traz alguns desafios, como o licenciamento de suas
próprias versões modificadas das ferramentas de código aberto, por exemplo.
IV. ( ) Provedores de software de banco de dados e de ciência de dados estão adotando o movimento
de código aberto em vez de combater seu crescimento.
 
Agora, assinale a alternativa que apresenta a sequência correta:
1 em 1 pontos
0 em 1 pontos
12/12/2020 Revisar envio do teste: 20202 - PROVA N2 (A5) – GRA0691 ...
https://fmu.blackboard.com/webapps/assessment/review/review.jsp?attempt_id=_40956221_1&course_id=_619973_1&content_id=_15038170_1… 6/6
Resposta Selecionada: 
Resposta Correta: 
V, F, V, F.
F, V, V, V.

Outros materiais