Buscar

ATV4 GRA0749 FRAMEWORKS PARA BIG DATA BIGDA201 - 202010 ead

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

20/06/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 1/5
Curso
GRA0749 FRAMEWORKS PARA BIG DATA BIGDA201 - 202010.ead-29770518.06
Teste ATIVIDADE 4 (A4)
Iniciado 23/05/20 10:46
Enviado 20/06/20 09:21
Status Completada
Resultado da tentativa 10 em 10 pontos 
Tempo decorrido 670 horas, 35 minutos
Resultados exibidos Respostas enviadas, Respostas corretas, Comentários
Pergunta 1
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
A quantidade de dados estão aumento exponencialmente, sendo cada vez mais coletados e
analisados pelo setor para BI, o que também torna as soluções de armazenamento tradicionais caras
demais. Nesse aspecto, o Hive se apresenta como uma solução de data warehousing 
com suporte a consultas de maneira mais expressa. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O hiveQL inclui um sistema com suporte para tabelas contendo tipos primitivos.
Pois:
II. Possui ainda, um catálogo do sistema que contém esquemas estatísticos úteis na exploração de
dados.
 
A seguir, assinale a alternativa correta:
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
Resposta correta. A alternativa está correta, pois 
a asserção I é uma proposição verdadeira, pois o hiveQL inclui um sistema com suporte
para tabelas contendo tipos primitivos, coleções como matrizes e composições
agrupadas de diferentes tipos. A asserção II também é verdadeira e
justifica/complementa a I, pois O Hive também inclui uma espécie de catálogo do
sistema, chamado de Metastore, que contém esquemas e estatísticas de tabelas e seus
atributos (colunas), que são úteis na exploração de dados, otimização de consultas e
compilação de consultas.
Pergunta 2
Resposta Selecionada: 
Resposta Correta: 
Feedback
O Apache Hive é um software de código aberto destinado ao conceito de data warehouse que foi
desenvolvido a partir do Apache Hadoop. Ele oferece uma interface muito parecida com o SQL em
diferentes bancos de dados, auxilia na leitura, escrita e gerenciamento de grandes volumes, e
também, em sistemas de arquivos integrados ao Hadoop.
 
A respeito de características do apache hive, analise as afirmativas a seguir e assinale V para a(s)
Verdadeira(s) e F para a(s) Falsa(s). 
( ) O hive é um sistema de armazenamento que facilita a junção de dados para análise.
( ) Por trabalhar com grandes dados, o hive ocasiona muitas falhas, mesmo sendo distribuído.
( ) O hive consegue se conectar a ferramentas de análise de dados, devido a sua conexão via
bibliotecas.
( ) O hive possui somente uma linguagem query para consultas em SQL.
 
Assinale a alternativa que apresenta a sequência correta:
 
V, F, V, F.
V, F, V, F.
Resposta correta. A sequência está correta. A afirmativa I está correta, pois o Hive é um
1 em 1 pontos
1 em 1 pontos
20/06/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 2/5
da
resposta:
sistema de armazenamento ou depósito de dados, pertencente ao
ecossistema Hadoop, que busca facilitar a junção de dados para geração de análises de
grandes conjuntos de dados, que chamamos comumente de Big Data. A afirmativa III
está correta, pois o hive possibilita a conexão de dados via bibliotecas como JDBC e
ODBC, consegue se conectar a ferramentas de análise de dados amplamente utilizadas
no mercado como o Tableau, o Power BI (da Microsoft), entre outras.
Pergunta 3
Resposta
Selecionada:
 
Resposta Correta: 
Feedback
da
resposta:
O HBase é um banco de dados que se divide em cluster, onde cada máquina dentro do cluster é
chamado de nó. Existem 2 tipos de nodes , sendo o Master e o RegionServer. Existem grandes
diferenças entre utilizar o HBase e um banco de dados relacional. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O HBase requer hardware potente para que a manipulação dos dados sejam realizados de forma
mais rápida. 
Pois:
II. Um banco de dados relacional possui uma arquitetura mais rígida com a expansão possuindo maior
limitação.
 
A seguir, assinale a alternativa correta:
 
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
Resposta correta. A alternativa está correta, pois 
a asserção II é uma proposição verdadeira, pois o banco de dados relacional possui uma
arquitetura mais rígida, com a expansão possuindo maior limitação, seja em recursos
financeiros ou em tempo.
Pergunta 4
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
O termos Big Data Analytics refere-se a analisar grandes quantidades de dados que são produzidos
diariamente a fim de obter informações para um determinado negócio. Além disso, é muito utilizado na
tomada de decisões e para testar processos existentes. O conceito ainda apresenta técnicas analytics.
 
A respeito das técnicas analytics, analise as afirmativas a seguir e assinale V 
para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
I. ( ) A análise descritiva se baseia nas predições para prescrever sugestões para que problemas
sejam evitados antes mesmo de acontecerem.
II. ( ) A análise prescritiva é uma análise do estado atual de uma instituição ou empresa, respondendo
perguntas como: Que produto tem maior saída?.
III. ( ) A análise diagnóstica busca responder perguntas para entender por qual motivo algo aconteceu,
como: porque tal serviço teve queda.
IV. ( ) A análise preditiva busca realizar projeções futuras a respeito de algo, respondendo perguntas
como a estima de clientes para o próximo ano.
 
Assinale a alternativa que apresenta a sequência correta:
 
F, F, V, V.
F, F, V, V.
Resposta correta. A sequência está correta. A afirmativa III é verdadeira, pois a análise
diagnóstica possui característica de analisar algo e responde a pergunta porque algo
aconteceu, como por exemplo, um aumento ou queda de vendas. A afirmativa IV é
verdadeira, pois a análise preditiva busca por projeções futuras, baseando-se em realizar
perguntas do tipo: probabilidade de um cliente voltar a comprar, ou estimativa de novos
clientes para o próximo ano.
1 em 1 pontos
1 em 1 pontos
20/06/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 3/5
Pergunta 5
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
Dentro do ecossistema Hadoop existem diferentes tecnologias para cada necessidade. O pacote não
foi lançado todo de uma só vez, mas foram surgindo necessidades conforme o tempo foi passando.
Assim, novas tecnologias apareceram para atender a demanda. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O banco HBase é oferecido como um serviço por empresas que os fornecem em nuvem como a
Amazon, a Microsoft e Google.
Pois:
II. A grande vantagem de se utilizar os serviços oferecidos por estas empresas é que elas já oferecem
todo o necessário para que tais ferramentas funcionem
 
A seguir, assinale a alternativa correta:
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
Resposta correta. A alternativa está correta, pois 
a asserção I é verdadeira, pois o banco HBase não precisa de ferramentas visuais de
interface para ser gerenciado, mas ele é oferecido como um serviço por empresas que os
fornecem em nuvem como a Amazon, a Microsoft (por meio através do servidor Azure), a
Google, entre outras. A asserção II é verdadeira, e complementa a I, pois a grande
vantagem de se utilizar os serviços de empresas como Amazon, Microsoft, Google e
demais organizações da área de dados, é que elas já oferecem todo o necessário para
que tais ferramentas funcionem.
Pergunta 6
RespostaSelecionada: 
Resposta Correta: 
Feedback
da
resposta:
A análise em grandes conjuntos de dados tem sido essencial para as funções de várias equipes de
analistas de dados. São utilizados diversos aplicativos de BI para análise de dados, como aplicativos
de relatórios simples, dashboards dinâmicos, ferramentas de análise preditiva e prescritiva. 
Considerando o exposto acima, podemos afirmar corretamente que as tecnologias mais utilizadas para
atender grandes empresas são:
 
Hive e Hadoop.
Hive e Hadoop.
Resposta correta. A alternativa está correta, pois Hive 
e Hadoop são as tecnologias mais utilizadas para atender a esses requisitos em grandes
empresas e organizações em todo o mundo, como a Microsoft, a rede de tv americana
CBS, Digg (uma espécie de centralizador de links, notícias e podcasts), Hi5 (rede social).
SQL é uma linguagem, e DDL e DML são recursos dessa linguagem.
Pergunta 7
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
Dado é algo importante para o Big Data, afinal, é através de grandes volumes de dados que o Big
Data trabalha. Grandes volumes de dados começaram a surgir a partir do “boom” da internet e foi
necessário surgir ferramentas que os manipulam de forma rápida. 
Neste sentido, assinale a alternativa que indique corretamente o nome da técnica destinada a análise
de grandes volumes de dados:
Big Data Analytics.
Big Data Analytics.
Resposta correta. A alternativa está correta, O termo Big Data Analytics representa as
formas de analisar grandes volumes de dados. Tem estado em evidência a partir de 2012
1 em 1 pontos
1 em 1 pontos
1 em 1 pontos
20/06/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 4/5
resposta: devido ao aumento considerável na quantidade de dados geradas desde a década de
2010 em diante, com o aumento massivo de comunicadores instantâneos
como Messenger e WhatsApp e as redes sociais. Ainda segundo Marquesone (2018),
existem hoje quatro técnicas de analytics 
que são distintas entre si pelo tipo de resultado gerado.
Pergunta 8
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Realizar uma boa análise de dados é sempre muito importante, seja em qualquer área. Uma das áreas
que vem se utilizando muito disso é a Business Intelligence, ou ainda, inteligência de negócios. Este é
um setor que tem crescido muito para atender cada vez mais empresas de diversos ramos.
 
Considerando o excerto apresentado, a respeito da análise de grandes dados, analise as afirmativas a
seguir:
I. O MapReduce, do Hadoop , é muito utilizado porque desenvolvedores escrevem programas de fácil
manutenção.
II. O Hive suporta consultas de maneira expressa, por meio de sua linguagem conhecida como
HiveQL.
III. A linguagem Hive suporta tabelas contendo tipos primitivos, matrizes e agrupamento de tipos.
IV. O Hive possui um problema, um catálogo do sistema, que o deixa lento ao retornar dados.
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
II e III apenas.
II e III apenas.
Resposta correta. A afirmativa I está correta. A afirmativa II está correta, pois o Hive se
apresenta como uma solução de data warehousing de código aberto com suporte a
consultas de maneira mais expressa, por meio através de uma linguagem declarativa do
tipo SQL - o HiveQL. A afirmativa III está correta, pois a linguagem hive inclui um sistema
com suporte para tabelas contendo tipos primitivos, coleções como matrizes e
composições agrupadas de diferentes tipos.
Pergunta 9
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
Todo um projeto de Big Data é feito de etapas. Cada etapa precisa passar por fases que definem bem
o problema. A visualização de dados é, geralmente, a última etapa de um processo. Mas vale lembrar
que a visualização é uma etapa importante, assim como todas as etapas que compõem o Big Data.
 
Considerando o excerto apresentado, e das características de visualização de dados, analise as
afirmativas a seguir:
I. Dentro do Hadoop, existem diferentes tecnologias para cada necessidade.
II. Dados em tempo real não extintos nesta ferramenta, para eliminar processamento indevido.
III. O banco HBase necessita de ferramentas visuais de interface para gerenciar serviços.
IV. A etapa de visualização exige o uso de novas soluções, que simplifiquem processos.
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
 
I e IV apenas.
I e IV apenas.
Resposta correta. A afirmativa I está correta. A afirmativa I está correta, pois dentro do
ecossistema Hadoop, como você já pôde perceber, existem diferentes tecnologias para
cada necessidade. O pacote inteiro não foi lançado todo de uma só vez, mas foram
surgindo necessidades nos trabalhos. A afirmativa IV está correta, pois quando falamos
de visualização de dados, é exigido soluções que oferecem recursos com a finalidade de
simplificar processos, bem como têm a presença de características que enriquecem a
experiência com usuários ao visualizarem dos dados.
Pergunta 10
O Hive possui um linguagem própria para consulta, chamada de HQL ou HiveQL. Esta linguagem
possui características semelhantes a linguagem SQL. Além desta linguagem, ainda possui outra, uma
1 em 1 pontos
1 em 1 pontos
1 em 1 pontos
20/06/2020 Blackboard Learn
https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 5/5
Sábado, 20 de Junho de 2020 09h21min42s BRT
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
linguagem procedural, chamada HPL ( Hive Procedural Language ). Nesse sentido, analise o exemplo
abaixo:
 
hive> select * from tb_clientes; hive> show tables;
 elaborado pelo autor
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. No exemplo é utilizado um exemplo em linguagem HQL com a presença de comandos select e show
tables. 
Pois: 
II. Possui a característica de comandos semelhantes ao da linguagem SQL.
 
A seguir, assinale a alternativa correta:
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
Resposta correta. A alternativa está correta, pois 
a asserção I é uma proposição verdadeira, pois no exemplo podemos verificar a
presença de comando HQL, com a presença de comando select e show tables. A
asserção II também é verdadeira e justifica/complementa a I, pois a linguagem HQL é
semelhante aos comandos da linguagem SQL, muito utilizada em transações de bancos
de dados relacionais.