Buscar

Atividade 4 - FRAMEWORKS PARA BIGDATA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

5/30/2020 Minha Disciplina
https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 1/5
Pergunta 1
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
A quantidade de dados estão aumento exponencialmente, sendo cada vez mais coletados e
analisados pelo setor para BI, o que também torna as soluções de armazenamento tradicionais caras
demais. Nesse aspecto, o Hive se apresenta como uma solução de data warehousing 
com suporte a consultas de maneira mais expressa. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O hiveQL inclui um sistema com suporte para tabelas contendo tipos primitivos.
Pois:
II. Possui ainda, um catálogo do sistema que contém esquemas estatísticos úteis na exploração de
dados.
 
A seguir, assinale a alternativa correta:
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
Resposta correta. A alternativa está correta, pois 
a asserção I é uma proposição verdadeira, pois o hiveQL inclui um sistema com suporte
para tabelas contendo tipos primitivos, coleções como matrizes e composições
agrupadas de diferentes tipos. A asserção II também é verdadeira e
justifica/complementa a I, pois O Hive também inclui uma espécie de catálogo do
sistema, chamado de Metastore, que contém esquemas e estatísticas de tabelas e seus
atributos (colunas), que são úteis na exploração de dados, otimização de consultas e
compilação de consultas.
Pergunta 2
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
O termos Big Data Analytics refere-se a analisar grandes quantidades de dados que são produzidos
diariamente a fim de obter informações para um determinado negócio. Além disso, é muito utilizado na
tomada de decisões e para testar processos existentes. O conceito ainda apresenta técnicas analytics.
 
A respeito das técnicas analytics, analise as afirmativas a seguir e assinale V 
para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
I. ( ) A análise descritiva se baseia nas predições para prescrever sugestões para que problemas
sejam evitados antes mesmo de acontecerem.
II. ( ) A análise prescritiva é uma análise do estado atual de uma instituição ou empresa, respondendo
perguntas como: Que produto tem maior saída?.
III. ( ) A análise diagnóstica busca responder perguntas para entender por qual motivo algo aconteceu,
como: porque tal serviço teve queda.
IV. ( ) A análise preditiva busca realizar projeções futuras a respeito de algo, respondendo perguntas
como a estima de clientes para o próximo ano.
 
Assinale a alternativa que apresenta a sequência correta:
 
F, F, V, V.
F, F, V, V.
Resposta correta. A sequência está correta. A afirmativa III é verdadeira, pois a análise
diagnóstica possui característica de analisar algo e responde a pergunta porque algo
aconteceu, como por exemplo, um aumento ou queda de vendas. A afirmativa IV é
verdadeira, pois a análise preditiva busca por projeções futuras, baseando-se em realizar
perguntas do tipo: probabilidade de um cliente voltar a comprar, ou estimativa de novos
clientes para o próximo ano.
Pergunta 3
Trabalhar com Big Data significa trabalhar com um grande volume de dados. E claro, analisar esses
dados requer muita atenção e um processamento específico necessitando rapidez. Porém, não
1 em 1 pontos
1 em 1 pontos
0 em 1 pontos
5/30/2020 Minha Disciplina
https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 2/5
Resposta Selecionada:
 
Resposta Correta: 
Feedback
da
resposta:
adianta ter os dados certos, mas com a informação errada.
 
Considerando o excerto apresentado, sobre a análise de Big Data, analise as afirmativas a seguir:
 
I. O termo Big Data Analytics representa as formas de analisar grandes volumes de dados; a técnica
analytics possui quatro técnicas.
II. Utilizar métodos estatísticos e algoritmos de aprendizagem de máquina necessitam que modelos
sejam adaptados para processamento paralelo.
III. A análise descritiva busca responder a pergunta de porque algo aconteceu, e vem depois da
análise diagnóstica.
IV. Ter parte dos dados ou realizar um cálculo errado pode dar um retorno incorreto de uma
informação.
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
 
I, II e IV apenas. 
 
I e II apenas.
Sua resposta está incorreta. A alternativa está incorreta, A afirmativa III está incorreta,
pois a análise descritiva, na verdade, é uma análise do estado atual de uma instituição ou
empresa. Como exemplo, uma base de dados de clientes que respondam a perguntas
como: Qual produto mais vendido? Quanto foi vendido nos últimos meses? Esses
resultados são apresentados geralmente em forma de gráficos e dashboards.
Pergunta 4
Resposta Selecionada: 
Resposta Correta: 
Feedback
da
resposta:
A análise em grandes conjuntos de dados tem sido essencial para as funções de várias equipes de
analistas de dados. São utilizados diversos aplicativos de BI para análise de dados, como aplicativos
de relatórios simples, dashboards dinâmicos, ferramentas de análise preditiva e prescritiva. 
Considerando o exposto acima, podemos afirmar corretamente que as tecnologias mais utilizadas para
atender grandes empresas são:
 
Hive e Hadoop.
Hive e Hadoop.
Resposta correta. A alternativa está correta, pois Hive 
e Hadoop são as tecnologias mais utilizadas para atender a esses requisitos em grandes
empresas e organizações em todo o mundo, como a Microsoft, a rede de tv americana
CBS, Digg (uma espécie de centralizador de links, notícias e podcasts), Hi5 (rede social).
SQL é uma linguagem, e DDL e DML são recursos dessa linguagem.
Pergunta 5
Resposta Selecionada: 
Resposta Correta: 
Feedback
Todo um projeto de Big Data é feito de etapas. Cada etapa precisa passar por fases que definem bem
o problema. A visualização de dados é, geralmente, a última etapa de um processo. Mas vale lembrar
que a visualização é uma etapa importante, assim como todas as etapas que compõem o Big Data.
 
Considerando o excerto apresentado, e das características de visualização de dados, analise as
afirmativas a seguir:
I. Dentro do Hadoop, existem diferentes tecnologias para cada necessidade.
II. Dados em tempo real não extintos nesta ferramenta, para eliminar processamento indevido.
III. O banco HBase necessita de ferramentas visuais de interface para gerenciar serviços.
IV. A etapa de visualização exige o uso de novas soluções, que simplifiquem processos.
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
 
I e IV apenas.
I e IV apenas.
Resposta correta. A afirmativa I está correta. A afirmativa I está correta, pois dentro do
1 em 1 pontos
1 em 1 pontos
5/30/2020 Minha Disciplina
https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 3/5
da
resposta:
ecossistema Hadoop, como você já pôde perceber, existem diferentes tecnologias para
cada necessidade. O pacote inteiro não foi lançado todo de uma só vez, mas foram
surgindo necessidades nos trabalhos. A afirmativa IV está correta, pois quando falamos
de visualização de dados, é exigido soluções que oferecem recursos com a finalidade de
simplificar processos, bem como têm a presença de características que enriquecem a
experiência com usuários ao visualizarem dos dados.
Pergunta 6
Resposta
Selecionada:
Resposta Correta: 
Feedback
da
resposta:
O HBase foi criado sob o conceito do BigTable , da Google, e também é um banco de dados não
relacional que lida com bilhões de dados. Ele se divide em cluster, onde cada máquina dentro do
cluster é chamado de nó. Existem dois tipos de nós no HBase. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O nó máster requer alta disponibilidade, uma vez que é elemento central do processo.
Pois:
II. Esse tipo de nó é responsável pela realização de armazenamento, leitura e escritaem tabelas.
 
A seguir, assinale a alternativa correta:
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
A asserção I é uma proposição verdadeira e a asserção II é uma proposição
falsa.
Sua resposta está incorreta. A alternativa está incorreta, pois somente a asserção I é
verdadeira. A asserção II é uma proposição falsa, sendo que, a característica exposta
refere-se ao nó RegionServer, que é responsável pela realização de armazenamento,
leitura e escrita em tabelas. Um cliente faz comunicação com um nó Region
ServerRegionServer 
para fazer leitura e escrita na base.
Pergunta 7
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
A visualização de dados é, geralmente, a última etapa do processo e exige o uso de novas soluções,
oferecendo recursos que simplificam o processo de visualização. Podemos dizer que lidar com dados
requer cuidado, visualizar dados pode ser uma grande arte. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. No HBase é possível interagir via shell script, prompt de comando ou interface gráfica.
 Pois:
II. Há uma ferramenta chamada HB TOP que realiza o monitoramento em tempo real.
 
A seguir, assinale a alternativa correta:
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta
da I.
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa
correta da I.
Sua resposta está incorreta. A alternativa está incorreta, pois as duas asserções são
proposições verdadeiras, no entanto, uma não justifica a outra. No HBase é possível
interagir via shell script, prompt de comando ou interface gráfica. Há uma ferramenta
chamada HB TOPHBTOP que realiza o monitoramento em tempo real.
Pergunta 8
O HBase é um banco de dados que se divide em cluster, onde cada máquina dentro do cluster é
0 em 1 pontos
0 em 1 pontos
1 em 1 pontos
5/30/2020 Minha Disciplina
https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 4/5
Resposta
Selecionada:
 
Resposta Correta: 
Feedback
da
resposta:
chamado de nó. Existem 2 tipos de nodes , sendo o Master e o RegionServer. Existem grandes
diferenças entre utilizar o HBase e um banco de dados relacional. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O HBase requer hardware potente para que a manipulação dos dados sejam realizados de forma
mais rápida. 
Pois:
II. Um banco de dados relacional possui uma arquitetura mais rígida com a expansão possuindo maior
limitação.
 
A seguir, assinale a alternativa correta:
 
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
Resposta correta. A alternativa está correta, pois 
a asserção II é uma proposição verdadeira, pois o banco de dados relacional possui uma
arquitetura mais rígida, com a expansão possuindo maior limitação, seja em recursos
financeiros ou em tempo.
Pergunta 9
Resposta
Selecionada:
Resposta Correta:
Feedback
da
resposta:
Dentro do ecossistema Hadoop existem diferentes tecnologias para cada necessidade. O pacote não
foi lançado todo de uma só vez, mas foram surgindo necessidades conforme o tempo foi passando.
Assim, novas tecnologias apareceram para atender a demanda. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O banco HBase é oferecido como um serviço por empresas que os fornecem em nuvem como a
Amazon, a Microsoft e Google.
Pois:
II. A grande vantagem de se utilizar os serviços oferecidos por estas empresas é que elas já oferecem
todo o necessário para que tais ferramentas funcionem
 
A seguir, assinale a alternativa correta:
 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
As asserções I e II são proposições verdadeiras, e a II é uma justificativa
correta da I.
Resposta correta. A alternativa está correta, pois 
a asserção I é verdadeira, pois o banco HBase não precisa de ferramentas visuais de
interface para ser gerenciado, mas ele é oferecido como um serviço por empresas que os
fornecem em nuvem como a Amazon, a Microsoft (por meio através do servidor Azure), a
Google, entre outras. A asserção II é verdadeira, e complementa a I, pois a grande
vantagem de se utilizar os serviços de empresas como Amazon, Microsoft, Google e
demais organizações da área de dados, é que elas já oferecem todo o necessário para
que tais ferramentas funcionem.
Pergunta 10
Resposta Selecionada: 
Dado é algo importante para o Big Data, afinal, é através de grandes volumes de dados que o Big
Data trabalha. Grandes volumes de dados começaram a surgir a partir do “boom” da internet e foi
necessário surgir ferramentas que os manipulam de forma rápida. 
Neste sentido, assinale a alternativa que indique corretamente o nome da técnica destinada a análise
de grandes volumes de dados:
Big Data Analytics.
1 em 1 pontos
1 em 1 pontos
5/30/2020 Minha Disciplina
https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 5/5
Resposta Correta: 
Feedback
da
resposta:
Big Data Analytics.
Resposta correta. A alternativa está correta, O termo Big Data Analytics representa as
formas de analisar grandes volumes de dados. Tem estado em evidência a partir de 2012
devido ao aumento considerável na quantidade de dados geradas desde a década de
2010 em diante, com o aumento massivo de comunicadores instantâneos
como Messenger e WhatsApp e as redes sociais. Ainda segundo Marquesone (2018),
existem hoje quatro técnicas de analytics 
que são distintas entre si pelo tipo de resultado gerado.

Outros materiais