Simulado BigData

•

ESTÁCIO EAD

1

0

1

0

caleby soares

25/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.795 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1a 
 Questão 
Acerto: 1,0 / 1,0 
 
Big Data se refere ao imenso volume de conjuntos de dados que alcançam elevadas 
ordens de magnitude. O valor real do Big Data está no insight que ele produz quando 
analisado ¿ buscando padrões, derivando significado, tomando decisões e, por fim, 
respondendo ao mundo com inteligência. Referente ao Big Data, é correto afirmar que o 
termo variedade refere-se: 
 
 
Aos data centers físicos que transformam os dados em informações pertinentes 
ao negócio 
 
Ao controle de dados semiestruturados de formatos definidos como texto e 
números 
 A um conjunto de dados mais diversos, incluindo dados estruturados, 
semiestruturados e não estruturados. É heterogêneo e vem em muitos 
formatos, incluindo texto, documento, imagem, vídeo e outros 
 
Ao banco de dados homogêneo que trata de informações do mesmo tipo 
definindo padrões de segurança 
 
A um conjunto de dados que são gerados em tempo real, o que requer a oferta 
imediata de informações úteis 
Respondido em 17/12/2021 14:07:44 
 
 
2a 
 Questão 
Acerto: 1,0 / 1,0 
 
(FCC - 2020 - AL-AP - Analista Legislativo - Desenvolvedor de Banco de Dados) 
Atualmente, diversos dados são coletados pelos sistemas digitais de empresas na 
internet para constituir Big Data com conteúdo sobre os resultados alcançados por seus 
produtos e serviços, prestígio da imagem da organização e seus representantes. Porém, 
parte desses dados pode ser falsa ou manipulada por internautas. O tratamento dos 
dados, a fim de qualificá-los antes de disponibilizá-los para a tomada de decisão na 
empresa, segundo o conceito das cinco dimensões ¿V¿ de avaliação de um Big Data, se 
refere: 
 
 
 À veracidade 
 
À variedade 
 
 Ao valor 
 
 
 Ao volume 
 
À velocidade 
 
Respondido em 17/12/2021 14:08:18 
 
Explicação: 
O V de Veracidade é sobre as fontes e a qualidade dos dados, pois eles devem ser 
confiáveis 
 
 
3a 
 Questão 
Acerto: 1,0 / 1,0 
 
(FUNDATEC - 2017 - CREMERS - Técnico em Informática) Analisando uma tabela em um 
banco de dados relacional, qual seria o conceito de chave primária? 
 
 
Uma coluna que permita a inserção de um valor de documento válido. 
 Uma coluna ou combinação de colunas cujos valores distinguem uma linha das 
demais, dentro da mesma tabela. 
 
Apenas uma coluna que possua valor numérico e autoincremental. 
 
Uma coluna que permita a inserção de um valor de documento inválido. 
 
Apenas uma coluna que possua valor numérico e não autoincremental. 
Respondido em 17/12/2021 14:09:09 
 
Explicação: 
Uma coluna ou combinação de colunas cujos valores distinguem uma linha das demais, 
dentro da mesma tabela. 
 
 
4a 
 Questão 
Acerto: 1,0 / 1,0 
 
O conceito de computação em nuvem (em inglês, cloud computing) refere-se: 
 
 
Ao armazenamento de dados feito em serviços que poderão ser acessados de 
qualquer lugar do mundo, a qualquer hora, havendo necessidade de instalação 
de programas ou, por vezes, de armazenar dados 
 
À tecnologia de comunicação de dados que permite uma transmissão de dados 
mais rápida através de linhas de telefone do que um modem convencional pode 
oferecer, sendo os dados transmitidos mais rapidamente em uma direção do que 
na outra, assimetricamente 
 À utilização da memória e da capacidade de armazenamento e cálculo de 
computadores e servidores compartilhados e interligados por meio da Internet, 
seguindo o princípio da computação em grade 
 
Ao protocolo de comunicação da comada de aplicação utilizado para sistemas de 
informação de hipermídia, distribuídos e colaborativos, representando a base 
para a comunicação de dados da World Wide Web 
 
Ao programa que habilita seus usuários a interagirem com documentos HTML 
hospedados em um servidor da rede, destacando-se na era da web 2.0, uma vez 
que quase tudo do que se necessita está online 
Respondido em 17/12/2021 14:11:29 
 
 
5a 
 Questão 
Acerto: 1,0 / 1,0 
 
Marque a opção que apresenta SOMENTE ferramentas utilizadas para análise de dados. 
 
 
R e Apache Spark 
 Apache mahout e Spark mllib 
 
HBase e Python 
 
MarkLogic e Weka 
 
Hadoop MapReduce e Apache mahout 
Respondido em 17/12/2021 14:12:35 
 
 
6a 
 Questão 
Acerto: 1,0 / 1,0 
 
Visualização de dados é importante para comunicar a mensagem de forma rápida e 
eficiente. Marque a opção que representa o tipo de visualização que tem como objetivo 
representar a frequência de ocorrência de cada palavra existente em uma base de 
dados textual. 
 
 
Barra 
 Word cloud 
 
Linha 
 
Rain of words 
 
Jogo de palavras 
Respondido em 17/12/2021 14:13:07 
 
 
7a 
 Questão 
Acerto: 1,0 / 1,0 
 
 São componentes do método do MapReduce: 
 
 
Computador mestre e computador escravo 
 
Computador principal e computador secundário 
 
Nó gestor e nó operário 
 
Nó principal e nó secundário 
 
 Nó mestre e nó escravo 
Respondido em 17/12/2021 14:15:57 
 
Explicação: 
Nó mestre e nó escravo 
 
 
8a 
 Questão 
Acerto: 1,0 / 1,0 
 
O ecossistema do Hadoop possui um conjunto de ferramentas de alto nível para facilitar 
a manipulação dos dados em sistemas distribuídos. Marque a opção que apresenta a 
ferramenta projetada para transferir dados entre o Hadoop e um banco de dados 
relacional. 
 
 
Hive 
 
Mahout 
 Sqoop 
 
Cassandra 
 
HBase 
Respondido em 17/12/2021 14:16:55 
 
 
9a 
 Questão 
Acerto: 1,0 / 1,0 
 
(FUNCAB 2008) A técnica RAID (Redundant Arrays of Inexpensive Disk) é usada: 
 
 
 em gerenciamento de disco para otimizar as operações de E/S e implementar 
redundância e proteção de dados; 
 
na conexão à rede padrão ethernet; 
 
no armazenamento de informação ECC (error correcting code), que é a 
informação de controle de erros; 
 
na alocação dinâmica de memória RAM; 
 
na otimização das interfaces IDE. 
Respondido em 17/12/2021 14:17:56 
 
Explicação: 
Em gerenciamento de disco para otimizar as operações de E/S e implementar redundância e 
proteção de dados; 
 
 
10a 
 Questão 
Acerto: 1,0 / 1,0 
 
O Apache Spark é um mecanismo de análise unificado para processamento de dados em 
grande escala com várias vantagens. Marque a opção que NÃO representa uma dessas 
vantagens. 
 
 O Spark tem um gerenciador de recursos do cluster próprio responsável por 
alocar e monitorar os recursos disponíveis no cluster para todas as aplicações 
 
O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, 
Hive e qualquer outro formato de entrada aceito pelo Hadoop 
 
No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, 
Python ou R 
 
O Spark tem um rico conjunto de bibliotecas para implementar processamentos 
em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado 
de máquina 
 
A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo 
extremamente rápido, em particular quando o cluster é grande o suficiente para 
armazenar todos os dados em memória 
Respondido em 17/12/2021 14:19:01 
 
 
 
 
 
javascript:abre_colabore('38403','276013569','5097882878');