Buscar

APOL 1 - Big Date (E)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

Questão 1/5 - Big Data (E)
Com o início do uso massivo de computadores nos anos 1950, para manter sistemas de operações, folhas de pagamento e contabilidade, surgem à necessidade de sistemas capazes de gerenciar dados com maiores volumes e estruturas mais complexas.
Em relação a este contexto, existem 4 grandes fases de modelos de armazenamento, sendo estes descritos corretamente na opção:
Nota: 20.0
	
	A
	Modelos Pré-Relacionais, modelos relacionais, modelos orientados a objetos e os modelos não relacionais.
Você acertou!
Comentário: Existem 4 grandes fases desses modelos: os pré-relacionais (com modelo hierárquico e rede) iniciados em 1960; o relacional, nos anos de 1970, orientado a objetos nos anos de 1980; e finalmente o NoSQL ou modelo não relacional, nos anos 2000.
	
	B
	Modelos de rede, modelos estruturados, modelos não estruturados e modelos semiestruturado.
	
	C
	Modelos de rede, modelo orientado a objetos, modelo indexado e modelo neural.
	
	D
	Modelos relacionais, modelos não relacionais, modelo programado e modelo hierárquico.
Questão 2/5 - Big Data (E)
Com as novas ondas tecnológicas, as grandes organizações estão investindo e procurando benefícios com as tecnologias de big data. Tais organizações possuem um grande ambiente de TI, redes, banco de dados e demais tecnologias para administrar um negócioe a construção de um big data para o armazenamento, análise e resultados pode agregar valor significativo aos negócios. Qual framework consegue fazer a centralização desse ambiente e tem um papel importante:
Nota: 20.0
	
	A
	Plataforma de Mídias Sociais
	
	B
	BI
	
	C
	MapReduce
	
	D
	Hadoop
Você acertou!
Hadoop oferece a essas empresas uma maneira de não apenas ingerir rapidamente os dados, mas também processá-los e armazená-los para reutilização. Devido ao custo-benefício superior, algumas empresas chegam a apostar no Hadoop para substituir os data warehouses, o Hadoop centraliza a ações de um ambiente de integração Big Data.
Questão 3/5 - Big Data (E)
O termo Big Data começa a despertar muita atenção, mas ainda é um conceito mal definido e menos compreendido. Na definição de Big Data, utilizam-se características ou atributos que alguns pesquisadores adotam como sendo os cinco Vs. Porém, a base necessária para o reconhecimento de Big Data é formada por três propriedades:
Nota: 20.0
	
	A
	valor, velocidade e volume.
	
	B
	valor, veracidade e volume.
	
	C
	variedade, valor e volume.
	
	D
	variedade, velocidade e volume.
Você acertou!
Comentário: Big Data, em geral, é definido como ativos de altos volume, velocidade e variedade de informação que exigem custo benefício, de formas inovadoras de processamento de informações para maior visibilidade e tomada de decisão. Big Data = volume + variedade + velocidade.
Questão 4/5 - Big Data (E)
O projeto Apache Hadoop é um conjunto de ferramentas (framework) para o processamento de grandes quantidades de dados em clusters computacionais homogêneos. Um dos pilares do Hadoop é seu sistema de arquivos distribuídos. Esse sistema de arquivos deve possuir um formato de fácil acesso, confiável e por serem utilizados em aplicações muito robustas devem possuir muita integridade. Como o Hadoop usa codificação aberta, permite modificações e customizações, sendo tal característica frequentemente vista em distribuições e aplicações Linux. O sistema de arquivos é o:
Nota: 20.0
	
	A
	GDFS
	
	B
	NFS
	
	C
	HDFS
Você acertou!
Comentário: O HDFS (Hadoop Distributed FileSystem) é um sistema de arquivos criado para armazenar arquivos muito grandes em volume de dados, em ambiente distribuídos, em vários servidores de armazenamento.
	
	D
	EXT4
Questão 5/5 - Big Data (E)
A correlação de dados começou com o engenheiro de software Greg Lindem contratado da Amazon, ele administrava o site da empresa, na época a Amazon possuía dezenas de críticos e editores literários que selecionavam os livros e títulos que eram apresentados no site, assim como os indicavam para os clientes que acessavam o site, baseados na crítica literária, mas sem correlação, sem elementos que poderiam fazer um leitor gostar de livros tão adversos. Existe uma etapa de preparação de dados, antes de tudo começar, que consiste em executar um processo de coletar, limpar, normalizar, combinar, estruturar e organizar os dados para análise. Embora alguns campos de dados possam ser usados no estado em que se encontram, a maioria requer algum tipo de tratamento, os dados possuem vários formatos, como ações inerentes existe uma “limpeza de dados” que remove alguns dados, exceto uma opção não se encaixa nesse processo de limpeza, assinale essa opção:
Nota: 0.0
	
	A
	Remoção de abreviações e normatização de dados numéricos.
	
	B
	Exclusão de campos repetidos e preenchimento de campos vazios.
	
	C
	Padronização de formato de datas, detecção de anomalias e exclusão de dados duplicados.
	
	D
	Remoção de palavras chave e dados de cliente.
Comentário: Como ações inerentes a esse processo de preparação de dados, as mais comuns são a remoção de abreviações, normalização de dados numéricos, exclusão de campos repetidos, preenchimento de campos vazios, padronização de formatos de datas e de unidades, hierarquização de entrada de dados, detecção de anomalias, assim como a deduplicação e desambiguação dessas mesmas entradas.

Continue navegando