Buscar

TÓPICOS DE BIG DATA EM PYTHON

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
	 
	 
	 1.
	Ref.: 6076630
	Pontos: 0,00  / 1,00
	
	No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários:
I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados
II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão
III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados
Analise as frases listadas e assinale a alternativa correta.
		
	 
	As opções I, II, e III estão corretas.
	
	Apenas as opções II e III.
	
	Apenas a opção II.
	 
	Apenas as opções I e III.
	
	Apenas a opção I.
	
	
	 2.
	Ref.: 6076628
	Pontos: 0,00  / 1,00
	
	O seguinte constructo da linguagem Python representa o condicional simples:
		
	
	while
	 
	with
	
	else
	 
	if
	
	for
	
	
	 
		
	02318 - BIG DATA ANALYTICS
	 
	 
	 3.
	Ref.: 6076113
	Pontos: 1,00  / 1,00
	
	Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn?
		
	
	cout
	 
	plot_tree
	
	printf
	
	print
	
	console.log
	
	
	 4.
	Ref.: 6075830
	Pontos: 0,00  / 1,00
	
	O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como:
		
	 
	Informações.
	
	Dados Faltantes.
	 
	Big Data.
	
	Conhecimento.
	
	Observações.
	
	
	 
		
	02508 - HADOOP E ARMAZENAMENTO DE DADOS
	 
	 
	 5.
	Ref.: 6076197
	Pontos: 0,00  / 1,00
	
	A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters.
		
	 
	Zookeeper
	
	HBase
	 
	Spark
	
	Flume
	
	HCluster
	
	
	 6.
	Ref.: 6075861
	Pontos: 0,00  / 1,00
	
	Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção  que apresenta o componente responsável por  desempenhar o papel de mestre na arquitetura do Hadoop.
		
	 
	DataNode
	
	Bloco de dados
	
	HServerMap
	
	Replicador
	 
	NameNode
	
	
	 
		
	02727 - PRINCÍPIOS DE BIG DATA
	 
	 
	 7.
	Ref.: 6067386
	Pontos: 1,00  / 1,00
	
	Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que podem ser encontrados.
		
	
	5
	
	2
	 
	3
	
	6
	
	4
	
	
	 8.
	Ref.: 6067203
	Pontos: 0,00  / 1,00
	
	Selecione a opção correta sobre o uso de Big Data.
		
	
	Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras.
	 
	Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados.
	 
	O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado.
	
	É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas.
	
	Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados.
	
	
	 
		
	02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
	 
	 
	 9.
	Ref.: 6075911
	Pontos: 0,00  / 1,00
	
	O Spark é um framework de alto desempenho usado para aplicações de Big Data. Em relação à arquitetura do Spark, selecione a opção correta.
		
	 
	O gerenciador de cluster do Spark oferece suporte a Hadoop YARN.
	
	O Executor e os Worker Nodes desempenham papeis equivalentes na arquitetura do Spark.
	 
	O gerenciador de cluster do Spark faz o gerenciamento da execução das tarefas.
	
	Os Worker Nodes da arquitetura Spark são responsáveis pelo gerenciamento das máquinas que executarão como escravos.
	
	O Executor corresponde ao conjunto de máquina que executam como escravos.
	
	
	 10.
	Ref.: 6076009
	Pontos: 0,00  / 1,00
	
	A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas.
		
	 
	RDD
	
	numpy.array
	 
	DataFrame
	
	PySpark
	
	SQL

Continue navegando