Buscar

AV TÓPICOS DE BIG DATA EM PYTHON

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
	 
	 
	 1.
	Ref.: 6076630
	Pontos: 1,00  / 1,00
	
	No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários:
I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados
II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão
III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados
Analise as frases listadas e assinale a alternativa correta.
		
	 
	As opções I, II, e III estão corretas.
	
	Apenas a opção II.
	
	Apenas as opções I e III.
	
	Apenas a opção I.
	
	Apenas as opções II e III.
	
	
	 2.
	Ref.: 6076764
	Pontos: 1,00  / 1,00
	
	A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.
		
	
	Apenas I e II.
	 
	Apenas I e III.
	
	Apenas I.
	
	Apenas II e III.
	
	Apenas II.
	
	
	 
		
	02318 - BIG DATA ANALYTICS
	 
	 
	 3.
	Ref.: 6075832
	Pontos: 1,00  / 1,00
	
	Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra:
		
	 
	Pré-Processamento    .                              
	
	Coleta de Dados.
	
	Descoberta de Padrões.
	
	Transformação de Dados.
	
	Avaliação.
	
	
	 4.
	Ref.: 6076113
	Pontos: 1,00  / 1,00
	
	Qual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit-Learn?
		
	
	console.log
	
	cout
	
	print
	 
	plot_tree
	
	printf
	
	
	 
		
	02508 - HADOOP E ARMAZENAMENTO DE DADOS
	 
	 
	 5.
	Ref.: 6076138
	Pontos: 0,00  / 1,00
	
	Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível.
		
	 
	Consistência.
	 
	Atomicidade.
	
	Durabilidade.
	
	Indivisibilidade.
	
	Isolamento.
	
	
	 6.
	Ref.: 6075861
	Pontos: 0,00  / 1,00
	
	Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção  que apresenta o componente responsável por  desempenhar o papel de mestre na arquitetura do Hadoop.
		
	
	HServerMap
	 
	DataNode
	 
	NameNode
	
	Replicador
	
	Bloco de dados
	
	
	 
		
	02727 - PRINCÍPIOS DE BIG DATA
	 
	 
	 7.
	Ref.: 6067459
	Pontos: 0,00  / 1,00
	
	Existem diversos motivos que justificam o uso da computação em nuvem, apesar disso, existe um conceito que é essencial para computação em nuvem. Selecione a opção correta que contenha esse conceito.
		
	
	produtividade
	
	confiabilidade
	 
	abstração
	
	segurança
	 
	disponibilidade
	
	
	 8.
	Ref.: 6067207
	Pontos: 1,00  / 1,00
	
	Em relação às características do processamento de fluxo de dados, selecione a opção correta.
		
	
	São relacionados à aplicações de internet das coisas
	
	Sempre são do mesmo tipo
	 
	Representam o estado de um sistema em um dado momento
	
	São invariáveis no tempo
	
	O fluxo de dados é intermitente
	
	
	 
		
	02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
	 
	 
	 9.
	Ref.: 6082364
	Pontos: 1,00  / 1,00
	
	Observe o trecho de código abaixo
import numpy as np
x = np.array([1, 5, 1, 6, 4, 7, 7])
função_teste = lambda x: x+x
print(função_teste(x))
Selecione a opção correta a respeito dele.
		
	
	O programa ficará sintaticamente correto se for acrescentado o "SparkContext" para executar o MapReduce.
	
	A saída do programa é [2].
	
	O programa produz a saída 31.
	
	O programa vai gerar um erro.
	 
	O programa vai gerar e imprimir [2 10 2 12 8 14 14].
	
	
	 10.
	Ref.: 6082370
	Pontos: 0,00  / 1,00
	
	Selecione a opção correta que contenha as categorias em que transformações podem ser classificadas.
		
	
	Mapeamento e partição
	
	Separação e finalização
	 
	Estreitas e amplas
	
	Embaralhamento e redução
	 
	Mapeamento e redução

Continue navegando