Buscar

AV TÓPICOS DE BIG DATA EM PYTHON

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Disciplina: TÓPICOS DE BIG DATA EM PYTHON 
	AV
	Aluno: TIAGO JOSE DE LIMA
	202004083902
	Professor: ROBSON LORBIESKI
 
	Turma: 9001
	EEX0174_AV_202004083902 (AG) 
	 03/06/2022 10:03:14 (F) 
			Avaliação:
2,0
	Nota Partic.:
	Av. Parcial.:
2,0
	Nota SIA:
2,0 pts
	
Estação de trabalho liberada pelo CPF 13936051763 com o token 267030 em 03/06/2022 10:02:28.
	O aproveitamento da Avaliação Parcial será considerado apenas para as provas com nota maior ou igual a 4,0.
	 
		
	02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
	 
	 
	 1.
	Ref.: 6076764
	Pontos: 0,00  / 1,00
	
	A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.
		
	
	Apenas II.
	
	Apenas II e III.
	 
	Apenas I e II.
	
	Apenas I.
	 
	Apenas I e III.
	
	
	 2.
	Ref.: 6076846
	Pontos: 0,00  / 1,00
	
	Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como:
		
	 
	Faltantes.
	
	Enviesados.
	
	Nulos.
	
	Embaralhados.
	 
	Corrompidos.
	
	
	 
		
	02318 - BIG DATA ANALYTICS
	 
	 
	 3.
	Ref.: 6075832
	Pontos: 0,00  / 1,00
	
	Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra:
		
	
	Transformação de Dados.
	 
	Pré-Processamento    .                              
	 
	Avaliação.
	
	Descoberta de Padrões.
	
	Coleta de Dados.
	
	
	 4.
	Ref.: 6075830
	Pontos: 0,00  / 1,00
	
	O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como:
		
	 
	Informações.
	
	Observações.
	
	Conhecimento.
	 
	Big Data.
	
	Dados Faltantes.
	
	
	 
		
	02508 - HADOOP E ARMAZENAMENTO DE DADOS
	 
	 
	 5.
	Ref.: 6076138
	Pontos: 0,00  / 1,00
	
	Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível.
		
	 
	Indivisibilidade.
	
	Consistência.
	
	Isolamento.
	
	Durabilidade.
	 
	Atomicidade.
	
	
	 6.
	Ref.: 6075861
	Pontos: 0,00  / 1,00
	
	Ser capaz de gerenciar uma infraestrutura complexa é uma habilidade fundamental para o profissional de Tecnologia da Informação. Sendo assim, analise as alternativas e selecione a opção  que apresenta o componente responsável por  desempenhar o papel de mestre na arquitetura do Hadoop.
		
	
	Replicador
	 
	NameNode
	
	HServerMap
	
	Bloco de dados
	 
	DataNode
	
	
	 
		
	02727 - PRINCÍPIOS DE BIG DATA
	 
	 
	 7.
	Ref.: 6067294
	Pontos: 1,00  / 1,00
	
	Selecione a opção a respeito da computação em nuvem.
		
	
	é uma outra forma de denominar a internet das coisas
	
	é uma forma de abstrair serviços da internet das coisas em redes locais distribuídas
	 
	é um conjunto de tecnologias que disponibilizam sistemas e recursos na internet
	
	é a definição para aplicações de Big Data que utilizam os protocolos de internet
	
	trata-se da utilização de aplicações com finalidades específicas
	
	
	 8.
	Ref.: 6067388
	Pontos: 0,00  / 1,00
	
	Em relação às aplicações de Internet das coisas, selecione a opção correta sobre os seus objetivos.
		
	
	Aumentar a complexidade do processo de gestão dos dados
	 
	Melhorar a interatividade com o usuário
	 
	Obter dados que sirvam como base na tomada de decisão
	
	Aumentar a diversidade dos dados
	
	Ampliar o volume de dados da aplicação
	
	
	 
		
	02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
	 
	 
	 9.
	Ref.: 6076011
	Pontos: 0,00  / 1,00
	
	A escolha adequada de uma linguagem de programação é fundamental para a maximização dos resultados almejados. Nesse sentido, selecione a opção que contém a linguagem de programação mais adequada para desenvolver aplicações para o Spark.
		
	
	R
	 
	Python
	
	Java Script
	
	Java
	 
	Scala
	
	
	 10.
	Ref.: 6082362
	Pontos: 1,00  / 1,00
	
	O MapReduce é uma técnica de computação distribuída considerada extremamente eficiente para o processamento de dados, desempenhando papel fundamental no Spark. Em relação ao MapReduce, selecione a opção correta.
		
	
	A principal característica do MapReduce é a utilização eficiente da memória.
	
	Projetos de big data só podem ser tratados por MapReduce.
	
	As fases de processamento do MapReduce podem variar de acordo com a aplicação.
	 
	Pode ser aplicada para projetos que envolvam grandes volumes e variedade de dados.
	
	Só é possível utilizar o MapReduce no Spark através do PySpark.

Outros materiais