Buscar

AVS - TÓPICOS DE BIG DATA EM PYTHON

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disciplina: TÓPICOS DE BIG DATA EM PYTHON 
	AVS
	Aluno: 
	
	Professor:  
 
	Turma: 
	
	 27/11/2022 20:42:00 (F) 
			Avaliação:
8,0
	Av. Parcial.:
2,0
	Nota SIA:
10,0 pts
	 
		
	02260 - ANÁLISE DE DADOS EM PYTHON COM PANDAS
	 
	 
	 1.
	Ref.: 6076913
	Pontos: 1,00  / 1,00
	
	A coleta e preparação dos dados para análise no Python são de extrema importância. Os dados secundários são assim definidos devido:
		
	
	A sua baixa qualidade.
	
	O fato de virem de uma fonte alternativa não convencional.
	 
	O fato de terem sido obtidos a partir de terceiros.
	
	O fato de requererem muito mais pré-processamento.
	
	O fato de ocuparem menos espaço de memória.
	
	
	 2.
	Ref.: 6076764
	Pontos: 0,00  / 1,00
	
	A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que:
I - O nome Pandas se refere a dados em painel ou panel data
II - O DataFrame é o coletivo de listas (lists)
III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta.
		
	
	Apenas II e III.
	
	Apenas II.
	 
	Apenas I e II.
	
	Apenas I.
	 
	Apenas I e III.
	
	
	 
		
	02318 - BIG DATA ANALYTICS
	 
	 
	 3.
	Ref.: 6075829
	Pontos: 0,00  / 1,00
	
	Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando?
		
	 
	IA SubSimbólica
	 
	IA Simbólica
	
	IA Pura
	
	IA Biológica
	
	IA Quântica
	
	
	 4.
	Ref.: 6075831
	Pontos: 1,00  / 1,00
	
	Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?
		
	
	KDD-DM.
	
	KDM.
	
	SIGM.
	 
	CRISP-DM.
	
	SIGKDD.
	
	
	 
		
	02508 - HADOOP E ARMAZENAMENTO DE DADOS
	 
	 
	 5.
	Ref.: 6075862
	Pontos: 1,00  / 1,00
	
	Em relação aos arquivos de configuração do Hadoop, selecione a opção correta que contém o arquivo que trata das configurações do HDFS.
		
	 
	hdfs-site.xml
	
	mapred-site.xml
	
	hadoop-env.cmd
	
	yarn-site.xml
	
	core-site.xml
	
	
	 6.
	Ref.: 6076140
	Pontos: 1,00  / 1,00
	
	Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela geração de fragmento para os componentes da fase de redução.
		
	
	Leitor de registros.
	 
	Particionador.
	
	Redutor.
	
	Mapeador.
	
	Combinador.
	
	
	 
		
	02727 - PRINCÍPIOS DE BIG DATA
	 
	 
	 7.
	Ref.: 6067388
	Pontos: 1,00  / 1,00
	
	Em relação às aplicações de Internet das coisas, selecione a opção correta sobre os seus objetivos.
		
	
	Melhorar a interatividade com o usuário
	
	Ampliar o volume de dados da aplicação
	 
	Obter dados que sirvam como base na tomada de decisão
	
	Aumentar a diversidade dos dados
	
	Aumentar a complexidade do processo de gestão dos dados
	
	
	 8.
	Ref.: 6067203
	Pontos: 1,00  / 1,00
	
	Selecione a opção correta sobre o uso de Big Data.
		
	
	Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras.
	
	É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas.
	 
	O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado.
	
	Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados.
	
	Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados.
	
	
	 
		
	02729 - PRINCIPIOS DE DESENVOLVIMENTO DE SPARK COM PYTHON
	 
	 
	 9.
	Ref.: 6082368
	Pontos: 1,00  / 1,00
	
	O Apache Spark é um framework de código aberto aplicado para projetos de Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como ações no Spark.
		
	
	collect, flatMap e sample.
	
	reduce, map e filter.
	
	take, filter e sample.
	 
	first, take e reduce.
	
	count, collect e map.
	
	
	 10.
	Ref.: 6076005
	Pontos: 1,00  / 1,00
	
	As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em grafos.
		
	
	RDDs
	 
	GraphX
	
	Spark Streaming
	
	Spark Core
	
	MLlib

Continue navegando