Buscar

TÓPICOS DE BIG DATA EM PYTHON AV

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1a
          Questão
	Acerto: 1,0  / 1,0
	
	Selecione a opção em que a computação se refere à execução de aplicações e serviços em uma rede distribuída usando recursos virtualizados.
		
	
	Computação Paralela
	
	Computação centralizada
	 
	Computação em Nuvem
	
	Computação de banco de dados
	
	Computação de Big Data
	Respondido em 08/04/2022 01:30:12
	
	Explicação:
As aplicações de computação em nuvem são acessadas por protocolos de Internet e padrões de rede. As demais opções estão erradas, pois nenhuma delas trabalha obrigatoriamente com protocolos de internet.
	
		2a
          Questão
	Acerto: 1,0  / 1,0
	
	Selecione a opção em que a camada fornece comunicação ponta a ponta nas aplicações de internet das coisas.
		
	
	Camada de aplicação
	
	Camada de enlace de dados
	 
	Camada de transporte
	
	Camada lógica
	
	Camada de sessão
	Respondido em 08/04/2022 01:29:47
	
	Explicação:
A camada de transporte é encarregada pela comunicação ponta a ponta entre as aplicações e oferece confiabilidade, além de garantir que os pacotes serão entregues da mesma forma que o usuário os enviou. Em relação às outras opções, a camada lógica simplesmente não existe. Já a camada de enlace de dados detecta erros e, quando necessário, os corrige. A camada de sessão trata dos processos responsáveis pela transferência de dados. Por fim, a camada de aplicação é responsável pela comunicação fim-a-fim entre processos.
	
		3a
          Questão
	Acerto: 1,0  / 1,0
	
	A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
		
	
	Replicação
	
	YARN
	 
	DataNode
	
	NameNode
	
	Bloco de dados
	Respondido em 08/04/2022 01:36:39
	
	Explicação:
O DataNode é componente da arquitetura do HDFS responsável pelo armazenamento dos dados na forma de blocos de dados.
	
		4a
          Questão
	Acerto: 1,0  / 1,0
	
	Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele.
		
	
	apenas estruturado
	
	apenas não estruturado
	
	estruturado e semiestruturado
	 
	estruturado, não estruturado e semiestruturado
	
	apenas tabelas relacionais
	Respondido em 08/04/2022 01:37:22
	
	Explicação:
O Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados que correspondem a característica de variedade dos dados que é bem típica de aplicações de Big Data.
	
		5a
          Questão
	Acerto: 1,0  / 1,0
	
	O MapReduce é uma técnica clássica de programação e é bastante utilizada por diversos frameworks como o Spark, por exemplo. Em relação à técnica MapReduce, selecione a opção correta.
		
	 
	É uma técnica de computação distribuída
	
	Só pode ser aplicada para grandes volumes de dados
	
	Foi substituída no Spark por acesso direto à memória
	
	Consiste em uma técnica de programação sequencial
	
	É uma técnica lenta para processamento de grandes volumes de dados
	Respondido em 08/04/2022 01:32:12
	
	Explicação:
Gabarito: É uma técnica de computação distribuída
Justificativa: O MapReduce é uma técnica de computação distribuída que apesar de clássica ainda é considerada muito eficiente para processamento de grandes volumes de dados. Apesar de ser adequada para projetos de big data, ela também pode ser utilizada para menores volumes, mas não é apropriada para esses casos.
	
		6a
          Questão
	Acerto: 0,0  / 1,0
	
	Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com finalidades específicas. Nesse sentido, selecione a opção que contém o componente responsável por estabelecer uma conexão com o Cluster.
		
	
	DataFrame
	
	SparkSession
	 
	SparkContext
	
	Spark.Catalog
	 
	RDD
	Respondido em 08/04/2022 01:46:43
	
	Explicação:
Gabarito: SparkContext
Justificativa: O componente responsável por estabelecer uma conexão com o cluster é o SparkContext e pode ser usado para criar RDDs, acumuladores e variáveis de transmissão nesse cluster. O SparkSession, por sua vez, é um ponto de entrada para que o Spark possa trabalhar com RDD, DataFrame e Dataset. O Spark.Catalog é uma interface para gerenciar um catálogo de metadados de entidades relacionais.
	
		7a
          Questão
	Acerto: 0,0  / 1,0
	
	Eduardo quer mostrar aos gestores da empresa como as ações da carteira de investimentos recomendada que ele e o time dele propuseram estão valorizando e gerando muitos dividendos aos clientes. Para isso, Eduardo construiu um gráfico de ______, pois está lidando com dados ________ e quer mostrar o quão bem as recomendações geradas por seu time estão evoluindo.
Respectivamente a resposta que completa as duas lacunas é:
		
	
	Linha; Categóricos
	 
	Pizza; Numéricos
	
	Linha; Numéricos
	
	Pizza; Categóricos
	 
	Linha; Temporais
	Respondido em 08/04/2022 02:01:29
	
	Explicação:
O gráfico correto é o de linhas, pois os dados são temporais, uma vez que Eduardo quer mostrar cronologia para os acionistas e o gráfico de linha representa muito bem isto, e os dados em questão variam ao longo de meses ou anos. Gráficos de pizza não se aplicam a dados temporais. Os dados não são simplesmente numéricos pois, em essência, estamos lidando com a cronologia, logo são dados temporais. O tipo de dados em que números variam no tempo não pode ser classificado como tipo categórico.
	
		8a
          Questão
	Acerto: 1,0  / 1,0
	
	A visualização dos dados é fundamental no processo de análise, interpretação e obtenção de conhecimento. Dentre as visualizações mais adequadas para dados numéricos estão:
I - Histograma
II - Gráfico de Dispersão
III - Gráfico de Pizza
Analise as alternativas listadas e assinale a correta.
		
	
	Apenas III
	
	Apenas I e III
	 
	Apenas I e II
	
	Apenas II e III
	
	As alternativas I, II e III
	Respondido em 08/04/2022 02:05:46
	
	Explicação:
Os gráficos de histograma e de dispersão respectivamente expressam a distribuição das variáveis e a sua correlação. A alternativa III está incorreta, pois o gráfico de pizza é para dados categóricos, quando queremos mostrar proporção e valores distintos de categorias possíveis.
	
		9a
          Questão
	Acerto: 1,0  / 1,0
	
	Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando?
		
	
	IA Biológica
	
	IA Pura
	
	IA Simbólica
	
	IA Quântica
	 
	IA SubSimbólica
	Respondido em 08/04/2022 02:37:20
	
	Explicação:
As redes neurais são modelos conexionistas ou subsimbólicas, pois encontram conhecimento nos dados a partir de inferências estatísticas sem requerer regras pré-definidas, sendo essa a sua maior diferença dos modelos simbólicos, e sua vantagem sobre aqueles é a capacidade de atingir melhores predições por exatidão.
	
		10a
          Questão
	Acerto: 1,0  / 1,0
	
	Qual o objetivo da inteligência artificial ao simular comportamentos humanos na máquina?
		
	
	Fazer com que computadores acessem a internet mais rápido.
	
	Incrementar o uso da memória de longa duração do sistema.
	
	Viabilizar a computação paralela.
	
	Melhorar a capacidade de processamento de dados do sistema.
	 
	Otimizar algoritmos para que eles se adaptem a contextos não previamente codificados.

Continue navegando