Buscar

TÓPICOS DE BIG DATA EM PYTHON AV2


Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Continue navegando


Prévia do material em texto

Disc.: TÓPICOS DE BIG DATA EM PYTHON   
	
	
	Acertos: 10,0 de 10,0
	02/05/2022
		1a
          Questão
	Acerto: 1,0  / 1,0
	
	Selecione a opção correta com a medida de volume de dados que normalmente é usada para se referenciar a projetos de Big Data.
		
	
	Zetabytes
	
	Gigabytes
	 
	Petabytes
	
	Terabytes
	
	Exabytes
	Respondido em 02/05/2022 13:18:46
	
	Explicação:
As aplicações que possuem ordem de grandeza de petabytes de volume de dados são consideradas de Big Data. As alternativas da questão podem ser vistas em ordem crescente de grandeza das unidades de medida de armazenamento: Gigabytes, Terabytes, Petabytes, Exabytes e Zetabytes.
	
		2a
          Questão
	Acerto: 1,0  / 1,0
	
	Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de transações bancárias.
		
	
	dados semiestruturados
	
	dados não estruturados
	
	dados de Big Data
	 
	dados estruturados
	
	dados de Internet das Coisas
	Respondido em 02/05/2022 13:19:05
	
	Explicação:
Os dados de transações bancárias são salvos em tabelas e, portanto, correspondem a dados estruturados, que são típicos de sistemas de transações on line armazenados em banco de dados. As demais alternativas tratam de dados não convencionais que não são armazenados em bancos de dados tradicionais.
	
		3a
          Questão
	Acerto: 1,0  / 1,0
	
	Em relação aos arquivos de configuração do Hadoop, selecione a opção correta que contém o arquivo que trata das configurações do HDFS.
		
	
	core-site.xml
	
	hadoop-env.cmd
	 
	hdfs-site.xml
	
	yarn-site.xml
	
	mapred-site.xml
	Respondido em 02/05/2022 13:20:12
	
	Explicação:
O arquivo de configuração hdfs-site.xml é o responsável pela definição de configuração para processos do HDFS. Ele também é responsável por fazer a especificação da replicação de bloco padrão e verificação de permissão no HDFS.
	
		4a
          Questão
	Acerto: 1,0  / 1,0
	
	Em relação as fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.
		
	
	Agrupamento
	
	Combinação
	 
	Embaralhamento
	
	Redução
	
	Gravação da saída
	Respondido em 02/05/2022 13:21:44
	
	Explicação:
Através do processo de embaralhamento, também conhecido pelo termo em inglês "shuffling", o mecanismo MapReduce faz a geração de pares intermediários de valor e chave que são transferidos para a fase de redução, o que é realizado em paralelo com outras tarefas da fase de mapeamento.
	
		5a
          Questão
	Acerto: 1,0  / 1,0
	
	Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com finalidades específicas. Selecione a opção que contém o componente do ecossistema do Spark especializado em aplicações de aprendizado de máquina.
		
	
	RDDs
	
	MLSpark
	 
	MLlib
	
	GraphX Learning
	
	Spark Learning
	Respondido em 02/05/2022 13:22:30
	
	Explicação:
Gabarito: MLlib
Justificativa: O componente MLlib é o componente do ecossistema do Spark usado para implementar algoritmos estatísticos e de aprendizado de máquina para simplificar pipelines de aprendizado de máquina em projetos de big data. As opções Spark Learning, GraphX Learning e MLSpark não são componentes válidos do Spark. Os RDDs são componentes para conjunto de dados resilientes.
	
		6a
          Questão
	Acerto: 1,0  / 1,0
	
	O Spark é uma ferramenta computacional voltada para aplicações de Big Data. Selecione a opção correta a respeito do componente que pode ser tratado com o Spark SQL.
		
	 
	RDD
	
	Work Node
	
	DAG
	
	Executor
	
	Tasks
	Respondido em 02/05/2022 13:22:41
	
	Explicação:
Gabarito: RDD
Justificativa: O componente Spark SQL do ecossistema do Spark fornece suporte à linguagem SQL para manipular RDDs. DAGs correspondem a abstrações sobre as execuções dos processos. O Executor é responsável pela execução de tarefas individuais, enquanto o Work Node corresponde ao conjunto de máquinas que executam as tarefas que são as Tasks, ou seja, subdivisões do processo.
	
		7a
          Questão
	Acerto: 1,0  / 1,0
	
	A visualização dos dados é fundamental no processo de análise e interpretação. Qual o tipo de visualização de dados mais indicada para dados temporais?
		
	 
	Gráfico de Linha.
	
	Gráfico de Barra.
	
	Gráfico de Estrela.
	
	Gráfico de Faces de Chernoff.
	
	Gráfico de Matriz de Dispersão.
	Respondido em 02/05/2022 13:23:19
	
	Explicação:
O gráfico de linhas passa a visualização de cronologia, acompanhando a linha de vida do dado, mostrando através das inclinações ou gradientes, o crescimento ou decrescimento do dado. As demais alternativas indicam tipos de visualização inadequados para dados temporais.
	
		8a
          Questão
	Acerto: 1,0  / 1,0
	
	A linguagem Python se destaca como intuitiva e de fácil aprendizagem. Analise o código abaixo que apresenta laços condicionais e instruções de repetição.
for i in range(10):
    if (i%2==0):
        print(i)
 Qual a saída esperada após a execução do programa?
		
	
	Serão impressos no console os números racionais entre 0 e 9.
	
	Serão impressos no console os números pares entre 1 e 10.
	
	Serão impressos no console os números ímpares entre 0 e 10.
	 
	Serão impressos no console os números pares entre 0 e 9.
	
	Serão impressos no console os números ímpares entre 0 e 9.
	Respondido em 02/05/2022 13:23:48
	
	Explicação:
O constructo de laço que itera sobre uma sequência dos números reais de 0 a 9, e cujo condicional dentro do laço escolhe apenas os números cujo resto de sua divisão por 2 seja 0, condição lógica que define se um número é par ou não.
	
		9a
          Questão
	Acerto: 1,0  / 1,0
	
	As técnicas de aprendizado de máquina para aprendizado supervisionado são:
 
I - Classificação
II - Agrupamento
III - Regressão
		
	
	Apenas I
	
	Apenas I e II
	 
	Apenas I e III
	
	Apenas II e III
	
	Apenas II
	Respondido em 02/05/2022 13:20:43
	
	Explicação:
O aprendizado supervisionado contempla duas técnicas que são a de classificação, em que o modelo tenta aprender a categorizar observações, e a regressão, que tenta aferir um valor numérico para novos registros, baseado no registro histórico e suas características.
	
		10a
          Questão
	Acerto: 1,0  / 1,0
	
	Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando?
		
	
	IA Pura
	
	IA Biológica
	
	IA Quântica
	 
	IA SubSimbólica
	
	IA Simbólica
	Respondido em 02/05/2022 13:24:44
	
	Explicação:
As redes neurais são modelos conexionistas ou subsimbólicas, pois encontram conhecimento nos dados a partir de inferências estatísticas sem requerer regras pré-definidas, sendo essa a sua maior diferença dos modelos simbólicos, e sua vantagem sobre aqueles é a capacidade de atingir melhores predições por exatidão.