Buscar

TÓPICOS DE BIG DATA EM PYTHON 5 acertos

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disc.: TÓPICOS DE BIG DATA EM PYTHON   
	
	
	Acertos: 5,0 de 10,0
	30/03/2022
		1a
          Questão
	Acerto: 0,0  / 1,0
	
	Em relação aos V's que caracterizam os projetos de Big Data, selecione a opção que trata do processamento dos dados.
		
	 
	variedade
	
	volume
	
	valor
	
	veracidade
	 
	velocidade
	Respondido em 30/03/2022 16:01:55
	
	Explicação:
A característica velocidade trata da rapidez de geração e processamento dos dados. Variedade diz respeito ao formato dos dados, valor está relacionado ao resultado útil da análise dos dados, volume significa a quantidade de dados disponíveis para tratamento e a veracidade diz respeito à confiabilidade da origem dos dados.
	
		2a
          Questão
	Acerto: 0,0  / 1,0
	
	Em relação às plataformas para Internet das Coisas, selecione a opção correta sobre o Arduino.
		
	
	É um protocolo de internet das coisas
	
	É um programa
	 
	É uma placa de hardware
	 
	É um ecossistema que envolve software e hardware
	
	É o outro nome para Raspberry PI
	Respondido em 30/03/2022 16:30:55
	
	Explicação:
O arduino é uma tecnologia que combina hardware e software e é utilizada para internet das coisas. Portanto, não é um programa, nem uma placa de hardware e tão pouco um protocolo de comunicação. Já o Raspberry PI não é o mesmo que Arduino, pois se trata de uma outra tecnologia para internet das coisas.
	
		3a
          Questão
	Acerto: 1,0  / 1,0
	
	Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação. Selecione a opção correta a respeito do Data Lake.
		
	
	São exclusivos da distribuição Hadoop Apache.
	
	Possui alta latência para acesso dos dados.
	 
	Armazenam os dados de modo eficiente.
	
	Aplicam processos de tratamento nos dados.
	
	Demandam por equipamentos especiais.
	Respondido em 30/03/2022 16:06:29
	
	Explicação:
O Data Lake utiliza um método muito eficiente para fazer o armazenamento dos dados. Dessa forma ele possui baixa latência para acessar os dados. Além disso, o Data Lake não demanda por equipamentos especiais e não é de uso exclusivo da distribuição Hadoop Apache.
	
		4a
          Questão
	Acerto: 1,0  / 1,0
	
	Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação. Selecione a opção correta que define resumidamente o que é o Data Lake.
		
	
	É uma tecnologia de armazenamento e processamento de dados.
	
	Trata-se de um componente do HDFS responsável pela implementação do mecanismo MapReduce para fazer o gerenciamento dos dados.
	
	É um repositório para tratamento dos dados.
	
	É um ambiente para tratamento e armazenamento apenas de dados relacionais.
	 
	É um repositório centralizado para armazenamento de dados.
	Respondido em 30/03/2022 16:08:52
	
	Explicação:
O Data Lake é um repositório centralizado capaz de armazenar dados nos diversos formatos: estruturados, não estruturados e semiestruturados sem a necessidade de aplicar nenhum tratamento.
	
		5a
          Questão
	Acerto: 1,0  / 1,0
	
	O PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para utilização do PySpark.
		
	
	Python e Escala
	 
	Java e Python
	
	Casandra e Spark
	
	Java e R
	
	Hadoop e Spark
	Respondido em 30/03/2022 16:09:35
	
	Explicação:
Gabarito: Java e Python
Justificativa: A utilização do PySpark depende principalmente de três pré-requisitos: instalação e configuração do Java, Python e do Spark. Além disso, é necessário tratar detalhes da plataforma sobre a qual o Spark vai rodar. No caso do Google Colab, é necessário instalar o FindSpark e o próprio PySpark também.
	
		6a
          Questão
	Acerto: 0,0  / 1,0
	
	Observe o trecho de código abaixo
query = "SELECT * FROM tabela_teste WHERE valor = "+str(str_valor)
registros = spark.sql(query)
Selecione a opção correta a respeito dele.
		
	 
	A execução do trecho de código vai funcionar corretamente.
	 
	Trata-se de um exemplo de utilização do Spark SQL
	
	A implementação do trecho de código está errada.
	
	É um exemplo de aplicação de GraphX.
	
	É possível afirmar que a tabela_teste existe.
	Respondido em 30/03/2022 16:33:23
	
	Explicação:
Gabarito: Trata-se de um exemplo de utilização do Spark SQL
Justificativa: O trecho de código corresponde a uma aplicação do Spark SQL. Esse componente viabiliza a utilização de código SQL que facilita bastante a manipulação de dados estruturados. A implementação está codificada corretamente, apesar de não ser possível afirmar se vai executar sem erros, pois no código não aparecem informações que permitam fazer afirmações sobre a execução.
	
		7a
          Questão
	Acerto: 0,0  / 1,0
	
	A linguagem Python fornece para o cientista de dados uma grande variedade de funções e bibliotecas. Qual o método que faz a projeção do Dataframe orientado pelos rótulos das colunas do conjunto?
		
	
	iloc
	
	shuffle
	
	reset_index
	 
	loc
	 
	sum
	Respondido em 30/03/2022 16:17:56
	
	Explicação:
Através do método loc, passando o nome da coluna ou colunas desejadas entre colchetes, é aplicada a operação de projeção do DataFrame, de acordo com o objetivo desejado. As demais alternativas não dizem respeito à projeção do DataFrame.
	
		8a
          Questão
	Acerto: 1,0  / 1,0
	
	No mundo de Big Data, temos dados os mais variados possíveis, e sua classificação é fundamental para um cientista de dados. As notas que compõem o histórico escolar de um aluno são classificadas como  que tipo de dados?
		
	
	Temporais
	
	Numéricos
	
	Semi-Estruturados
	
	Atemporais
	 
	Categóricos
	Respondido em 30/03/2022 16:19:37
	
	Explicação:
O correto é classificar como dados categóricos, pois a nota de um aluno mesmo que possa ser operada por funções de soma, média etc., representa um conceito ou extrato/proporção de aprendizado de um aluno, um 8 muitas das vezes significa que o aluno aprendeu 80% da matéria por exemplo, ou implica na condição de apto, ou reprovado. O tipo numérico seria correto se não tivesse o contexto implícito de categoria, por isso devemos ter cuidado ao modelarmos nossos dados.
	
		9a
          Questão
	Acerto: 1,0  / 1,0
	
	Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?
		
	
	SIGM.
	
	KDD-DM.
	
	KDM.
	 
	CRISP-DM.
	
	SIGKDD.
	Respondido em 30/03/2022 16:20:10
	
	Explicação:
O processo de tamanho similar ao KDD cujo âmbito industrial se beneficia mais devido à suas etapas de entendimento do negócio é o CRISP-DM, processo esse que, diferentemente do KDD, contempla a entrega do artefato de aprendizado de máquina.
	
		10a
          Questão
	Acerto: 0,0  / 1,0
	
	Alfredo começou em um laboratório de pesquisa e inovação no começo deste ano. Este laboratório investiga a relação entre trocas de mensagens em redes sociais e variações na bolsa de valores, dependendo principalmente de modelos de redes neurais recorrentes. Com qual tipo de IA Alfredo está lidando?
		
	 
	IA Pura
	
	IA Biológica
	
	IA Simbólica
	
	IA Quântica
	 
	IA SubSimbólica
	Respondido em 30/03/2022 16:22:55
	
	Explicação:
As redes neurais são modelos conexionistas ou subsimbólicas, pois encontram conhecimento nos dados a partir de inferências estatísticas sem requerer regras pré-definidas, sendo essa a sua maior diferença dos modelos simbólicos, e sua vantagem sobre aqueles é a capacidade de atingir melhores predições por exatidão.

Continue navegando