Logo Passei Direto
Buscar

AVS1 - BIG DATA

User badge image
Rubens Saito

em

Ferramentas de estudo

Questões resolvidas

Um dos desdobramentos de Big Data é a Big Data Analytics, que se refere aos softwares capazes de tratar dados para transformá-los em informações úteis às organizações.
Big Data Analytics difere de Business Intelligence por
Analisar dúvidas já conhecidas para as quais se deseje obter resposta
Analisar o que já existe, definindo as melhores hipóteses
Dar enfoque à coleta, à transformação e à disponibilização dos dados
Analisar o que já existe e o que está por vir, apontando novos caminhos
Priorizar o ambiente de negócios em detrimento de outras áreas

Um dos principais tipos de sistemas gerenciadores de banco de dados são os bancos de dados relacionais.
Assinale a alternativa que apresenta a forma que todos os dados de um banco de dados relacional são armazenados.
Arquivos
Tabelas
Memória
Fitas
Discos

Big Data requer clusters de servidores de apoio às ferramentas que processam grandes volumes, alta velocidade e formatos variados de Big Data.
Nesse sentido, é correto afirmar que Hadoop refere-se a
Um sistema de armazenamento e processamento de dados massivamente escalável - não é um banco de dados
Um banco de dados com capacidade melhorada
Uma estratégia baseada em tecnologia que permite a coleta de insights mais profundos e relevantes dos clientes, parceiros e sobre o negócio
Um banco de dados com tecnologia de virtualização
Um equipamento de hardware que permite que sistemas administrem crescentes cargas de processamento

Com relação a análise de dados marque a alternativa INCORRETA.
Após a captura, armazenamento e processamento dos dados, iniciamos a fase de análise. Nessa fase temos inúmeras possibilidades de converter dados brutos em conhecimento.
O objetivo das atividades preditivas é construir um modelo para prever as propriedades e/ou tendências de um conjunto de dados desconhecido.
As ferramentas de análise de dados disponíveis atualmente facilitam a construção de inúmeros algoritmos utilizando uma diversidade de dados. Os excelentes resultados nas análises geralmente vêm de dados brutos sem nenhum tipo de tratamento.
A detecção de anomalias nos ajuda a perceber a existência de valores extremos que influenciarão alguns métodos baseados em estatística, mesmo em casos em que as anomalias correspondam a dados válidos.
O foco principal das tarefas da categoria descritiva é caracterizar e apresentar as propriedades de um conjunto de dados de maneira concisa e informativa.

Visualização de dados é importante para comunicar a mensagem de forma rápida e eficiente.
Marque a opção que representa o tipo de visualização que tem como objetivo representar a frequência de ocorrência de cada palavra existente em uma base de dados textual.
Rain of words
Word cloud
Barra
Jogo de palavras
Linha

Assinale a opção correta sobre MapReduce, de acordo com Hurwitz (2015)
No contexto de Big Data, a técnica MapReduce não é utilizada por ser pouco eficiente quando o volume de dados é muito alto.
Apesar da utilização da técnica MapReduce para tratar grandes volumes de dados no contexto de Big Data, não é recomendável a sua utilização em uma arquitetura distribuída, virtualizada ou multiprocessada.
MapReduce é uma estrutura de software que permite que desenvolvedores escrevam programas que possam processar quantidades massivas de dados desestruturados em paralelo, por meio de um grupo distribuído de processadores.
A técnica MapReduce é utilizada pelos SGBD para a criação de gatilhos nas tabelas no banco de dados relacionais.
No MapReduce, a função Map coloca um valor inicial em uma variável acumuladora e, então, processa cada elemento de uma lista passada pela função Reduce e, ao final, retorna um resultado do acumulador.

Imagine uma situação hipotética onde uma Analista de Tecnologia da Informação foi solicitada para configurar um Servidor de Arquivos implementando técnicas RAID (Redundant Array of Inexpensive Disks). Para realizar a configuração do RAID, essa Analista pretende utilizar o Sistema Operacional GNU/Linux Debian pelo fato desse sistema operacional suportar diversos tipos de RAID via software.
Durante o processo de configuração do RAID, ela optou pelo RAID do tipo 0. Qual foi a motivação dessa escolha?
Implementar redundância
Implementar um subsistema JBOD
Replicar o conteúdo do disco principal
Implementar redundância baseada em paridade
Otimizar o desempenho

O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com várias vantagens.
Marque a opção que NÃO representa uma dessas vantagens.
O Spark tem um gerenciador de recursos do cluster próprio responsável por alocar e monitorar os recursos disponíveis no cluster para todas as aplicações
O Spark tem um rico conjunto de bibliotecas para implementar processamentos em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado de máquina
No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, Python ou R
O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, Hive e qualquer outro formato de entrada aceito pelo Hadoop
A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo extremamente rápido, em particular quando o cluster é grande o suficiente para armazenar todos os dados em memória

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Um dos desdobramentos de Big Data é a Big Data Analytics, que se refere aos softwares capazes de tratar dados para transformá-los em informações úteis às organizações.
Big Data Analytics difere de Business Intelligence por
Analisar dúvidas já conhecidas para as quais se deseje obter resposta
Analisar o que já existe, definindo as melhores hipóteses
Dar enfoque à coleta, à transformação e à disponibilização dos dados
Analisar o que já existe e o que está por vir, apontando novos caminhos
Priorizar o ambiente de negócios em detrimento de outras áreas

Um dos principais tipos de sistemas gerenciadores de banco de dados são os bancos de dados relacionais.
Assinale a alternativa que apresenta a forma que todos os dados de um banco de dados relacional são armazenados.
Arquivos
Tabelas
Memória
Fitas
Discos

Big Data requer clusters de servidores de apoio às ferramentas que processam grandes volumes, alta velocidade e formatos variados de Big Data.
Nesse sentido, é correto afirmar que Hadoop refere-se a
Um sistema de armazenamento e processamento de dados massivamente escalável - não é um banco de dados
Um banco de dados com capacidade melhorada
Uma estratégia baseada em tecnologia que permite a coleta de insights mais profundos e relevantes dos clientes, parceiros e sobre o negócio
Um banco de dados com tecnologia de virtualização
Um equipamento de hardware que permite que sistemas administrem crescentes cargas de processamento

Com relação a análise de dados marque a alternativa INCORRETA.
Após a captura, armazenamento e processamento dos dados, iniciamos a fase de análise. Nessa fase temos inúmeras possibilidades de converter dados brutos em conhecimento.
O objetivo das atividades preditivas é construir um modelo para prever as propriedades e/ou tendências de um conjunto de dados desconhecido.
As ferramentas de análise de dados disponíveis atualmente facilitam a construção de inúmeros algoritmos utilizando uma diversidade de dados. Os excelentes resultados nas análises geralmente vêm de dados brutos sem nenhum tipo de tratamento.
A detecção de anomalias nos ajuda a perceber a existência de valores extremos que influenciarão alguns métodos baseados em estatística, mesmo em casos em que as anomalias correspondam a dados válidos.
O foco principal das tarefas da categoria descritiva é caracterizar e apresentar as propriedades de um conjunto de dados de maneira concisa e informativa.

Visualização de dados é importante para comunicar a mensagem de forma rápida e eficiente.
Marque a opção que representa o tipo de visualização que tem como objetivo representar a frequência de ocorrência de cada palavra existente em uma base de dados textual.
Rain of words
Word cloud
Barra
Jogo de palavras
Linha

Assinale a opção correta sobre MapReduce, de acordo com Hurwitz (2015)
No contexto de Big Data, a técnica MapReduce não é utilizada por ser pouco eficiente quando o volume de dados é muito alto.
Apesar da utilização da técnica MapReduce para tratar grandes volumes de dados no contexto de Big Data, não é recomendável a sua utilização em uma arquitetura distribuída, virtualizada ou multiprocessada.
MapReduce é uma estrutura de software que permite que desenvolvedores escrevam programas que possam processar quantidades massivas de dados desestruturados em paralelo, por meio de um grupo distribuído de processadores.
A técnica MapReduce é utilizada pelos SGBD para a criação de gatilhos nas tabelas no banco de dados relacionais.
No MapReduce, a função Map coloca um valor inicial em uma variável acumuladora e, então, processa cada elemento de uma lista passada pela função Reduce e, ao final, retorna um resultado do acumulador.

Imagine uma situação hipotética onde uma Analista de Tecnologia da Informação foi solicitada para configurar um Servidor de Arquivos implementando técnicas RAID (Redundant Array of Inexpensive Disks). Para realizar a configuração do RAID, essa Analista pretende utilizar o Sistema Operacional GNU/Linux Debian pelo fato desse sistema operacional suportar diversos tipos de RAID via software.
Durante o processo de configuração do RAID, ela optou pelo RAID do tipo 0. Qual foi a motivação dessa escolha?
Implementar redundância
Implementar um subsistema JBOD
Replicar o conteúdo do disco principal
Implementar redundância baseada em paridade
Otimizar o desempenho

O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com várias vantagens.
Marque a opção que NÃO representa uma dessas vantagens.
O Spark tem um gerenciador de recursos do cluster próprio responsável por alocar e monitorar os recursos disponíveis no cluster para todas as aplicações
O Spark tem um rico conjunto de bibliotecas para implementar processamentos em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado de máquina
No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, Python ou R
O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, Hive e qualquer outro formato de entrada aceito pelo Hadoop
A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo extremamente rápido, em particular quando o cluster é grande o suficiente para armazenar todos os dados em memória

Prévia do material em texto

Disc.: BIG DATA   
	Aluno(a): NAME
	XPTO
	Acertos: 10,0 de 10,0
	09/09/2021
		1a
          Questão
	Acerto: 1,0  / 1,0
	
	Um dos desdobramentos de big data é o big data analytics, que se refere aos softwares capazes de tratar dados para transformá-los em informações úteis às organizações. O big data analytics difere do business intelligence por
		
	
	Priorizar o ambiente de negócios em detrimento de outras áreas
	
	Analisar dúvidas já conhecidas para as quais se deseje obter resposta
	
	Analisar o que já existe, definindo as melhores hipóteses
	
	Analisar o que já existe e o que está por vir, apontando novos caminhos
	 
	Dar enfoque à coleta, à transformação e à disponibilização dos dados
	Respondido em 09/09/2021 22:48:16
	
		2a
          Questão
	Acerto: 1,0  / 1,0
	
	Um dos desdobramentos de Big Data é a Big Data Analytics, que se refere aos softwares capazes de tratar dados para transformá-los em informações úteis às organizações. Big Data Analytics difere de Business Intelligence por 
		
	
	Analisar dúvidas já conhecidas para as quais se deseje obter resposta
	
	Analisar o que já existe, definindo as melhores hipóteses
	
	Dar enfoque à coleta, à transformação e à disponibilização dos dados
	 
	Analisar o que já existe e o que está por vir, apontando novos caminhos
	
	Priorizar o ambiente de negócios em detrimento de outras áreas
	Respondido em 09/09/2021 22:48:27
	
		3a
          Questão
	Acerto: 1,0  / 1,0
	
	Um dos principais tipos de sistemas gerenciadores de banco de dados são os bancos de dados relacionais. Assinale a alternativa que apresenta a forma que todos os dados de um banco de dados relacional são armazenados.
		
	
	Arquivos
	 
	Tabelas
	
	Memória
	
	Fitas
	
	Discos
	Respondido em 09/09/2021 22:48:32
	
		4a
          Questão
	Acerto: 1,0  / 1,0
	
	Big Data requer clusters de servidores de apoio às ferramentas que processam grandes volumes, alta velocidade e formatos variados de Big Data. Nesse sentido, é correto afirmar que Hadoop refere-se a
		
	
	Um banco de dados com capacidade melhorada
	
	Uma estratégia baseada em tecnologia que permite a coleta de insights mais profundos e relevantes dos clientes, parceiros e sobre o negócio
	 
	Um sistema de armazenamento e processamento de dados massivamente escalável ¿ não é um banco de dados
	
	Um equipamento de hardware que permite que sistemas administrem crescentes cargas de processamento
	
	Um banco de dados com tecnologia de virtualização
	Respondido em 09/09/2021 22:48:38
	
		5a
          Questão
	Acerto: 1,0  / 1,0
	
	Com relação a análise de dados marque a alternativa INCORRETA.
		
	 
	As ferramentas de análise de dados disponíveis atualmente facilitam a construção de inúmeros algoritmos utilizando uma diversidade de dados. Os excelentes resultados nas análises geralmente vêm de dados brutos sem nenhum tipo de tratamento.
	
	O foco principal das tarefas da categoria descritiva é caracterizar e apresentar as propriedades de um conjunto de dados de maneira concisa e informativa.
	
	A detecção de anomalias nos ajuda a perceber a existência de valores extremos que influenciarão alguns métodos baseados em estatística, mesmo em casos em que as anomalias correspondam a dados válidos.
	
	Após a captura, armazenamento e processamento dos dados, iniciamos a fase de análise. Nessa fase temos inúmeras possibilidades de converter dados brutos em conhecimento.
	
	O objetivo das atividades preditivas é construir um modelo para prever as propriedades e/ou tendências de um conjunto de dados desconhecido.
	Respondido em 09/09/2021 22:48:47
	
		6a
          Questão
	Acerto: 1,0  / 1,0
	
	Visualização de dados é importante para comunicar a mensagem de forma rápida e eficiente. Marque a opção que representa o tipo de visualização que tem como objetivo representar a frequência de ocorrência de cada palavra existente em uma base de dados textual.
		
	
	Rain of words
	 
	Word cloud
	
	Barra
	
	Jogo de palavras
	
	Linha
	Respondido em 09/09/2021 22:48:50
	
		7a
          Questão
	Acerto: 1,0  / 1,0
	
	Assinale a opção correta sobre MapReduce, de acordo com Hurwitz (2015)
		
	
	Apesar da utilização da técnica MapReduce para tratar grandes volumes de dados no contexto de Big Data, não é recomendável a sua utilização em uma arquitetura distribuída, virtualizada ou multiprocessada.
	
	No contexto de Big Data, a técnica MapReduce não é utilizada por ser pouco eficiente quando o volume de dados é muito alto.
	 
	MapReduce é uma estrutura de software que permite que desenvolvedores escrevam programas que possam processar quantidades massivas de dados desestruturados em paralelo, por meio de um grupo distribuído de processadores.
	
	A técnica MapReduce é utilizada pelos SGBD para a criação de gatilhos nas tabelas no banco de dados relacionais.
	
	No MapReduce, a função Map coloca um valor inicial em uma variável acumuladora e, então, processa cada elemento de uma lista passada pela função Reduce e, ao final, retorna um resultado do acumulador.
	Respondido em 09/09/2021 22:48:59
	
		8a
          Questão
	Acerto: 1,0  / 1,0
	
	O ecossistema do Hadoop possui um conjunto de ferramentas de alto nível para facilitar a manipulação dos dados em sistemas distribuídos. Marque a opção que apresenta a ferramenta projetada para transferir dados entre o Hadoop e um banco de dados relacional.
		
	
	Hive
	
	Cassandra
	
	Mahout
	
	HBase
	 
	Sqoop
	Respondido em 09/09/2021 22:50:11
	
		9a
          Questão
	Acerto: 1,0  / 1,0
	
	Imagine uma situação hipotética onde uma Analista de Tecnologia da Informação foi solicitada para configurar um Servidor de Arquivos implementando técnicas RAID (Redundant Array of Inexpensive Disks). Para realizar a configuração do RAID, essa Analista pretende utilizar o Sistema Operacional GNU/Linux Debian pelo fato desse sistema operacional suportar diversos tipos de RAID via software. Durante o processo de configuração do RAID, ela optou pelo RAID do tipo 0. Qual foi a motivação dessa escolha?
		
	
	Implementar redundância baseada em paridade
	
	Implementar redundância
	 
	Otimizar o desempenho
	
	Replicar o conteúdo do disco principal
	
	Implementar um subsistema JBOD
	Respondido em 09/09/2021 22:50:18
	
		10a
          Questão
	Acerto: 1,0  / 1,0
	
	O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com várias vantagens. Marque a opção que NÃO representa uma dessas vantagens.
		
	
	A combinação de DAG e RDD ajudam ao Spark realizar o processamento paralelo extremamente rápido, em particular quando o cluster é grande o suficiente para armazenar todos os dados em memória
	
	O Spark tem um rico conjunto de bibliotecas para implementar processamentos em estilo SQL, processamento de streaming, algoritmos de grafos e aprendizado de máquina
	
	O Spark é tem a flexibilidade para processar dados em HDFS, HBase, Cassandra, Hive e qualquer outro formato de entrada aceito pelo Hadoop
	
	No Spark as aplicações têm possibilidade de serem escritas em Java, Scala, Python ou R
	 
	O Spark tem um gerenciador de recursos do cluster próprio responsável por alocar e monitorar os recursos disponíveis no cluster para todas as aplicações
	Respondido em 09/09/2021 22:50:39

Mais conteúdos dessa disciplina