Prévia do material em texto
1. O que é Big Data? a) Dados que não podem ser armazenados em um banco de dados tradicional. b) Um conjunto de dados que é maior que 1 terabyte. c) Dados que são coletados em tempo real e possuem alta variação. d) Um conjunto de dados tão grande e complexo que exige ferramentas específicas para processamento e análise. Resposta correta: d) Um conjunto de dados tão grande e complexo que exige ferramentas específicas para processamento e análise. Explicação: Big Data refere-se a conjuntos de dados que são grandes, complexos e variados, e que não podem ser gerenciados ou analisados usando ferramentas tradicionais de processamento de dados. 2. Quais são as "3 Vs" que caracterizam o Big Data? a) Volume, Variedade e Veracidade. b) Velocidade, Valor e Volume. c) Volume, Velocidade e Variedade. d) Veracidade, Valor e Variação. Resposta correta: c) Volume, Velocidade e Variedade. Explicação: Os 3 Vs do Big Data são Volume (grande quantidade de dados), Velocidade (rápida geração e processamento de dados), e Variedade (diversidade de formatos e fontes de dados). 3. Qual das seguintes opções é uma característica importante do Big Data? a) Dados organizados em tabelas relacionais. b) Dados que podem ser processados em tempo real. c) Dados que devem ser sempre coletados manualmente. d) Dados que precisam ser processados por bancos de dados relacionais tradicionais. Resposta correta: b) Dados que podem ser processados em tempo real. Explicação: O Big Data frequentemente exige que os dados sejam processados em tempo real ou quase em tempo real para extrair informações valiosas rapidamente. 4. Qual é a principal função do Hadoop no contexto de Big Data? a) Armazenamento de dados em tempo real. b) Criação de gráficos e visualizações interativas. c) Processamento distribuído de grandes volumes de dados. d) Criação de modelos de aprendizado de máquina. Resposta correta: c) Processamento distribuído de grandes volumes de dados. Explicação: O Hadoop é uma plataforma que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores, tornando o Big Data mais acessível e gerenciável. 5. Qual é a principal diferença entre dados estruturados e não estruturados no Big Data? a) Dados estruturados podem ser armazenados em bancos de dados relacionais, enquanto dados não estruturados não podem. b) Dados estruturados são mais difíceis de processar do que dados não estruturados. c) Dados estruturados são dados organizados em tabelas, enquanto dados não estruturados não têm uma estrutura predefinida. d) Dados estruturados são mais volumosos do que dados não estruturados. Resposta correta: c) Dados estruturados são dados organizados em tabelas, enquanto dados não estruturados não têm uma estrutura predefinida. Explicação: Dados estruturados têm uma organização rígida (como tabelas de banco de dados), enquanto dados não estruturados, como texto livre ou imagens, não seguem um formato predefinido e são mais difíceis de organizar e processar. 6. O que é "Data Lake" em Big Data? a) Um banco de dados específico para armazenar dados analíticos. b) Uma técnica para otimizar consultas em Big Data. c) Um repositório centralizado para armazenar grandes volumes de dados em seu formato bruto. d) Uma ferramenta para visualização de Big Data. Resposta correta: c) Um repositório centralizado para armazenar grandes volumes de dados em seu formato bruto. Explicação: Data Lakes são repositórios de dados onde dados brutos, estruturados ou não estruturados, são armazenados em seu formato original até que possam ser analisados. 7. Qual é o papel da "mineração de dados" no Big Data? a) Armazenar dados de maneira eficiente. b) Extrair padrões e conhecimento útil a partir de grandes volumes de dados. c) Criar relatórios de dados em tempo real. d) Melhorar a segurança dos dados. Resposta correta: b) Extrair padrões e conhecimento útil a partir de grandes volumes de dados. Explicação: Mineração de dados é o processo de analisar grandes conjuntos de dados em busca de padrões, tendências e informações que podem ser usadas para tomar decisões informadas. 8. O que é "NoSQL" no contexto de Big Data? a) Um tipo de banco de dados relacional. b) Um tipo de banco de dados orientado a objetos. c) Bancos de dados não relacionais, projetados para grandes volumes de dados. d) Um protocolo de segurança para proteger dados. Resposta correta: c) Bancos de dados não relacionais, projetados para grandes volumes de dados. Explicação: Bancos de dados NoSQL são usados para armazenar e processar grandes volumes de dados não estruturados, sendo mais flexíveis e escaláveis do que bancos de dados relacionais tradicionais. 9. Qual é a diferença entre "batch processing" e "stream processing" no Big Data? a) "Batch processing" processa dados em tempo real, enquanto "stream processing" processa dados em lotes. b) "Batch processing" processa grandes volumes de dados em lotes, enquanto "stream processing" processa dados em tempo real. c) "Batch processing" é mais eficiente do que "stream processing". d) "Batch processing" é usado apenas para dados não estruturados. Resposta correta: b) "Batch processing" processa grandes volumes de dados em lotes, enquanto "stream processing" processa dados em tempo real. Explicação: O "batch processing" envolve o processamento de grandes volumes de dados em intervalos específicos, enquanto o "stream processing" lida com o processamento de dados em tempo real à medida que são gerados. 10. Qual ferramenta é comumente usada para análise de Big Data com base em aprendizado de máquina? a) SQL b) Apache Spark c) MongoDB d) Excel Resposta correta: b) Apache Spark Explicação: Apache Spark é uma ferramenta de processamento de dados em grande escala que oferece suporte a processamento em tempo real e aprendizado de máquina, sendo frequentemente usada em análises de Big Data.