Prévia do material em texto
1️⃣ Sobre análise de dados, assinale a alternativa correta: A) Refere-se apenas à criação de gráficos. B) É o processo de coleta, tratamento e interpretação de dados para apoiar decisões. C) É sinônimo de programação. D) Só pode ser realizada com Big Data. E) Não envolve estatística. 2️⃣ As etapas clássicas de um processo de análise de dados incluem: A) Coleta, limpeza, transformação, análise e interpretação. B) Apenas coleta e visualização. C) Coleta e armazenamento apenas. D) Programação e deploy. E) Mineração e blockchain. 3️⃣ Em estatística descritiva, são medidas de tendência central: A) Variância e desvio padrão B) Média, mediana e moda C) Correlação e regressão D) Intervalo e amplitude E) Covariância e erro padrão 4️⃣ O desvio padrão mede: A) A média dos dados B) A dispersão dos dados em relação à média C) A moda dos dados D) A probabilidade condicional E) O valor máximo da amostra 5️⃣ Em análise exploratória de dados (EDA), o principal objetivo é: A) Criar modelos preditivos complexos B) Explorar padrões, inconsistências e características dos dados C) Implementar redes neurais D) Substituir a etapa de limpeza E) Eliminar todos os outliers automaticamente 6️⃣ O processo de ETL significa: A) Extract, Transform, Load B) Execute, Transfer, Log C) Evaluate, Train, Learn D) Extract, Test, Learn E) Export, Transform, Link 7️⃣ Em bancos de dados relacionais, a linguagem padrão para consulta é: A) Python B) R C) SQL D) Java E) Scala 8️⃣ Qual das alternativas caracteriza Big Data? A) Dados pequenos e estruturados B) Apenas dados financeiros C) Grandes volumes de dados com alta velocidade e variedade D) Apenas dados não estruturados E) Apenas dados armazenados em planilhas 9️⃣ No contexto de Big Data, os "3 Vs" são: A) Volume, Velocidade e Variedade B) Valor, Validação e Vetor C) Volume, Verificação e Visualização D) Velocidade, Vetorização e Virtualização E) Valor, Versão e Visual 🔟 Em aprendizado de máquina supervisionado, o modelo aprende: A) Sem dados B) A partir de dados rotulados C) Apenas por tentativa e erro sem base D) Sem variável alvo E) Apenas com dados não estruturados 1️⃣1️⃣ No ecossistema do Apache Spark, o módulo voltado para aprendizado de máquina é: A) Spark SQL B) Spark Streaming C) MLlib D) GraphX E) Hive 1️⃣2️⃣ O Hadoop é conhecido principalmente por: A) Visualização de dados B) Processamento distribuído e armazenamento em larga escala C) Criação de dashboards D) Desenvolvimento mobile E) Modelagem estatística avançada 1️⃣3️⃣ Em visualização de dados, o principal objetivo é: A) Substituir análises estatísticas B) Apresentar dados de forma clara e compreensível C) Aumentar o volume de dados D) Eliminar variáveis E) Evitar interpretação humana 1️⃣4️⃣ Correlação entre duas variáveis indica: A) Relação de causalidade obrigatória B) Relação estatística entre variáveis C) Igualdade entre variáveis D) Independência total E) Erro de medição 1️⃣5️⃣ Um outlier é: A) Um dado que representa a média B) Um dado inconsistente com a distribuição geral C) Um dado categórico D) Um dado duplicado E) Um dado nulo ✅ GABARITO 1️⃣ B 2️⃣ A 3️⃣ B 4️⃣ B 5️⃣ B 6️⃣ A 7️⃣ C 8️⃣ C 9️⃣ A 🔟 B 1️⃣1️⃣ C 1️⃣2️⃣ B 1️⃣3️⃣ B 1️⃣4️⃣ B 1️⃣5️⃣ B