Prévia do material em texto
Análise de dados O que e analise de dados? a) Um processo de coleta de dados sem a necessidade de interpretacao. b) A pratica de examinar, limpar e modelar dados para encontrar informacoes uteis. c) A simples apresentacao de dados em graficos e tabelas. d) Uma tecnica para armazenar dados em bancos de dados. Resposta correta: b) A analise de dados e o processo de examinar, limpar e modelar dados para encontrar informacoes uteis, tirar conclusoes e apoiar a tomada de decisoes. Qual e o primeiro passo em uma analise de dados? a) Definir as ferramentas que serao utilizadas. b) Interpretar os resultados obtidos. c) Coletar e organizar os dados. d) Apresentar os resultados em um grafico. Resposta correta: c) O primeiro passo na analise de dados e coletar e organizar as informacoes de forma estruturada para garantir que a analise seja feita com dados precisos e completos. Qual e a diferenca principal entre dados qualitativos e quantitativos? a) Dados qualitativos sao apenas numeros, enquanto dados quantitativos sao palavras. b) Dados qualitativos sao subjetivos e nao podem ser medidos diretamente, enquanto dados quantitativos sao objetivos e podem ser medidos numericamente. c) Dados qualitativos nao sao importantes na analise de dados. d) Nao ha diferenca entre os dois tipos de dados. Resposta correta: b) Dados qualitativos referem-se a caracteristicas ou descricoes que nao podem ser medidos numericamente, enquanto dados quantitativos sao informacoes numericas que podem ser analisadas de maneira objetiva. Qual e o objetivo da limpeza de dados em um processo de analise? a) Eliminar todos os dados irrelevantes. b) Organizar os dados em um formato que facilite a analise. c) Modificar os dados para que se ajustem a um padrao predeterminado. d) Aumentar o volume de dados para melhorar os resultados. Resposta correta: b) A limpeza de dados visa organizar e corrigir informacoes inconsistentes, faltantes ou duplicadas, facilitando a analise subsequente. O que sao outliers em analise de dados? a) Valores que estao muito proximos do valor medio dos dados. b) Valores que estao fora do intervalo esperado e podem distorcer a analise. c) O numero de dados coletados durante a pesquisa. d) Os valores mais comuns dentro de um conjunto de dados. Resposta correta: b) Outliers sao dados que estao muito distantes dos outros pontos em um conjunto de dados. Eles podem ser erros de coleta ou valores extremos que distorcem os resultados da analise. Qual das opcoes abaixo descreve melhor o conceito de "tendencia central" em analise de dados? a) A medida que descreve o comportamento de dispersao dos dados. b) O valor medio ou tipico de um conjunto de dados. c) O valor mais alto de um conjunto de dados. d) O valor mais baixo de um conjunto de dados. Resposta correta: b) A tendencia central refere-se ao valor medio ou tipico de um conjunto de dados, representando o ponto de centralidade ao redor do qual a maioria dos dados se agrupa. Isso pode ser medido pela media, mediana ou moda. Qual tecnica estatistica e comumente usada para medir a dispersao dos dados? a) Desvio padrao. b) Moda. c) Mediana. d) Media. Resposta correta: a) O desvio padrao e uma medida de dispersao que mostra o quanto os dados se afastam da media, ajudando a entender a variabilidade de um conjunto de dados. Qual e o proposito de uma analise de correlacao? a) Determinar a relacao de causalidade entre duas variaveis. b) Identificar se existe uma relacao entre duas ou mais variaveis e a forca dessa relacao. c) Estabelecer a tendencia de crescimento de uma variavel ao longo do tempo. d) Medir a variacao de uma unica variavel. Resposta correta: b) A analise de correlacao e usada para identificar e medir a relacao entre duas ou mais variaveis, sem necessariamente estabelecer causalidade. O que e um teste de hipotese em analise de dados? a) Um metodo para limpar dados antes da analise. b) A comparacao entre duas ou mais distribuicoes de dados. c) Um procedimento estatistico usado para verificar se os dados apoiam uma suposicao ou teoria. d) Uma tecnica para realizar analise multivariada. Resposta correta: c) O teste de hipotese e uma tecnica estatistica usada para verificar se uma suposicao sobre um conjunto de dados pode ser aceita ou rejeitada com base em uma analise rigorosa. Em que consiste a analise de regressao? a) Em prever o valor de uma variavel com base em outra variavel. b) Em medir a dispersao dos dados. c) Em identificar a tendencia central dos dados. d) Em comparar a media de dois grupos de dados. Resposta correta: a) A analise de regressao e uma tecnica que permite prever o valor de uma variavel dependente com base em uma ou mais variaveis independentes. O que sao variaveis independentes e dependentes em um estudo de regressao? a) Variaveis independentes sao aquelas que dependem de outras para serem explicadas. b) Variaveis dependentes sao as que sao manipuladas no estudo, enquanto as independentes nao. c) Variaveis independentes sao as que influenciam as variaveis dependentes. d) Variaveis independentes e dependentes sao sempre as mesmas. Resposta correta: c) Em um estudo de regressao, as variaveis independentes sao aquelas que influenciam ou explicam a variabilidade da variavel dependente, que e o resultado ou a variavel de interesse. O que e uma distribuicao normal em analise de dados? a) Uma distribuicao de dados em que todos os valores sao iguais. b) Uma distribuicao de dados em forma de "barril", com concentracao de valores nas extremidades. c) Uma distribuicao de dados simetrica, com a maioria dos dados concentrados em torno da media. d) Uma distribuicao de dados onde os valores sao dispersos uniformemente. Resposta correta: c) A distribuicao normal e uma distribuicao de dados simetrica em torno da media, com a maior parte dos valores agrupados proximos a media e caindo progressivamente nas extremidades. O que e uma variavel categorica em analise de dados? a) Uma variavel que pode ser medida em termos numericos. b) Uma variavel que assume valores em categorias ou grupos distintos. c) Uma variavel que representa um valor medio. d) Uma variavel que indica a frequencia dos dados. Resposta correta: b) Uma variavel categorica assume valores que representam diferentes categorias ou grupos, como sexo, cor, ou tipo de produto. Essas variaveis nao podem ser medidas numericamente. O que e uma analise de series temporais? a) A analise de dados que nao variam ao longo do tempo. b) A analise de dados em que a ordem cronologica e importante para entender o comportamento de uma variavel ao longo do tempo. c) A analise de dados que envolvem apenas variaveis qualitativas. d) A analise de dados que se concentra exclusivamente no valor medio. Resposta correta: b) A analise de series temporais examina como uma variavel se comporta ao longo do tempo, buscando identificar padroes, tendencias e sazonalidades. O que e "overfitting" em modelos de analise de dados? a) Quando um modelo e simples demais para capturar a complexidade dos dados. b) Quando um modelo e muito complexo e se ajusta excessivamente aos dados de treinamento, resultando em baixa generalizacao. c) Quando um modelo nao e capaz de lidar com grandes volumes de dados. d) Quando um modelo ignora variaveis importantes. Resposta correta: b) "Overfitting" ocorre quando um modelo de analise de dados e excessivamente ajustado aos dados de treinamento, o que pode prejudicar sua capacidade de generalizar para novos dados. Qual e a funcao da visualizacao de dados na analise de dados? a) Tornar os dados acessiveis apenas para especialistas. b) Apresentar os dados de forma que facilite a interpretacao e a comunicacao dos resultados. c) Substituir o processo de analise estatistica. d) Aumentar o volume de dados para uma analise mais robusta. Resposta correta: b) A visualizacao de dados serve para representar graficamente os dados, facilitando sua interpretacao e a comunicacaode resultados de forma clara e acessivel. O que significa "vies" em um conjunto de dados? a) A selecao de uma amostra de dados sem representatividade. b) A presenca de valores extremos que nao afetam a analise. c) A dispersao dos dados ao redor da media. d) A tendencia de um modelo de dados a ser mais preciso em algumas situacoes do que em outras. Resposta correta: a) Vies em dados ocorre quando a amostra coletada nao representa com precisao a populacao ou o fenomeno sendo estudado, o que pode distorcer os resultados. O que e analise de dados exploratoria (EDA)? a) A analise dos dados para verificar se eles atendem a uma hipotese pre-determinada. b) A exploracao dos dados de maneira visual e estatistica para descobrir padroes,