Logo Passei Direto
Buscar

Fundamentos de Estatística para Ciência de Dados

Ferramentas de estudo

Questões resolvidas

Esta prova explora os fundamentos estatísticos essenciais para a Ciência de Dados. Os conceitos abordam probabilidade, testes de hipóteses, distribuição de dados e análise descritiva.
Em um conjunto de dados, qual métrica representa a dispersão dos valores ao redor da média?
a) Moda.
b) Mediana.
c) Variância.
d) Percentil.
e) Média harmônica.

Em estatística, qual é o significado de p-valor em um teste de hipóteses?
a) A probabilidade de que a hipótese alternativa seja verdadeira.
b) A probabilidade de observar um resultado extremo assumindo que a hipótese nula seja verdadeira.
c) O intervalo de confiança do teste.
d) O tamanho da amostra usada no experimento.
e) A diferença entre médias de dois grupos.

A distribuição normal é caracterizada por:
a) Um formato assimétrico e enviesado.
b) Um pico central e simetria ao redor da média.
c) Uma tendência exponencial crescente.
d) Um valor constante ao longo do tempo.
e) Múltiplos picos em sua curva.

Qual é a principal diferença entre variáveis nominais e ordinais?
a) As variáveis ordinais são numéricas, enquanto as nominais são categóricas.
b) As variáveis nominais têm uma ordem específica, enquanto as ordinais não têm.
c) As variáveis ordinais têm uma ordem natural, enquanto as nominais não têm ordem.
d) As variáveis nominais são contínuas, enquanto as ordinais são discretas.
e) Não há diferença significativa entre elas.

Qual é o objetivo de calcular um intervalo de confiança em uma análise?
a) Determinar a média de uma amostra.
b) Estimar a variabilidade dos dados.
c) Identificar outliers.
d) Estimar o intervalo provável de um parâmetro populacional com base em uma amostra.
e) Calcular a probabilidade de eventos futuros.

Qual distribuição é usada para modelar o número de eventos que ocorrem em um intervalo fixo de tempo?
a) Binomial.
b) Normal.
c) Poisson.
d) Exponencial.
e) Uniforme.

Uma empresa realiza um teste A/B para comparar dois layouts de site. Qual técnica estatística é mais adequada para verificar diferenças significativas nas conversões?
a) Regressão logística.
b) Teste t de Student.
c) Análise de variância (ANOVA).
d) Teste qui-quadrado.
e) Teste de Mann-Whitney.

Qual é a característica principal de um outlier em um conjunto de dados?
a) Ele é sempre o menor valor do conjunto.
b) Está fora do intervalo interquartil (IQR).
c) Ele afeta diretamente o cálculo da mediana.
d) É um valor com alta frequência nos dados.
e) É sempre um erro nos dados.

O que é um boxplot?
a) Um gráfico que mostra a dispersão de uma variável ao longo do tempo.
b) Um gráfico que exibe as estatísticas descritivas de uma variável, incluindo outliers.
c) Um gráfico que compara duas variáveis categóricas.
d) Um método para calcular a correlação entre variáveis.
e) Um tipo de histograma acumulativo.

Ao calcular a correlação de Pearson entre duas variáveis, um coeficiente de +1 indica:
a) Uma relação inversamente proporcional perfeita.
b) Uma ausência total de correlação.
c) Uma correlação perfeita e positiva entre as variáveis.
d) Que as variáveis são independentes.
e) Uma relação linear com variância alta.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Escolha uma das opções e acesse esse e outros materiais sem bloqueio. 🤩

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Esta prova explora os fundamentos estatísticos essenciais para a Ciência de Dados. Os conceitos abordam probabilidade, testes de hipóteses, distribuição de dados e análise descritiva.
Em um conjunto de dados, qual métrica representa a dispersão dos valores ao redor da média?
a) Moda.
b) Mediana.
c) Variância.
d) Percentil.
e) Média harmônica.

Em estatística, qual é o significado de p-valor em um teste de hipóteses?
a) A probabilidade de que a hipótese alternativa seja verdadeira.
b) A probabilidade de observar um resultado extremo assumindo que a hipótese nula seja verdadeira.
c) O intervalo de confiança do teste.
d) O tamanho da amostra usada no experimento.
e) A diferença entre médias de dois grupos.

A distribuição normal é caracterizada por:
a) Um formato assimétrico e enviesado.
b) Um pico central e simetria ao redor da média.
c) Uma tendência exponencial crescente.
d) Um valor constante ao longo do tempo.
e) Múltiplos picos em sua curva.

Qual é a principal diferença entre variáveis nominais e ordinais?
a) As variáveis ordinais são numéricas, enquanto as nominais são categóricas.
b) As variáveis nominais têm uma ordem específica, enquanto as ordinais não têm.
c) As variáveis ordinais têm uma ordem natural, enquanto as nominais não têm ordem.
d) As variáveis nominais são contínuas, enquanto as ordinais são discretas.
e) Não há diferença significativa entre elas.

Qual é o objetivo de calcular um intervalo de confiança em uma análise?
a) Determinar a média de uma amostra.
b) Estimar a variabilidade dos dados.
c) Identificar outliers.
d) Estimar o intervalo provável de um parâmetro populacional com base em uma amostra.
e) Calcular a probabilidade de eventos futuros.

Qual distribuição é usada para modelar o número de eventos que ocorrem em um intervalo fixo de tempo?
a) Binomial.
b) Normal.
c) Poisson.
d) Exponencial.
e) Uniforme.

Uma empresa realiza um teste A/B para comparar dois layouts de site. Qual técnica estatística é mais adequada para verificar diferenças significativas nas conversões?
a) Regressão logística.
b) Teste t de Student.
c) Análise de variância (ANOVA).
d) Teste qui-quadrado.
e) Teste de Mann-Whitney.

Qual é a característica principal de um outlier em um conjunto de dados?
a) Ele é sempre o menor valor do conjunto.
b) Está fora do intervalo interquartil (IQR).
c) Ele afeta diretamente o cálculo da mediana.
d) É um valor com alta frequência nos dados.
e) É sempre um erro nos dados.

O que é um boxplot?
a) Um gráfico que mostra a dispersão de uma variável ao longo do tempo.
b) Um gráfico que exibe as estatísticas descritivas de uma variável, incluindo outliers.
c) Um gráfico que compara duas variáveis categóricas.
d) Um método para calcular a correlação entre variáveis.
e) Um tipo de histograma acumulativo.

Ao calcular a correlação de Pearson entre duas variáveis, um coeficiente de +1 indica:
a) Uma relação inversamente proporcional perfeita.
b) Uma ausência total de correlação.
c) Uma correlação perfeita e positiva entre as variáveis.
d) Que as variáveis são independentes.
e) Uma relação linear com variância alta.

Prévia do material em texto

Prova 6: Fundamentos de Estatística para Ciência de Dados
Introdução
Esta prova explora os fundamentos estatísticos essenciais para a Ciência de Dados. Os conceitos abordam probabilidade, testes de hipóteses, distribuição de dados e análise descritiva.
Questões
1. Em um conjunto de dados, qual métrica representa a dispersão dos valores ao redor da média?
a) Moda.
b) Mediana.
c) Variância.
d) Percentil.
e) Média harmônica.
2. Em estatística, qual é o significado de p-valor em um teste de hipóteses?
a) A probabilidade de que a hipótese alternativa seja verdadeira.
b) A probabilidade de observar um resultado extremo assumindo que a hipótese nula seja verdadeira.
c) O intervalo de confiança do teste.
d) O tamanho da amostra usada no experimento.
e) A diferença entre médias de dois grupos.
3. A distribuição normal é caracterizada por:
a) Um formato assimétrico e enviesado.
b) Um pico central e simetria ao redor da média.
c) Uma tendência exponencial crescente.
d) Um valor constante ao longo do tempo.
e) Múltiplos picos em sua curva.
4. Qual é a principal diferença entre variáveis nominais e ordinais?
a) As variáveis ordinais são numéricas, enquanto as nominais são categóricas.
b) As variáveis nominais têm uma ordem específica, enquanto as ordinais não têm.
c) As variáveis ordinais têm uma ordem natural, enquanto as nominais não têm ordem.
d) As variáveis nominais são contínuas, enquanto as ordinais são discretas.
e) Não há diferença significativa entre elas.
5. Qual é o objetivo de calcular um intervalo de confiança em uma análise?
a) Determinar a média de uma amostra.
b) Estimar a variabilidade dos dados.
c) Identificar outliers.
d) Estimar o intervalo provável de um parâmetro populacional com base em uma amostra.
e) Calcular a probabilidade de eventos futuros.
6. Qual distribuição é usada para modelar o número de eventos que ocorrem em um intervalo fixo de tempo?
a) Binomial.
b) Normal.
c) Poisson.
d) Exponencial.
e) Uniforme.
7. Uma empresa realiza um teste A/B para comparar dois layouts de site. Qual técnica estatística é mais adequada para verificar diferenças significativas nas conversões?
a) Regressão logística.
b) Teste t de Student.
c) Análise de variância (ANOVA).
d) Teste qui-quadrado.
e) Teste de Mann-Whitney.
8. Qual é a característica principal de um outlier em um conjunto de dados?
a) Ele é sempre o menor valor do conjunto.
b) Está fora do intervalo interquartil (IQR).
c) Ele afeta diretamente o cálculo da mediana.
d) É um valor com alta frequência nos dados.
e) É sempre um erro nos dados.
9. O que é um boxplot?
a) Um gráfico que mostra a dispersão de uma variável ao longo do tempo.
b) Um gráfico que exibe as estatísticas descritivas de uma variável, incluindo outliers.
c) Um gráfico que compara duas variáveis categóricas.
d) Um método para calcular a correlação entre variáveis.
e) Um tipo de histograma acumulativo.
10. Ao calcular a correlação de Pearson entre duas variáveis, um coeficiente de +1 indica:
a) Uma relação inversamente proporcional perfeita.
b) Uma ausência total de correlação.
c) Uma correlação perfeita e positiva entre as variáveis.
d) Que as variáveis são independentes.
e) Uma relação linear com variância alta.
Gabarito e Justificativas
1. c) A variância mede a dispersão dos valores ao redor da média.
2. b) O p-valor representa a probabilidade de observar um resultado extremo, assumindo a hipótese nula verdadeira.
3. b) A distribuição normal é simétrica e possui um pico central na média.
4. c) Variáveis ordinais têm uma ordem natural, enquanto as nominais não possuem ordem.
5. d) Intervalos de confiança estimam o intervalo provável de um parâmetro populacional com base na amostra.
6. c) A distribuição de Poisson modela o número de eventos em um intervalo fixo.
7. b) O teste t de Student é adequado para comparar médias entre dois grupos.
8. b) Outliers geralmente estão fora do intervalo interquartil e podem influenciar análises.
9. b) Um boxplot exibe estatísticas descritivas e ajuda a identificar outliers.
10. c) Um coeficiente de +1 indica uma correlação perfeita e positiva entre as variáveis.

Mais conteúdos dessa disciplina