Buscar

Métodos Estatísticos e Técnicas

Prévia do material em texto

39. Explique o que é o método de bootstrap e como é usado em estatística. 
 Resposta: O método de bootstrap é uma técnica estatística que utiliza amostragem 
com reposição para estimar a distribuição de uma estatística de interesse. É usado 
quando a distribuição da estatística não pode ser obtida por métodos analíticos, como a 
distribuição da média ou do desvio padrão. 
 
40. O que é um teste de Kruskal-Wallis e quando é usado? 
 Resposta: O teste de Kruskal-Wallis é uma técnica estatística não paramétrica usada 
para determinar se há diferenças significativas entre as medianas de três ou mais grupos 
independentes. É usado quando os dados não são distribuídos normalmente ou quando 
as suposições do teste ANOVA não são atendidas. 
 
41. Explique o que é o coeficiente de Spearman e quando é usado. 
 Resposta: O coeficiente de Spearman é uma medida de correlação não paramétrica 
que avalia a relação monotônica entre duas variáveis. É usado quando os dados não 
estão em uma escala de intervalo ou razão e não atendem às suposições do coeficiente 
de correlação de Pearson. 
 
42. O que é a suposição de normalidade em estatística e por que é importante? 
 Resposta: A suposição de normalidade é a suposição de que os dados seguem uma 
distribuição normal. É importante porque muitos métodos estatísticos paramétricos, 
como o teste t de Student e a ANOVA, requerem que os dados sejam normalmente 
distribuídos para produzir resultados válidos. 
 
43. Explique o que é a regressão polinomial e como é interpretada. 
 Resposta: A regressão polinomial é uma extensão da regressão linear que modela a 
relação entre uma variável independente e uma variável dependente usando um 
polinômio de grau maior que um. Ela permite capturar relações não lineares entre as 
variáveis, mas pode levar ao overfitting se o grau do polinômio for muito alto. 
 
44. O que é um teste de Mann-Whitney e quando é usado? 
 Resposta: O teste de Mann-Whitney é uma técnica estatística não paramétrica usada 
para determinar se existem diferenças significativas entre as medianas de duas amostras 
independentes. É usado quando os dados não são distribuídos normalmente ou quando 
as suposições do teste t de Student não são atendidas. 
 
45. Explique o que é a normalização de dados e por que é feita.