Logo Passei Direto
Buscar

Técnicas de Modelagem Estatística e Preditiva

Ferramentas de estudo

Questões resolvidas

Esta prova foca em técnicas avançadas de modelagem estatística e preditiva, com ênfase em métodos de previsão, validação de modelos e análise de erros. A prova abrange tanto a estatística descritiva quanto técnicas mais complexas de aprendizado de máquina.
O que é a distribuição binomial?
a) Uma distribuição para variáveis contínuas.
b) Uma distribuição de probabilidade associada a experimentos com dois resultados possíveis.
c) Uma distribuição usada em análise de séries temporais.
d) Uma distribuição que se aplica apenas a dados normais.
e) Uma distribuição usada para calcular a média de uma amostra.

O que significa a técnica de regularização L2 (Ridge Regression)?
a) Penaliza os erros quadráticos no modelo.
b) Penaliza a soma dos valores absolutos dos coeficientes.
c) Penaliza a soma dos quadrados dos coeficientes do modelo.
d) Penaliza a complexidade do modelo através de termos de interação.
e) Penaliza o número de variáveis no modelo.

Em um modelo de regressão linear múltipla, o que é a multicolinearidade?
a) A correlação entre a variável dependente e as variáveis independentes.
b) A ausência de relação entre as variáveis independentes.
c) A correlação forte entre duas ou mais variáveis independentes.
d) A correlação entre os erros do modelo.
e) A correlação entre as variáveis dependentes.

O que significa p-valor de 0,01 em um teste de hipótese?
a) Há uma chance de 1% de que a hipótese alternativa seja verdadeira.
b) Há uma chance de 99% de que a hipótese nula seja verdadeira.
c) Há 1% de chance de que os dados observados sejam consistentes com a hipótese nula.
d) A hipótese nula deve ser rejeitada com 99% de confiança.
e) Há uma chance de 1% de que o modelo esteja superajustado.

Qual a principal função de um algoritmo de clustering?
a) Classificar dados em categorias predefinidas.
b) Agrupar dados similares em clusters ou grupos.
c) Realizar previsões de variáveis contínuas.
d) Estimar a dispersão de dados.
e) Reduzir a dimensionalidade dos dados.

O que caracteriza o modelo de regressão logística?
a) Prever uma variável contínua baseada em variáveis independentes contínuas.
b) Prever uma variável categórica com mais de duas classes.
c) Prever uma variável categórica binária, como sim/não.
d) Estimar os parâmetros de uma variável dependente contínua.
e) Reduzir a dimensionalidade dos dados.

O que é overfitting em modelos de aprendizado de máquina?
a) Quando o modelo é simples demais e não captura os padrões nos dados.
b) Quando o modelo se ajusta excessivamente aos dados de treinamento, perdendo a capacidade de generalização.
c) Quando o modelo tem uma quantidade insuficiente de dados.
d) Quando o modelo é muito complexo e não consegue resolver o problema.
e) Quando o modelo aprende sem usar dados de treinamento.

O que é o erro padrão da média (SEM)?
a) A média dos erros cometidos pelo modelo.
b) A medida da variabilidade dos dados em torno da média.
c) A raiz quadrada da variância da amostra.
d) A média das diferenças quadráticas entre os valores observados e previstos.
e) A medida da precisão com que a média da amostra representa a população.

O que significa o coeficiente de determinação (R²)?
a) A variação explicada pela variável dependente.
b) A variância explicada pela relação entre as variáveis independentes.
c) A proporção da variação total dos dados explicada pelo modelo.
d) A média dos erros quadráticos do modelo.
e) A precisão da previsão do modelo.

O que é a técnica de K-fold Cross Validation?
a) Uma técnica para reduzir a complexidade do modelo.
b) Uma técnica de validação para dividir os dados em k subconjuntos e treinar o modelo k vezes.
c) Uma técnica para aumentar a variância do modelo.
d) Uma técnica para agrupar os dados em k grupos.
e) Uma técnica de ajuste de hiperparâmetros.

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Esta prova foca em técnicas avançadas de modelagem estatística e preditiva, com ênfase em métodos de previsão, validação de modelos e análise de erros. A prova abrange tanto a estatística descritiva quanto técnicas mais complexas de aprendizado de máquina.
O que é a distribuição binomial?
a) Uma distribuição para variáveis contínuas.
b) Uma distribuição de probabilidade associada a experimentos com dois resultados possíveis.
c) Uma distribuição usada em análise de séries temporais.
d) Uma distribuição que se aplica apenas a dados normais.
e) Uma distribuição usada para calcular a média de uma amostra.

O que significa a técnica de regularização L2 (Ridge Regression)?
a) Penaliza os erros quadráticos no modelo.
b) Penaliza a soma dos valores absolutos dos coeficientes.
c) Penaliza a soma dos quadrados dos coeficientes do modelo.
d) Penaliza a complexidade do modelo através de termos de interação.
e) Penaliza o número de variáveis no modelo.

Em um modelo de regressão linear múltipla, o que é a multicolinearidade?
a) A correlação entre a variável dependente e as variáveis independentes.
b) A ausência de relação entre as variáveis independentes.
c) A correlação forte entre duas ou mais variáveis independentes.
d) A correlação entre os erros do modelo.
e) A correlação entre as variáveis dependentes.

O que significa p-valor de 0,01 em um teste de hipótese?
a) Há uma chance de 1% de que a hipótese alternativa seja verdadeira.
b) Há uma chance de 99% de que a hipótese nula seja verdadeira.
c) Há 1% de chance de que os dados observados sejam consistentes com a hipótese nula.
d) A hipótese nula deve ser rejeitada com 99% de confiança.
e) Há uma chance de 1% de que o modelo esteja superajustado.

Qual a principal função de um algoritmo de clustering?
a) Classificar dados em categorias predefinidas.
b) Agrupar dados similares em clusters ou grupos.
c) Realizar previsões de variáveis contínuas.
d) Estimar a dispersão de dados.
e) Reduzir a dimensionalidade dos dados.

O que caracteriza o modelo de regressão logística?
a) Prever uma variável contínua baseada em variáveis independentes contínuas.
b) Prever uma variável categórica com mais de duas classes.
c) Prever uma variável categórica binária, como sim/não.
d) Estimar os parâmetros de uma variável dependente contínua.
e) Reduzir a dimensionalidade dos dados.

O que é overfitting em modelos de aprendizado de máquina?
a) Quando o modelo é simples demais e não captura os padrões nos dados.
b) Quando o modelo se ajusta excessivamente aos dados de treinamento, perdendo a capacidade de generalização.
c) Quando o modelo tem uma quantidade insuficiente de dados.
d) Quando o modelo é muito complexo e não consegue resolver o problema.
e) Quando o modelo aprende sem usar dados de treinamento.

O que é o erro padrão da média (SEM)?
a) A média dos erros cometidos pelo modelo.
b) A medida da variabilidade dos dados em torno da média.
c) A raiz quadrada da variância da amostra.
d) A média das diferenças quadráticas entre os valores observados e previstos.
e) A medida da precisão com que a média da amostra representa a população.

O que significa o coeficiente de determinação (R²)?
a) A variação explicada pela variável dependente.
b) A variância explicada pela relação entre as variáveis independentes.
c) A proporção da variação total dos dados explicada pelo modelo.
d) A média dos erros quadráticos do modelo.
e) A precisão da previsão do modelo.

O que é a técnica de K-fold Cross Validation?
a) Uma técnica para reduzir a complexidade do modelo.
b) Uma técnica de validação para dividir os dados em k subconjuntos e treinar o modelo k vezes.
c) Uma técnica para aumentar a variância do modelo.
d) Uma técnica para agrupar os dados em k grupos.
e) Uma técnica de ajuste de hiperparâmetros.

Prévia do material em texto

Prova- 71: Técnicas de Modelagem Estatística e Preditiva
Introdução
Esta prova foca em técnicas avançadas de modelagem estatística e preditiva, com ênfase em métodos de previsão, validação de modelos e análise de erros. A prova abrange tanto a estatística descritiva quanto técnicas mais complexas de aprendizado de máquina.
Questões
1. O que é a distribuição binomial?
a) Uma distribuição para variáveis contínuas.
b) Uma distribuição de probabilidade associada a experimentos com dois resultados possíveis.
c) Uma distribuição usada em análise de séries temporais.
d) Uma distribuição que se aplica apenas a dados normais.
e) Uma distribuição usada para calcular a média de uma amostra.
2. O que significa a técnica de regularização L2 (Ridge Regression)?
a) Penaliza os erros quadráticos no modelo.
b) Penaliza a soma dos valores absolutos dos coeficientes.
c) Penaliza a soma dos quadrados dos coeficientes do modelo.
d) Penaliza a complexidade do modelo através de termos de interação.
e) Penaliza o número de variáveis no modelo.
3. Em um modelo de regressão linear múltipla, o que é a multicolinearidade?
a) A correlação entre a variável dependente e as variáveis independentes.
b) A ausência de relação entre as variáveis independentes.
c) A correlação forte entre duas ou mais variáveis independentes.
d) A correlação entre os erros do modelo.
e) A correlação entre as variáveis dependentes.
4. O que significa p-valor de 0,01 em um teste de hipótese?
a) Há uma chance de 1% de que a hipótese alternativa seja verdadeira.
b) Há uma chance de 99% de que a hipótese nula seja verdadeira.
c) Há 1% de chance de que os dados observados sejam consistentes com a hipótese nula.
d) A hipótese nula deve ser rejeitada com 99% de confiança.
e) Há uma chance de 1% de que o modelo esteja superajustado.
5. Qual a principal função de um algoritmo de clustering?
a) Classificar dados em categorias predefinidas.
b) Agrupar dados similares em clusters ou grupos.
c) Realizar previsões de variáveis contínuas.
d) Estimar a dispersão de dados.
e) Reduzir a dimensionalidade dos dados.
6. O que caracteriza o modelo de regressão logística?
a) Prever uma variável contínua baseada em variáveis independentes contínuas.
b) Prever uma variável categórica com mais de duas classes.
c) Prever uma variável categórica binária, como sim/não.
d) Estimar os parâmetros de uma variável dependente contínua.
e) Reduzir a dimensionalidade dos dados.
7. O que é overfitting em modelos de aprendizado de máquina?
a) Quando o modelo é simples demais e não captura os padrões nos dados.
b) Quando o modelo se ajusta excessivamente aos dados de treinamento, perdendo a capacidade de generalização.
c) Quando o modelo tem uma quantidade insuficiente de dados.
d) Quando o modelo é muito complexo e não consegue resolver o problema.
e) Quando o modelo aprende sem usar dados de treinamento.
8. O que é o erro padrão da média (SEM)?
a) A média dos erros cometidos pelo modelo.
b) A medida da variabilidade dos dados em torno da média.
c) A raiz quadrada da variância da amostra.
d) A média das diferenças quadráticas entre os valores observados e previstos.
e) A medida da precisão com que a média da amostra representa a população.
9. O que significa o coeficiente de determinação (R²)?
a) A variação explicada pela variável dependente.
b) A variância explicada pela relação entre as variáveis independentes.
c) A proporção da variação total dos dados explicada pelo modelo.
d) A média dos erros quadráticos do modelo.
e) A precisão da previsão do modelo.
10. O que é a técnica de K-fold Cross Validation?
a) Uma técnica para reduzir a complexidade do modelo.
b) Uma técnica de validação para dividir os dados em k subconjuntos e treinar o modelo k vezes.
c) Uma técnica para aumentar a variância do modelo.
d) Uma técnica para agrupar os dados em k grupos.
e) Uma técnica de ajuste de hiperparâmetros.
Gabarito e Justificativas
1. b) A distribuição binomial é usada para modelar experimentos com dois resultados possíveis, como sucesso ou falha.
2. c) A regularização L2 penaliza a soma dos quadrados dos coeficientes do modelo, ajudando a reduzir o overfitting.
3. c) A multicolinearidade ocorre quando duas ou mais variáveis independentes estão altamente correlacionadas, o que pode prejudicar a interpretação do modelo.
4. c) O p-valor de 0,01 significa que há uma chance de 1% de que os dados observados sejam consistentes com a hipótese nula.
5. b) O clustering é usado para agrupar dados em clusters com base na semelhança entre eles.
6. c) A regressão logística é usada para prever uma variável categórica binária, como "sim" ou "não".
7. b) O overfitting ocorre quando o modelo se ajusta excessivamente aos dados de treinamento e perde a capacidade de generalização para novos dados.
8. e) O erro padrão da média (SEM) mede a precisão com que a média da amostra representa a população.
9. c) O R² indica a proporção da variação total explicada pelo modelo de regressão.
10. b) O K-fold cross-validation divide os dados em k subconjuntos e treina o modelo k vezes, ajudando a validar o desempenho do modelo de forma robusta.

Mais conteúdos dessa disciplina