Prévia do material em texto
Prova- 157: Análise e Implementação de Modelos Supervisionados Introdução Esta prova examina as técnicas de análise de modelos supervisionados, incluindo algoritmos como SVM, Árvores de Decisão e KNN, e avalia as metodologias para melhoria e interpretação desses modelos em problemas práticos. Questões 1. Qual a principal característica de um modelo supervisionado? a) Ele aprende a partir de dados não rotulados. b) Ele aprende a partir de dados rotulados, onde os resultados são conhecidos. c) Ele faz previsões de valores contínuos sem rotulagem. d) Ele utiliza algoritmos genéticos para aprender padrões. e) Ele ajusta seus parâmetros automaticamente sem supervisão. 2. Em um modelo de Máquina de Vetores de Suporte (SVM), qual é a função do vetor de suporte? a) Ajustar o número de atributos usados para classificar os dados. b) Representar os pontos críticos de separação entre as classes. c) Aumentar o número de exemplos utilizados no treinamento. d) Diminuir a complexidade do modelo. e) Calcular a precisão do modelo. 3. O que significa overfitting em um modelo supervisionado? a) O modelo é incapaz de capturar padrões dos dados. b) O modelo se ajusta muito bem aos dados de treinamento, mas não generaliza bem para novos dados. c) O modelo não se ajusta aos dados de treinamento. d) O modelo tem baixo erro tanto em dados de treinamento quanto de teste. e) O modelo diminui a complexidade dos dados. 4. Em que tipo de problemas o K-Nearest Neighbors (KNN) é mais eficiente? a) Problemas de regressão com variáveis contínuas. b) Problemas de classificação com uma grande quantidade de dados. c) Problemas de agrupamento com dados muito espalhados. d) Problemas de classificação com dados que podem ser bem separados em clusters. e) Problemas de detecção de anomalias. 5. O que caracteriza a técnica de regularização L1 (Lasso)? a) A penalização dos coeficientes do modelo que são grandes, incentivando valores pequenos, mas não forçando a eliminação de variáveis. b) A penalização dos coeficientes grandes, incentivando a eliminação de variáveis menos importantes. c) A técnica que força os coeficientes a zero, removendo variáveis irrelevantes. d) A técnica que aumenta o número de variáveis no modelo. e) A técnica que reduz a complexidade do modelo sem penalizar coeficientes. 6. O que significa bias em modelos de aprendizado supervisionado? a) A variabilidade entre diferentes conjuntos de dados. b) A diferença entre o erro médio de treinamento e o erro médio de teste. c) A tendência do modelo de fazer previsões sistematicamente erradas para certas classes. d) O erro causado pela incapacidade do modelo de ajustar-se bem aos dados de treinamento. e) A complexidade do modelo de aprendizado. 7. Em um algoritmo de regressão linear, o que a função de custo visa minimizar? a) O número de atributos do modelo. b) O erro quadrático médio entre as previsões do modelo e os valores reais. c) O número de variáveis irrelevantes. d) A precisão do modelo. e) O número de exemplos no conjunto de treinamento. 8. O que é a técnica de Cross-Validation (validação cruzada)? a) Um método para aumentar a quantidade de dados de treinamento. b) Uma técnica para dividir os dados em subconjuntos para testar o modelo em diferentes partes do conjunto de dados. c) Uma técnica para reduzir a dimensionalidade dos dados. d) Um método para ajustar os parâmetros do modelo. e) Uma técnica para combinar os resultados de diferentes modelos. 9. O que é a Curva ROC e como ela é utilizada na avaliação de modelos de classificação? a) Uma curva que mede a complexidade do modelo. b) Uma curva que mostra a relação entre verdadeiros positivos e falsos negativos. c) Uma curva que compara taxas de verdadeiros positivos e falsos positivos. d) Uma curva que compara erro médio e precisão do modelo. e) Uma curva que mostra a distribuição de erros nos dados de teste. 10. Qual é o efeito da regularização L2 (Ridge) no modelo? a) Ela força os coeficientes do modelo a se tornarem zero. b) Ela penaliza os coeficientes grandes, ajudando a prevenir overfitting. c) Ela adiciona mais variáveis ao modelo. d) Ela reduz o número de dados utilizados para treinamento. e) Ela melhora a acurácia do modelo. Gabarito e Justificativas 1. b) O modelo supervisionado é treinado com dados rotulados, ou seja, com entradas e saídas conhecidas. 2. b) O vetor de suporte define a fronteira de decisão entre as classes. 3. b) Overfitting ocorre quando o modelo se ajusta demais aos dados de treinamento, perdendo capacidade de generalização. 4. d) O KNN é eficiente em problemas de classificação, especialmente quando as classes podem ser bem separadas. 5. b) A regularização L1 força a eliminação de variáveis irrelevantes, forçando coeficientes a zero. 6. c) Bias refere-se à tendência do modelo de cometer erros sistemáticos ao prever. 7. b) A função de custo em regressão linear visa minimizar o erro quadrático médio. 8. b) Cross-validation divide os dados em partes para avaliar o modelo em diferentes subconjuntos. 9. c) A curva ROC compara as taxas de verdadeiros positivos e falsos positivos para avaliar o modelo. 10. b) A regularização L2 penaliza coeficientes grandes, prevenindo o overfitting.