Prévia do material em texto
Aprendizado de Máquina - Resample Lista de Exercícios Para Estudo - Avaliação e Escolha de Modelos Essa lista de exercícios foi feita por aluno com o objetivo de revisar o entendimento dos principais tópicos baseado nos materiais do professor da disciplina de Aprendizado de Máquina. Exercícios 1. Como escolher o modelo adequado para um problema específico de aprendizado de máquina? 2. O que é o trade-off entre viés e variância e como ele impacta a escolha do modelo? 3. Quais métricas podem ser utilizadas para comparar diferentes modelos? 4. Como interpretar o erro quadrático médio (MSE) na avaliação de modelos? 5. Em que casos a acurácia não é a melhor métrica para avaliar um modelo? 6. Como o uso de múltiplos modelos pode melhorar a performance geral? 7. Quais são os sinais de que um modelo está subajustado aos dados? 8. Como a complexidade do modelo influencia seu desempenho em novos dados? 9. Quais técnicas podem ser aplicadas para evitar overfitting durante o treinamento? 10. Como a escolha do modelo é impactada pela disponibilidade de dados? Gabarito 1. A escolha do modelo depende das características dos dados, do objetivo do problema e das restrições computacionais. É recomendável testar múltiplos algoritmos e escolher o que apresenta melhor desempenho. 2. O trade-off entre viés e variância é essencial na escolha do modelo. Modelos com baixo viés são flexíveis, mas têm maior risco de variância, enquanto modelos com alto viés são mais simples, mas podem não capturar toda a complexidade dos dados. 3. Métricas como precisão, recall, F1-score e MSE permitem comparar diferentes modelos, cada uma com vantagens específicas dependendo do tipo de problema. 4. O MSE mede o erro médio ao quadrado entre previsões e valores reais, sendo útil para avaliar a precisão de modelos de regressão e identificar desvios significativos. 5. Em problemas com dados desbalanceados, como detecção de fraudes, a acurácia pode ser enganosa. Métricas como F1-score e AUC são mais indicadas nesses casos. 6. Combinar múltiplos modelos, como em técnicas de ensemble, melhora a performance ao agregar diferentes perspectivas e reduzir erros. 7. Subajuste ocorre quando o modelo é simples demais para capturar padrões nos dados. Isso se reflete em baixa performance tanto no treinamento quanto no teste. 8. Modelos complexos podem ter bom desempenho no treinamento, mas falham em generalizar para novos dados, levando ao overfitting. 9. Técnicas como regularização, validação cruzada e uso de conjuntos de validação ajudam a evitar o overfitting, garantindo que o modelo tenha bom desempenho em novos dados. 10. A escolha do modelo é diretamente afetada pela quantidade e qualidade dos dados. Com poucos dados, é recomendável utilizar modelos simples para evitar overfitting.