A alternativa correta é a letra B) Utilizar os dados na proporção 80-20. Essa proporção é bastante utilizada e recomendada na área de aprendizagem de máquina, na qual 80% dos dados são utilizados para treinamento e 20% para teste. Essa estratégia ajuda a evitar o overfitting, que é quando o modelo se ajusta muito bem aos dados de treinamento, mas não consegue generalizar para novos dados. A validação cruzada é uma técnica utilizada para avaliar a capacidade de generalização do modelo, mas não é utilizada para dividir os dados em treinamento e teste. As outras alternativas estão incorretas, pois não seguem as boas práticas de aprendizagem de máquina.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar