A divisão dos dados em teste e treino é um procedimento rápido e fácil de se executar, podendo ser aplicado na maioria dos modelos de predição. Não deve ser utilizado apenas em poucos casos, como em pequenos conjuntos de dados e situações em que configuração adicional é necessária, como quando é usado para classificação e o conjunto de dados não está balanceado.
Por que é necessário dividir os dados em teste e treino?
A.
Para avaliar a capacidade de generalização do modelo;
B.
Para definir qual método de aprendizado de máquina se deve utilizar;
C.
Para aumentar o desempenho do modelo escolhido.
A alternativa correta é A) Para avaliar a capacidade de generalização do modelo. A divisão dos dados em teste e treino é necessária para avaliar a capacidade de generalização do modelo, ou seja, a capacidade do modelo de se adaptar a novos dados que não foram utilizados no treinamento.
A. Para avaliar a capacidade de generalização do modelo;
A divisão dos dados em teste e treino permite testar a capacidade do modelo simulando um ambiente real, além de avaliar métricas de desempenho, como acurácia, sensibilidade e especificidade; por fim, permite realizar ajustes e validar os resultados.
Para escrever sua resposta aqui, entre ou crie uma conta
Algoritmos e Estrutura de Dados
•UNIP
Compartilhar