Ed
há 2 meses
Vamos analisar cada uma das alternativas para identificar a correta: A) O conjunto de dados completo deve ser utilizado nas duas fases. - Esta afirmação é incorreta, pois o conjunto de dados deve ser dividido em conjuntos de treinamento e teste. Usar o conjunto completo em ambas as fases não permite uma avaliação adequada do modelo. B) A abordagem leave-one-out (LOO) é uma forma de validação cruzada, que cria o modelo com base em todos os atributos da base exceto um, por iteração. Esse processo é repetido de forma que cada atributo da base é deixado de fora do treinamento por uma vez. - Esta afirmação é parcialmente correta, mas confunde atributos com instâncias. O LOO deixa de fora uma instância (exemplo) de cada vez, não um atributo. Portanto, não é a melhor opção. C) O conjunto de treinamento deve, obrigatoriamente, ter 90% dos dados, e o de teste 10%. - Esta afirmação é incorreta, pois a divisão entre treinamento e teste pode variar dependendo do contexto e do tamanho do conjunto de dados. Não existe uma regra fixa de 90/10. D) A validação cruzada é realizada sobre a base completa, dividindo as tuplas em conjuntos separados de teste e treino. O número de vezes que isso é feito é passado como parâmetro para o método. - Esta afirmação é correta. A validação cruzada envolve dividir o conjunto de dados em várias partes e realizar múltiplas iterações de treinamento e teste, o que é uma prática comum para avaliar a performance do modelo. Portanto, a alternativa correta é: D) A validação cruzada é realizada sobre a base completa, dividindo as tuplas em conjuntos separados de teste e treino. O número de vezes que isso é feito é passado como parâmetro para o método.