Logo Passei Direto
Buscar
A predição de dados consiste na construção de um modelo com base em atributos preditores e no alvo da análise, que pode ser discreto ou contínuo. Após criar o modelo, um importante passo é avaliar sua qualidade para predizer classes de dados novos, cujo rótulo é desconhecido. Para isso, é essencial que sejam realizadas duas etapas, o treinamento e o teste do modelo de predição.Com base nas fases de treinamento e teste do modelo, assinale a alternativa CORRETA: A) O conjunto de dados completo deve ser utilizado nas duas fases. B) A abordagem leave-one-out (LOO) é uma forma de validação cruzada, que cria o modelo com base em todos os atributos da base exceto um, por iteração. Esse processo é repetido de forma que cada atributo da base é deixado de fora do treinamento por uma vez. C) O conjunto de treinamento deve, obrigatoriamente, ter 90% dos dados, e o de teste 10%. D) A validação cruzada é realizada sobre a base completa, dividindo as tuplas em conjuntos separados de teste e treino. O número de vezes que isso é feito é passado como parâmetro para o método.
User badge image
Denis

há 2 meses

Respostas

User badge image

Ed Verified user icon

há 2 meses

Vamos analisar cada uma das alternativas para identificar a correta: A) O conjunto de dados completo deve ser utilizado nas duas fases. - Esta afirmação é incorreta, pois o conjunto de dados deve ser dividido em conjuntos de treinamento e teste. Usar o conjunto completo em ambas as fases não permite uma avaliação adequada do modelo. B) A abordagem leave-one-out (LOO) é uma forma de validação cruzada, que cria o modelo com base em todos os atributos da base exceto um, por iteração. Esse processo é repetido de forma que cada atributo da base é deixado de fora do treinamento por uma vez. - Esta afirmação é parcialmente correta, mas confunde atributos com instâncias. O LOO deixa de fora uma instância (exemplo) de cada vez, não um atributo. Portanto, não é a melhor opção. C) O conjunto de treinamento deve, obrigatoriamente, ter 90% dos dados, e o de teste 10%. - Esta afirmação é incorreta, pois a divisão entre treinamento e teste pode variar dependendo do contexto e do tamanho do conjunto de dados. Não existe uma regra fixa de 90/10. D) A validação cruzada é realizada sobre a base completa, dividindo as tuplas em conjuntos separados de teste e treino. O número de vezes que isso é feito é passado como parâmetro para o método. - Esta afirmação é correta. A validação cruzada envolve dividir o conjunto de dados em várias partes e realizar múltiplas iterações de treinamento e teste, o que é uma prática comum para avaliar a performance do modelo. Portanto, a alternativa correta é: D) A validação cruzada é realizada sobre a base completa, dividindo as tuplas em conjuntos separados de teste e treino. O número de vezes que isso é feito é passado como parâmetro para o método.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina