Logo Passei Direto
Buscar

Informática

UNIASSELVI
A Classificação de Dados é realizada quando temos um atributo com valores categóricos que pode ser empregado como alvo de nossa classificação. Esse atributo é responsável por categorizar conjunto de tuplas de dados de acordo com uma característica semântica, que pode ser diferente de acordo com a base de dados e o domínio de aplicações. Nesse contexto, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Se o conjunto de dados tiver somente atributos numéricos, é possível transformar os valores de pelo menos um deles e usar como atributo classe, se isso for relevante à análise. ( ) Nem todos os atributos de um conjunto de dados precisam ser parte do modelo de classificação. ( ) O modelo de classificação por árvore de decisão não comete erros durante a fase de teste, se for treinado usando validação cruzada. Assinale a alternativa que apresenta a sequência CORRETA:
User badge image
Irineo lima dos santos

ano passado

Respostas

User badge image

Ed Verified user icon

ano passado

Vamos analisar cada uma das afirmações sobre a Classificação de Dados: ( ) Se o conjunto de dados tiver somente atributos numéricos, é possível transformar os valores de pelo menos um deles e usar como atributo classe, se isso for relevante à análise. É verdadeira. Atributos numéricos podem ser transformados em categorias (por exemplo, através de discretização) e utilizados como atributos de classe, desde que essa transformação faça sentido para a análise. ( ) Nem todos os atributos de um conjunto de dados precisam ser parte do modelo de classificação. É verdadeira. Em um modelo de classificação, é comum que nem todos os atributos sejam utilizados, pois alguns podem não ter relevância para a tarefa de classificação ou podem introduzir ruído. ( ) O modelo de classificação por árvore de decisão não comete erros durante a fase de teste, se for treinado usando validação cruzada. É falsa. Embora a validação cruzada ajude a avaliar a performance do modelo e a evitar overfitting, isso não garante que o modelo não cometa erros durante a fase de teste. Sempre haverá uma taxa de erro, pois o modelo pode não generalizar perfeitamente para dados não vistos. Portanto, a sequência correta é: V - V - F. A alternativa que apresenta essa sequência é: a) V - V - F.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina