Logo Passei Direto
Buscar
Você é responsável por configurar o pipeline de treinamento de um modelo de rede neural em um problema de classificação com uma base de dados tabular. Durante a etapa de preparação dos dados, foi solicitado que você avalie o processo de divisão do conjunto, a seleção e o tratamento de atributos, além de estratégias para evitar sobreajuste e garantir a representatividade dos dados.
Está correto o que se afirma em:
I. Dividir os dados em conjuntos de desenvolvimento e teste, usando apenas o conjunto de teste após a finalização do modelo.
II. Realizar validação cruzada estratificada para manter a proporção de classes em todos os subconjuntos utilizados.
III. Aplicar normalização aos dados, equalizando as escalas dos atributos antes do treinamento do modelo.
IV. Utilizar o conjunto de validação para ajustar hiperparâmetros e o conjunto de teste para calcular o erro final.
V. Codificar atributos categóricos com ordens semânticas sempre usando one-hot encoding, independentemente da hierarquia entre categorias.
a. I, II e III, apenas.
b. I, II, III, IV e V.
c. II, IV e V, apenas.
d. I, III e V, apenas.
e. I, II, III e IV, apenas.
User badge image
Desvendando com Questões

anteontem

Respostas

User badge image

Ed Verified user icon

anteontem

Vamos analisar cada afirmativa: I. Dividir os dados em conjuntos de desenvolvimento e teste, usando apenas o conjunto de teste após a finalização do modelo. Verdadeiro, essa é uma prática comum para evitar sobreajuste, onde o conjunto de teste é reservado para a avaliação final do modelo. II. Realizar validação cruzada estratificada para manter a proporção de classes em todos os subconjuntos utilizados. Verdadeiro, a validação cruzada estratificada é importante para garantir que a distribuição das classes seja mantida em todos os subconjuntos, especialmente em problemas de classificação. III. Aplicar normalização aos dados, equalizando as escalas dos atributos antes do treinamento do modelo. Verdadeiro, a normalização é uma prática comum para garantir que os atributos estejam na mesma escala, o que pode melhorar o desempenho do modelo. IV. Utilizar o conjunto de validação para ajustar hiperparâmetros e o conjunto de teste para calcular o erro final. Verdadeiro, essa é uma prática correta, onde o conjunto de validação é usado para ajuste e o conjunto de teste é reservado para a avaliação final. V. Codificar atributos categóricos com ordens semânticas sempre usando one-hot encoding, independentemente da hierarquia entre categorias. Falso, o one-hot encoding é adequado para atributos categóricos sem ordem, mas não é a única abordagem para atributos com ordens semânticas, onde outras técnicas, como a codificação ordinal, podem ser mais apropriadas. Com base nas análises, os itens verdadeiros são I, II, III e IV. Portanto, a alternativa correta que contém todos os itens verdadeiros é: e) I, II, III e IV, apenas.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

A preparação adequada dos dados é um aspecto crítico no processo de treinamento de modelos de inteligência artificial, especialmente de redes neurais. Este processo envolve diversas técnicas destinadas a otimizar tanto a precisão quanto a eficiência dos algoritmos de aprendizado. Dentre estas técnicas, a normalização é uma das mais relevantes, pois equaliza a influência de cada característica no modelo, prevenindo que variáveis com escalas amplas impactem negativamente a performance do algoritmo. Tal prática é importante para manter a consistência dos dados e para acelerar o processo de aprendizado ao facilitar o caminho do gradiente na busca pelo mínimo global da função de perda.
A respeito dessas asserções, assinale a alternativa correta:
I. A normalização dos dados é um passo essencial na preparação dos dados para redes neurais, pois ajusta os valores das características para um intervalo comum.
II. A normalização ajuda a evitar que características com valores maiores dominem o aprendizado e melhora a convergência do modelo durante o treinamento.
a. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
b. A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
c. As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I.
d. As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I.
e. As asserções I e II são falsas.

Mais conteúdos dessa disciplina