Questão 19
Ao implementar um pipeline em Scikit-Learn, qual seria a ordem correta das etapas para garantir que o modelo receba os dados corretamente preparados?
Alternativas
Alternativa 1:
Normalizar os dados, tratar valores faltantes, aplicar a codificação de variáveis categóricas e treinar o modelo.
Alternativa 2:
Tratar valores faltantes, aplicar a codificação de variáveis categóricas, normalizar os dados e, em seguida, treinar o modelo.
Alternativa 3:
Aplicar a codificação de variáveis categóricas, normalizar os dados, tratar valores faltantes e treinar o modelo.
Alternativa 4:
Treinar o modelo diretamente sem aplicar processamento.
Alternativa 5:
Normalizar os dados e treinar o modelo sem tratar valores faltantes ou codificar variáveis categóricas.
Ed
há 3 semanas
A ordem correta das etapas para garantir que o modelo receba os dados corretamente preparados em um pipeline do Scikit-Learn é: Alternativa 2: Tratar valores faltantes, aplicar a codificação de variáveis categóricas, normalizar os dados e, em seguida, treinar o modelo. Essa sequência é importante porque primeiro você deve lidar com dados ausentes, depois transformar variáveis categóricas em um formato que o modelo possa entender, em seguida, normalizar os dados para que todas as variáveis estejam na mesma escala, e finalmente, treinar o modelo.