Buscar

Slides da Segunda Aula Interativa do Módulo 1 - Bootcamp Engenheiro(a) de Machine Learning

Prévia do material em texto

Fundamentos de Aprendizado 
de Máquina
Segunda Aula Interativa
Prof. Túlio Philipe Vieira
Questão Aquecimento.
Desafio.
1
2
Nesta aula
• Classificação Binária
• Identificar se o empregado vai ou não continuar no emprego.
• Dataset: Human Resources Analytics.
Questão de Aquecimento
• Visualização e pré-processamento dos dados
• Qual tipo de dados estamos trabalhando: valores reais, 
categóricos ou ambos?
• Existem correlações entre as variáveis?
• Existem dados nulos?
• Existem dados que precisam ser normalizados?
• Para os “labels”, existem classes não balanceadas?
Questão de Aquecimento
Qual rede, algoritmo ou estratégia?
Regressão Logística RNA MLP Deep MLP
Resultados
• Nem sempre precisamos normalizar;
• Permite que o modelo seja menos sensível a variações (principalmente em regressão 
linear);
• Em análises multivariadas, valores em escalas (range) maiores podem “ofuscar” outras 
variáveis;
• Algoritmos baseados em distância euclidiana (KNN/PCA) podem sofrer mais com 
diferentes “range”;
• Redes neurais possuem maior velocidade de convergência (gradiente descendente) 
com valores “normalizados”;
• Coeficientes tendem a ser “mais estáveis” a partir da normalização;
• Regularizações podem ser prejudicadas. 
Por que normalizar?
Prévia - Desafio
Aquecimento.
Desafio.
1
2
Na Aula de Hoje

Continue navegando