Baixe o app para aproveitar ainda mais
Prévia do material em texto
Fundamentos de Aprendizado de Máquina Segunda Aula Interativa Prof. Túlio Philipe Vieira Questão Aquecimento. Desafio. 1 2 Nesta aula • Classificação Binária • Identificar se o empregado vai ou não continuar no emprego. • Dataset: Human Resources Analytics. Questão de Aquecimento • Visualização e pré-processamento dos dados • Qual tipo de dados estamos trabalhando: valores reais, categóricos ou ambos? • Existem correlações entre as variáveis? • Existem dados nulos? • Existem dados que precisam ser normalizados? • Para os “labels”, existem classes não balanceadas? Questão de Aquecimento Qual rede, algoritmo ou estratégia? Regressão Logística RNA MLP Deep MLP Resultados • Nem sempre precisamos normalizar; • Permite que o modelo seja menos sensível a variações (principalmente em regressão linear); • Em análises multivariadas, valores em escalas (range) maiores podem “ofuscar” outras variáveis; • Algoritmos baseados em distância euclidiana (KNN/PCA) podem sofrer mais com diferentes “range”; • Redes neurais possuem maior velocidade de convergência (gradiente descendente) com valores “normalizados”; • Coeficientes tendem a ser “mais estáveis” a partir da normalização; • Regularizações podem ser prejudicadas. Por que normalizar? Prévia - Desafio Aquecimento. Desafio. 1 2 Na Aula de Hoje
Compartilhar