Buscar

Aula 13 - Aplicações no Kagle - Prof Matheus Facure

Prévia do material em texto

Análise de Big Data Via 
Machine Learning e 
Inteligência Artificial
Análise de Big Data Via 
Machine Learning e 
Inteligência Artificial
Tema da Aula: Ensamble
Prof. Matheus Facure Alves
Coordenação:
Profa. Dra. Alessandra 
de Ávila Montini
Outubro - 2019
Análise de Big Data Via 
Machine Learning e 
Inteligência Artificial
Título
• Conteúdo 2
Currículo
1
Bacharel em Economia, Universidade de Brasília.
Nubank. Principais atividades:
Engenharia de Dados, Desenvolvimento de ELT e integração de data analytics com 
micro-serviços. 
Modelagem comportamental e de análise de risco de crédito. 
Modelagem de marketing
Criação de agentes de resposta automática com NLP.
Inferência causal e análise de dívidas.
Blogger nas horas vagas
https://matheusfacure.github.io/tutoriais/
MBA 
BIG DATA
Título
• Conteúdo 2
2
Desafio - Base de crédito
https://www.kaggle.com/c/GiveMeSomeCredit
MBA 
BIG DATA
Título
• Conteúdo 2
2
Desafio - Base de crédito
Variáveis:
• SeriousDlqin2yrs – resposta
• RevolvingUtilizationOfUnsecuredLines
• Age
• NumberOfTime30.59DaysPastDueNotWorse
• DebtRatio
• MonthlyIncome
• NumberOfOpenCreditLinesAndLoans
• NumberOfTimes90DaysLate
• NumberRealEstateLoansOrLines
• NumberOfTime60.89DaysPastDueNotWorse
• NumberOfDependents
MBA 
BIG DATA
Título
• Conteúdo 2
2
Desafio - Base de crédito
Objetivo:
• Prever se um cliente não irá pagar o crédito.
• Vocês terão acesso a duas bases:
”credit_train.csv” com 50.000 observaçoões e todas as features disponíveis e a 
variável resposta.
”credit_test_features.csv” com 150.000 observações e as mesmas features sem a 
informação da variável resposta.
• A métrica a ser avaliada será o AUC.
• O vencedor será aquele com o melhor AUC na base de teste (só eu tenho a 
resposta).
MBA 
BIG DATA
Título
2
Etapas do Modelo
Análise
Descritiv
a
Missing e 
Outliers
Feature
Engineeri
ng
Feature 
Selection
Modelo
Criação de 
novas 
variáveis

Continue navegando