Prévia do material em texto
Inteligência Artificial Aula 09 – Aprendizagem Supervisionada - Regressão Profa. Rafaella Nascimento rafaellalnascimento@fac.pe.senac.br Revisão Modelagem Definição: Criar um modelo utilizando um algoritmo de aprendizagem que aprenda com os dados explicando ou encontrando padrões. 1. Temos no início a Técnica/Algoritmo de aprendizagem (estratégia comput para resolver o problema) • A técnica/algoritmo aprende e generaliza a partir de dados de treinamento. 2. Temos um modelo (temos o conhecimento/aprendizado sobre os dados) • Agora aplica-se o conhecimento adquirido a dados de teste (novos dados que ele nunca viu antes) para fazer previsões e ser avaliado quanto a seu propósito. 3. Temos um sistema Modelagem • Sabemos que os algoritmos de aprendizagem aprendem a partir de dados. • Podemos utilizar dados históricos para realizar estas atividades. Como vimos, precisamos de: 1. Dados para treinamento do modelo e 2. Dados para teste do modelo. Particionamento de Dados Regressão 6 Regressão: O que é? • Um objeto descrito por características (X) e uma resposta correspondente (Y). • Quando os valores de Y são categóricos (Classes), tem-se um problema de classificação. • Quando tais valores são numéricos, tem-se um problema de regressão. Nº Quartos Tamanho (m²) Ano Construção Valor 2 70 2009 R$ 100.000,00 3 95 2009 R$ 150.000,00 4 153 2015 R$ 156.000,00 3 134 2015 R$ 132.000,00 2 102 1994 R$ 100.000,00 2 98 1980 R$ 87.000,00 1 60 2015 R$ 123.000,00 Regressão Linear • De forma geral, aplicar técnicas de regressão consiste na obtenção de uma equação que explique a variação do Y pela variação do X. • Pode ser verificado a existência de uma relação funcional entre essas variáveis, através de um gráfico denominado diagrama de dispersão (linear). • O gráfico pode revelar o comportamento entre Y e X de várias formas como relacionamento linear, quadrático, exponencial... Regressão Linear: Exemplo • Considere um experimento em que se analisa a octanagem da gasolina (Y) em função da adição de um novo aditivo (X). • Foram realizados testes com os percentuais 1% a 6% de aditivo. 8 X Y 1 80,5 2 81,6 3 82,1 4 83,7 5 83,9 6 85,0 Correlação • A correlação é uma técnica estatística que mostrará de que forma os pares de variáveis estão fortemente relacionados. • Por exemplo , a altura e o peso estão relacionados pois as pessoas mais altas tendem a ser mais pesadas do que as mais baixas. • A ligação não é perfeita. As pessoas de altura equivalente variam em peso, mas expressa uma tendência. 9 Correlação • Uma estimativa = 1.0 é uma conexão positiva ideal entre as duas variáveis. Para um incremento positivo em uma variável, há também um incremento positivo na outra. • Uma estimativa = – 1.0 existe uma conexão negativa ideal entre as duas variáveis. Os fatores se movem de forma inversa – para um incremento positivo em uma variável, há uma redução na variável subsequente. • Na hipótese remota de que a conexão entre dois fatores é 0, não há conexão entre eles. Correlação • O coeficiente de correlação de Pearson: também chamado de correlação linear ou r de Pearson, é um grau de relação entre duas variáveis quantitativas e exprime o grau de correlação através de valores situados entre -1 e 1. • • O coeficiente de correlação de postos de Spearman: denominado pela letra grega rho (ρ), é uma medida de correlação não paramétrica também avaliado no intervalo entre -1 e 1. Não exige a suposição de que a relação entre as variáveis seja linear, nem requer que as mesmas sejam quantitativas Correlação • Comparando os dois métodos: Avaliação 13 Coeficiente de Determinação Para regressão linear → Outras técnicas de regressão • Máquinas de Vector de Suport - Support Vector Regression (SVR) • Rede Neural • Árvores • Random Forest • Regressão linear 14 Dúvidas? Profa. Rafaella Nascimento rafaellalnascimento@fac.pe.senac.br