Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 ANÁLISE DE REGRESSÃO LINEAR Prof. Jorge Mattar Neto jmattar@up.edu.br É a técnica utilizada para medir ou estimar, através de equações Matemáticas as relações entre variáveis. INTRODUÇÃO A ANÁLISE DE REGRESÃO Análise de regressão é usada para: • Prever o valor de uma variável dependente com base no valor de pelo menos uma variável independente. • Explicar o impacto das alterações em uma variável independente sobre a variável dependente. • Variável dependente: a variável que queremos explicar. • Variável independente: a variável usada para explicar a variávelde pendente. RELAÇÃO ENTRE DUAS VARIÁVEIS Parte-se do princípio que existe uma relação de casualidade entre X e Y. VARIÁVEL INDEPENDENTE (x) VARIÁVEL DEPENDENTE (Y) RENDA (R$) X CONSUMO (R$) ÁREA CONSTRUÍDA (m²) X PREÇO DO IMÓVEL (R$) TEMPERATURA DO FORNO (ºC) X RESISTÊNCIA MECÂNICA DA CERÂMICA (Mpa) MEMÓRIA RAM DO COMPUTADOR (Gb) X TEMPO DE RESPOSTA DO SISTEMA (s) HORAS DE ESTUDO X NOTA NA AVALIAÇÃO Que tipo de relação existe entre as duas variáveis? MODELO DE REGRESSÃO LINEAR SIMPLES Apenas uma variável independente, x. • A relação entre x e y é descrita por uma função linear. • Alterações em y supõe-se serem causadas por alterações em x. TIPOS DE MODELOS DE REGRESSÃO 0 10 20 30 40 50 0 5 10 15 20 25 relação linear positiva -50 -40 -30 -20 -10 0 0 5 10 15 20 25 relação linear negativa 2,001 2,002 2,003 2,004 2,005 2,006 2,007 2,008 0 5 10 15 20 25 relação não linear 0 2 4 6 8 10 0 5 10 15 20 25 nenhuma relação O Modelo de Regressão Linear Populacional y = β0 + β1 x + ε Componente de erro aleatório Intercepto populacional Coeficiente de inclinação populacional Termo de erro aleatório, ou residual Variável independente Variável dependente Componente linear 2 Hipóteses do modelo de regressão linear • Os erros (ε) são estatisticamente independentes; • Os erros são normalmente distribuídos para qualquer determinado valor de x; • A distribuição de probabilidade dos erros é normal; • A distribuição de probabilidade dos erros tem variância constante; • A relação entre x e y é linear. O Modelo de Regressão Linear x y xi Valor previsto de y para xi Valor observado de y para xi intercepto= 0 i inclinação= 1 Erro aleatório para este valor de x y = β0 + β1 x + ε O Modelo de Regressão estimado Variável independente A regressão com base na amostra fornece uma estimativa da reta de regressão da população. Estimativa do intercepto da regressão Estimativa da inclinação da regressão Valor estimado de Y Os erros aleatórios ei têm média igual a zero Método dos mínimos quadrados • b0 e b1 são obtidos encontrando-se os valores de b0 e b1 que minimize a soma dos quadrados dos resíduos. • As fórmulas para b1 e b0 são: As equações de mínimos quadrados: A equação é do tipo: • b1 é a variação estimada no valor médio de y como resultado de uma unidade de variação de x. • b0 é o valor médio estimado de y quando o valor de x é zero. EQUAÇÃO DE REGRESSÃO REGRESSÃO LINEAR Equação Geral de ajustamento: CÁLCULO DOS COEFICIENTES DA RETA: x y 3 X(%) Y(octana gem) 1 80,5 2 81,6 3 82,1 4 83,7 5 83,9 6 85,0 21 496,8 Considere um experimento em que se analisa a octanagem da gasolina (Y) em função da adição de um novo aditivo (X). Para isso foram realizados ensaios com percentuais de 1, 2, 3, 4, 5 e 6% de aditivos. Os resultados são mostrados na tabela abaixo: Determine um modelo de regressão que permita predizer o índice de octanagem da gasolina(Y) a partir de uma quantidade do novo aditivo(X). EXEMPLO X(%) Y(octanagem) 1 80,5 2 81,6 3 82,1 4 83,7 5 83,9 6 85,0 21 496,8 EXEMPLO - Resolução X.Y X² 80,50 1,00 163,20 4,00 246,30 9,00 334,80 16,00 419,50 25,00 510,00 36,00 1.754,30 91,00 y = 0,8857x + 79,7 80,00 80,50 81,00 81,50 82,00 82,50 83,00 83,50 84,00 84,50 85,00 85,50 0,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 ín d ic e d e o c ta n ag e m quantidade de aditivo(%) Diagrama de dispersão e reta de regressão ajustada • O modelo nos permite predizer o índice de octanagem da gasolina; se adicionarmos 5,5% de aditivo, espera-se que o índice de octanagem seja 84,57.(y = 79,7 + 0,886.5,5 = 84,57) • O coeficiente b1, fornece uma estimativa da variação esperada de Y, neste caso, a cada 1% a mais do novo aditivo, esperamos um aumento de 0,886 no índice de octanagem. Propriedades da regressão de mínimos quadrados Variação explicada e não explicada Variação total Variação explicada pela regressão Variação não explicada Pela regressão (residual) Variação explicada e não explicada • VT = soma de quadrados total. Mede a variação dos valores de yi em torno de sua média. • VR = soma dos quadrados dos erros. Variação atribuída a outros fatores não explicados pela relação entre x e y. • VE = soma de quadrados da regressão. Variação explicada pela regressão linear entre x e y. 4 Variação explicada e não explicada Coeficiente de determinação – R² • O coeficiente de determinação é a parcela da variação de Y explicada pela variação de X. • O coeficiente de determinação também chamado de R- quadrado e representado por R² . onde Exemplos de valores aproximados de R² Exemplos de valores aproximados de R² x yi y y^ y -y (y -y)² 1,00 80,50 82,8 2,00 81,60 82,8 3,00 82,10 82,8 4,00 83,70 82,8 5,00 83,90 82,8 6,00 85,00 82,8 21,00 496,80 soma dos quadrados: Coeficiente de determinação: R² = 13,73 = 0,975 = 97,5% 14,08 • A variância da octanagem da gasolina é explicada, em parte, pela variação da quantidade de aditivo, 97,5% de explicação e em parte devido a outros fatores intervenientes no processo. Exemplo – continuação y^ 80,59 81,47 82,36 83,24 84,13 85,01 y -y -2,30 -1,20 -0,70 0,90 1,10 2,20 -0,09 0,13 -0,26 0,46 -0,23 -0,01 -2,21 -1,33 -0,44 0,44 1,33 2,21 (y -y)² 5,29 0,01 4,90 1,44 0,02 1,77 0,49 0,07 0,19 0,81 0,21 0,19 1,21 0,05 1,77 4,84 0,00 4,90 14,08 0,35 13,73 VE VT xi yi 1,00 80,50 2,00 81,60 3,00 82,10 4,00 83,70 5,00 83,90 6,00 85,00 21,00 496,80 : Coeficiente de determinação: VT = 41.149,12 – 496,8² = 41.149,12 – 41.135,04 = 14,08 6 Exemplo – PROCESSO SIMPLIFICADO DE CÁLCULO xi. yi 80,50 163,20 246,30 334,80 416,50 510,00 1754,30 yi² 6480,25 6658,56 6740,41 7005,69 7039,21 7225,00 41149,12 𝑽𝑻 = 𝒚²𝒊 − 𝒚𝒊 ² 𝒏 𝑽𝑬 = 𝒃𝟏 𝒙𝒊𝒚𝒊 − 𝒙𝒊 𝒚𝒊 𝒏 𝒚 = 𝟕𝟗, 𝟕 + 𝟎, 𝟖𝟖𝟔 ∙ 𝐱 VE = (0,886) 1.754,30 – 21 ∙ 496,8 = 13,73 6 𝐕𝐑 = 𝐕𝐓 − 𝐕𝐄 R² = 13,73 = 0,975 = 97,5% 14,08 5 Uma fábrica esta interessada emestimar sua demanda para o mês de setembro. Os dados da fábrica estão apresentados na tabela a seguir: a) Qual a equação da reta ajustada? b) Estimar a demanda para setembro com base na equação de regressão linear. EXEMPLO 2 MÊS MAR ABR MAI JUN JUL AGO DEMANDA 3 6 5 7 8 6 RESOLUÇÃO MESES X Y X.Y X² Y² MAR 1 3 ABR 2 6 MAI 3 5 JUN 4 7 JUL 5 8 AGO 6 6 MESES X Y X.Y X² Y² MAR 1 3 3 1 9 ABR 2 6 12 4 36 MAI 3 5 15 9 25 JUN 4 7 28 16 49 JUL 5 8 40 25 64 AGO 6 6 36 36 36 21 35 134 91 219 b1 = n x y – x y n x² – ( x)² b0 = y – m x n Σ x = 21; Σ x² = 91; Σ y = 35; Σ y² = 219 Σ x.y = 134. b1 = .6 134 – 21 35 = 0,657 6 91 – (21)². b0 = .35 – (0,657) 21 = 3,53 6 Dados: Cálculo do coeficiente angular: Cálculo do coeficiente linear: Equação da reta: y = 3,53 + 0,657 x a) Qual a equação da reta ajustada? b) Estimar a demanda para setembro com base na equação de regressão linear. Equação da reta y = 3,53 + 0,657 x Equação da reta y = 3,53 + 0,657 x P/ x = 7(setembro), teremos: y = 3,53 + 0,657(7) y = 8,13. EXEMPLO 3 A tabela seguinte registra uma amostra extraída dos registros de uma rede de lojas, com os valores de investimentos em Propaganda e Vendas em mil reais. . PROPAGANDA 28 20 33 39 37 22 18 11 36 VENDAS 130 66 160 180 150 151 52 66 200 EXEMPLO 3 a) Construir o gráfico de dispersão. A tendência parece linear? b) Estime a reta de regressão das vendas em função do investimento em propaganda. c) Qual seria a previsão de vendas para um investimento de R$40.000,00 em propaganda? d) Qual seria o investimento em propaganda para assegurar vendas de R$190.000,00 6 RESOLUÇÃO: Investimento x Vendas X (investimento) Y (vendas) X.Y X² Y² 28 130 3640 784 16900 20 66 1320 400 4356 33 160 5280 1089 25600 39 180 7020 1521 32400 37 150 5550 1369 22500 22 151 3322 484 22801 18 52 936 324 2704 11 66 726 121 4356 36 200 7200 1296 40000 244 1155 34994 7388 171617 0 50 100 150 200 250 0 5 10 15 20 25 30 35 40 45 V en d as - e m m il r ea is Investimentos- em mil reais Investimento X Vendas b1 = n x.y – x y n x² – ( x)² b0 = y – m x n Σ x = 244; Σ x² = 7388; Σ y = 1155; Σ y² = 171617 Σ x.y = 34994. b1 = 934994 – 244 1155 = 4,7622 97388 – (244)². b0 = 1155 – (4,7622) 244 = – 0 ,7752 9 Dados: Cálculo do coeficiente angular: Cálculo do coeficiente linear: Equação da reta: y = – 0 ,7752+ 4,7622 x b) Estime a reta de regressão das vendas em função do investimento em propaganda. y = – 0,7752 + 4,7622 40 y (vendas) = – 0 ,7752+ 4,7622 x (investimento) c) Qual seria a previsão de vendas para um investimento de R$40.000,00 em propaganda? y = – 0,7752 + 190,488 y40 = 189,71 = R$189.710,00 190 = – 0,7752 + 4,7622 x y (vendas) = – 0 ,7752+ 4,7622 x (investimento) 190 + 0,7752 = 4,7622 x x = 190,7752 / 4,7622 d) Qual seria o investimento em propaganda para assegurar vendas de R$190.000,00 x = 40,06 = R$40.060,00
Compartilhar