Buscar

ANÁLISE REGRESSÃO LINEAR SIMPLES resumo

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

1 
ANÁLISE DE REGRESSÃO LINEAR 
Prof. Jorge Mattar Neto jmattar@up.edu.br 
É a técnica utilizada para medir ou 
estimar, através de equações 
Matemáticas as relações entre variáveis. 
INTRODUÇÃO A ANÁLISE DE REGRESÃO 
Análise de regressão é usada para: 
• Prever o valor de uma variável dependente com base 
no valor de pelo menos uma variável independente. 
• Explicar o impacto das alterações em uma variável 
independente sobre a variável dependente. 
• Variável dependente: a variável que queremos 
explicar. 
• Variável independente: a variável usada para 
explicar a variávelde pendente. 
RELAÇÃO ENTRE DUAS VARIÁVEIS 
Parte-se do princípio que existe uma relação de 
casualidade entre X e Y. 
VARIÁVEL INDEPENDENTE (x) VARIÁVEL DEPENDENTE (Y) 
RENDA (R$) X CONSUMO (R$) 
ÁREA CONSTRUÍDA (m²) X PREÇO DO IMÓVEL (R$) 
TEMPERATURA DO FORNO (ºC) X 
RESISTÊNCIA MECÂNICA DA 
CERÂMICA (Mpa) 
MEMÓRIA RAM DO 
COMPUTADOR (Gb) 
X 
TEMPO DE RESPOSTA DO 
SISTEMA (s) 
HORAS DE ESTUDO X NOTA NA AVALIAÇÃO 
Que tipo de relação existe entre as duas variáveis? 
MODELO DE REGRESSÃO LINEAR SIMPLES 
Apenas uma variável independente, x. 
• A relação entre x e y é descrita por uma 
função linear. 
• Alterações em y supõe-se serem causadas 
por alterações em x. 
TIPOS DE MODELOS DE REGRESSÃO 
0
10
20
30
40
50
0 5 10 15 20 25
relação linear positiva 
-50
-40
-30
-20
-10
0
0 5 10 15 20 25
relação linear negativa 
2,001
2,002
2,003
2,004
2,005
2,006
2,007
2,008
0 5 10 15 20 25
relação não linear 
0
2
4
6
8
10
0 5 10 15 20 25
nenhuma relação 
O Modelo de Regressão Linear Populacional 
 
 y = β0 + β1 x + ε 
 
Componente de 
erro aleatório 
Intercepto 
populacional 
Coeficiente 
de inclinação 
populacional 
Termo de 
erro aleatório, 
ou residual 
Variável 
independente 
Variável 
dependente 
Componente linear 
2 
Hipóteses do modelo de regressão linear 
• Os erros (ε) são estatisticamente independentes; 
• Os erros são normalmente distribuídos para 
qualquer determinado valor de x; 
• A distribuição de probabilidade dos erros é 
normal; 
• A distribuição de probabilidade dos erros tem 
variância constante; 
• A relação entre x e y é linear. 
O Modelo de Regressão Linear 
x 
y 
xi 
Valor previsto 
de y para xi 
Valor observado 
 de y para xi 
intercepto= 0 
 i 
inclinação= 1 
Erro aleatório 
para este 
valor de x 
 y = β0 + β1 x + ε 
O Modelo de Regressão estimado 
Variável 
independente 
A regressão com base na amostra fornece uma 
estimativa da reta de regressão da população. 
Estimativa do 
intercepto da 
regressão 
Estimativa da 
inclinação da 
regressão 
Valor estimado 
 de Y 
Os erros aleatórios ei têm média igual a zero 
Método dos mínimos quadrados 
• b0 e b1 são obtidos encontrando-se os valores de b0 e b1 
que minimize a soma dos quadrados dos resíduos. 
• As fórmulas para b1 e b0 são: 
As equações de mínimos quadrados: 
 A equação é do tipo: 
• b1 é a variação estimada no valor médio de y 
 como resultado de uma unidade de variação de x. 
• b0 é o valor médio estimado de y quando o valor 
 de x é zero. 
EQUAÇÃO DE REGRESSÃO 
REGRESSÃO LINEAR 
Equação Geral de ajustamento: 
CÁLCULO DOS COEFICIENTES DA RETA: 
x 
 y 
 
3 
X(%) Y(octana
gem) 
1 80,5 
2 81,6 
3 82,1 
4 83,7 
5 83,9 
6 85,0 
21 496,8 
Considere um experimento em que se analisa a octanagem da 
gasolina (Y) em função da adição de um novo aditivo (X). Para isso 
foram realizados ensaios com percentuais de 1, 2, 3, 4, 5 e 6% de 
aditivos. Os resultados são mostrados na tabela abaixo: 
Determine um modelo de regressão 
que permita predizer o índice de 
octanagem da gasolina(Y) a partir de 
uma quantidade do novo aditivo(X). 
EXEMPLO 
X(%) Y(octanagem) 
1 80,5 
2 81,6 
3 82,1 
4 83,7 
5 83,9 
6 85,0 
21 496,8 
EXEMPLO - Resolução 
X.Y 
 
X² 
80,50 1,00 
163,20 4,00 
246,30 9,00 
334,80 16,00 
419,50 25,00 
510,00 36,00 
1.754,30 91,00 
y = 0,8857x + 79,7 
80,00
80,50
81,00
81,50
82,00
82,50
83,00
83,50
84,00
84,50
85,00
85,50
0,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00
ín
d
ic
e
 d
e
 o
c
ta
n
ag
e
m
 
quantidade de aditivo(%) 
Diagrama de dispersão e reta de regressão 
ajustada 
• O modelo nos permite predizer o índice de octanagem da gasolina; se 
adicionarmos 5,5% de aditivo, espera-se que o índice de octanagem seja 
84,57.(y = 79,7 + 0,886.5,5 = 84,57) 
• O coeficiente b1, fornece uma estimativa da variação esperada de Y, 
neste caso, a cada 1% a mais do novo aditivo, esperamos um aumento 
de 0,886 no índice de octanagem. 
Propriedades da regressão de mínimos quadrados 
Variação explicada e não explicada 
Variação 
 total 
Variação explicada 
pela regressão 
Variação não explicada 
Pela regressão (residual) 
Variação explicada e não explicada 
• VT = soma de quadrados total. 
 Mede a variação dos valores de yi em torno de sua 
 média. 
• VR = soma dos quadrados dos erros. 
 Variação atribuída a outros fatores não explicados pela 
 relação entre x e y. 
• VE = soma de quadrados da regressão. 
 Variação explicada pela regressão linear entre x e y. 
4 
Variação explicada e não explicada Coeficiente de determinação – R² 
• O coeficiente de determinação é a parcela da variação 
de Y explicada pela variação de X. 
 
• O coeficiente de determinação também chamado de R-
quadrado e representado por R² . 
onde 
Exemplos de valores aproximados de R² Exemplos de valores aproximados de R² 
x yi y 
 
 y^ y -y 
 
 
 
 (y -y)² 
 
 
1,00 80,50 82,8 
2,00 81,60 82,8 
3,00 82,10 82,8 
4,00 83,70 82,8 
5,00 83,90 82,8 
6,00 85,00 82,8 
21,00 496,80 soma dos quadrados: 
Coeficiente de determinação: R² = 13,73 = 0,975 = 97,5% 
 14,08 
• A variância da octanagem da gasolina é explicada, em parte, pela 
variação da quantidade de aditivo, 97,5% de explicação e em 
parte devido a outros fatores intervenientes no processo. 
Exemplo – continuação 
 
 y^ 
80,59 
81,47 
82,36 
83,24 
84,13 
85,01 
y -y 
-2,30 
-1,20 
-0,70 
0,90 
1,10 
2,20 
 
-0,09 
0,13 
-0,26 
0,46 
-0,23 
-0,01 
 
-2,21 
-1,33 
-0,44 
0,44 
1,33 
2,21 
(y -y)² 
 
 
5,29 0,01 4,90 
1,44 0,02 1,77 
0,49 0,07 0,19 
0,81 0,21 0,19 
1,21 0,05 1,77 
4,84 0,00 4,90 
14,08 0,35 13,73 
VE VT 
xi yi 
 
 
1,00 80,50 
2,00 81,60 
3,00 82,10 
4,00 83,70 
5,00 83,90 
6,00 85,00 
21,00 496,80 : 
Coeficiente de determinação: 
VT = 41.149,12 – 496,8² = 41.149,12 – 41.135,04 = 14,08 
 6 
Exemplo – PROCESSO SIMPLIFICADO DE CÁLCULO 
 
xi. yi 
80,50 
163,20 
246,30 
334,80 
416,50 
510,00 
1754,30 
yi² 
6480,25 
6658,56 
6740,41 
7005,69 
7039,21 
7225,00 
41149,12 
𝑽𝑻 = 𝒚²𝒊 −
 𝒚𝒊 ²
𝒏
 
𝑽𝑬 = 𝒃𝟏 𝒙𝒊𝒚𝒊 −
 𝒙𝒊 𝒚𝒊
𝒏
 
𝒚 = 𝟕𝟗, 𝟕 + 𝟎, 𝟖𝟖𝟔 ∙ 𝐱 
VE = (0,886) 1.754,30 – 21 ∙ 496,8 = 13,73 
 6 
 
𝐕𝐑 = 𝐕𝐓 − 𝐕𝐄 
R² = 13,73 = 0,975 = 97,5% 
 14,08 
5 
Uma fábrica esta interessada emestimar sua demanda 
para o mês de setembro. Os dados da fábrica estão 
apresentados na tabela a seguir: 
a) Qual a equação da reta ajustada? 
b) Estimar a demanda para setembro com base na 
equação de regressão linear. 
EXEMPLO 2 
MÊS MAR ABR MAI JUN JUL AGO 
DEMANDA 3 6 5 7 8 6 
RESOLUÇÃO 
MESES X Y X.Y X² Y² 
MAR 1 3 
ABR 2 6 
MAI 3 5 
JUN 4 7 
JUL 5 8 
AGO 6 6 
MESES X Y X.Y X² Y² 
MAR 1 3 3 1 9 
ABR 2 6 12 4 36 
MAI 3 5 15 9 25 
JUN 4 7 28 16 49 
JUL 5 8 40 25 64 
AGO 6 6 36 36 36 
21 35 134 91 219 
b1 = n x y – x y 
 n x² – ( x)² 
 b0 = y – m  x 
 n 
Σ x = 21; Σ x² = 91; Σ y = 35; Σ y² = 219 Σ x.y = 134. 
b1 = .6 134 – 21 35 = 0,657 
 6  91 – (21)². 
b0 = .35 – (0,657) 21 = 3,53 
 6 
Dados: 
Cálculo do coeficiente angular: 
Cálculo do coeficiente linear: 
Equação da reta: 
y = 3,53 + 0,657 x 
a) Qual a equação da reta ajustada? 
 
 
b) Estimar a demanda para setembro com base 
na equação de regressão linear. 
Equação da reta y = 3,53 + 0,657 x 
Equação da reta y = 3,53 + 0,657  x 
P/ x = 7(setembro), teremos: 
y = 3,53 + 0,657(7) 
y = 8,13. 
EXEMPLO 3 
A tabela seguinte registra uma amostra extraída dos 
registros de uma rede de lojas, com os valores de 
investimentos em Propaganda e Vendas em mil 
reais. 
. 
PROPAGANDA 28 20 33 39 37 22 18 11 36 
VENDAS 130 66 160 180 150 151 52 66 200 
EXEMPLO 3 
a) Construir o gráfico de dispersão. A tendência parece 
 linear? 
b) Estime a reta de regressão das vendas em função do 
 investimento em propaganda. 
c) Qual seria a previsão de vendas para um investimento 
 de R$40.000,00 em propaganda? 
d) Qual seria o investimento em propaganda para 
 assegurar vendas de R$190.000,00 
6 
RESOLUÇÃO: 
 Investimento x Vendas 
X 
(investimento) 
Y 
(vendas) 
X.Y X² Y² 
28 130 3640 784 16900 
20 66 1320 400 4356 
33 160 5280 1089 25600 
39 180 7020 1521 32400 
37 150 5550 1369 22500 
22 151 3322 484 22801 
18 52 936 324 2704 
11 66 726 121 4356 
36 200 7200 1296 40000 
244 1155 34994 7388 171617 
0
50
100
150
200
250
0 5 10 15 20 25 30 35 40 45
V
en
d
as
 -
 e
m
 m
il
 r
ea
is
 
Investimentos- em mil reais 
Investimento X Vendas 
b1 = n  x.y – x  y 
 n x² – ( x)² 
 b0 = y – m x 
 n 
Σ x = 244; Σ x² = 7388; Σ y = 1155; Σ y² = 171617 Σ x.y = 34994. 
b1 = 934994 – 244  1155 = 4,7622 
 97388 – (244)². 
b0 = 1155 – (4,7622)  244 = – 0 ,7752 
 9 
Dados: 
Cálculo do coeficiente angular: 
Cálculo do coeficiente linear: 
Equação da reta: y = – 0 ,7752+ 4,7622  x 
b) Estime a reta de regressão das vendas em função do 
 investimento em propaganda. 
y = – 0,7752 + 4,7622  40 
y (vendas) = – 0 ,7752+ 4,7622 x (investimento) 
c) Qual seria a previsão de vendas para um investimento de 
 R$40.000,00 em propaganda? 
y = – 0,7752 + 190,488 
y40 = 189,71 = R$189.710,00 
190 = – 0,7752 + 4,7622 x 
y (vendas) = – 0 ,7752+ 4,7622  x (investimento) 
190 + 0,7752 = 4,7622 x 
x = 190,7752 / 4,7622 
d) Qual seria o investimento em propaganda para 
 assegurar vendas de R$190.000,00 
x = 40,06 = R$40.060,00

Outros materiais