Buscar

Regressão Linear

Prévia do material em texto

1 
 
Regressão Linear Simples 
 
Introdução 
 
O método de regressão linear simples ajusta um modelo matemático para relacionar uma variável 
dependente y com outra variável independente x, ambas variáveis numéricas. 
 
Modelo teórico 
Y = � + �X + � 
Onde, 
� = constante que representa o intercepto da reta com o eixo do Y (coeficiente linear) 
� = constante que representa a inclinação da reta (coeficiente angular). Representa o quanto 
será o acréscimo (ou decréscimo) em y para cada aumento de uma unidade em x. 
� = erros aleatórios. Estes erros aleatórios informam que o modelo não é exato, devido à erros 
de medição ou ausência de outras fontes de variabilidade que afetam a resposta y e que não 
estão incluídas no modelo. 
 
Método de mínimos quadrados 
 
O método de mínimos quadrados usa os dados de uma amostra de n pares de valores das 
variáveis para estimar os coeficientes da equação abaixo, cuja reta minimiza as diferenças entre 
a reta e os dados observados na amostra. 
�	 = 
 + �� 
Onde 

 = ��∑ ��� − �∑� ∑����∑��� − �∑��� 	 
 
� = �� − �
�̅� = 	∑�� − �
∑�
� � 
 
Medida da qualidade do ajuste 
 
Coeficiente de determinação 
 
O coeficiente de determinação, R2, mede o percentual de toda a variação na variável resposta 
(Y) que é explicada pelo modelo ajustado. Para regressão linear simples, o R2 é igual ao 
coeficiente de correlação de Pearson elevado ao quadrado. 
 
�� = �����çã"	#�$%�&�'�	$#%"	("'#%"	�)*+,�'"�����çã"	,",�%	�"+	'�'"+ = -�./0
�																	0% ≤ �� ≤ 100% 
 
Quanto maior o valor de R2, melhor será o ajuste do modelo (vamos considerar que R2 > 70% é 
um bom modelo) 
 
2 
 
Exemplo 
A tabela a seguir relaciona a quantidade de clientes com o total das vendas (em mil reais) 
realizadas por uma loja durante um período de dez dias. O objetivo é prever o total das vendas 
com base na quantidade de clientes para os próximos dias. 
 
Tabela 1 
Dias Clientes Venda 
1 12 4.0 
2 20 6.0 
3 11 3.5 
4 22 6.5 
5 15 5.2 
6 18 6.5 
7 12 4.2 
8 16 5.6 
9 14 5.5 
10 10 3.0 
 
A nossa variável dependente y será o as vendas e a variável independente x será a quantidade 
de clientes. 
 
Y = vendas 
 
X = Clientes 
 
 
3 
 
Passo-a-passo para o ajuste da equação linear 
 
Usando	as	fórmulas:							
 = ��∑ ��� − �∑ �∑ ����∑ �2� − �∑ ��2 					e							� =
∑ �
� − �
∑ �
� � 
 
Vamos precisar dos somatórios ∑�� ,∑� , ∑ �� , ∑ � e	∑�� 
 
Considerando a tabela 2, vamos seguir os passos abaixo: 
 
Passo 1) Digite os dados das variáveis X e Y nas colunas (1) e (2); 
 
Passo 2) Calcule o produto na coluna (3) = (1) x (2); 
 
�� 
12 x 4 = 48 
... 
10 x 3 = 30 
 
Passo 3) Calcule os valores de X ao quadrado na coluna (4) e de Y ao quadrado na coluna (5); 
 
�� �� 
122 = 144 42 = 16 
... ... 
102 = 100 32 = 9 
 
Passo 4) Obtenha os somatórios das colunas (1), (2), (3), (4) e (5) 
 
 ∑�� = 791.5,			 ∑ � = 150, ∑ �� = 2394, ∑� = 50				e	 ∑ �� = 264.04 
 
Passo 5) Calcule o coeficiente angular b 
 

 = ��∑��� − �∑ � ∑����∑ ��� − �∑ ��� =
10�791.5� − �150 ∙ 50�
10�2394� − �150�� = 0,2882							(�%	�#�%/&%�#�,# 
 
Passo 6) Calcule o coeficiente linear a 
 
(é'��	'#	Y:			�� = ∑�� =
50
10 = 5											(é'��	'#	X:			�̅ =
∑ �
� =
150
10 = 15 
 � = �� − �
�̅� = 5 − �0,2882 ∙ 15� = 0,677							(�%	�#�% 
 
Passo 7) Escreva o modelo ajustado 
 �P = � + 
� = 0,677 + 0,2882� 
ou 
Q#�'�+ = 0,677 + 0,2882 ∙ &%�#�,#+ 
4 
 
 
Passo 8) Interprete o modelo obtido e faça as previsões (se necessário) 
 
Retirando a parte fixa que não depende da quantidade de clientes, as vendas diária irá aumentar 
288,2 reais ( = 0,2882 x 1000) para cada cliente a mais. 
 
Passo 9) Avalie a qualidade do ajuste usando o coeficiente de determinação R2 
 
Calcule o coeficiente de correlação de Pearson 
 
�./ = ��∑��� − �∑ � ∙ ∑��R��∑ ��� − �∑ ��� ∙ R��∑��� − �∑��� =	 
 
�./ = 10�791.5� − �150 ∙ 50�R10�2394� − �150�� ∙ R10�264.04� − �50�� =
415
√1440 ∙ √140.4 = 0,92 
 
Calcule o coeficiente de determinação R2 
 
�� = -�./0� = �0,92�� = 0,85			"*	85% 
Cerca de 85% de da variação no volume de vendas é explicada pelo modelo ajustado. Podemos 
considerar que o modelo é bom para se fazer predições. 
 
 
 
 
Tabela 2 
 
(1) 
x 
(2) 
y 
(3) �� (4) �� (5) �� 
 12 4.0 48 144 16 
 20 6.0 120 400 36 
 11 3.5 38.5 121 12.25 
 22 6.5 143 484 42.25 
 15 5.2 78 225 27.04 
 18 6.5 117 324 42.25 
 12 4.2 50.4 144 17.64 
 16 5.6 89.6 256 31.36 
 14 5.5 77 196 30.25 
 10 3.0 30 100 9 
SOMA 150 50 791.5 2394 264.04 
 
 
 
5 
 
Regressão Linear Simples no Excel 2010 
A covariância amostral é obtida no Excel 2010 usando as fórmulas INTERCEPÇÃO(valY ; valX) e 
INCLINAÇÃO(valY ; valX) 
 
 
Regressão Linear Simples usando o R 
1) Baixe e instale o programa R em https://www.r-project.org/ clique em CRAN (no lado 
esquerdo) e escolha qualquer repositório (por exemplo, da Universidade Federal do 
Paraná - http://cran-r.c3sl.ufpr.br/). 
Ou 
2) Use a versão on-line do programa R, disponível em www.r-fiddle.org.

Continue navegando