Buscar

Regressão Linear

Prévia do material em texto

Prof. Msc. Luciano Melo
ESTATÍSTICA – CORRELAÇÃO E REGRESSÃO LINEAR
CORRELAÇÃO LINEAR
Em estatística descritiva, o coeficiente de correlação de Pearson,
também chamado de "coeficiente de correlação produto-momento" ou
simplesmente de " de Pearson" mede o grau da correlação (e a direção
dessa correlação - se positiva ou negativa) entre duas variáveis
de escala métrica (intervalar ou de razão). Este coeficiente, normalmente
representado por assume apenas valores entre -1 e 1.
• Se ρ=1, significa uma correlação perfeita positiva entre as duas
variáveis.
• Se ρ=-1 significa uma correlação negativa perfeita entre as duas
variáveis - Isto é, se uma aumenta, a outra sempre diminui.
• Se ρ=0, significa que as duas variáveis não dependem linearmente
uma da outra.
No entanto, pode existir uma dependência não linear. Assim, o
resultado deve ser investigado por outros meios. Aqui vamos explorar a
penas a correlação linear.
CORRELAÇÃO LINEAR
Uma empresa compra de um fornecedor, "produtos
descartáveis para o consumo mensal" de seus funcionários. As
quantidades e os custos destes produtos estão expressos na
tabela a seguir. Construa um diagrama de dispersão,(gráfico
de nuvem) e obtenha a reta regressão (ajustada) para esta
situação. Calcule o valor para uma quantidade estimada em
50 unidades do produto.
Quantidades(x) 10 11 12 13 14 15 18 20
Custos(Y) 80 92 100 120 135 142 150 158
Gráfico e equação da reta regressão
y = 7,8658x + 11,021
R² = 0,8839
0
20
40
60
80
100
120
140
160
180
0 5 10 15 20 25
C
U
S
TO
S
QUANTIDADES
CONSUMO DE PRODUTOS DESCARTÁVEIS 
EMPRESA ALFA MAR/2013
Gráfico em nuvem
No gráfico de nuvem, devem aparecer somente os pontos! A reta
ajustada é traçada ao final. Para traçar a reta, é necessário considerar
valores arbitrário para "x" na equação e obter "y".
Neste caso, se x=0 , teremos y=11 / Se x=10, teremos y=78.
Com estes pontos que podemos chamar de A(0; 11) e B(10,78), traçamos
a reta ajustada. Da geometria analítica, temos um postulado que diz "dois
pontos determinam uma reta". Assim, os valores indicados para "x" na
equação devem ser convenientes...dependendo dos valores das
variáveis.
Importante: Não é possível determinar a equação da reta
(regressão)diretamente pelo modo clássico! As variáveis tem relação
estatística entre si, não são, portanto, meras relações funcionais.
Passos para obter a equação...
1. Monte a tabela para obter os somatórios com os valores dados no problema.
2. Obtenha os somatórios no final de cada coluna.
3. Determine incialmente as médias para as variáveis "x e "y".
4. Determine o valor do coeficiente "a" usando a fórmula.
5. Determine o valor de "b" apenas substituindo os valores de "x" ; "y" e "a" na fórmula da
equação da reta de regressão.
6. Trace os pontos no gráfico "x" e "y" obtendo a nuvem. Neste caso use os dados do
problema inicial.
7. Por último trace a reta ajustada, após obter os dois pontos A e B, com valores
arbitrários.
8. Finalmente, obtenha o valor para a quantidade desejada substituindo-o na equação
final da reta de regressão.
Cálculos para obtenção da equação
X Y X.Y X.X
10 80 800 100
11 92 1012 121
12 100 1200 144
13 120 1560 169
14 135 1890 196
15 142 2130 225
18 150 2700 324
20 158 3160 400
113 977 14452 1679
Total
médias
n
y
y
n
x
x ;12,122
8
977
;12,14
8
113




 87,7
)113()1679.(8
977.113)452.14.(8
)(
..
222







xxn
yxyxn
a
1112,14).87,7(12,122  bxayb
11.87,7.  xbxaY
Coeficiente correlação
X Y X.Y X.X Y.Y
10 80 800 100 6400
11 92 1012 121 8464
12 100 1200 144 10000
13 120 1560 169 14400
14 135 1890 196 18225
15 142 2130 225 20164
18 150 2700 324 22500
20 158 3160 400 24964
113 977 14452 1679 125117
Total
Esta tabela é a mesma da questão
anterior, basta acrescentar a coluna
Y.Y.
OBS: nesta parte do cálculo, não há
gráficos!
A fórmula para o cálculo de "r" sofre
uma modificação no denominador...
Veja a raiz quadrada!
Cálculo e análise de r...
22
2222
)977()125117.(8].[)113()1679.(8[
)977.(113)14452.(8
])(.].[)([
..






yynxxn
yxyxn
r
94,0
88,5546
5215
30767841
5215
r
Nota: Este resultado indica uma forte correlação entre as
variáveis quantidade e custo. O resultado 0,94 pode ser
multiplicado por 100 para exibir a porcentagem, portanto, 94%.

Continue navegando