Buscar

Estatística - Poli - Aulas 22, 23 e 24 Correlação e Regressão

Prévia do material em texto

Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Aulas 22, 23 e 24
Correlação e Regressão
Profs.
Fernando Tobal Berssaneti
André Leme Fleury
Renato de Oliveira Moraes
Leandro Alves Patah
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
• Coeficiente de Correlação
• Método dos Mínimos Quadrados
Regressão
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
• Tendência conjunta: o comportamento de uma está vinculado 
ao comportamento da outra
Duas variáveis quantitativas de interesse
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Coeficiente de Correlação de Pearson









n
i i
yy
n
i i
xx
n
i
iixy
yyS
xxS
yyxxS
Onde
1
2
1
2
1
)(
)(
))((
yyxx
xy
SS
S
r
.

CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
:,onde
SS
S
r
YYXX
XY



 

n
yx
yxSXY
.
.
 2
2
n
x
xSXX

 
 2
2
n
y
ySYY

 
CORRELAÇÃO LINEAR
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Coeficiente de Correlação de Pearson
r=1 0<r<1 r≈0
-1<r<0 r=-1
CORRELAÇÃO LINEAR
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
• Equação que relaciona as variáveis de interesse
REGRESSÃO
Regressão
 ),...,,( 21 nxxxfy
Y = variável dependente
X = variável independente
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
• x1, x2, ..., xn são admitidos sem erro;
• y é admitido com erro;
•  ~ N(0; σ²R);
• σ²R = constante;
Hipóteses – Modelo Usual de Regressão
REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Regressão Linear Simples
σ²r
X1 X2 X3
Modelo Teórico
yi = α + βxi + εi
REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Reta teórica
Reta Estimativa
xyi  
bxay ˆ
Coeficiente AngularCoeficiente Linear 
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Método dos Mínimos Quadrados
   2
22
minˆminmin    iiiii bxayyyd
di
A reta de regressão é 
aquela que minimiza a 
soma dos quadrados 
das distâncias di
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
• Sempre há uma reta que representa um conjunto de pontos
• Mas nem sempre esta reta é o melhor modelo
Método dos Mínimos Quadrados
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
   2
22
minˆminmin    iiiii bxayyyd
 





00
22
ii d
b
ed
a
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 







  
 


2
0)(2
02
iiii
ii
iii
ii
xbxayx
xbnay
Assim
bxayx
bxay
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 
 












xbya
S
S
xx
yxx
b
xx
xy
i
ii
2
 
 



 


n
x
xS
n
yx
yxS
Onde
i
ixx
ii
iixy
2
2
.
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Mês Investimento
Vendas
Perdidas
1 130 10,1
2 81 10,5
3 93 11,3
4 113 10,5
5 90 11,6
6 63 12,4
7 55 15
8 102 11,3
9 92 12,4
Mês Investimento Vendas
Perdidas
10 81 12
11 103 10,9
12 90 11,6
13 74 12,4
14 73 13,1
15 102 10,9
16 78 12
17 100 10,5
18 100 10,5
EXEMPLO 01
Obter a reta de regressão pelo método dos mínimos quadrados que relacione o 
investimento feito em publicidade e as vendas perdidas mensais obtidas por uma 
empresa do ramo de confecções.
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Mês Investimento (x)
Vendas
Perdidas
(y)
xi² yi² xiyi
1 130 10,1 16900 102,01 1313
2 81 10,5 6561 110,25 850,5
3 93 11,3 8649 127,69 1050,9
4 113 10,5 12769 110,25 1186,5
5 90 11,6 8100 134,56 1044
6 63 12,4 3969 153,76 781,2
7 55 15 3025 225 825
8 102 11,3 10404 127,69 1152,6
9 92 12,4 8464 153,76 1140,8
10 81 12 6561 144 972
11 103 10,9 10609 118,81 1122,7
12 90 11,6 8100 134,56 1044
13 74 12,4 5476 153,76 917,6
14 73 13,1 5329 171,61 956,3
15 102 10,9 10404 118,81 1111,8
16 78 12 6084 144 936
17 100 10,5 10000 110,25 1050
18 100 10,5 10000 110,25 1050
Total 1620 209 151404 2451,02 18504,9
 
 
 
5604
18
1620
151404
1,305
18
2091620
9,18504
.
2
2
2










 
n
x
xS
n
yx
yxS
i
ixx
ii
iixy
EXEMPLO 01
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 
 












xbya
S
S
xx
yxx
b
xx
xy
i
ii
2
0544,0
5604
1,305



xx
xy
S
S
b
511,16
18
1620
0544,0
18
209
 xbyaEXEMPLO 01
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Reta estimativa de regressão:
xy 0544,0511,16ˆ 
EXEMPLO 01
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Podemos afirmar que o modelo linear é significativo?
Qual o valor esperado de y para um determinado x?
Podemos testar estatisticamente hipóteses sobre os parâmetros da reta de 
Mínimos Quadrados?
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 Conclusão a partir do valor de r:
 Se r próximo de +1, existe forte correlação positiva
 Se r próximo de -1, existe forte correlação negativa
 Estimativa da Reta de Regressão:
 Reta de Regressão:
abxy 
xbya
Sxx
Sxy
b


:queEm
Regressão Linear
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 Possíveis exemplos de 
correlação:
 Correlação positiva
 quando X aumenta, Y 
também aumenta 
x
y
x
y
 Possíveis exemplos de 
correlação:
Correlação negativa
 quando X aumenta, Y 
diminui 
Regressão Linear
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 Possíveis exemplos de correlação:
 Nenhuma correlação
 para cada valor de X, não existe um valor preferencial 
de Y 
x
y
Regressão Linear
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 Na elaboração dos gráficos de correlação é importante utilizar o conceito 
de estratificação
 Isto é, os pares de dados colocados no gráfico devem corresponder a 
um conjunto de dados homogêneos
x
y
Regressão Linear
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti,Fleury, Moraes e Patah PRO 3200 – Estatística 
Os dados da tabela abaixo relacionam a quantidade de recursos humanos 
empregados em um projeto de TI com a quantidade de dias para execução de um 
determinado pacote de atividades do projeto.
Qtde de pessoas 6 7 8 9 10
Tempo para finalizar o 
pacote de atividades 
(dias)
4,62 4,12 3,21 2,86 1,83
4,5 3,88 3,05 2,53 2,02
4,43 4,01 3,16 2,71 2,24
4,81 3,67 3,3 2,62 1,95
Qual a sua conclusão com relação à correlação dos dados? Se eu precisar 
realizar esse pacote de atividades em 4,5 dias, quantos recursos precisarei 
alocar?
EXERCÍCIO 01
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
TESTE PARA O COEFICIENTE DE CORRELAÇÃO
Para um dado valor de r, o qual é um estimador do coeficiente de correlação 
populacional , é possível concluir, a um dado nível de significância , se 
realmente existe correlação linear entre as variáveis
𝐻0: 𝜌 = 0
𝐻1: 𝜌 ≠ 0
𝑡𝑐𝑎𝑙 = 𝑟
𝑛 − 2
1 − 𝑟2 𝑡𝑐𝑟𝑖𝑡 = 𝑡𝑛−2;𝛼 𝑜𝑢 𝛼 2
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Pessoa Altura (cm) Peso (Kg)
1 174 73
2 161 66
3 170 64
4 180 94
5 182 79
6 164 72
7 156 62
8 168 64
9 176 90
10 175 81
Verificar se podemos, ao nível de significância de 5%, concluir a existência de 
correlação positiva entre altura e o peso das pessoas da amostra abaixo. 
EXERCÍCIO 02 (Exemplos págs. 183 e 185 – Costa Neto)
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Distribuições das Estimativas
Intervalos de Confiança
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Testes de Hipóteses Intervalos de Confiança ...
Regressão
Reta teórica
Reta estimativa
'' xy  
'ˆ bxay 
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Variação residual
xx
xy
S
S
b
xbya
bxay


 'ˆ
 
 2



xxS
yxxS
ixx
iixy
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Método dos Mínimos 
Quadrados
Minimizar a variação residual
Variação em torno da reta dos Mínimos Quadrados
di
2
)ˆ(
1
2
2



 
n
yy
S
n
i ii
R
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Estimação dos parâmetros 
a e b
2
...
2
)ˆ(
1
2
2






 
n
bSS
n
yy
S
xyyy
n
i ii
R
   
n
y
yyyS
i
iiyy
2
22 
 
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Variáveis aleatórias, portanto, têm distribuição 
normal com uma média e uma variância.
bxay ˆ
);(~,
);(~


Normalba
Normal

CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Pode-se demonstrar que:
xx
R
S
b
b
²
)²(
)(





 )(b
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
xx
R
S
b
b
Normalb
²
)²(
)(
~





xx
R
S
S
bS
2
2 )( 
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Pode-se demonstrar que:
 )(a
xx
iR
nS
x
a
a
Normala



2
²
)²(
)(
~



CORRELAÇÃO E REGRESSÃO
xx
iR
nS
xS
aS


22
2 )(
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Intervalos de confiança
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
')'ˆ( xy  
'yˆ
'x
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Intervalo de confiança para o coeficiente 
angular da reta (β)
CORRELAÇÃO E REGRESSÃO
)(.2/;2 bStb n  
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Intervalo de confiança para a constante “α”
CORRELAÇÃO E REGRESSÃO
)(.2/;2 aSta n  
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Intervalo de Confiança para 
α+βx’
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Também é uma distribuição Normal
 







 



xx
i
Ri
i
ii
S
xx
n
bxaVar
estimativadaVariância
bxaEstimativa
xy
2
2 1
)(
:
)(


CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Região de confiança de α+βxi
 
)
'1
(.'ˆ
2
2
2/;2
xx
Rn
S
xx
n
Sty

  
CORRELAÇÃO E REGRESSÃO
𝑦′ = 𝑎 + 𝑏𝑥
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Também é uma distribuição Normal
 







 


xx
i
Rii
i
S
xx
n
bxaVar
estimativadaVariância
bxaEstimativa
2
2 11)(
:

CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Região de Previsão para yi = α+βxi+εi
 
xx
Rn
S
xx
n
Sty
2
2/;2
'1
1.'ˆ

  
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Dados os pontos abaixo, a respeito de duas substâncias produzidas durante 
uma reação química.
Construir intervalos de 95% de confiança para o valor médio de y e para 
a previsão y´, quando x=10.
x 1 2 3 4 5 6 7 8
y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0
EXERCÍCIO 03 (Exemplos págs. 192 e 203 – Costa Neto)
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
CORRELAÇÃO E REGRESSÃO
Teste de Hipóteses e Análise de Variância aplicados à Regressão
POPULAÇÃO
AMOSTRA
μ
σ
π
x
S
p
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
xy  
bxay ˆ
Reta teórica
Reta experimental
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
x 1 2 3 4 5 6 7 8
y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0
EXEMPLO 02a (Exemplo pág. 200 – Costa Neto)
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Reta dos Mínimos Quadrados
x 1 2 3 4 5 6 7 8
y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0 xy 2167,01749,0ˆ 
xx
xy
S
S
b
xbya
bxay


ˆ
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 
06,2
8
)2,9(
64,12
42
8
36
204
1,9
8
2,9.36
5,50
2
2



yy
xx
xyS
S
S
xi yi xiyi xi² yi²
1
2
3
4
5
6
7
8
0,5
0,6
0,9
0,8
1,2
1,5
1,7
2,0
0,5
1,2
2,7
3,2
6,0
9,0
11,9
16,0
1
4
9
16
25
36
49
64
0,25
0,36
0,81
0,64
1,44
2,25
2,89
4,00
36 9,2 50,5 204 12,64
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Ao nível de 5% de significância, a reta tem inclinação superior a 0,10?
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 





1,0:
1,0:
1
0


H
H
β
Teste de Hipóteses
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 
0147,0
6
1,9.2167,006,2
2
.
2
2
2 









n
SbS
n
yy
S
xyyyi
R
Variância residual
06,2
42
1,9



yy
xx
xy
S
S
S
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
00035,0
42
01422,0
)(
2
2 
xx
R
S
S
bS
Como já vimos na unidade anterior...
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
24,6
00035,0
1,02167,0
)(
00 






bS
b
S
S
b
t
xx
R
calc

T de Student
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
943,1
24,6
%5;6;2 

 ttt
t
ncrit
calc

1,943
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 





1,0:
1,0:
1
0


H
H
β > 0,10
Como tcalc > tcrít
Rejeito H0  a inclinação da reta é maior que 0,10
EXEMPLO 02a
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
xy  
Ao nível de 5% de significância, a reta passa pela origem?
α = 0
EXEMPLO 02b (Exemplo pág. 200 – Costa Neto)
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 





0:
0:
1
0


H
H

Teste de Hipóteses
EXEMPLO 02b
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
0089,0
42.8
204.0147,0
)²(
854,1
0089,0
01749,0
)(
22
0







xx
iR
calc
nS
xS
aS
Onde
aS
a
t

T de Student
EXEMPLO 02b
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
447,2
854,1
%5,2;62/;2 

 ttt
t
ncrit
calc
T de Student
Continua válida a hipótese de que a reta 
passa pela origem!
EXEMPLO 02b
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Verificar a validade do 
modelo de regressão
Análise de Variância aplicada à Regressão
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
     222 ˆˆ   yyyyyyS iiyy
Graus de 
Liberdade
SQT = SQR + SQE
n - 1 = n - 2 + 1
Fonte de 
Variação
x
y
y^
_
SQR
SQE
SQT
y
ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
80
82
84
86
1 2 3 4 5 6
y ymédio
 2
: totalVariação
 

yyS
yy
iyy
i
SQT = SQR + SQE
Fonte de 
Variação
     222 ˆˆ   yyyyyyS iiyyANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
80
82
84
86
1 2 3 4 5 6
y f(x)
 
  2
:explicada não Variação
ˆ
 

xfy
xfyyy
i
ii
SQT = SQR + SQE
Fonte de 
Variação
     222 ˆˆ   yyyyyyS iiyyANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
80
82
84
86
0 1 2 3 4 5 6
ymédio f(x)
 
  2
:regressão pela explicada Variação
ˆ
 

yxf
yxfyy
SQT = SQR + SQE
Fonte de 
Variação
     222 ˆˆ   yyyyyyS iiyyANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 
 
  xxyyi
xyxx
yyi
SbSSQESQTyySQR
bSSbyySQE
SyySQT
22
22
2
ˆ
ˆ






     222 ˆˆ   yyyyyyS iiyy
SQT = SQR + SQE
Fonte de 
Variação
ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 
11
2
2






n
S
n
yy
S
yyi
Y
 
2
².
2
ˆ
2
2







n
SbS
n
yy
S
xxyyi
R
Variância Total
Variância Residual
ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Fonte de 
Variação
Soma de 
Quadrados
Graus de 
Liberdade
Quadrado
Médio
F F
Regressão 1
Residual
Total
2n
1n
xxSb .
2
2
².


n
SbS xxyy
R
xx
S
Sb
F
2
2.
 ;2;1 nF
SQT = SQR + SQE
xxSbSQE .
2
xxyy SbS
SQR
.2

yySSQT 
Se Fcalc > Fcrít
Há evidências para 
validar a regressão
ANÁLISE DE VARIÂNCIA APLICADA À REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Coeficiente de Determinação
CORRELAÇÃO E REGRESSÃO
r2 =
SQE
SQT
=
SQT − SQR
SQT
O coeficiente de determinação mede quanto da variação total foi explicada pela 
regressão. No caso da regressão linear. É igual ao coeficiente de correlação ao 
quadrado.
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
ikki Uxxxy   ...2211
i
k
ki Uxxxy   ...221
Regressão Linear Múltipla
Regressão Polinomial
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Regressão Polinomial
CORRELAÇÃO E REGRESSÃO
 𝑦𝑃 = 𝑎 + 𝑏 𝑥 − 𝑥 + c(x − 𝑥)
2
 𝑦𝑖 = 𝑛𝑎 + 𝑐 𝑥𝑖 − 𝑥
2
 𝑥𝑖 − 𝑥 𝑦𝑖 = 𝑏 𝑥𝑖 − 𝑥
2
 𝑥𝑖 − 𝑥
2 𝑦𝑖 = 𝑎 𝑥𝑖 − 𝑥
2 + 𝑐 𝑥𝑖 − 𝑥
4
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
X Y
1 0,5
2 0,6
3 0,9
4 0,8
5 1,2
6 1,5
7 1,7
8 2,0
Ajustar a parábola de mínimos quadrados 
aos dados do quadro ao lado.
EXERCÍCIO 04 (Exemplo pág. 200 – Costa Neto)
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Analise de Melhoria
CORRELAÇÃO E REGRESSÃO
• Sempre é possível encontrar um polinômio de grau n-1 que 
se ajusta aos “n” pontos experimentais
• Sempre é possível buscar equações mais elaboradas até o 
ponto em que a melhoria de ajuste conseguida em relação 
ao modelo anterior seja significativa
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Analise de Melhoria
CORRELAÇÃO E REGRESSÃO
• Primeiramente, deve-se achar a equação da reta de 
regressão
• Depois, deve-se verificar se a adoção de uma parábolatraz 
uma melhoria de ajuste em relação à reta. Se isso ocorrer, 
verifica-se se a cúbica de regressão apresenta melhoria de 
ajuste em relação à parábola, e assim sucessivamente
• Recomenda-se prosseguir até que duas etapas sucessivas 
não tenham produzido melhoria significativa
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Analise de Melhoria
CORRELAÇÃO E REGRESSÃO
A hipótese a ser testada é a de não haver melhoria de ajuste. Essa hipótese 
será testada, de maneira semelhante ao teste da regressão linear, por:
𝐹 =
 𝑦𝑃𝑖 − 𝑦𝑖
2
𝑆𝑃
2
Onde 𝑆𝑃
2 é a estimativa da variância residual em torno da parábola, sendo 
dado por:
𝑆𝑃
2 =
 𝑦𝑖 − 𝑦𝑃𝑖
2
𝑛 − 3
Admitiremos que houve melhoria significativa de ajuste se F > 𝐹1, 𝑛−3;𝛼
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
CORRELAÇÃO E REGRESSÃO
 𝑦𝑖 − 𝑦𝑖
2 = 𝑦𝑃𝑖 − 𝑦𝑖
2
+ 𝑦𝑖 − 𝑦𝑃𝑖
2
Graus de 
Liberdade
n - 2 = 1 + n - 3
Onde 𝑦𝑃𝑖 são os valores calculados pela parábola 
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Fonte de 
Variação
Soma de 
Quadrados
G.L. Quadrado Médio F F
Melhoria 
de ajuste
 𝑦𝑃𝑖 − 𝑦𝑖
2
1 𝑦𝑃𝑖 − 𝑦𝑖
2
𝐹 =
 𝑦𝑃𝑖 − 𝑦𝑖
2
𝑆𝑃
2
𝐹1,𝑛−3; 𝛼
Residual s/ 
a parábola
 𝑦𝑖 − 𝑦𝑃𝑖
2
n-3 𝑆𝑃
2 =
 𝑦𝑖 − 𝑦𝑃𝑖
2
𝑛 − 3
Residual s/ 
a reta
𝑆𝑦𝑦 − 𝑏
2𝑆𝑥𝑥 n-2
CORRELAÇÃO E REGRESSÃO
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
 𝑦𝑃 = 0,408 + 0,0772x + 0,0155𝑥
2
Testar se a parábola de mínimos quadrados obtida anteriormente oferece 
uma representação do fenômeno significativamente melhor que a reta, 
para os dados do exemplo apresentado anteriormente.
𝑥𝑖 𝑦𝑖
1 0,5
2 0,6
3 0,9
4 0,8
5 1,2
6 1,5
7 1,7
8 2
𝑛 =
𝑆𝑦𝑦 =
𝑆𝑥𝑥 =
 𝑦𝑖 =
𝑏 =
 𝑥 =
EXERCÍCIO 05 (Exemplo pág. 218 – Costa Neto)
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
𝑥𝑖 𝑦𝑖 𝑦𝑃𝑖 𝑦𝑖 − 𝑦𝑃𝑖 (𝑦𝑖 − 𝑦𝑃𝑖)
2
1 0,5
2 0,6
3 0,9
4 0,8
5 1,2
6 1,5
7 1,7
8 2
SQRp =
EXERCÍCIO 05
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Fonte de 
Variação
Soma de 
Quadrados
G.L. Quadrado Médio F F
Melhoria 
de ajuste
 𝑦𝑃𝑖 − 𝑦𝑖
2
1 𝐹1,𝑛−3; 𝛼
Residual s/ 
a parábola
 𝑦𝑖 − 𝑦𝑃𝑖
2
n-3
Residual s/ 
a reta
𝑆𝑦𝑦 − 𝑏
2𝑆𝑥𝑥 n-2
EXERCÍCIO 05
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Os dados da tabela ao lado correspondem
às variáveis gasto com alimentação (y) e
renda familiar (x), numa amostra de 10
famílias. Ao analisar o diagrama de
dispersão, ficou claro que o modelo linear
(reta) não é adequado à representação de
y em função de x. Porém, não está claro
qual dos dois modelos é preferível: uma
parábola quadrática ou uma parábola
cúbica.
X Y
3 1,5
5 3
10 6
20 10
30 15
50 20
70 25
100 30
150 40
200 46
EXERCÍCIO 06
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Após encontradas as equações para a parábola quadrática e
para a parábola cúbica, foram calculados os resíduos para estes
dois modelos.
y x
𝑦𝑖 − 𝑦𝑃𝑖
quadratico
𝑦𝑖 − 𝑦𝑃𝑖
cubico
1,5 3 -1,72 -0,87
3 5 -0,96 -0,31
6 10 0,21 0,42
10 20 0,66 0,22
15 30 2,28 1,42
20 50 1,00 -0,07
25 70 0,37 -0,31
30 100 -1,85 -1,37
40 150 -0,63 1,20
46 200 0,65 -0,33
a) Que modelo é mais adequado:
quadrático ou cúbico? Usar
alfa=5%.
b) Qual o valor do coeficiente de
determinação (r2) para o modelo
quadrático? E para o cúbico?
c) Qual a estimativa de gasto com
alimentação para uma família que
tem renda de 1000?
EXERCÍCIO 06
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
y x
𝑦𝑖 − 𝑦𝑃𝑖
quadratico
𝑦𝑖 − 𝑦𝑃𝑖
cubico
𝑦𝑖 − 𝑦𝑃𝑖
2
quadatico
𝑦𝑖 − 𝑦𝑃𝑖
2
Cubico
1,5 3 -1,72 -0,87
3 5 -0,96 -0,31
6 10 0,21 0,42
10 20 0,66 0,22
15 30 2,28 1,42
20 50 1,00 -0,07
25 70 0,37 -0,31
30 100 -1,85 -1,37
40 150 -0,63 1,20
46 200 0,65 -0,33
SQRq = SQRc = SQT = (yi− y
2
=
EXERCÍCIO 06
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Fonte 
variação
SQ GL QM Fcal Fcrit
Melhoria
Residual 
para a cúbica
Residual 
para a 
parábola
EXERCÍCIO 06
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística
Profs. Berssaneti, Fleury, Moraes e Patah PRO 3200 – Estatística 
Não se pode afirmar nada.
SQT = (yi− y)
2 = 2152,025
R2q =
SQT − SQRq
SQT
=
2152,025 − 14,9369
2152,025
= 0,9931
R2c =
SQT − SQRc
SQT
=
2152,025 − 6,621
2152,025
= 𝟎, 𝟗𝟗𝟔𝟗
EXERCÍCIO 06

Continue navegando