Buscar

Aula 4. ZAB0262

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
Medidas de Relacionamento 
entre Variáveis 
Introdução 
 Até agora, consideramos sempre a existência de uma única variável 
de interesse. 
 Entretanto, importantes problemas em Estatística envolvem duas ou 
mais variáveis quantitativas. 
Nosso objetivo é apresentar algumas das chamadas MEDIDAS DE 
RELACIONAMENTO, consideradas importantes no campo da 
aplicabilidade prática do nosso dia a dia. 
 Tais medidas servem para: 
(a) Avaliar a possibilidade de associação (linear) entre 
duas ou mais variáveis quantitativas; 
(b) Caracterizar a natureza da associação (linear) . 
Motivação para o estudo 
ALUNO ALTURA (cm) (X) PESO (kg) (Y) 
1 174 73 
2 161 66 
3 170 64 
4 180 94 
5 182 79 
6 164 72 
7 156 62 
8 168 64 
9 176 90 
10 175 81 
Exemplo: Avaliação de altura (cm) e peso (kg) de 10 alunos 
de uma faculdade 
Motivação para o estudo 
Exemplo: Avaliação de altura (cm) e peso (kg) de 10 alunos 
de uma faculdade 
40
50
60
70
80
90
100
150 155 160 165 170 175 180 185
Altura, em cm
Pe
so
, e
m
 k
g
Covariância 
 É uma medida do grau de associação e da forma de 
relacionamento (linear) entre duas variáveis 
quantitativas contínuas. 
1
).().(
),(ˆˆ
11
1
,,




 

n
n
YX
YX
YXvoCS
n
i
i
n
i
in
i
ii
YXYX
1
)()(
),(ˆˆ 1,,





n
YYXX
YXvoCS
i
n
i
i
YXYX
 Conjunto de Dados 
Amostra 
Medidas de Relacionamento 
Covariância 
n
n
YX
YX
YXCov
n
i
i
n
i
in
i
ii
YX
).().(
),(
11
1
,

 



n
YX
YXCov
Yi
n
i
Xi
YX
)()(
),( 1,






 Conjunto de Dados 
População 
Medidas de Relacionamento 
2 
Covariância 
Algumas considerações importantes relacionadas a 
Covariância: 
 Pode assumir qualquer valor entre - a +; 
 Valores positivos: X  e Y  ou X  e Y ; 
 Valores negativos: X  e Y  ou X  e Y . 
 Indica o sentido de variação entre duas variáveis 
quaisquer; 
Medidas de Relacionamento 
ALUNO ALTURA (X) PESO (Y) PRODUTO (X.Y) 
1 174 73 12702 
2 161 66 10626 
3 170 64 10880 
4 180 94 16920 
5 182 79 14378 
6 164 72 11808 
7 156 62 9672 
8 168 64 10752 
9 176 90 15840 
10 175 81 14175 
 1706 745 127753 
 Exemplo de Cálculo da Covariância 
9
127097127753
110
10
)745.1706(
127753
1
).().(
ˆ
11
1
,,









 

n
n
YX
YX
S
n
i
i
n
i
in
i
ii
YXYX kgcmS YXYX .89,72ˆ ,, 
Medidas de Relacionamento 
Coeficiente de Correlação Momento-Produto de Pearson 
 (ou Coeficiente de Correlação Linear) 
YX
XY
YX
SS
S
r
.
, 
 Conjunto de Dados 
Amostra => 
YX
XY
YX 


.
, 
População => 
Também é uma medida do grau de associação e da 
forma de relacionamento (linear) entre duas variáveis 
quantitativas contínuas, com a vantagem de permitir 
“classificação” do grau de associação. 
Medidas de Relacionamento 
Coeficiente de Correlação (Linear) 
Algumas considerações importantes relacionadas ao 
Coeficiente de Correlação: 
 Pode assumir qualquer valor entre -1 a +1; 
 Valores positivos: X  e Y  ou X  e Y ; 
 Valores negativos: X  e Y  ou X  e Y . 
0 1 -1 -0,5 0,5 
Baixa correlação entre X e Y 
Medidas de Relacionamento 
Coeficiente de Correlação (Linear) 
Algumas considerações importantes relacionadas ao 
Coeficiente de Correlação. 
-0,7 0,7 0 1 -1 -0,5 0,5 
Baixa correlação entre X e Y 
Correlação média entre X e Y Alta 
correlação 
Alta 
correlação 
Medidas de Relacionamento 
ALUNO ALTURA(X) QUADRADO 
ALTURA 
PESO QUADRADO 
PESO 
PRODUTO 
1 174 30276 73 5329 12702 
2 161 25921 66 4356 10626 
3 170 28900 64 4096 10880 
4 180 32400 94 8836 16920 
5 182 33124 79 6241 14378 
6 164 26896 72 5184 11808 
7 156 24336 62 3844 9672 
8 168 28224 64 4096 10752 
9 176 30976 90 8100 15840 
10 175 30625 81 6561 14175 
 1706 291678 745 56643 127753 
Exemplo do Cálculo do Coeficiente de Correlação 
Medidas de Relacionamento 
3 
 Exemplo de Cálculo do Coeficiente de Correlação 
YX
YX
SS
YXvoC
r
.
),(ˆ
, 
2
2
2
1
1
2
22
49,70
110
10
)1706(
291678
1
)(
ˆ cm
n
n
X
X
S
n
i
in
i
i
XX 







 

2
2
2
1
1
2
22
72,126
110
10
)745(
56643
1
)(
ˆ kg
n
n
Y
Y
S
n
i
in
i
i
YY 







 

kgcmYXvoCSσ YXYX .89,72),(ˆˆ ,, 
Já calculamos: 
Precisaremos das Variâncias de X e Y: 
Medidas de Relacionamento 
 Cálculo do Coeficiente de Correlação 
YX
XY
YX
SS
S
r
.
, 
222
49,70ˆ cmSσ XX 
222
72,126ˆ kgSσ YY 
kgcmYXvoCSσ YXYX .89,72),(ˆˆ ,, 
Já calculamos: 
cmSσ XX 40,849,70ˆ 
kgSσ YY 26,1172,126ˆ 
77,0771,0
26,11.40,8
89,72
.
, 
YX
XY
YX
SS
S
r
Medidas de Relacionamento 
Motivação para o estudo 
Exemplo: Avaliação de altura (cm) e peso (kg) de 10 alunos de 
uma faculdade 
40
50
60
70
80
90
100
150 155 160 165 170 175 180 185
Altura, em cm
Pe
so
, e
m
 k
g
 Coeficientes de Regressão (Linear) 
 Permite estabelecer uma função de associação entre duas 
variáveis: uma dependente (Y) e outra independente (X) por 
meio de modelo do tipo: 
iebXaY  ieXY  10 
ou 
 Desejamos obter os Coeficientes de Regressão (a e b ou 0 e 
1) com mínimo erro possível, ou seja: ei ter média 0 e 
variância 2e : 
),0(~
2
ei Ne 
Medidas de Relacionamento 
 Coeficientes de Regressão (Linear) 
 Amostra de n pares de valores (x1,y1),(x2,y2),....(xn,yn) 
podemos estabelecer um regressão através do modelo: 
iii ebxay 
 Pressupomos que: 
a. A relação entre as variáveis X e Y é linear; 
b. Os valores da variável X não são sujeitos a erros (são fixos); 
c. A média dos erros é nula, isto é, E( )=0; 
d. A variância do erro é constante, variância residual, Var( )= 2; 
e. Os erros tem distribuição normal, isto é, ; 
f. É nula a correlação entre os erros, para qualquer i≠j. 
),0(~
2
ei Ne 
ie
ie
0),( ji eecorr
Medidas de Relacionamento  Coeficientes de Regressão (Linear) 
 O MMQ consiste em “obter estimativas de a e b que minimizam a soma do 
quadrado dos erros” 
 


n
i
ii bxaySQE
1
2
 Derivamos parcialmente SQE em relação aos parâmetros a e b: 
 Igualamos as derivadas a zero e calculamos os estimadores de e , que 
satisfazem o Sistema de Equações Normais: 
 
  )2(
)2(
1
1
i
n
i
ii
n
i
ii
xbxay
b
SQE
bxay
a
SQE










 

 



n
i
n
i
i
n
i
iii
n
i
i
n
i
i
xbxayx
xbany
1 1
2
1
11
ˆˆ
ˆˆ
aˆ bˆ
4 
 Coeficientes de Regressão (Linear) 
 Para isso utilizamos o Método dos Mínimos Quadrados 
(M.M.Q.), que minimiza as Somas de Quadrados dos Erros, 
por meio dos seguintes estimadores: 
XbYa  XY 10  
Intercepto => ou 
2
),(ˆ
XS
YXvoC
b 
21
),(ˆ
XS
YXvoC

Coef. de Regressão => ou 
Medidas de Relacionamento 
ALUNO ALTURA(X) QUADRADO 
ALTURA 
PESO QUADRADO 
PESO 
PRODUTO 
1 174 30276 73 5329 12702 
2 161 25921 66 4356 10626 
3 170 28900 644096 10880 
4 180 32400 94 8836 16920 
5 182 33124 79 6241 14378 
6 164 26896 72 5184 11808 
7 156 24336 62 3844 9672 
8 168 28224 64 4096 10752 
9 176 30976 90 8100 15840 
10 175 30625 81 6561 14175 
 1706 291678 745 56643 127753 
 Exemplo do Cálculo dos Coeficientes de Regressão 
Medidas de Relacionamento 
kgcmYXvoCS YXYX .89,72),(ˆˆ ,, 
2
2
2
1
1
2
22
49,70
110
10
)1706(
291678
1
)(
ˆ cm
n
n
X
X
S
n
i
in
i
i
XX 







 

Já calculamos: 

49,70
89,72),(ˆ
21
XS
YXvoC cmkg /034,11 
 6,170.034,15,7410 XY  90,1010 
Medidas de Relacionamento 
40
50
60
70
80
90
100
150 155 160 165 170 175 180 185
Altura, em cm
Pe
so
, e
m
 kg
cmkg /034,11 
90,1010 
XY 034,190,101ˆ 
Medidas de Relacionamento 
 Coeficiente de Determinação 
 Permite avaliar a porcentagem de observações que estão 
próxima ou mesmo sob uma função de regressão ajustada. 
100.)(
2
,
2
YXrR 
No nosso exemplo, 
77,0771,0, YXr  100.)77,0(
22
R %29,59
2 R
Medidas de Relacionamento 
40
50
60
70
80
90
100
150 155 160 165 170 175 180 185
Altura, em cm
Pe
so
, e
m
 kg
XY 034,190,101ˆ 
%29,59
2 R
Medidas de Relacionamento 
5 
Os dados abaixo são referentes aos teores de conservantes (em mg/100 ml do 
produto) e vida útil de prateleira (em dias) para uma amostra de 09 marcas de 
iogurtes, encontrados nos principais Hipermercados da grande São Paulo 
Marca 
Teor de 
Conservante (X) 
Vida Útil de 
Prateleira (Y) 
Produto 
Quadrado 
(X) 
Quadrado (Y) 
1 174 73 12.702 30.276 5.329 
2 161 66 10.626 25.921 4.356 
3 170 64 10.880 28.900 4.096 
4 180 94 16.920 32.400 8.836 
5 182 79 14.378 33.124 6.241 
6 164 72 11.808 26.896 5.184 
7 156 62 9.672 24.336 3.844 
8 168 64 10.752 28.224 4.096 
9 178 90 16.020 31.684 8.100 
1533 664 113.758 261.761 50.082 
A obtenção das estimativas de Covariância, do Coeficiente de Correlação Linear entre 
as variáveis, bem como as particulares interpretações para cada uma das estimativas. 
Se necessário, estime também os Coeficientes de Regressão (a e by.x) e o Coeficiente 
de Determinação associado. 
Exercício 
0,00 
10,00 
20,00 
30,00 
40,00 
50,00 
60,00 
70,00 
80,00 
90,00 
100,00 
156,00 161,00 164,00 168,00 170,00 174,00 178,00 180,00 182,00 
V
id
a
 Ú
ti
l 
d
e
 P
ra
te
le
ir
a
, 
e
m
 d
ia
s
 
Teores de Conversantes, em mg/100 ml 
VUP(Obs.) VUP(Est.) 
Y = -100,9842 + 1,0260.X 
r2xy = 61,61% 
Marca Conserv(X) VUP(Obs.) VUP(Est.) 
7 156,00 62,00 59,07 2,93 
2 161,00 66,00 64,20 1,80 
6 164,00 72,00 67,28 4,72 
8 168,00 64,00 71,38 -7,38 
3 170,00 64,00 73,44 -9,44 
1 174,00 73,00 77,54 -4,54 
9 178,00 90,00 81,64 8,36 
4 180,00 94,00 83,70 10,30 
5 182,00 79,00 85,75 -6,75 
eˆ

Continue navegando