A maior rede de estudos do Brasil

Grátis
11 pág.
AndreSalles - EstAplic - Correlação

Pré-visualização | Página 1 de 2

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ 
 
 
- 46 - 
 
 
- ESTATÍSTICA APLICADA – ANÁLISE DE CORRELAÇÃO - 
Prof. André A. de Salles 
 
 
 
ESTATÍSTICA APLICADA 
-- UNIDADE 4 -- 
ANÁLISE DE CORRELAÇÃO 
 
Relação entre duas variáveis 
 
 Consumo × renda 
 Peso × idade 
 Quantidade × preço 
 taxa de juros × procura por moeda 
 Salário × escolaridade 
 taxa de câmbio × balança comercial 
 Vendas × gastos com publicidade 
 Demanda × preço 
 
 
 
Problemas reais envolvem relações --- bivariadas 
 --- multivariadas 
 
Se existe relação, ou associação, entre duas ou mais variáveis é importante a 
informação do grau dessa associação e é esse o objeto de estudo da associação ou 
da correlação. 
 
Estudo da Correlação 
 
como medir a relação, 
aderência, ou associação entre 
duas variáveis ou mais. 
 
 
 coeficiente de correlação ≡ correlação momento-produto (Karl Pearson). 
 
 Coeficiente de correlação ρ (rô) da população é definido como: 
 
 
YX
XY
XYYX σσ
σρρ ==);( ou )()(
),();(
YDPXDP
YXCOVYX XY == ρρ 
 
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ 
 
 
- 47 - 
 
 
- ESTATÍSTICA APLICADA – ANÁLISE DE CORRELAÇÃO - 
Prof. André A. de Salles 
 
 
 
VARIÁVÉIS ALEATÓRIAS BIVARIADAS (ou bidimensionais) 
 
 INFERÊNCIA 
 ESTATISTICA 
 PRESSUPOSTO 
Existe distribuição da 
população para todas as 
possíveis observações das 
variáveis de interesse. 
 
 
 
 
Distribuições populacionais ---- Parâmetros 
 
 
 
DISTRIBUIÇÃO DISCRETA DE PROBABILIDADE DE ( )YX ; 
 
ijjiji pyxPyYxXP ==== );();( 
 
 
 DISTRIBUIÇÃO DE PROBABILIDADE BIVARIADA 
 
 
X 
Y 
 
 1x K ix K mx 
 
 )(YP ) 
 
 
1y 
 
11p K 1ip K 1mp 
 
1•p 
 
 
M 
 
 M K M K M 
 
M 
 
 
jy 
 
jp1 K ijp K mjp 
 
jp• 
 
 
M 
 
 M K M K M 
 
M 
 
 
ny 
 
np1 K inp K mnp 
 
n
p
•
 
 
 
 P(X) 
 
•1p K •ip K •mp 
 
1 
 
 
 
 
 
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ 
 
 
- 48 - 
 
 
- ESTATÍSTICA APLICADA – ANÁLISE DE CORRELAÇÃO - 
Prof. André A. de Salles 
 
 
 
 
Seis parâmetros importantes: 
 
 
- Médias 
 ∑ •==
i
iiX xpXE )(µ 
 ∑ •==
i
jjY ypYE )(µ 
- Variâncias 
 ∑ −=−== •
i
XiiXX xpXEXVar
222 )()()( µµσ 
 ∑ −=−== •
j
YjjYY ypYEYVar
222 )()()( µµσ 
- Covariância 
 [ ] ))(())(();( YjX
I J
iijYXXY yxpYXEYXCov µµµµσ −−=−−== ∑∑ 
 
 
- Coeficiente de Correlação 
 
 
YX
XY
XYYX σσ
σρρ ==);( 
 
 
 
 
 
PROBABILIDADES CONDICIONADAS 
 
 
)(
),()/(
i
ji
ij
xXP
yYxXP
xXyYP
=
==
=== ou 
•
=
i
ij
ij p
p
xyP )/( , 
 
 
 
sendo: )/( ij xXyYP == a probabilidade de jyY = condicionada a ixX = ; 
 
•ip a probabilidade marginal e ijp a probabilidade conjunta. 
 
 
 
 
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ 
 
 
- 49 - 
 
 
- ESTATÍSTICA APLICADA – ANÁLISE DE CORRELAÇÃO - 
Prof. André A. de Salles 
 
 
 
Parâmetros importantes: 
 
 
- Média Condicional (ou valor esperado condicionado) 
)(
);())/(()/(/
i
ji
j j
jijjiXY
xP
yxP
yxXyPyXYE
i ∑ ∑====µ 
 
- Variância Condicional 
 
)/()()/( 2/2 / ij
j
XYjiXY xXYPYXYVar ii =×−== ∑ µσ 
 
Observação: 
As médias e variâncias condicionais são funções de x => tem-se um conjunto de m 
médias e variâncias (da mesma forma pode-se obter um conjunto de n médias e 
variâncias condicionais para x em função de y). 
 
 
 
 
 
Exemplos: 
 
 
• SALÁRIOS vs TEMPO DE SERVIÇO --- firma com 10 operários: 
 
 
Operário 1 2 3 4 5 6 7 8 9 10 
Salário ($) 140 150 180 160 170 170 160 160 160 150 
tempo (anos) 4 5 6 6 6 6 5 6 6 5 
 
Y = salário em $ 
X = tempo de serviço em anos 
N = 10 
 
 
 
 
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ 
 
 
- 50 - 
 
 
- ESTATÍSTICA APLICADA – ANÁLISE DE CORRELAÇÃO - 
Prof. André A. de Salles 
 
 
 
Dada a Distribuição de Probabilidade Conjunta (X ; Y) , tem-se: 
 
X 
Y 
 
4
 
 
5 
 
6 
 
P(Y) 
 
 
140 
 
0,1 
 
0,0 
 
0,0 
 
0,1 
 
 
150 
 
0,0 
 
0,0 
 
0,0 
 
0,0 
 
 
160 
 
0,0 
 
0,0 
 
0,0 
 
0,0 
 
 
170 
 
0,0 
 
0,0 
 
0,0 
 
0,0 
 
 
180 
 
0,0 
 
0,0 
 
0,0 
 
0,0 
 
 
 P(X) 
 
0,1 
 
0,0 
 
0,0 
 
1,0 
 
 
 
• SALÁRIOS vs DESPESAS COM FÉRIAS → as variáveis formam a população. 
 
X = salário em $ mil 
Y = despesa com férias em $ mil 
 
Dada a Distribuição de Probabilidade Conjunta (X ; Y) , tem-se: 
 
X 
Y 
 
20
 
 
30 
 
40 
 
 
1 
 
0,28 
 
0,03 
 
0,00 
 
 
2 
 
0,08 
 
0,15 
 
0,03 
 
 
3 
 
0,04 
 
0,06 
 
0,06 
 
 
4 
 
0,00 
 
0,06 
 
0,15 
 
 
5 
 
0,00 
 
0,00 
 
0,03 
 
 
6 
 
0,00 
 
0,00 
 
0,03 
 
 
 P(X) 
 
0,4 
 
0,30 
 
0,30 
 
 Media 
(Y/X) 
 
1,40 
 
2,50 
 
3,90 
 
 Variancia 
(Y/X) 
 
0,44 
 
0,85 
 
1,09 
 
 
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ 
 
 
- 51 - 
 
 
- ESTATÍSTICA APLICADA – ANÁLISE DE CORRELAÇÃO - 
Prof. André A. de Salles 
 
 
 
Probabilidades de Y condicionadas a X 
 
 
X 
Y 
 
20
 
 
30 
 
40 
 
 
1 
 
0,7 
 
0,1 
 
0,0 
 
 
2 
 
0,2 
 
0,5 
 
0,1 
 
 
3 
 
0,1 
 
0,2 
 
0,2 
 
 
4 
 
0,0 
 
0,2 
 
0,5 
 
 
5 
 
0,0 
 
0,0 
 
0,1 
 
 
6 
 
0,0 
 
0,0 
 
0,1 
 
 
 
DISTRIBUIÇÃO DE PROBABILIDADE CONTÍNUA DE ( )YX ; 
 
ijjiji pyxPyYxXP ==== );();( ou XYXYXY pfYXf ==),( 
 
Seis parâmetros importantes: 
 
- Médias ∫
+∞
∞−
== dxxxfXE xX )()(µ 
 ∫
+∞
∞−
== dxxxfXE xX )()(µ 
- Variâncias 
 
22 )()( XX XEXVar µσ −== 
 
22 )()( YY YEYVar µσ −== 
 
- Covariância 
 [ ] ∫∫ −−=−−==
R
yxxyYXXY dxdyyxfYXEYXCov ))(())(();( µµµµσ 
- Coeficiente de Correlação 
 
 
YX
XY
XYYX σσ
σρρ ==);( 
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – UFRJ 
 
 
- 52 - 
 
 
- ESTATÍSTICA APLICADA – ANÁLISE DE CORRELAÇÃO - 
Prof. André A. de Salles 
 
 
 
VARIÁVEIS ALEATORIAS BIVARIADAS