Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.

Prévia do material em texto

Estat́ıstica
Departamento de Estat́ıstica / UFPB
Correlação
Introdução
Neste caṕıtulo iremos estu-
dar as relações entre variáveis
utilizando métodos gráficos e
numéricos. Vamos começar
discutindo um pouco sobre as
relações entre as variáveis. E
os cuidados que devemos ter ao
estabelecer relações de causa e
efeito.
2 15
Objetivo da Análise de Correlação
Análise de Correlação
Suponha que tenhamos duas variáveis quantitativas de interesse, a análise de correlação nos fornecerá um
número, o coeficiente de correlação, e uma escala de referência
Relação Forte Relação ForteRelação Fraca
0-0,1-0,2-0,3-0,4-0,5-0,6-0,7-0,8-0,9-1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
na qual podemos estabelecer o grau de associação destas variáveis,
SE EXISTIR uma relação LINEAR entre elas.
3 15
Existência de Relação Linear
O cálculo da correlação entre duas variáveis X e Y só faz sentido se as seguintes hipóteses forem satisfeitas:
1. Existe relação entre as variáveis X e Y ;
2. A relação entre as variáveis X e Y é
linear.
4 15
Existência de Relação Linear
O cálculo da correlação entre duas variáveis X e Y só faz sentido se as seguintes hipóteses forem satisfeitas:
1. Existe relação entre as variáveis X e Y ;
2. A relação entre as variáveis X e Y é
linear.
A primeira hipótese estabelece que a correlação não
determina se duas variáveis são ou não correlacionadas.
No entanto, se existe razões para acreditarmos que essa
relação é plauśıvel, a correlação nos ajudará a responder
qual é o grau de relação entre elas.
4 15
Existência de Relação Linear
O cálculo da correlação entre duas variáveis X e Y só faz sentido se as seguintes hipóteses forem satisfeitas:
1. Existe relação entre as variáveis X e Y ;
2. A relação entre as variáveis X e Y é
linear.
A segunda hipótese refere-se ao tipo de relação entre as
variáveis.
4 15
Relação entre variáveis
De modo geral, quando os resultados da análise de correlação indicam que as variáveis X e Y tem um grau
elevado de correlação, isso pode ocorrer porque:
X e Y são correlacionadas de fato ou
Outros fatores não considerados alteram na mesma
medida tanto X quanto Y , de modo que a correlação
observado é apenas uma coincidência.
Portanto, devemos ter bastante cuidado ao estabelecer
relações de causa e efeito baseadas apenas nos resultados
gráficos/numéricos da análise de correlação.
5 15
Relação entre variáveis
De modo geral, quando os resultados da análise de correlação indicam que as variáveis X e Y tem um grau
elevado de correlação, isso pode ocorrer porque:
X e Y são correlacionadas de fato ou
Outros fatores não considerados alteram na mesma
medida tanto X quanto Y , de modo que a correlação
observado é apenas uma coincidência.
Portanto, devemos ter bastante cuidado ao estabelecer
relações de causa e efeito baseadas apenas nos resultados
gráficos/numéricos da análise de correlação.
5 15
Relação entre variáveis
De modo geral, quando os resultados da análise de correlação indicam que as variáveis X e Y tem um grau
elevado de correlação, isso pode ocorrer porque:
X e Y são correlacionadas de fato ou
Outros fatores não considerados alteram na mesma
medida tanto X quanto Y , de modo que a correlação
observado é apenas uma coincidência.
Portanto, devemos ter bastante cuidado ao estabelecer
relações de causa e efeito baseadas apenas nos resultados
gráficos/numéricos da análise de correlação.
5 15
Tipos de Relação entre variáveis
A segunda hipótese necessária para
utilizarmos a análise de correlação é
que as variáveis X e Y tenham
uma relação linear.
Portanto, vamos classificar os tipos de relações entre as variáveis.
Para isso,
precisamos utilizar uma ferramenta gráfica
denominada de Gráfico de Dispersão,
que é um gráfico cartesiano das amostras das variáveis X e Y .
6 15
Seja X e Y duas variáveis quantitativas, há três tipos de relações que podem ocorrer:
Não há relação entre X e Y .
Neste tipo de caso, quando X aumenta, Y varia
aleatoriamente como o gráfico ao lado.
Existe uma relação linear entre X e Y .
A relação linear pode ocorrer de duas formas:
§ Relação linear direta (ou positiva): quando X
cresce, Y também cresce. Os pontos se distribuem
aleatoriamente em torno de uma reta crescente.
§ Relação linear indireta (ou negativa): quando X
cresce, Y decresce. Os pontos se distribuem
aleatoriamente em torno de uma reta decrescente.
Existe uma relação não linear entre X e Y . Neste
caso, Y se distribui aleatoriamente em torno de uma
curva não linear.
0 2 4 6 8 10
−
3
−
2
−
1
0
1
2
3
x
y
7 15
Seja X e Y duas variáveis quantitativas, há três tipos de relações que podem ocorrer:
Não há relação entre X e Y .
Neste tipo de caso, quando X aumenta, Y varia
aleatoriamente como o gráfico ao lado.
Existe uma relação linear entre X e Y .
A relação linear pode ocorrer de duas formas:
§ Relação linear direta (ou positiva): quando X
cresce, Y também cresce. Os pontos se distribuem
aleatoriamente em torno de uma reta crescente.
§ Relação linear indireta (ou negativa): quando X
cresce, Y decresce. Os pontos se distribuem
aleatoriamente em torno de uma reta decrescente.
Existe uma relação não linear entre X e Y . Neste
caso, Y se distribui aleatoriamente em torno de uma
curva não linear.
0 2 4 6 8 10
0
2
4
6
8
10
x
y
7 15
Seja X e Y duas variáveis quantitativas, há três tipos de relações que podem ocorrer:
Não há relação entre X e Y .
Neste tipo de caso, quando X aumenta, Y varia
aleatoriamente como o gráfico ao lado.
Existe uma relação linear entre X e Y .
A relação linear pode ocorrer de duas formas:
§ Relação linear direta (ou positiva): quando X
cresce, Y também cresce. Os pontos se distribuem
aleatoriamente em torno de uma reta crescente.
§ Relação linear indireta (ou negativa): quando X
cresce, Y decresce. Os pontos se distribuem
aleatoriamente em torno de uma reta decrescente.
Existe uma relação não linear entre X e Y . Neste
caso, Y se distribui aleatoriamente em torno de uma
curva não linear.
0 2 4 6 8 10
−
10
−
8
−
6
−
4
−
2
0
2
x
y
7 15
Seja X e Y duas variáveis quantitativas, há três tipos de relações que podem ocorrer:
Não há relação entre X e Y .
Neste tipo de caso, quando X aumenta, Y varia
aleatoriamente como o gráfico ao lado.
Existe uma relação linear entre X e Y .
A relação linear pode ocorrer de duas formas:
§ Relação linear direta (ou positiva): quando X
cresce, Y também cresce. Os pontos se distribuem
aleatoriamente em torno de uma reta crescente.
§ Relação linear indireta (ou negativa): quando X
cresce, Y decresce. Os pontos se distribuem
aleatoriamente em torno de uma reta decrescente.
Existe uma relação não linear entre X e Y . Neste
caso, Y se distribui aleatoriamente em torno de uma
curva não linear.
0 2 4 6 8 10
0
5
10
15
20
25
x
y
7 15
Seja X e Y duas variáveis quantitativas, há três tipos de relações que podem ocorrer:
Não há relação entre X e Y .
Neste tipo de caso, quando X aumenta, Y varia
aleatoriamente como o gráfico ao lado.
Existe uma relação linear entre X e Y .
A relação linear pode ocorrer de duas formas:
§ Relação linear direta (ou positiva): quando X
cresce, Y também cresce. Os pontos se distribuem
aleatoriamente em torno de uma reta crescente.
§ Relação linear indireta (ou negativa): quando X
cresce, Y decresce. Os pontos se distribuem
aleatoriamente em torno de uma reta decrescente.
Existe uma relação não linear entre X e Y . Neste
caso, Y se distribui aleatoriamente em torno de uma
curva não linear.
0 2 4 6 8 10
−
10
0
−
50
0
50
10
0
x
y
7 15
Exemplo 1:
Uma agência imobiliária emergente pos-
sui 8 casas de 3 quartos para locação no
bairro do CasteloBranco.
O gerente observou uma certa dificuldade em alugar as casas mais
antigas e que precisavam de reformas para atender a demanda do
mercado, provocando uma desvalorização no preço dos aluguéis.
A fim de verificar se suas suposições são válidas, ele fez um le-
vantamento do tempo desde a última reforma do imóvel (Variável
X) e do preço do aluguel (Variável Y ) das 8 casas. Com estas
informações, o gerente fez um Gráfico de Dispersão, como mostra
a Figura ao lado. O gráfico de dispersão estava de acordo com suas
suspeitas, as residências cujas reformas eram mais antigas estavam
mais desvalorizadas no mercado. Este é um exemplo de relação
linear negativa (indireta).
Gráfico de Dispersão do tempo de reforma
X e do preço do aluguel Y de casas do
Castelo Branco.
5 10 15 20
1
3
0
0
1
4
0
0
1
5
0
0
1
6
0
0
1
7
0
0
x
y
8 15
Exemplo 2:
Numa cidade, a velocidade
de caminhada recomendada
para atravessar a rua no
semáforo é de 1,2 m/s.
Um estudo preliminar foi realizado com oito idosos desta
localidade onde foram medidas as distâncias X em me-
tros da avenida e o tempo para atravessar a rua Y em
segundos.
A relação entre a distância percorrida e o tempo de ca-
minha é inquestionável. No entanto, esse tipo de relação
pode ou não ser linear, isso depende de muitos fatores.
Este é um exemplo de relação linear positiva (direta).
Contudo, para longas caminhadas provavelmente seria
uma relação não-linear... Por quê?
Gráfico de Dispersão entre a distância
percorrida X e o tempo de caminhada.
10.0 10.5 11.0 11.5
11
.5
12
.0
12
.5
x
y
9 15
Coeficiente de Correlação de Pearson
Definição (Coeficiente de Correlação de Pearson):
Seja tpx1, y1q, px2, y2q, . . . , pxn, ynqu uma amostra aleatória de tamanho n, na qual, de cada i-ésima unidade
amostral, com i “ 1, . . . , n, foi observado os valores xi e yi, das variáveis X e Y , respectivamente.
O Coeficiente de Correlação de Pearson, r, é definido por:
r “
Sxy
a
SxxSyy
,
em que
Sxy “
ř
xy ´ nx̄ȳ,
Sxx “
ř
x2 ´ nx̄2,
Syy “
ř
y2 ´ nȳ2.
10 15
Coeficiente de Correlação de Pearson
O Coeficiente de correlação de Pearson mede a o grau de associação linear entre duas variáveis quantitativas,
quando essa associação linear existe. O coeficiente r assume valores entre -1 e 1 e podemos dar a seguinte
interpretação para o valor de r:
Quando r está próximo de -1, dizemos que X e Y possui uma relação linear indireta (ou negativa);
Quando r está próximo de 0, dizemos que não há relação linear entre X e Y ;
Quando r está próximo de 1, dizemos que X e Y possui uma relação linear direta (ou positiva);
Relação Negativa
0-0,1-0,2-0,3-0,4-0,5-0,6-0,7-0,8-0,9-1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
11 15
Coeficiente de Correlação de Pearson
O Coeficiente de correlação de Pearson mede a o grau de associação linear entre duas variáveis quantitativas,
quando essa associação linear existe. O coeficiente r assume valores entre -1 e 1 e podemos dar a seguinte
interpretação para o valor de r:
Quando r está próximo de -1, dizemos que X e Y possui uma relação linear indireta (ou negativa);
Quando r está próximo de 0, dizemos que não há relação linear entre X e Y ;
Quando r está próximo de 1, dizemos que X e Y possui uma relação linear direta (ou positiva);
Relação Positiva
0-0,1-0,2-0,3-0,4-0,5-0,6-0,7-0,8-0,9-1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
11 15
Coeficiente de Correlação de Pearson
O Coeficiente de correlação de Pearson mede a o grau de associação linear entre duas variáveis quantitativas,
quando essa associação linear existe. O coeficiente r assume valores entre -1 e 1 e podemos dar a seguinte
interpretação para o valor de r:
Quando r está próximo de -1, dizemos que X e Y possui uma relação linear indireta (ou negativa);
Quando r está próximo de 0, dizemos que não há relação linear entre X e Y ;
Quando r está próximo de 1, dizemos que X e Y possui uma relação linear direta (ou positiva);
Relação Fraca
0-0,1-0,2-0,3-0,4-0,5-0,6-0,7-0,8-0,9-1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
11 15
Coeficiente de Correlação de Pearson
O Coeficiente de correlação de Pearson mede a o grau de associação linear entre duas variáveis quantitativas,
quando essa associação linear existe. O coeficiente r assume valores entre -1 e 1 e podemos dar a seguinte
interpretação para o valor de r:
Quando r está próximo de -1, dizemos que X e Y possui uma relação linear indireta (ou negativa);
Quando r está próximo de 0, dizemos que não há relação linear entre X e Y ;
Quando r está próximo de 1, dizemos que X e Y possui uma relação linear direta (ou positiva);
Relação Negativa Relação PositivaRelação Fraca
0-0,1-0,2-0,3-0,4-0,5-0,6-0,7-0,8-0,9-1 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
11 15
Coeficiente de Correlação de Pearson
Exemplo 3:
Considere as amostras de três variáveis apresentadas na tabela a seguir. Obtenha o coeficiente de correlação
de Pearson entre as variáveis X e Y , depois, entre as variáveis X e W .
Amostras das variáveis X, Y e W .
x y w
1 1 9
3 4 8
5 5 5
7 6 2
9 8 0
12 15
Exemplo 3: correlação entre X e Y .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e Y , podemos seguir os seguintes
passos:
2 4 6 8
1
2
3
4
5
6
7
8
x
y
1. Crie as colunas: x2, y2 e xy.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
ȳ “
ř
y
n “ 24
5 “ 4,8.
x y
1 1
3 4
5 5
7 6
9 8
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Syy “
ÿ
y2 ´ nȳ2 “ 142´ 5p4, 82q “ 142´ 115, 2 “ 26, 8
Sxy “
ÿ
xy ´ nx̄ȳ “ 152´ 5p5qp4, 8q “ 152´ 120 “ 32
rxy “
Sxy
a
SxxSyy
“
32
a
p40qp26, 8q
“ 0,977.
Portanto, X e Y apresentam uma forte correlação linear positiva de aproximadamente 98%.
13 15
Exemplo 3: correlação entre X e Y .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e Y , podemos seguir os seguintes
passos:
1. Crie as colunas: x2, y2 e xy.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
ȳ “
ř
y
n “ 24
5 “ 4,8.
x y x2 y2 xy
1 1 12 “1 12 “1 1 ¨ 1 “1
3 4 32 “9 42 “16 3 ¨ 4 “12
5 5 52 “25 52 “25 5 ¨ 5 “25
7 6 72 “49 62 “36 7 ¨ 6 “42
9 8 92 “81 82 “64 9 ¨ 8 “72
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Syy “
ÿ
y2 ´ nȳ2 “ 142´ 5p4, 82q “ 142´ 115, 2 “ 26, 8
Sxy “
ÿ
xy ´ nx̄ȳ “ 152´ 5p5qp4, 8q “ 152´ 120 “ 32
rxy “
Sxy
a
SxxSyy
“
32
a
p40qp26, 8q
“ 0,977.
Portanto, X e Y apresentam uma forte correlação linear positiva de aproximadamente 98%.
13 15
Exemplo 3: correlação entre X e Y .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e Y , podemos seguir os seguintes
passos:
1. Crie as colunas: x2, y2 e xy.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
ȳ “
ř
y
n “ 24
5 “ 4,8.
x y x2 y2 xy
1 1 1 1 1
3 4 9 16 12
5 5 25 25 25
7 6 49 36 42
9 8 81 64 72
ř
x “25
ř
y “24
ř
x2 “165
ř
y2 “142
ř
xy “152
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Syy “
ÿ
y2 ´ nȳ2 “ 142´ 5p4, 82q “ 142´ 115, 2 “ 26, 8
Sxy “
ÿ
xy ´ nx̄ȳ “ 152´ 5p5qp4, 8q “ 152´ 120 “ 32
rxy “
Sxy
a
SxxSyy
“
32
a
p40qp26, 8q
“ 0,977.
Portanto, X e Y apresentam uma forte correlação linear positiva de aproximadamente 98%.
13 15
Exemplo 3: correlação entre X e Y .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e Y , podemos seguir os seguintes
passos:
1. Crie as colunas: x2, y2 e xy.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
ȳ “
ř
y
n “ 24
5 “ 4,8.
x y x2 y2 xy
1 1 1 1 1
3 4 9 16 12
5 5 25 25 25
7 6 49 36 42
9 8 81 64 72
ř
x “25
ř
y “24
ř
x2 “165
ř
y2 “142
ř
xy “152
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Syy “
ÿ
y2 ´ nȳ2 “ 142´ 5p4, 82q “ 142´ 115, 2 “ 26, 8
Sxy“
ÿ
xy ´ nx̄ȳ “ 152´ 5p5qp4, 8q “ 152´ 120 “ 32
rxy “
Sxy
a
SxxSyy
“
32
a
p40qp26, 8q
“ 0,977.
Portanto, X e Y apresentam uma forte correlação linear positiva de aproximadamente 98%.
13 15
Exemplo 3: correlação entre X e Y .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e Y , podemos seguir os seguintes
passos:
1. Crie as colunas: x2, y2 e xy.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
ȳ “
ř
y
n “ 24
5 “ 4,8.
x y x2 y2 xy
1 1 1 1 1
3 4 9 16 12
5 5 25 25 25
7 6 49 36 42
9 8 81 64 72
ř
x “25
ř
y “24
ř
x2 “165
ř
y2 “142
ř
xy “152
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Syy “
ÿ
y2 ´ nȳ2 “ 142´ 5p4, 82q “ 142´ 115, 2 “ 26, 8
Sxy “
ÿ
xy ´ nx̄ȳ “ 152´ 5p5qp4, 8q “ 152´ 120 “ 32
rxy “
Sxy
a
SxxSyy
“
32
a
p40qp26, 8q
“ 0,977.
Portanto, X e Y apresentam uma forte correlação linear positiva de aproximadamente 98%.
13 15
Exemplo 3: correlação entre X e W .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e W , podemos seguir os seguintes
passos:
2 4 6 8
0
2
4
6
8
x
w
1. Crie as colunas: x2, w2 e xw.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
w̄ “
ř
w
n “ 24
5 “ 4,8.
x w
1 9
3 8
5 5
7 2
9 0
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Sww “
ÿ
w2
´ nw̄2
“ 174´ 5p4, 82q “ 174´ 115, 2 “ 58, 8
Sxw “
ÿ
xw ´ nx̄w̄ “ 72´ 5p5qp4, 8q “ 72´ 120 “ ´48
rxw “
Sxw
?
SxxSww
“
´48
a
p40qp58, 8q
“ -0,9897.
Portanto, X e W apresentam uma forte correlação linear negativa de aproximadamente 99%.
14 15
Exemplo 3: correlação entre X e W .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e W , podemos seguir os seguintes
passos:
1. Crie as colunas: x2, w2 e xw.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
w̄ “
ř
w
n “ 24
5 “ 4,8.
x w x2 w2 xw
1 9 12 “1 92 “81 1 ¨ 9 “9
3 8 32 “9 82 “64 3 ¨ 8 “24
5 5 52 “25 52 “25 5 ¨ 5 “25
7 2 72 “49 22 “4 7 ¨ 2 “14
9 0 92 “81 02 “0 9 ¨ 0 “0
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Sww “
ÿ
w2
´ nw̄2
“ 174´ 5p4, 82q “ 174´ 115, 2 “ 58, 8
Sxw “
ÿ
xw ´ nx̄w̄ “ 72´ 5p5qp4, 8q “ 72´ 120 “ ´48
rxw “
Sxw
?
SxxSww
“
´48
a
p40qp58, 8q
“ -0,9897.
Portanto, X e W apresentam uma forte correlação linear negativa de aproximadamente 99%.
14 15
Exemplo 3: correlação entre X e W .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e W , podemos seguir os seguintes
passos:
1. Crie as colunas: x2, w2 e xw.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
w̄ “
ř
w
n “ 24
5 “ 4,8.
x w x2 w2 xw
1 9 1 81 9
3 8 9 64 24
5 5 25 25 25
7 2 49 4 14
9 0 81 0 0
ř
x “25
ř
w “24
ř
x2 “165
ř
w2 “174
ř
xw “72
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Sww “
ÿ
w2
´ nw̄2
“ 174´ 5p4, 82q “ 174´ 115, 2 “ 58, 8
Sxw “
ÿ
xw ´ nx̄w̄ “ 72´ 5p5qp4, 8q “ 72´ 120 “ ´48
rxw “
Sxw
?
SxxSww
“
´48
a
p40qp58, 8q
“ -0,9897.
Portanto, X e W apresentam uma forte correlação linear negativa de aproximadamente 99%.
14 15
Exemplo 3: correlação entre X e W .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e W , podemos seguir os seguintes
passos:
1. Crie as colunas: x2, w2 e xw.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
w̄ “
ř
w
n “ 24
5 “ 4,8.
x w x2 w2 xw
1 9 1 81 9
3 8 9 64 24
5 5 25 25 25
7 2 49 4 14
9 0 81 0 0
ř
x “25
ř
w “24
ř
x2 “165
ř
w2 “174
ř
xw “72
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Sww “
ÿ
w2
´ nw̄2
“ 174´ 5p4, 82q “ 174´ 115, 2 “ 58, 8
Sxw “
ÿ
xw ´ nx̄w̄ “ 72´ 5p5qp4, 8q “ 72´ 120 “ ´48
rxw “
Sxw
?
SxxSww
“
´48
a
p40qp58, 8q
“ -0,9897.
Portanto, X e W apresentam uma forte correlação linear negativa de aproximadamente 99%.
14 15
Exemplo 3: correlação entre X e W .
Para calcular o coeficiente de correlação de Pearson entre as variáveis X e W , podemos seguir os seguintes
passos:
1. Crie as colunas: x2, w2 e xw.
2. Obtenha os somatórios de todas as
colunas.
3. Calcule:
x̄ “
ř
x
n “ 25
5 “ 5.
w̄ “
ř
w
n “ 24
5 “ 4,8.
x w x2 w2 xw
1 9 1 81 9
3 8 9 64 24
5 5 25 25 25
7 2 49 4 14
9 0 81 0 0
ř
x “25
ř
w “24
ř
x2 “165
ř
w2 “174
ř
xw “72
Sxx “
ÿ
x2 ´ nx̄2 “ 165´ 5p52q “ 165´ 125 “ 40
Sww “
ÿ
w2
´ nw̄2
“ 174´ 5p4, 82q “ 174´ 115, 2 “ 58, 8
Sxw “
ÿ
xw ´ nx̄w̄ “ 72´ 5p5qp4, 8q “ 72´ 120 “ ´48
rxw “
Sxw
?
SxxSww
“
´48
a
p40qp58, 8q
“ -0,9897.
Portanto, X e W apresentam uma forte correlação linear negativa de aproximadamente 99%.
14 15
Referências Bibliográficas
Os livros BUSSAB e MORETTIN (2017), COSTA NETO (2002) estão dispońıvel na Minha Biblioteca, que é
uma base de livros eletrônicos, em português, que reúne milhares de t́ıtulos acadêmicos das diversas áreas do
conhecimento. Para acessar a Biblioteca você deve fazer o login no SIGAA da UFPB e acessar seguindo esta
sequência no menu: Biblioteca ´ ą Pesquisar Livros Digitais ´ ą Minha Biblioteca.
BUSSAB, W. O.; MORETTIN, P. A. Estat́ıstica Básica. 9ª. ed. São Paulo: Saraiva, 2017. Dispońıvel em:
xhttps://sigaa.ufpb.bry.
COSTA NETO, P. L. O. Estat́ıstica. 2ª. ed. São Paulo: Edgard Blücher, 2002. Dispońıvel em:
xhttps://sigaa.ufpb.bry.
15 / 15
https://sigaa.ufpb.br
https://sigaa.ufpb.br
	2. Correlação
	2.1 Introdução
	2.2 Tipos de Relação entre variáveis
	2.3 Coeficiente de Correlação de Pearson

Mais conteúdos dessa disciplina