Coeficiente de Correlação de Pearson

0

Mey Terumi

17/08/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 3 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística Aplicada

24.179 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

1 
 
Correlação 
Introdução 
O coeficiente de correlação indica a força e a direção do relacionamento linear entre duas 
variáveis aleatórias. Há vários tipos de coeficientes que são adaptados à natureza dos dados. O 
mais conhecido é o coeficiente de correlação de Pearson (ou coeficiente de correlação produto-
momento) que é calculado dividindo a covariância entre duas variáveis pelo produto de seus 
desvios padrão. 
 
Para uma amostra de n pares de valores das variáveis X e Y, o coeficiente de correlação de 
Pearson amostral é calculado por: 
 
��� =
���(	, �)

� ∙ 
�
=
∑(� − �̅)(� − ��)
�∑(� − �̅)� ∙ �∑(� − ��)�
 
 
Onde 
Sx e Sy = desvio padrão de X e de Y, respectivamente. 
�̅	�	�� = média de X e de Y, respectivamente. 
 
O coeficiente ��� não depende das unidades de medida das variáveis e o seu valor está sempre 
dentro o intervalo de -1 a +1. Uma correlação positiva (��� > 0) mostra que Y tende a crescer, 
quando X cresce (gráfico 1), e uma correlação negativa quando (��� < 0) mostra que Y tende a 
decrescer, quando X cresce (gráfico 2). Uma correlação próximo de zero indica que não há uma 
relação linear entre as variáveis (gráficos 3 e 4). 
 
Gráfico 1 Gráfico 2 Gráfico 3 Gráfico 4 
��� > 0 ��� < 0 ��� ≈ 0 ��� ≈ 0 
 
 
Quanto maior o valor de ��� (positivo ou negativo), mais forte é a associação (gráficos 5 a 10). 
 
Gráfico 5 Gráfico 6 Gráfico 7 
��� = 0,81 ��� = 0,94 ��� = 1 
 
 
 
2 
 
Gráfico 8 Gráfico 9 Gráfico 10 
��� = −0,81 ��� = −0,94 ��� = −1 
 
 
O quadro a seguir fornece um guia para interpretar a intensidade da correlação entre as 
variáveis. 
 
Valor de ��� (+ ou -) Interpretação 
De 0.0 a menos de 0,2 Correlação linear muito fraca 
De 0.2 a menos de 0,4 Correlação linear fraca 
De 0.4 a menos de 0,7 Correlação linear moderada 
De 0.7 a menos de 0,9 Correlação linear forte 
De 0.9 a menos de 1.0 Correlação linear muito forte 
Igual a 1,0 Correlação linear perfeita 
 
 
Propriedades da correlação 
• < colocar depois > 
 
Fórmula alternativa da covariância 
 
O coeficiente ��� pode ser obtido pela fórmula abaixo, onde são usados apenas somatórios 
simples. 
 
��� =
!∑�� − (∑� ∑�)
�!∑�� − (∑�)� ∙ �! ∑�� − (∑�)�
 
 
 
Cuidados com a correlação 
 
• Uma correlação de 0,3 não pode ser escrita como 30%, por exemplo. 
 
• Correlação não é causalidade: Um comportamento próximo de duas variáveis não 
significa que uma é causa da outra. Uma correlação alta positiva entre taxa de divórcio 
e consumo de margarina, não significa que o consumo de margarina leva a um aumento 
da taxa de divórcio. (hypescience.com/margarina-causa-divorcios/) 
 
 
 
 
 
 
 
3 
 
Exemplo 
A tabela a seguir mostra a rentabilidade de duas ações de duas empresas diferentes num 
período de cinco meses. Calcule o coeficiente de correlação entre as rentabilidades das duas 
empresas. 
Tabela 1 
Mês 
Ações 
Empresa X 
Ações 
Empresa Y 
Janeiro 7 20 
Fevereiro 8 25 
Março 5 18 
Abril 4 12 
Maio 6 20 
 
 
4 
 
Passo-a-passo para o cálculo da correlação 
 
Usando	a	fórmula:									��� =
!∑ �� − (∑ �∑ �)
�!∑ �2 − (∑ �)2 ∙ �!∑ �2 − (∑ �)2
 
 
Vamos precisar dos somatórios ∑�� ,∑� , ∑ �� , ∑ � e	∑�� 
 
Considerando a tabela 2, vamos seguir os passos abaixo: 
 
Passo 1) Digite os dados das variáveis X e Y nas colunas (1) e (2); 
 
Passo 2) Calcule o produto na coluna (3) = (1) x (2); 
 
�� 
7 x 20 = 140 
8 x 25 = 200 
5 x 18 = 90 
4 x 12 = 48 
6 x 20 = 120 
 
Passo 3) Calcule os valores de X ao quadrado na coluna (4) e de Y ao quadrado na coluna (5); 
 
�� �� 
72 = 49 202 = 400 
82 = 64 252 =625 
52 = 25 182 = 324 
42 = 16 122 = 144 
62 = 36 202 = 400 
 
Passo 4) Obtenha os somatórios das colunas (1), (2), (3), (4) e (5) e substitua na fórmula 
 
 ∑�� = 598,			 ∑ � = 30, ∑ �� = 190, ∑� = 95				e	 ∑ �� = 1893 
 
��� =
5(598) − (30 ∙ 95)
�5(190) − (30)� ∙ �5(1893) − (95)�
=
140
√50 ∙ √440
= 0,94 
 
 Tabela 2 
 
(1) 
x 
(2) 
y 
(3) 
�� 
(4) 
�� 
(5) 
�� 
 7 15 140 49 400 
 8 25 200 64 625 
 5 18 90 25 324 
 4 12 48 16 144 
 6 20 120 36 400 
Soma 30 90 598 190 1893 
 
5 
 
Coeficiente de correlação de Pearson no Excel 2010 
A covariância amostral é obtida no Excel 2010 usando a fórmula COVARIAÇÃO.S(matriz1, 
matriz2). 
 
 
Coeficiente de correlação de Pearson no R 
1) Baixe e instale o programa R em https://www.r-project.org/ clique em CRAN (no lado 
esquerdo) e escolha qualquer repositório (por exemplo, da Universidade Federal do 
Paraná - http://cran-r.c3sl.ufpr.br/). 
Ou 
2) Use a versão on-line do programa R, disponível em www.r-fiddle.org.