Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Correlação Introdução O coeficiente de correlação indica a força e a direção do relacionamento linear entre duas variáveis aleatórias. Há vários tipos de coeficientes que são adaptados à natureza dos dados. O mais conhecido é o coeficiente de correlação de Pearson (ou coeficiente de correlação produto- momento) que é calculado dividindo a covariância entre duas variáveis pelo produto de seus desvios padrão. Para uma amostra de n pares de valores das variáveis X e Y, o coeficiente de correlação de Pearson amostral é calculado por: ��� = ���( , �) � ∙ � = ∑(� − �̅)(� − ��) �∑(� − �̅)� ∙ �∑(� − ��)� Onde Sx e Sy = desvio padrão de X e de Y, respectivamente. �̅ � �� = média de X e de Y, respectivamente. O coeficiente ��� não depende das unidades de medida das variáveis e o seu valor está sempre dentro o intervalo de -1 a +1. Uma correlação positiva (��� > 0) mostra que Y tende a crescer, quando X cresce (gráfico 1), e uma correlação negativa quando (��� < 0) mostra que Y tende a decrescer, quando X cresce (gráfico 2). Uma correlação próximo de zero indica que não há uma relação linear entre as variáveis (gráficos 3 e 4). Gráfico 1 Gráfico 2 Gráfico 3 Gráfico 4 ��� > 0 ��� < 0 ��� ≈ 0 ��� ≈ 0 Quanto maior o valor de ��� (positivo ou negativo), mais forte é a associação (gráficos 5 a 10). Gráfico 5 Gráfico 6 Gráfico 7 ��� = 0,81 ��� = 0,94 ��� = 1 2 Gráfico 8 Gráfico 9 Gráfico 10 ��� = −0,81 ��� = −0,94 ��� = −1 O quadro a seguir fornece um guia para interpretar a intensidade da correlação entre as variáveis. Valor de ��� (+ ou -) Interpretação De 0.0 a menos de 0,2 Correlação linear muito fraca De 0.2 a menos de 0,4 Correlação linear fraca De 0.4 a menos de 0,7 Correlação linear moderada De 0.7 a menos de 0,9 Correlação linear forte De 0.9 a menos de 1.0 Correlação linear muito forte Igual a 1,0 Correlação linear perfeita Propriedades da correlação • < colocar depois > Fórmula alternativa da covariância O coeficiente ��� pode ser obtido pela fórmula abaixo, onde são usados apenas somatórios simples. ��� = !∑�� − (∑� ∑�) �!∑�� − (∑�)� ∙ �! ∑�� − (∑�)� Cuidados com a correlação • Uma correlação de 0,3 não pode ser escrita como 30%, por exemplo. • Correlação não é causalidade: Um comportamento próximo de duas variáveis não significa que uma é causa da outra. Uma correlação alta positiva entre taxa de divórcio e consumo de margarina, não significa que o consumo de margarina leva a um aumento da taxa de divórcio. (hypescience.com/margarina-causa-divorcios/) 3 Exemplo A tabela a seguir mostra a rentabilidade de duas ações de duas empresas diferentes num período de cinco meses. Calcule o coeficiente de correlação entre as rentabilidades das duas empresas. Tabela 1 Mês Ações Empresa X Ações Empresa Y Janeiro 7 20 Fevereiro 8 25 Março 5 18 Abril 4 12 Maio 6 20 4 Passo-a-passo para o cálculo da correlação Usando a fórmula: ��� = !∑ �� − (∑ �∑ �) �!∑ �2 − (∑ �)2 ∙ �!∑ �2 − (∑ �)2 Vamos precisar dos somatórios ∑�� ,∑� , ∑ �� , ∑ � e ∑�� Considerando a tabela 2, vamos seguir os passos abaixo: Passo 1) Digite os dados das variáveis X e Y nas colunas (1) e (2); Passo 2) Calcule o produto na coluna (3) = (1) x (2); �� 7 x 20 = 140 8 x 25 = 200 5 x 18 = 90 4 x 12 = 48 6 x 20 = 120 Passo 3) Calcule os valores de X ao quadrado na coluna (4) e de Y ao quadrado na coluna (5); �� �� 72 = 49 202 = 400 82 = 64 252 =625 52 = 25 182 = 324 42 = 16 122 = 144 62 = 36 202 = 400 Passo 4) Obtenha os somatórios das colunas (1), (2), (3), (4) e (5) e substitua na fórmula ∑�� = 598, ∑ � = 30, ∑ �� = 190, ∑� = 95 e ∑ �� = 1893 ��� = 5(598) − (30 ∙ 95) �5(190) − (30)� ∙ �5(1893) − (95)� = 140 √50 ∙ √440 = 0,94 Tabela 2 (1) x (2) y (3) �� (4) �� (5) �� 7 15 140 49 400 8 25 200 64 625 5 18 90 25 324 4 12 48 16 144 6 20 120 36 400 Soma 30 90 598 190 1893 5 Coeficiente de correlação de Pearson no Excel 2010 A covariância amostral é obtida no Excel 2010 usando a fórmula COVARIAÇÃO.S(matriz1, matriz2). Coeficiente de correlação de Pearson no R 1) Baixe e instale o programa R em https://www.r-project.org/ clique em CRAN (no lado esquerdo) e escolha qualquer repositório (por exemplo, da Universidade Federal do Paraná - http://cran-r.c3sl.ufpr.br/). Ou 2) Use a versão on-line do programa R, disponível em www.r-fiddle.org.
Compartilhar