Baixe o app para aproveitar ainda mais
Prévia do material em texto
AULA 5 CORRELAÇÃO DEPARTAMENTO DE CIÊNCIAS CONTÁBEIS Disciplina: MÉTODOS QUANTITATIVOS VOLTADOS PARA PESQUISA EM CONTABILIDADE Professor: ALAN CARTER KULLACK 96 CORRELAÇÃO Definição: O termo correlação significa relação em dois sentidos (co + relação), e é usado em estatística para designar a força que mantém unidos dois conjuntos de valores. Exemplos: Peso x Idade, Consumo x Renda, Altura x Peso de um indivíduo. OBS1: A verificação da existência e do grau de relação entre as variáveis é o objeto de estudo da correlação. OBS2: Uma vez caracterizada esta relação, procura-se descrevê-la sob forma matemática, através de uma função. A estimação dos parâmetros dessa função matemática é o objeto da regressão. Os pares de valores das duas variáveis poderão ser colocados num diagrama cartesiano chamado “diagrama de dispersão”. A vantagem de construir um diagrama de dispersão está em que, muitas vezes sua simples observação já nos dá uma ideia bastante boa de como as duas variáveis se relacionam. Uma medida do grau e do sinal da correlação é dada pela covariância entre as duas variáveis aleatórias X e Y que é uma medida numérica de associação linear existente entre elas, e definida por: Cov(X, Y) = 1 . ∑x.y - ∑x.∑y n n É mais conveniente usar para medida de correlação, o coeficiente de correlação linear de Pearson, como estimador de xy, definido por: 97 rxy = Cov (x,y) = Sxy σx . σy Sxx . Syy e Sxx = ∑x2 - (∑x)2 ; Syy = ∑y2 – (∑y)2 n n sendo: n = número de pares das observações. CORRELAÇÃO LINEAR Definição: É toda análise de correlação (ρ), a qual utilizamos duas variáveis quantitativas da amostra, para verificarmos se existe correlação entre elas. O grau de correlação é sintetizado e conhecido pelo coeficiente de correlação de Pearson(r). FÓRMULA: r = n.∑Xi.Yi – (∑Xi).(∑Yi) [ n.∑Xi2 – (Xi)2] . [ n.∑Yi2 – (∑Yi)2 ] Onde: X = Variável independente; Y = Variável dependente; n = Número de elementos observados. 98 OBS: Uma população que tenha duas variáveis não correlacionadas linearmente pode produzir uma amostra com coeficiente de correlação diferente de zero. Para testar se a amostra foi ou não retirada de uma população de coeficiente de correlação não nulo entre duas variáveis, precisamos saber qual é a distribuição amostral da estatística r. COEFICIENTE DE RELAÇÃO LINEAR Definição: O coeficiente de correlação rxy linear é um número puro que varia de –1 a +1 e sua interpretação dependerá do valor numérico e do sinal, como segue: rxy = -1 Correlação perfeita negativa; -1 < rxy < 0 Correlação negativa; rxy = 0 Correlação nula; 0 < rxy < 1 Correlação positiva; rxy = 1 Correlação perfeita positiva; 0,2 < rxy < 0,4 Correlação fraca; 0,4 < rxy < 0,7 Correlação moderada; 0,7 < rxy < 0,9 Correlação forte; Resumidamente, temos: 1º) r ≥ 0,5 (forte correlação positiva); 2º) r < 0,5 (fraca correlação positiva); 3º) r ≥ - 0,5 (forte correlação negativa); 4º) r < - 0,5 (fraca correlação negativa). 99 ANÁLISE DO DIAGRAMA DE DISPERSÃO O diagrama de dispersão mostrará que a correlação será tanto mais forte quanto mais próximo estiver o coeficiente de –1 ou +1, e será tanto mais fraca quanto mais próximo o coeficiente estiver de zero. a) CORRELAÇÃO PERFEITA NEGATIVA (RXY = -1): Quando os pontos estiverem perfeitamente alinhados, mas em sentido contrário, a correlação é denominada perfeita negativa. b) CORRELAÇÃO NEGATIVA (-1 < RXY < 0): A correlação é considerada negativa quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de X associados a valores crescentes de Y. c) CORRELAÇÃO NULA (RXY = 0): Quando não houver relação entre as variáveis X e Y, ou seja, quando os valores de X e Y ocorrerem independentemente, não existe correlação entre elas. d) CORRELAÇÃO POSITIVA (0 < RXY < 1): Será considerada positiva se os valores crescentes de X estiverem associados a valores crescentes de Y. e) CORRELAÇÃO PERFEITA POSITIVA (RXY = 1): A correlação linear perfeita positiva corresponde ao caso anterior, só que os pontos (X, Y) estão perfeitamente alinhados. f) CORRELAÇÃO ESPÚRIA: Quando duas variáveis X e Y forem independentes, o coeficiente de correlação será nulo. Entretanto, algumas vezes, isto não ocorre, podendo, assim mesmo, o coeficiente apresentar um valor próximo de –1 ou +1. Neste caso a correlação é espúria. Algumas situações que podem se apresentar os diagramas de dispersão. 100 DIAGRAMAS DE DISPERSÃO LINEAR Fonte: http://www.lugli.com.br/2008/02/diagrama-de-dispersao/ OBS: Se x e y variam em sentidos contrários,existe correlação negativa entre as variáveis. Essa correlação é tanto maior quanto menor é a dispersão dos pontos. Fonte: http://www.lugli.com.br/2008/02/diagrama-de-dispersao/ OBS: Se x cresce e y varia ao acaso,não existe correlação entre as variáveis ou o que é o mesmo entre elas pé nula. 101 Fonte: http://www.lugli.com.br/2008/02/diagrama-de-dispersao/ r SQUARE Definição: Determina o impacto da variável independente do X no comportamento da variável dependente Y. OBS: A análise r Square é o resultado do coeficiente de correlação de Pearson ao quadrado(r2) Exemplo: Seja r = 0,92; onde X é o produto derivado do petróleo e Y é o resíduo deste material,logo podemos deduzir que existe uma forte correlação positiva entre as duas variáveis(X e Y),pois: r Square = r2 r Square = (0,92)2 rSquare = 0,8464 Logo podemos deduzir que: 0,8464 x 100% = 84,64 % é referente ao impacto da produção de resíduos, sendo que o restante (15,36%) retrata outras variáveis que também determinam esse impacto. 102 CONCLUSÕES FINAIS: Correlação não é o mesmo que causa e efeito. Duas variáveis podem estar altamente correlacionadas e, no entanto, não haver relação de causa e efeito entre elas. Se duas variáveisestiverem amarradas por uma relação de causa e efeito elas estarão, obrigatoriamente, correlacionadas. O estudo de correlação pressupõe que as variáveis X e Y tenham uma distribuição normal. A palavra simples que compõe o nome correlação linear simples, indica que estão envolvidas no cálculo somente duas variáveis. O coeficiente de correlação linear de Pearson mede a correlação em estatística paramétrica. 103 EXERCÍCIOS DE FIXAÇÃO 01) Para estudar a poluição de um rio, um cientista mediu a concentração de um determinado composto orgânico (Y) e a precipitação pluviométrica na semana anterior (X): a) Existe alguma relação entre o nível de poluição e a precipitação pluviométrica? Informa-se que r= 0,89. Teste sua significância, ao nível de 5%. , 02) Um pesquisador deseja verificar se um instrumento para medir a concentração de determinada substância no sangue está bem calibrado. Para isto, ele tomou 15 amostras de concentrações conhecidas (X) e determinou a respectiva concentração através do instrumento (Y), obtendo: X 2,0 2,0 2,0 4,0 4,0 4,0 6,0 6,0 6,0 8,0 8,0 8,0 10,0 10,0 10,0 Y 2,1 1,8 1,9 4,5 4,2 4,0 6,2 6,0 6,5 8,2 7,8 7,7 9,6 10,0 10,1 Calcule o coeficiente de correlação entre as variáveis X e Y. 03) (AFTN-96) Considere a seguinte tabela, que apresenta valores referentes às variáveis x e y, porventura relacionadas: Valores das variáveis x e y relacionadas X y x2 y2 xy 1 2 3 4 5 6 5 7 12 13 18 20 1 4 9 16 25 36 25 49 144 169 324 400 5 14 36 52 90 120 21 75 91 1.111 317 Marque a opção que representa o coeficiente de correlação linear entre as variáveis x e y. a) 0,903 b) 0,926 c) 0,947 d) 0,962 e)0,989 X Y 0,91 0,10 1,33 1,10 4,19 3,40 2,68 2,10 1,86 2,60 1,17 1,00 104 GABARITO: 01 – Temos que verificar a significância do coeficiente através da fórmula: tc = r. n - 2 1 – r2 Fazendo: tc = 0,89 . 6 – 2 = 3,86 1 – (0,89)2 Portanto: tc = 3,86. O valor crítico de t para n-2 = 4 graus de liberdade, e 5% de nível de confiança é 2,78. Como o valor de t é superior ao valor crítico,concluí mos que X e Y se correlacionam-se. 02- X = 6 e Y = 6,040 e r = 0,996 03- Devemos utilizar a fórmula: YX YX SS YXCov r . ),( , Calculando a Covariância: YXYXyxCov ..),( . 83,52 6 317. . n YiXi YX ; 5,3 6 21 n Xi X ; e 5,12 6 75 n Yi Y Logo: Cov(x,y)=52,83-(3,5).(12,5) Cov(x,y)=9,08 Calculando as Variâncias de X e de Y: 222 XXS X 91,225,1216,155,3 6 91 22 XS e 222 YYS Y 91,2825,15616,1855,12 6 1111 22 YS Calculando os Desvios Padrões de X e de Y: XX SS 2 SX= 91,2 e YY SS 2 Sy= 91,28 Calculando a Correlação: YX YX SS YXCov r . ),( , 989,0 172,9 08,9 128,84 08,9 91,28.91,2 08,9 , YXr Resposta: 0.989 (letra E)
Compartilhar