Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Probabilidade e Estatística Prof. Dr. Marcos A. S. de Jesus 2 AULA 08 Correlação entre Variáveis Correlação entre Variáveis Introdução Nos estudos estatísticos que envolvem o coeficiente de correlação de Pearson (r), que também pode ser chamado de coeficiente de correlação produto-momento, mede a relação que existe entre duas variáveis dentro de uma mesma escala métrica. A finalidade do coeficiente de correlação é determinar qual é a intensidade da relação que existe entre conjuntos de dados ou informações conhecidas sobre duas variáveis expressas numericamente. O valor do coeficiente de correlação pode variar entre -1 e 1 e o resultado obtido define se a correlação é negativa ou positiva ou nula. 3 Diagrama de Dispersão e o valor de r r é sempre um valor entre 1 e –1 ou seja: -1 r 1 Se r = 1 as duas variáveis relacionadas têm correlação perfeitamente positivas; Se r = -1 as duas variáveis relacionadas têm correlação perfeitamente negativa; É importante lembrar que os gráficos são suposições, o gráfico não é uma análise confirmatória, ele é simplesmente uma análise exploratória, ou seja, podemos ter uma ideia gráfica do comportamento das variáveis. Mas, quando temos uma quantidade de dados muita elevada, nossa visão gráfica pode nos levar a uma interpretação errônea. Correlação Positiva Nesse caso costumamos dizer que as variáveis andam juntas, ou seja, quando uma delas cresce a outra tende a crescer e quando decresce, a outra também tende a decrescer. 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 Série1 4 Nesse caso costumamos dizer que as variáveis andam em sentidos opostos, ou seja, quando uma delas cresce a outra decresce e, quando uma delas decresce a outra tende a crescer. Correlação Negativa 0 2 4 6 8 10 12 0 1 2 3 4 5 6 Série1 Correlação Nula Nesse caso, dizemos que há uma baixa relação entre as variáveis, ou não existe (muito fraca) a relação. Veja que no gráfico a seguir, não é possível definir qual o comportamento entre as variáveis. 0 2 4 6 8 10 12 0 1 2 3 4 5 6 7 Série1 5 Entendendo Cálculo do Coeficiente de Correlação de Pearson Considere os dados contidos nas tabelas a seguir, construa um diagrama de dispersão para as variáveis x e y e determine o valor do coeficiente de correlação. X Y X2 Y2 X.Y 1 2 1 4 2 2 3 4 9 6 3 4 9 16 12 4 5 16 25 20 5 7 25 49 35 15 21 55 103 75 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 Série1 Entendendo a Fórmula de Pearson 𝒓 = σ 𝒙𝒚− σ 𝒙 σ 𝒚 𝒏 (σ 𝒙𝟐− (σ 𝒙)𝟐) 𝒏 ).(σ 𝒚𝟐− (σ 𝒚)𝟐 𝒏 ) → 𝒓 = 75− 15.21 5 55− 15 2 5 .(103− 21 2 5 ) r = 75−63 55−45 .(103−88,2) → r = 75−63 55−45 .(103−88,2) r = 12 10 .(14,8) r = 12 148 = 12 12,165525206 = 𝟎, 𝟗𝟖𝟔 (correlação positiva) 6 Saiba mais Considere os dados contidos nas tabelas a seguir, construa um diagrama de dispersão para as variáveis x e y e determine o valor do coeficiente de correlação. X Y X2 Y2 X.Y 1 10 1 100 10 2 8 4 64 16 3 6 9 36 18 4 5 16 25 20 5 1 25 1 5 15 30 55 226 69 0 2 4 6 8 10 12 0 1 2 3 4 5 6 Série1 Entenda melhor 𝒓 = σ 𝒙𝒚− σ 𝒙 σ 𝒚 𝒏 (σ 𝒙𝟐− (σ 𝒙)𝟐) 𝒏 ).(σ 𝒚𝟐− (σ 𝒚)𝟐 𝒏 ) → 𝒓 = 𝟔𝟗− 𝟏𝟓.𝟑𝟎 𝟓 𝟓𝟓− 𝟏𝟓 𝟐 𝟓 .(𝟐𝟐𝟔− 𝟑𝟎 𝟐 𝟓 ) 𝒓 = 𝟔𝟗−𝟗𝟎 𝟓𝟓−𝟒𝟓 .(𝟐𝟐𝟔−𝟏𝟖𝟎) → 𝒓 = −𝟐𝟏 𝟓𝟓−𝟒𝟓 .(𝟐𝟐𝟔−𝟏𝟖𝟎) 𝒓 = −𝟐𝟏 𝟏𝟎 .(𝟒𝟔) 𝒓 = −𝟐𝟏 𝟒𝟔𝟎 = −𝟐𝟏 𝟐𝟏,𝟒𝟒𝟕𝟔𝟏𝟎𝟓𝟗 = − 𝟎, 𝟗𝟕𝟗 Correlação negativa 7 Teste “t” para significância da Correlação de Pearson Introdução O coeficiente de correlação de Pearson (r) varia de -1 até +1. Se o coeficiente de correlação entre duas variáveis for igual à zero ou muito próximo desse valor, dizemos que há ausência de correlação entre as variáveis. Mas se o coeficiente de correlação linear entre as variáveis for igual a 0,48? Não se pode julgar o valor desse coeficiente sem saber o tamanho da amostra. Quando a amostra é muito pequena, mesmo coeficientes de correlação com valores altos tem pouco significado. Estabelecer o nível de significância (𝛼) e considerar 𝑛 o número de elementos da amostra. Seja 𝑟 = 0,75 para uma amostra com n = 20. Assim ficará: Procedimentos para cálculo do teste “t” 𝑡 = 𝑟 1−𝑟2 𝑛 − 2 𝑡 = 0,75 1 − (0,75)2 20 − 2 𝑡 = 0,75 0,4375 18 𝑡 = 4,81 Para ∝= 5%, temos na Tabela (Anexo 1) com n – 2 = 20 – 2 = 18 graus de liberdade o valor de t é igual a 2,1. Como o valor calculado em valor absoluto é igual 4,81, nesse caso 4,81 > 2,10, então concluímos que a correlação é significativa. 8 Procedimentos para cálculo do teste “t” Verificar se a correlação r = 0,38 é significativa calculada sobre uma amostra de tamanho 40, para 𝛼 = 0,05. 𝑡 = 𝑟 1−𝑟2 𝑛 − 2 𝑡 = 0,38 1 − (0,38)2 40 − 2 𝑡 = 0,38 0,8556 38 𝑡 = 2,53 Para ∝= 5%, temos na Tabela (Anexo 1) com n – 2 = 40 – 2 = 38 graus de liberdade o valor de t é igual a 2,04 (veja Tabela no anexo 1 Guia de Ensino). Como o valor calculado em valor absoluto é igual 2,53, nesse caso 2,53 > 2,04, então concluímos que a correlação é significativa. “Os afetos podem, às vezes, somar-se. Subtrair-se, nunca (Pitágoras, 580 – 497 a.C.)
Compartilhar