Buscar

Correlação e Regressão linear

Prévia do material em texto

Correlação 
e
 Regressão Linear
Será que existe relação 
entre altura e peso?
Em nosso cotidiano, observamos o
seguinte: à medida que a altura aumenta, as pessoas costumam ter
pesos maiores. 
Este é um exemplo de relação entre duas variáveis.
Coeficiente de Correlação
É uma medida que quantifica o grau dessa relação. 
Afirmar que uma variável está relacionada à outra, não implica a noção
de causalidade. Por isso, o peso elevado de um indivíduo não depende,
necessariamente, de sua altura.
Relação entre duas variáveis
A relação entre duas variáveis pode ser observada em diagramas de
dispersão. Quando queremos saber se uma variável tem relação com outra, medimos as duas variáveis de interesse para cada elemento da amostra.
Assim, se queremos saber se a altura tem relação com o peso, medimos a altura e o peso de cada pessoa. Então, cada uma irá fornecer um ponto a ser representado no gráfico de dispersão.
Tipos de Correlação
Correlação linear positiva
Quando um aumento de uma variável é acompanhado pelo aumento da outra variável, dizemos que há uma correlação positiva.
Correlação linear negativa
Gráfico com diversas marcações para duas variáveis: x e y. 
Iniciando na marcação: y = 4 e x = 0,5, quando y cai para 3,5, o x aumenta para 0,9, e assim sucessivamente.
Correlação nula
Correlação não linear
Quando a taxa de aumento ou diminuição pode mudar como uma mudança de variáveis, causando um "padrão curvo" nos dados, dizemos que é uma correlação não linear.
Grau de correlação - coeficiente linear de Pearson
O grau da correlação pode ser quantificado através do coeficiente linear de Pearson. Dependendo do resultado encontrado, a relação pode ser classificada em:
r = 0 - Não há correlação ou a correlação não é linear.
0 < r < 0,3 - Correlação positiva muito fraca.
0,3 ≤ r < 0,6 - Correlação positiva fraca.
0,6 ≤ r ≤1 - Correlação positiva forte.
-0,3 < r < 0 - Correlação negativa muito fraca.
-0,6 < r < -0,3 - Correlação negativa fraca.
-1 ≤ r ≤ -0,6 - Correlação negativa forte.
r = 1 - Correlação perfeita positiva.
r = -1 - Correlação perfeita negativa.
Exemplos de correlações negativas forte e fraca
O coeficiente de correlação linear de Pearson só tem significado se os dados possuem uma correlação linear, ou seja, estão dispostos no diagrama de dispersão em torno de uma reta.
Fórmula do coeficiente de correlação linear de Pearson
Exemplo para cálculo do coeficiente de correlação de Pearson
	Altura	Peso	 XY	 X²	 Y²
	150	50	7.500	22.500	2.500
	155	65	10.075	24.025	4.225
	162	60	9.720	26.244	3.600
	169	75	12.675	28.561	5.625
	172	65	11.180	29.584	4.225
	175	80	14.000	30.625	6.400
	179	73	13.067	32.041	5.329
	183	85	15.555	33.489	7.225
	187	80	14.960	34.969	6.400
	192	100	19.200	36.864	10.000
	1724	733	127.932	298.902	55.529
Substituindo os valores na Fórmula
Sendo: n=10
∑x = 1.724
∑y = 733
∑xy = 127.932
∑x∑y =1.724 x 733=1.263.692
∑x2 = 298.902
(∑x)2 = (1724)2 = 2.972.176
∑y2 = 55.529
(∑y)2= (733)2 = 537.289
Como encontraremos um r = 0,90, podemos dizer que a correlação encontrada é positiva forte.
EXERCÍCIOS
Qual correlação é apresentada no gráfico a seguir?
Positiva Forte 
(B) Positiva Fraca 
(C) Negativa Forte 
(D) Negativa Fraca 
(E) Nula
GABARITO
LETRA A – Positiva Forte
A medida em que x cresce, y também está crescendo. Dessa forma, a correlação é positiva.
A correlação é forte, porque a dispersão dos dados é pequena.
No artigo intitulado "Estresse e depressão entre alunos do último período de dois cursos de enfermagem" (Moreira & Furegato, 2013), os autores correlacionam uma escala quantitativa de níveis de estresse com uma escala quantitativa de avaliação do grau de depressão, cujo resultado é reproduzido a seguir.
Com base na análise do resultado obtido no estudo responda:
a) Qual a variável dependente e independente no gráfico?
b) A correlação é positiva ou negativa?
c) Você diria que existe ou não correlação entre as variáveis apresentadas? Por que?
GABARITO
a) No caso apresentado a variável independente é o nível de estresse, enquanto a variável dependente é o grau de depressão.
b) Trata-se de uma correlação positiva.
c) Existe uma forte correlação entre as variáveis. Observa-se no gráfico um grande número de elementos e baixa dispersão dos dados.
Por meio do diagrama de dispersão podemos ter noção qual a melhor correlação linear (positiva, negativa ou nula). Por exemplo, se o diagrama de dispersão sugerir uma reta crescente, então:
(A) a correlação linear será positiva e o coeficiente de correlação linear será superior a zero e igual ou menor do que 1.
(B) a correlação linear será negativa e o coeficiente de correlação linear será superior a zero e igual ou menor do que 1.
(C) a correlação linear será positiva e o coeficiente de correlação linear estará entre -1 a +1.
(D) a correlação linear será negativa e o coeficiente de correlação linear estará entre -1 a +1.
(E) a correlação linear será positiva e o coeficiente de correlação linear estará entre -1 a 0.
GABARITO
LETRA A
Por meio do diagrama de dispersão podemos ter noção qual a melhor correlação linear (positiva, negativa ou nula). Por exemplo, se o diagrama de dispersão sugerir uma reta decrescente, então:
Será uma correlação linear simples positiva, sendo que o coeficiente de correlação linear simples terá valor maior do que zero e menor ou igual 1.
(B) Será uma correlação linear simples positiva, sendo que o coeficiente de correlação linear simples terá valor entre -1 a < 0 (-1 a menor do que zero). 
(C) Será uma correlação linear simples negativa, sendo que o coeficiente de correlação linear simples terá valor maior do que zero e menor ou igual 1. 
(D) Será uma correlação linear simples negativa, sendo que o coeficiente de correlação linear simples terá valor entre -1 a < 0 (-1 a menor do que zero).
(E) Será uma correlação linear simples positiva. 
GABARITO
LETRA D

Continue navegando