Buscar

Correlação e Regressão Linear

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

correlação
Diagrama de Dispersão
Considere duas variáveis X e Y assumindo os valores (x1, y1), (x2, y2), · · · , (xn, yn). O diagrama de dispersão é um gráfico cartesiano contendo os pares de pontos (xi, yi), i = 1, 23, · · ·n.
A relação entre as variáveis será direta (ou positiva) quando os valores de Y aumentarem em decorrência da elevação dos valores de X . 
Será inversa (ou negativa) quando os valores de Y variarem inversamente em relação aos de X.
Tipos de correlações
Correlação linear positiva: ocorre quando a variável “X” aumenta a variável “Y” também aumenta.
 Correlação linear negativa: ocorre quando a variável “X” aumenta a variável “Y” diminui.
Correlação não linear: ocorre quando há um ponto de inflexão.
Coeficiente de correlação
Coeficiente de correlação: É uma medida do grau de correlação entre duas variáveis (representado pela letra r). Varia de –1 a + 1. 
Análise do Diagrama de Dispersão:
O diagrama de dispersão mostrará que a correlação será tanto mais forte quanto mais próximo estiver o coeficiente de -1 ou +1, e será tanto mais fraca quanto mais próximo o coeficiente estiver de zero.
 Correlação perfeita negativa (r = −1): Quando os pontos estiverem perfeitamente alinhados, mas em sentido contrário, a correlação é denominada perfeita negativa.
Correlação negativa (−1 < r < 0): A correlação é considerada negativa quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de X associados a valores crescentes de Y.
Correlação nula (r = 0): Quando não houver relação entre as variáveis X e Y, ou seja, quando os valores de X e Y ocorrerem independentemente, não existe correlação entre elas.
Correlação positiva (0 < r < 1): Será considerada positiva se os valores crescentes de X estiverem associados a valores crescentes de Y.
 Correlação perfeita positiva (r= 1): A correlação linear perfeita positiva corresponde ao caso anterior, só que os pontos (X, Y) estão perfeitamente alinhados.
Correlação espúria: Quando duas variáveis X e Y forem independentes, o coeficiente de correlação será nulo. Entretanto, algumas vezes, isto não ocorre, podendo, assim mesmo, o coeficiente apresentar um valor próximo de -1 ou +1. Neste caso a correlação é espúria.
exemplo
A tabela a seguir dá o número de anos de serviço (X) por número de clientes (Y) de agentes de uma companhia de seguros. Calcule o coeficiente de correlação entre as variáveis X e Y. Interprete o valor encontrado.
Solução
Exercício
Regressão Linear Simples
Finalidades da regressão
Previsão (prever o valor de y a partir do valor de x). 
Estimar o quanto x influencia ou modifica y.
 No caso linear, por que os valores observados de X e Y nem sempre serão iguais aos valores estimados pela reta de regressão?
As variações de Y podem não ser perfeitamente explicadas pelas variações de X, ou;
Podem existir outras variáveis das quais Y depende, ou;
 Os valores de X e Y podem ter sido obtidos de uma amostra específica que apresenta distorções em relação a realidade.
 pressupostos para uso da regressão linear
 A variável y deve ter distribuição normal ou aproximadamente normal;
Os pontos no diagrama de dispersão devem apresentar tendência linear. Se a relação for expressa por uma curva pode-se transformar os dados para tentar linearizar a associação ou então usa-se outra forma de regressão não linear;
A variação de x deve ser a mesma para cada valor de y (homocedasticidade).
Os valores de y foram obtidos ao acaso da população e são independentes uns dos outros;
 A variável x foi medida sem erro.
O Modelo de Regressão Linear Simples
Exemplo
Solução

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais