Baixe o app para aproveitar ainda mais
Prévia do material em texto
Correlação e Regressão A verificação da existência e do grau de relação entre variáveis é o objeto de estudo da correlação. Uma vez caracterizada, procura-se descrever uma relação sob forma matemática, através de uma função. A estimação de parâmetros dessa função matemática é objeto da regressão. Correlação Linear Simples O estudo da correlação tem por objetivo medir e avaliar o grau de relação existente entre duas variáveis aleatórias. Assim, por exemplo, podemos medir se a relação entre o número de filhos de uma família e sua renda é forte, fraca ou nula. A correlação linear procura medir a relação entre as variáveis x e y através da disposição dos pontos (x,y) em torno de uma reta. Medida de Correlação O instrumento de medida da correlação linear é dado pelo coeficiente de correlação de Pearson: n y y n x x n yx xy rXY 2 2 2 2 . O campo de variação do coeficiente r situa-se entre -1 e 1. 11 XYr O valor do coeficiente de correlação r sempre deverá estar entre –1 e 1. Geralmente multiplicamos o valor encontrado r por 100, dando a resposta em porcentagem. Abaixo temos a configuração do diagrama de dispersão para diversos valores de r. Correlação Linear Positiva A correlação linear será positiva se valores crescente de x estiverem associados a valores crescentes e y, ou valores decrescentes de x estiverem associados a valores decrescentes da variável y. Correlação Linear Negativa A correlação linear será negativa se valores crescente de x estiverem associados a valores decrescentes e y, ou valores decrescentes de x estiverem associados a valores crescentes da variável y. Correlação Nula Quando não houver relação entre as variáveis x e y, ou seja, quando as variações x e y ocorrerem independentemente, não existe correlação entre elas. Os diagramas mostram que a correlação será tanto mais forte quanto mais próximos estiverem o resultado de 1 , e será tanto mais fraca quanto mais próximo o resultado estiver de zero. Cálculo Prático do Coeficiente de Correlação Linear Para o cálculo do coeficiente de correlação é conveniente a construção de uma tabela onde, a partir dos valores de x e y, são determinadas todas as somas necessárias. Ex1: Calcular o coeficiente de correlação linear entre as variáveis x e y, usando os dados da tabela abaixo. Y 10 8 6 10 12 X 2 4 6 8 10 Solução: Y X X2 Y2 XY 10 2 4 100 20 8 4 16 64 32 6 6 36 36 36 10 8 64 100 80 12 10 100 144 120 46 30 220 444 288 416,0 208.40 12 5 46 444 5 30 200 5 4630 288 22 XYr O resultado mostra que a correlação linear entre as variáveis x e y é positiva (quando x cresce linearmente, y também cresce linearmente), porém é baixa. Exercício – Regressão Linear (revisão) Os dados abaixo referem-se ao volume de precipitação pluviométrica (mm) e ao volume de produção de leite C (milhões de litros), em determinada região do país. Anos Produção de leite C (100.000l) Índice pluviométrico (mm) 1970 26 23 1971 25 21 1972 31 28 1973 29 27 1974 27 23 1975 31 28 1976 32 27 1977 28 22 1978 30 26 1979 30 25 a) Ajustar os dados através de um modelo linear; b) Admitindo-se, em 1980, um índice pluviométrico de 24mm, qual deverá ser o volume esperado de produção do leite tipo C? Y X X2 XY 26 23 529 598 25 31 441 525 31 28 784 868 29 27 729 783 27 23 529 621 31 28 784 868 32 27 729 864 28 22 484 616 30 26 676 780 30 25 625 750 289Y 250X 63102 X 7273XY i) Determinação do parâmetro b: 8,0 60 48 10 250 6310 10 289.250 7273 22 2 n x x n yx xy b ii) Determinação do valor do parâmetro a : 9,8a iii) Equação da reta ajustada: xybxay 8,09,8 Para responder a letra b), devemos fazer x = 24mm, teremos: 1,28248,09,8 y De acordo com o modelo, podemos esperar apenas 28,1 milhões de litros produzidos para um índice pluviométrico de 24mm.
Compartilhar