Baixe o app para aproveitar ainda mais
Prévia do material em texto
CORRELAÇÃO E REGRESSÃO ESTATÍSTICA 2 1 - INTRODUÇÃO............................................................................................................4 2 – CORRELAÇÃO ESTATÍSTICA.................................................................................4 2.1 – TIPOS DE CORRELAÇÃO......................................................................................4 2.2 – DIAGRAMA DE DISPERSÃO................................................................................5 2.3 - COEFICIENTE DE CORRELAÇÃO........................................................................5 2.3.1- COEFICIENTE DE E CORRELAÇÃO LINEAR.................................................5 2.4 – EXERCICÍO RESOLVIDO......................................................................................5 3 - REGRESSÃO ESTATÍSTICA....................................................................................7 3.1 - EQUAÇÃO DE REGRESSÃO .................................................................................7 3.2 - EXERCÍCIOS RESOLVIDOS..................................................................................8 4 - CONCLUSÃO..............................................................................................................9 5 - REFERÊNCIAS BIBLIOGRÁFICAS........................................................................10 3 1. INTRODUÇÃO Antes de conceituarmos correlação e regressão estatística deve-se saber porque usá-la. No estudo de inferência, estuda-se casos com 1 variável e 2 populações. No estudo de Correlação e Regressão Estatísticas dever-se levar em conta 2 variáveis e 1 população. Exemplo: Peso e Comprimento (2variaveis) das baleias (1 população). Dentre esse estudo teremos a correlação e a regressão estatística, cujo principal objetivo é estudar a relação entres essas variáveis. Esse estudo pode ser investigando presença e/ou ausência dessa relação, que pode ser : 1) Quantificando a força dessa relação: correlação 2) Explicitando a forma dessa relação: regressão 2. CORRELAÇÃO ESTATÍSTICA A correlação é a medida padronizada da relação entre duas variáveis indica a força e a direção do relacionamento linear entre duas variáveis aleatórias. • A correlação nunca pode ser maior do que 1 ou menor do que menos 1. • Uma correlação próxima a zero indica que as duas variáveis não estão relacionadas. • Uma correlação positiva indica que as duas variáveis movem juntas, e a relação é forte quanto mais a correlação se aproxima 1. • Uma correlação negativa indica que as duas variáveis movem-se em direções opostas, • A relação fica mais forte quanto mais próxima a correlação de -1. • Duas variáveis que estão perfeitamente correlacionadas positivamente (r=1) movem-se essencialmente em perfeita proporção na mesma direção, • Dois conjuntos que estão perfeitamente correlacionados negativamente movem- se em perfeita proporção em direções opostas. A relação entre as variáveis é evidenciada pela formação de um padrão no diagrama de Dispersão 2.1 TIPOS DE CORRELAÇÃO A correlação entre 02 variáveis pode ser: 1. Correlação Positiva : O aumento de uma variável corresponde, ao aumento da outra. 2. Correlação Negativa: O aumento de uma variável corresponde a diminuição da outra. 3. Correlação Linear: Quando é possível ajustar uma reta, pode ser forte (quanto mais próximas da reta) ou fraca (quanto mais distantes da reta). 4. Correlação não-linear: Quando não é possível ajustar uma reta. 2.2 DIAGRAMA DE DISPERSÃO O diagrama de dispersão é um gráfico onde pontos no espaço cartesiano XY são usados para representar simultaneamente os valores de duas variáveis quantitativas medidas em cada elemento do conjunto de dados. Ele é muito útil para comparar dados, como antes e depois. De acordo com a correlação das variáveis o diagrama pode ser: 4 2.3 COEFICIENTE DE CORRELAÇÃO Coeficiente de correlação indica a força e a direção do relacionamento linear entre as duas variáveis a ser estudada, sendo denotada por r . Vários coeficientes são utilizados para situações diferentes, tais como o coeficiente de correlação de Pearson e o coeficiente Linear. 2.3.1 COEFICIENTE DE CORRELAÇÃO LINEAR Esse coeficiente serve para detectar padrões de lineares. (não vale para os padrões não lineares). • O valor de r estar sempre entre 1 e -1, ou seja −1 ≤ r ≤ 1 • Se r está próximo de 1, há uma forte correlação positiva. • Se r está próximo a –1, há uma forte correlação negativa. • Se r está próximo de 0, não há correlação linear. 2.4 EXERCICIOS RESOLVIDOS 1º) A tabela abaixo mostra o resultado de uma pesquisa com 10 famílias de determinada região. 5 Famílias Renda (R$) Poupança (R$) Nº de Filhos Média de Anos de Estudo da família A 10 4 8 3 B 15 7 6 4 C 12 5 5 5 D 70 20 1 12 E 80 20 2 16 F 100 30 2 18 G 20 8 3 8 H 30 8 2 8 I 10 3 6 4 J 60 15 1 8 a) Calcular ao coeficiente de correlação Linear entre a renda familiar e a poupança. Solução: RENDA (Y) POUPANÇA (X) X2 Y2 XY 10 4 16 100 40 15 7 79 225 105 12 5 25 144 60 70 20 400 4.900 1.400 80 20 400 6.400 1.600 100 30 900 10.000 3.000 20 8 64 400 160 30 8 64 900 240 10 3 9 100 30 60 15 225 3.600 900 ΣΣΣΣy =407 ΣΣΣΣx =120 ΣΣΣΣx2=2.152 ΣΣΣΣy2=26.769 ΣΣΣΣxy=7.535 Aplicando na Fórmula : r = (10 x 7.535 )– (120 x 407 = 0,9835 √(10x2.152) – 1202 √10x26.769 -4072 Existe uma forte correlação linear entre renda e a poupança familiar. O sinal do coeficiente mostra que as duas variáveis variam no mesmo sentido. b) Calcular o coeficiente de correlação linear entre renda e números de filhos para as dez famílias. Solução: Renda (y) N° de filhos (x) X 2 Y 2 XY 10 8 64 100 80 15 6 36 225 90 6 12 5 25 144 60 70 1 1 4.900 70 80 2 4 6.400 160 100 2 4 10.000 200 20 3 9 400 60 30 2 4 900 60 10 6 36 100 60 60 1 1 3.600 60 407 36 184 26.769 900 ΣΣΣΣy = 407 ΣΣΣΣx = 36 ΣΣΣΣx2 =184 ΣΣΣΣy2 = 26.769 ΣΣΣΣxy = 900 Aplicando a fórmula obtemos: r = (10 x 900)– (36 x 407) = - 0,758 √(10x184) – 362 √10x 26.769 -4072 O resultado revela uma correlação forte e inversa (negativa), ou seja, as famílias com maiores rendas têm menor número de filhos. 3. REGRESSÃO ESTATÍSTICA Já que foi estabelecido uma relação linear e uma boa correlação entre as variáveis , deve- se agora determinar uma formula matemática para prever os resultados de y dado os valores de x. Chama-se esta relação de regressão, ou seja, a regressão, em geral, trata da questão de se estimar um valor condicional esperado. 3.1 EQUAÇÃO DE REGRESSÃO A regressão linear que é um modelo adequado quando encontramos disposições dos pontos conforme os da figura abaixo: Caso como os estas figura não seriam bem descritos pela equação linear. Descrevemos a equação linear através da fórmula y = a + bx. Chamamos a de intecepto- y (valor de y para o qual x = 0) e b o coeficiente angular da reta. 7 Os diferentes valores observados representados pela figura abaixo serão ajustados através da técnica dos mínimos quadrados que permitem ajustar a melhor reta para o conjunto de pontos dados. Os valores de b e a são sinteticamente determinados pelas fórmulas: 3.2 EXEMPLO RESOLVIDO Os dados abaixo referem-se ao volume de precipitação pluviométrica (mm) e ao volume de produção de leite tipo C (milhões de litros), em determinada região do país. a) Ajustar os dados através de um modelo linear b) Admitindo-se, em 1980, um índice pluviométrico de 24 mm, qual deverá ser o volume esperado de produção do leite tipo C? Anos Produção de leite (1.000.000 l) Índice Pluviométrico (mm) 1970 26 23 1917 25 21 1972 31 28 1973 29 27 1974 27 23 1975 3128 1976 32 27 1977 28 22 1978 30 26 1979 30 25 Solução: Y X X2 XY 26 23 529 598 25 21 441 525 31 28 784 868 29 27 729 783 27 23 529 621 31 28 784 868 32 27 729 864 28 22 484 616 30 26 676 780 30 25 625 750 ΣΣΣΣy = 289 ΣΣΣΣx = 250 ΣΣΣΣx2 =6.310 ΣΣΣΣxy = 7.273 8 I –Determinar o valor do Parâmetro b b = (10x7.273)- (250x289) = 0,8 (10x6.310) - 2502 II – Determinar o valor do Parâmetro a a = 289 - 0,8. 250 = 8,9 10 10 III – Equação da Reta Ajustada y = a + bx y = 8,9 +0,8x b) fazendo x = 24 mm temos: y = 8,9 +0,8x24 = 28,1. De acordo co o modelo, podemos esperar 28,1 milhões de litros produzidos para um índice pluviométrico de 24 mm. 4. CONCLUSÃO Em virtude dos temas e tópicos abordados, pode-se concluir que Correlação e Regressão linear é um tema estatístico de enorme importância e aplicabilidade, não só a disciplinas e profissões afins, tais como matemática, engenharia, estatísticas entre outras, mas também percebemos sua aplicação nas mais variadas áreas de como medicina, farmacologia e até mesmo ma música. Estudar esse tema será ajudará o individuo a melhorar sua percepção estatística fornecendo-o um raciocínio lógico completo. 9 5. REFERÊNCIAS BIBLIOGRÁFICAS TOLEDO, Geraldo Luciano; OVALLE, IvoIzidoro. Estatística Básica. 2º Edição. São Paulo: Atlas, 1995. KNEIP, Flavia Conde. Capítulo 9: Correlação e Regressão. Disponível em: <http://www.fsp.usp.br/hep103/Aula5.pdf.> Acesso em: 15 de jun. 2009.
Compartilhar