Baixe o app para aproveitar ainda mais
Prévia do material em texto
Correlação e Regressão Capa da Obra Introdução Quando consideramos observações de duas ou mais variáveis, surge um novo problema: as relações que podem existir entre as variáveis estudadas. Assim, quando consideramos variáveis como peso e altura de um grupo de pessoas, uso de cigarro e incidência de câncer, procuramos verificar se existe alguma relação entre as variáveis de cada um dos pares e qual o grau dessa relação. Capa da Obra Sendo a relação entre as variáveis de natureza quantitativa, a correlação é o instrumento adequado para descobrir e medir essa relação. Uma vez caracterizada a relação, procuramos descrevê-la através de uma função matemática. A regressão é o instrumento adequado para a determinação dos parâmetros da função. Capa da Obra Correlação As relações do tipo peso – altura são conhecidas como relações estatísticas. Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe correlação entre elas. Capa da ObraDiagrama de dispersão Representando, em um sistema cartesiano ordenado ortogonal, os pares ordenados (x,y), obtemos uma nuvem de pontos que denominamos diagrama de dispersão. Capa da ObraCorrelação Linear Capa daObra Como a correlação em estudo tem como “imagem” uma reta ascendente, ela é chamada correlação linear positiva. Assim, uma correlação é: - Linear positiva se os pontos têm como imagem uma reta ascendente; - Linear negativa se os pontos têm como imagem uma reta descendente; - Não-linear se os pontos têm como imagem uma curva. Capa da ObraTipos de Correlação apa da ObraCoeficiente de correlação linear O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Esse coeficiente deve indicar o grau de intensidade da correlação entre duas variáveis e, ainda, o sentido dessa correlação (positivo ou negativo). Capa da Obra O coeficiente de correlação de Pearson é dado por: 2 2 2 2 i yyn.. i xxn. i y. i x i y i xn r ii Capa da Obra Dessa maneira, podemos ver que: - Se r=+1, há correlação perfeita e positiva entre as variáveis; - Se r=-1, há correlação perfeita e negativa entre as variáveis; - Se r=0, ou não há correlação entre as variáveis, ou a relação que porventura exista não é linear. Correlação Coeficiente de correlação linear Notas: Para que uma relação possa ser descrita por meio do coeficiente de correlação de Pearson é imprescindível que ela se aproxime de uma função linear. Uma maneira prática de verificarmos a linearidade da relação é a inspeção do diagrama de dispersão: se a elipse apresenta saliências ou reentrâncias muito acentuadas, provavelmente trata-se de correlação curvilínea. Correlação Coeficiente de correlação linear Para podermos tirar algumas conclusões significativas sobre o comportamento simultâneo das variáveis analisadas, é necessário que: Analisando o Diagrama de Dispersão, quando o coeficiente de correlação é um valor mais perto de 1 ou -1, os pontos estão mais próximos uns dos outros. Se o valor de r for menor que 0,6, os pontos no diagrama estarão mais dispersos. Capa da Obra Regressão Ajustamento da reta Sempre que desejamos estudar determinada variável em função de outra fazemos uma análise de regressão. A análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis, partindo de n observações das mesmas. A variável a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. Capa da Obra Regressão Ajustamento da reta Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por: Y = aX + b. Capa da Obra Ajustamento da reta Y = aX + b Determinar os valores de a e b através das seguintes fórmulas: Capa da ObraNota: Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros, o resultado, na realidade, é uma estimativa da verdadeira equação de regressão. Sendo assim, escrevemos: Capa da Obra Exemplos: 1) Uma empresa pretende analisar as despesas de combustível para a entrega de seus produtos. Foram coletados dados referentes a 5 caminhões, onde x representa a distância percorrida (em km) e y a quantidade necessária de combustível (em litros): Investigar se há correlação entre as variáveis. Caso exista, fazer uma estimativa para a quantidade de combustível associada a uma distância de 120km. x (km) y (litros) 50 60 80 80 90 85 100 90 150 190 x (km) y (litros) x.y x2 y2 50 60 3000 2500 3600 80 80 6400 6400 6400 90 85 7650 8100 7225 100 90 9000 10000 8100 150 190 28500 22500 36100 470 505 54550 49500 61425 2 2 2 2 i yyn.. i xxn. i y. i x i y i xn r ii 95,0 14,37227 35400 1385860000 35400 52100.26600 35400 52100.26600 35400 255025307125.220900247500 237350272750 50561425.5.47049500.5 505.47054550.5 22 r r r r De acordo com o coeficiente de correlação de Pearson (r = 0,95), temos uma CORRELAÇÃO LINEAR POSITIVA entre as variáveis, altamente significativa. 0952,243308,1 0952,24 0952,125101 94.3308,1101 101 5 505 94 5 470 x :Médias das Cálculo 3308,1 26600 35400 xy b b b y a , 2 2 i xxn. i y. i x i y i xn a i xayb . y = 1,330x - 24,09 0 20 40 60 80 100 120 140 160 180 200 0 50 100 150 200 Análise de Regressão Determinar a Equação da Reta de Regressão: y=a.x+b y=1,33x-24,09 Diagrama de Dispersão Análise de Regressão y=1,33x-24,09 Utilizamos a função para obter um valor estimado de y a partir de uma valor de x. Tempos x= 120km, então: y=1,33.120-24,09=135,51 Assim, uma estimativa para a quantidade de combustível associada a uma distância de 120km seria de, aproximadamente, 136 litros. Capa da Obra Exemplos: 2) Uma empresa pretende analisar as despesas de combustível para a entrega de seus produtos. Foram coletados dados referentes a 5 caminhões, onde x representa a distância percorrida (em km) e y a quantidade necessária de combustível (em litros): Investigar se há correlação entre as variáveis. Caso exista, fazer uma estimativa para a quantidade de combustível associada a uma distância de 30km. x (km) y (litros) 5 30 15 83 20 120 28 130 35 175 x (km) y (litros) x.y x2 y2 5 30 150 25 900 15 83 1245 225 6889 20 120 2400 400 14400 28 130 3640 784 16900 35 175 6125 1225 30625 103 538 13560 2659 69714 CÁLCULO DO COEFICIENTE DE CORRELAÇÃO 98,0 08,12602 12386 158812436 12386 591262686 12386 2894443485701060913295 5541467800 2 538697145 2 10326595 53810313560.5 . r . r ... . r De acordo com o coeficiente de correlação de Pearson (r = 0,98), temos uma CORRELAÇÃO LINEAR POSITIVA entre as variáveis, altamente significativa. y=4,61x+12,61 60722,126113,4 60722,12 99278,946,107 6,20.6113,46,107 . xy b b b xayb Análise de Regressão Determinar a Equação da Reta de Regressão: y=a.x+b 6,107 5 538 6,20 5 103 :Médias das Cálculo y x y = 4,611x + 12,60 0 20 40 60 80 100 120 140 160 180 200 0 10 20 30 40 Diagrama de Dispersão 6113,4 2686 12386 a Análise de Regressão Utilizamos a função para obter um valor estimado de y a partir de uma valor de x. Tempos x= 30km, então: y=4,61.30+12,61=150,91 Assim, uma estimativa paraa quantidade de combustível associada a uma distância de 30km seria de, aproximadamente, 151 litros. y=4,61x+12,61 Capa da Obra Exemplos: 3) Uma empresa com 10 armazéns compilou dados sobre a área de vendas (em metros quadrados) versus lucro diário: Colunas auxiliares 65 65 473 481 475 475 481 473. 65 65 10 2 2 y x yx y x n 91,0 1886,554 505 307125 505 525585 505 )42254750).(42254810( 42254730 )65475.10).(65481.10( 65.65473.10 22 r r r r 2 2 2 2 i yyn.. i xxn. i y. i x i y i xn r ii Capa da ObraAjustamento da reta Diagrama de Dispersão 65 65 10 y x n 91,0 59,55,6 5,6.86,05,6 86,0 585 505 b b b xayb a 5,6 10 65 5,6 10 65 n y y n x x i i estimado Lucro 35,491,04.86,0 91,086,0 y xy 91,086,0 xy baxy Equação de Regressão: Estimativa para x=4 (por exemplo): Determinação dos parâmetros a e b: Capa da ObraInterpolação e Extrapolação Voltando à tabela do exemplo anterior, vemos que 4,0 não figura entre os valores de área. Entretanto, podemos estimar o lucro diário correspondente a área fazendo X=4,0 na equação de regressão: Assim, O mesmo acontece com a área igual a 1,0: 91,086,0 XY 35,491,00,486,00,4 YX 77,191,00,186,00,1 YX Como 4 pertence ao intervalo [2,10], dizemos que foi feita uma interpolação; e como 1 não pertence ao intervalo [2,10], dizemos que foi feita uma extrapolação.
Compartilhar