Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística – Prof. Ricardo Luís Rocha Regressão Linear Unidade 3 Estatística – Prof. Ricardo Luís Rocha Ementa 3.1 – Reta dos mínimos quadrados 3.2 – Ajuste da reta de regressão linear simples Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Na unidade anterior estudamos a medida da intensidade de correlação entre duas variáveis. Se chegarmos à conclusão de que há uma grande correlação linear entre as variáveis, devemos determinar qual relação é essa. A determinação da relação linear entre duas variáveis é chamada de regressão linear. Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Dada uma coleção de dados amostrais emparelhados, a equação de regressão descreve a relação entre as duas variáveis. O gráfico da equação de regressão é chamado de reta de regressão (ou reta de melhor ajuste, ou reta de mínimos quadrados). xbby 10ˆ Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Esta equação descreve a relação entre x (chamada variável independente ou variável preditora) e (chamada variável dependente ou variável resposta). Na equação, b0 é chamado de intercepto y e b1 é o coeficiente angular. Para o cálculo de b0 e b1, utilizamos as fórmulas a seguir. yˆ Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Repare que os dados necessários para o cálculo de b0 e b1 são os mesmos para o cálculo do coeficiente de correlação linear r, o que torna a determinação de uma reta de regressão muito simples após o cálculo do coeficiente de correlação. 221 xxn yxxyn b n xby b 1 0 Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Variação marginal: Ao trabalharmos com duas variáveis relacionadas por uma equação de regressão, a variação marginal em uma delas é o quanto ela varia quando a outra variável sofre uma variação de exatamente uma unidade. A variação marginal é igual ao valor do coeficiente angular da reta b1. Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Outliers: Em um diagrama de dispersão, um ponto extremo (outlier) é um ponto que está muito afastado dos demais pontos. Pontos de influência: Os dados amostrais emparelhados podem conter um ou mais pontos de influência, que são pontos que afetam fortemente o gráfico da reta de regressão. Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Predições: As equações de regressão podem ser úteis quando usadas para predizer o valor de uma variável, dado um valor determinado da outra variável. Se a reta de regressão se ajusta bem aos dados, então tem sentido utilizar uma equação para fazer predições. Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Na ausência de correlação linear significativa, não podemos usar a equação de regressão para projetar ou predizer. Em vez disso, a melhor estimativa da segunda variável é simplesmente a sua média. Devemos também lembrar que não podemos extrapolar os valores da variável independente, pois não sabemos o comportamento da variável dependente y para valores não determinados de x. Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Exemplo: Os pesos de ursos machos podem ser determinados pelo seu comprimento? Como visto anteriormente, há uma correlação entre o peso e o comprimento dos ursos. Determine agora a reta de regressão que relacione o peso dos ursos com o seu comprimento. Comprimento em pol (x) 53,0 67,5 72,0 72,0 73,5 68,5 73,0 37,0 Peso em libras (y) 80 344 416 348 262 360 332 34 Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Resolução: Como visto anteriormente, este é o gráfico de dispersão dos dados. 0 50 100 150 200 250 300 350 400 450 0 10 20 30 40 50 60 70 80 Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Calculando agora o valor de b0 e b1: 221 xxn yxxyn b 659,9 75,9433 91128 5,51675,345258 21765,5161518798 21 b 66,351 8 5,516659,92176 0 b n xby b 1 0 Equação da reta: = 9,659x – 351,66 yˆ Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha A reta de regressão será: 0 50 100 150 200 250 300 350 400 450 0 10 20 30 40 50 60 70 80 Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Desta forma, podemos agora prever quanto pesará um urso macho que meça 71,0 polegadas: = 9,659x – 351,66 = 9,659.71 – 351,66 = 334,13 libras A variação marginal é de 9,659, que diz que para cada polegada de tamanho que o urso cresça, ele pesará mais 9,659 libras. yˆ yˆ yˆ Unidade 3 – Regressão Linear Estatística – Prof. Ricardo Luís Rocha Unidade 3 – Regressão Linear - Qualidade do modelo de regressão linear: Definições: Desvio total: distância vertical yy Desvio explicado: distância vertical yy ˆ Desvio não-explicado: distância vertical , também chamado de resíduo. yy ˆ y = valor observado y = média dos valores observados yˆ = valor predito pela equação de regressão Estatística – Prof. Ricardo Luís Rocha Unidade 3 – Regressão Linear a: Desvio Total: Valor Real – Média a c: Desvio Não Explicado: Valor Real – Predito c b: Desvio Explicado: Valor Predito – Média b yy yy ˆ yy ˆ y y yˆ y Estatística – Prof. Ricardo Luís Rocha Unidade 3 – Regressão Linear Mais definições: Variação total: soma dos quadrados dos desvios totais 2)( yy Variação explicada: soma dos quadrados dos desvios explicados 2)ˆ( yy 2)ˆ( yy Variação não-explicada: soma dos quadrados dos desvios não-explicados Estatística – Prof. Ricardo Luís Rocha Unidade 3 – Regressão Linear (d. Total) = (d. explicado) + (d. não-explicado) yy = yy ˆ + yy ˆ (v. total) = (v. explicada) + (v. não-explicada) De maneira análoga: 2)( yy = 2)ˆ( yy + 2)ˆ( yy Relações entre os desvios: Estatística – Prof. Ricardo Luís Rocha Unidade 3 – Regressão Linear Coeficiente de determinação: Definição: Valor da variação de y que é explicado pela reta de regressão. totalvariação explicada variação2 r 2 2 2 )( )ˆ( yy yy r Obs.: Podemos calcular r2 tanto pela definição acima, como simplesmente elevando ao quadrado o coeficiente de correlação linear r r2 sempre assumirá valores entre 0 e 1 ou Estatística – Prof. Ricardo Luís Rocha Exercício: Os dados emparelhados abaixo consistem nos pesos totais (y) de plástico descartados e tamanhos de residências (x). Determine a equação de regressão, a variação explicada, a variação não explicada, a variação total e o coeficiente de determinação. Peso 0,27 1,41 2,19 2,83 2,19 1,81 0,85 3,05 Tamanho 2 3 3 6 4 2 1 5 Unidade 3 – Regressão Linear
Compartilhar