Baixe o app para aproveitar ainda mais
Prévia do material em texto
Regressão Linear Prof. Carlos Roberto Fonseca Bioestatística Regressão Linear Teste estatístico utilizado para testar se existe influência de uma variável contínua (X) sobre uma outra variável contínua (Y) X (causa) Y (efeito) Y e X são variáveis contínuas Exemplos: Altura (m) Peso (kg) Umidade (%) Temperatura (°C) Concentração do Nutriente (mg/kg) Variável X Variável Y 0 0 Representação gráfica dos dados Variável X Variável Y 0 0 Representação gráfica do modelo de regressão linear A reta é o modelo Variável X Variável Y 0 0 A reta de regressão sempre passa pelas médias de x e y Média de y Média de x Variável X Variável Y b a 0 0 Equação Linear (y = bx + a) Coeficiente angular Inclinação Coeficiente da Regressão Intercepto Variável X Variável Y a 0 0 Equação Linear (y = bx + a) Valor de Y quando X = 0 Y = 0x + a, Y = a Variável X Variável Y 7 0 0 Equação Linear (y = bx + 7) Valor de Y quando X = 0 Y = 0x + a, Y = 7 Variável X Variável Y b 0 0 Equação Linear (y = bx + a) Taxa de aumento de Y em relação a X Variável X Variável Y 0.5 0 0 1 2 3 4 5 6 7 8 Equação Linear (y = 0.5x + a) Quantas unidades Y aumenta por cada 1 unidade de X 1 10 10.5 20 Variável X 0 0 1 2 3 4 5 6 7 8 Equação Linear 0.5 1 10 10.5 20 4 2 b = 0.5 H0: A variável X não influencia a variável Y. H1: A variável X influencia a variável Y. Hipótese nula (H0) e alternativa (H1) Variável X Variável Y Variável Y Ho: b = 0 H1: b ≠ 0 Hipótese Nula Hipótese Alternativa Variável X Variável X Variável Y Variável Y Ho: b = 0 H1: b ≠ 0 Hipótese Nula Hipótese Alternativa Variável X Na regressão linear as três regras de ouro também valem! Variável X Variável Y 0 0 Soma dos Quadrados Total SQtotal = Σ(Dado-Média de Y)2 Dado Y Média de Y Variável X Variável Y 0 0 Soma dos Quadrados do Erro Estimado Dado SQerro = Σ(Dado-Estimado)2 Variável X Variável Y 0 0 Soma dos Quadrados do Modelo Estimado SQmodelo = Σ(Estimado-Média de Y)2 Y Média de Y Exemplo de Aplicação HIPÓTESES Ho: A altura da árvore não afeta o número de frutos produzidos H1: A altura da árvore afeta o número de frutos produzidos PROBLEMA: Testar se a altura prevê o número de frutos produzidos por uma espécie de árvore Altura (m) Número de frutos produzidos Ho: b = 0 H1: b ≠ 0 Hipótese Nula Hipótese Alternativa Altura (m) Número de frutos produzidos Os Dados Visualização dos dados Encontrando-se o coeficiente angular (b) b = Covariância = Variância X ∑ (x – x)(y – y) / g.l. ∑ (x – x)2 / g.l. b = ∑ (x – x)(y – y) ∑ (x – x)2 Coeficiente angular (b) b = ∑ (x – x)(y – y) ∑ (x – x)2 b = ∑ (x – x)(y – y) ∑ (x – x)2 b = 200 40 b = 5 Coeficiente angular Ou seja, Y aumenta 5 unidades para cada 1 unidade de X 27 Encontrando-se o intercepto (a) Encontrando-se o intercepto (a) Y X Toda regressão passa pelas médias de X e Y = ponto fixo A inclinação da reta já foi calculada! 0 a Podemos deduzir o intercepto! 0 Y X a b.X a = Y – (b.X) Encontrando-se o intercepto (a) 0 0 60 4 a = 40 a = Y – (bX) Encontrando-se o intercepto (a) bX = 5x4 = 20 0 0 a = y – (bx) a = 60 – (5 × 4) a = 40 Intercepto Equação da Reta y = 5 x + 40 Achando-se os valores estimados de cada um dos dados pela regressão Se um dado tem x = 6, qual é o valor estimado de y? y = 5x + 40 Dado Estimado 6 ? y = 5⸼6 + 40 y = 30 + 40 y = 70 Se um dado tem x = 2, qual é o valor estimado de y? y = 5x + 40 Dado Estimado 2 ? y = 5⸼2 + 40 y = 10 + 40 y = 50 Encontrando-se a: Soma dos Quadrados Totais Soma dos Quadrados da Regressão Soma dos Quadrados do Erro Soma dos Quadrados Totais Soma dos Quadrados da Regressão Soma dos Quadrados do Erro Testando-se a significância da regressão F = Variância da Regressão Variância do Erro Fonte de Variação SQ g.l. MQ F Regressão SQreg 1 SQtrat/gltrat MQtrat/MQerro Erro SQerro N-2 SQerro/glerro Total SQtotal N-1 Tabela de ANOVA SQ – Soma dos Quadrados g.l. – Graus de Liberdade MQ – Média dos Quadrados F – Teste F Fonte de Variação SQ g.l. MQ F Regressão 1000 1 1000 4,33 Erro 3000 13 230,77 Total 4000 14 Tabela de ANOVA SQ – Soma dos Quadrados g.l. – Graus de Liberdade MQ – Média dos Quadrados F – Teste F Fcalculado = 4,33 g.l. = 1,13 Fcrítico = 4,67 g.l. = 1,13 (α = 0.05) Como Fcalculado ≤ Fcrítico, Ho é aceita e H1 é rejeitada No R qf(0.95,1,13) Ou seja, a altura não afeta o número de frutos! 1-pf(4.33,1,13) 0.12 Para se achar a Probabilidade de um F calculado no R Fcalculado = 4.33 g.l. = 1,13 F[1,13] = 4.33, P = 0.12, ns Script Resposta (P) Coeficiente de Determinação (r2) Quanto da variação de Y foi explicada por X? r2 = Soma dos quadrados da Regressão (SQreg) Soma dos Quadrados Total (SQtotal) Tabela de ANOVA r2 = 1000 / 4000 = 0,25 (Ou seja, a altura explica somente 25% da variação do número de frutos) Fonte de Variação SQ g.l. MQ F Regressão 1000 1 1000 4,33 Erro 3000 13 230,77 Total 4000 14 FIM Amostras X Y 1 3 30 2 2 40 3 1 50 4 4 40 5 3 50 6 2 60 7 5 50 8 4 60 9 3 70 10 6 60 11 5 70 12 4 80 13 7 70 14 6 80 15 5 90 0 40 Média X Média Y 4.00 60.00 X (X-Mx)(X-Mx )2 Y (Y-My)(Y-My) 2 (X-Mx)(Y-My) 13-1.001.00130-30.00900.00130.00 22-2.004.00240-20.00400.00240.00 31-3.009.00350-10.00100.00330.00 440.000.00440-20.00400.0040.00 53-1.001.00550-10.00100.00510.00 62-2.004.006600.000.0060.00 751.001.00750-10.00100.007-10.00 840.000.008600.000.0080.00 93-1.001.0097010.00100.009-10.00 1062.004.0010600.000.00100.00 1151.001.00117010.00100.001110.00 1240.000.00128020.00400.00120.00 1373.009.00137010.00100.001330.00 1462.004.00148020.00400.001440.00 1551.001.00159030.00900.001530.00 TOTAL60SQx =40.00TOTAL900SQy =4000.00Soma dos 200.00 N15 N15 Produtos das Mx4.00 My60.00 Diferenças YDadosMy(Y-My)(Y-My) 2 13060.00-30.00900.00 24060.00-20.00400.00 35060.00-10.00100.00 44060.00-20.00400.00 55060.00-10.00100.00 66060.000.000.00 75060.00-10.00100.00 86060.000.000.00 97060.0010.00100.00 106060.000.000.00 117060.0010.00100.00 128060.0020.00400.00 137060.0010.00100.00 148060.0020.00400.00 159060.0030.00900.00 TOTAL900 SQtotal =4000.00 N15 My60.00 YEstimadoMy(Est - My)(Est-My) 2 155.0060.00-5.0025.00 250.0060.00-10.00100.00 345.0060.00-15.00225.00 460.0060.000.000.00 555.0060.00-5.0025.00 650.0060.00-10.00100.00 765.0060.005.0025.00 860.0060.000.000.00 955.0060.00-5.0025.00 1070.0060.0010.00100.00 1165.0060.005.0025.00 1260.0060.000.000.00 1375.0060.0015.00225.00 1470.0060.0010.00100.00 1565.0060.005.0025.00 SQtratamento = 1000.00 YDadosEstimado(Y-Est)(Y-Est) 2 13055.00-25.00625.00 24050.00-10.00100.00 35045.005.0025.00 44060.00-20.00400.00 55055.00-5.0025.00 66050.0010.00100.00 75065.00-15.00225.00 86060.000.000.00 97055.0015.00225.00 106070.00-10.00100.00 117065.005.0025.00 128060.0020.00400.00 137075.00-5.0025.00 148070.0010.00100.00 159065.0025.00625.00 SQerro =3000.00
Compartilhar