Baixe o app para aproveitar ainda mais
Prévia do material em texto
Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 259 259 9 REGRESSÃO E CORRELAÇÃO Até então se tem estudado as medidas de variabilidade de dados somente com uma variável. Far-se-á agora um estudo de tais medidas envolvendo simultaneamente duas variáveis. Este estudo é realizado através da regressão e correlação. A regressão consiste na estimação de uma variável dependente a partir de outra variável independente. Por outro lado, a correlação determina o grau de relação entre as variáveis, ou seja, procura determinar quão bem uma equação linear, ou de outra espécie, descreve ou explica a relação entre as variáveis. O estudo de regressão exerce papel relevante dentro do campo da Estatística Experimental, devido a sua larga aplicação na interpretação de resultados experimentais, e têm por objetivo determinar a relação existente entre uma característica qualquer de interesse experimental, dependente, e outra característica independente, tomadas juntas. O pesquisador, geralmente, escolhe os valores da variável independente e depois estabelece a relação existente entre os valores das duas variáveis. Tal relação é expressa por uma função matemática (equação de regressão), onde se diz que a variável dependente (Y) é uma função da variável independente (X). Veja-se, como exemplo, um experimento para determinar o efeito de doses crescentes de nitrogênio (X) na produção de uma forrageira (Y). Parcelas 1 2 3 4 5 Doses de Nitrogênio (kg/ha) – (X) 0,0 50,0 100,0 150,0 200,0 Produção de Forragem (kg/ha) – (Y) 1.828,8 2.438,4 2.844,8 3.149,6 3.403,6 Observa-se que quando aumenta a dose de nitrogênio, aumenta a produção de forragem. Verifica-se que a relação entre as duas variáveis é aproximadamente linear, e pode ser representada por uma linha reta (curva de regressão), passando entre os pontos de um diagrama de dispersão, conforme apresentado na FIGURA 9.1. Porém nem sempre é assim, pois a regressão pode não ser linear, mas polinomial, tornando mais complexo o seu estudo. Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 260 260 FIGURA 9.1 – DIAGRAMA DE DISPERSÃO ENTRE DOSES DE NITROGÊNIO E A PRODUÇÃO DE FORRAGEM Para a maioria dos casos, tem-se uma regressão linear pelo menos para os valores de X adotados em pesquisa agropecuária, cuja equação de regressão é: Ŷ = a + bX onde: Ŷ = estimativa da variável dependente; a = intercepção no eixo dos Y, ou seja, o valor de Y quando X = 0; b = coeficiente angular da reta, isto é, b = tg (o ângulo formado pela reta ao cortar o eixo dos X) que determina a declividade da mesma e expressa o valor de Y para X = 0; X = variável independente. As estimativas dos parâmetros a e b são obtidos pelas fórmulas: XbYâ N X X N YX XY b 2 2 )( ))(( ˆ onde: Y = média de Y; X = média de X; N = número de observações. Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 261 261 Considerando os dados do exemplo citado anteriormente, tem-se a seguinte equação de regressão: X = 0,0 + 50,0 + ... + 200,0 = 500,0 Y = 1.828,8 + 2.438,4 + ... + 3.403,6 = 13.665,2 N = 5 X2 = (0,0)2 + (50,0)2 + ... + (200,0)2 = 0,0 + 2.500,0 + ... + 40.000,0 = 75.000,0 XY = (0,0 x 1.828,8) + (50,0 x 2.438,4) + ... + (200,0 x 3.403,6) = 0,0 + 121.920,0 + ... + 680.720,0 = 1.559.560,0 bˆ = N X X N YX XY 2 2 )( ))(( = 5 )0,500( 0,000.75 5 )2,665.13)(0,500( 0,560.559.1 2 = 5 0,000.250 0,500.75 5 0,600.832.6 0,560.559.1 = 0,000.500,500.75 0,520.366.10,560.559.1 = 0,500.25 0,040.193 = 7,570196 N Y Y = 5 2,665.13 = 2.733,04 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 262 262 N X X = 5 0,500 = 100,0 XbYâ = 0,100570196,704,733.2 x = 2.733,04 – 757,0196 = 1.976,0204 Ŷ = a + bX = 1.976,0204 + 7,570196 X É preciso ressaltar que a determinação da equação de regressão deve ser precedida de uma análise de variância, a fim de comprovar estatisticamente se os dados apresentam a suposta relação linear entre as variáveis X e Y. Quando duas variáveis não podem ser consideradas uma independente e outra dependente, em função de ambas estarem sujeitas e erros experimentais ponderáveis, como por exemplo, comprimento e largura de folhas de plantas, teor de potássio do solo e aumento de produção de cana-de-açúcar, brotamento e capacidade de armazenamento de bulbos de cebola, altura de planta e produção de forragem em capim elefante, peso e produção de leite de vacas leiteiras, ganho de peso e rendimento de carcaça em frangos de corte, etc., o emprego da regressão não é satisfatório e far-se-á uso, para esses casos, da correlação. 9.1 Coeficiente de Correlação Em casos como o que foi mencionado anteriormente, há interesse em determinar o grau de relação entre as duas vaiáveis. Essa relação pode ser medida pelo coeficiente de correlação, cuja estimativa é obtida através da fórmula: N Y Y N X X N YX XY r 2 2 2 2 )()( ))(( O valor de r pode variar de – 1 a + 1. Os valores – 1 e + 1 indicam o máximo de correlação; o sinal (+ ou –) indica o sentido da correlação; o valor 0 significa independência das variáveis, isto é, não existe correlação. Um problema a resolver é o de provar o valor de r obtido, a fim de verificar se difere de zero, valor que deveria assumir, teoricamente, na ausência de correlação. Há vários métodos para isso. Um deles consiste em calcular t através da fórmula: Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 263 263 2 1 2 N r r t onde: t = valor calculado do teste t com N – 2 graus de liberdade; r = estimativa do coeficiente de correlação; N = número de observações. Exemplo 1: A partir dos dados da TABELA 9.1, pede-se: a) Obter a estimativa do coeficiente de correlação; b) Aplicar o teste “t” e verificar se o valor de r é significativo. TABELA 9.1 – COMPORTAMENTO DE CULTIVARES DE CEBOLA (Allium cepa L.) EM RELAÇÃO AO CARÁTER BROTAMENTO E AO CARÁTER CAPACIDADE DE ARMAZENAMENTO Cultivares Caráter brotamento (em dias) Caráter Capacidade de Armazenamento (em %) BAIA DO CEDO SMJ-III 76,1 30,0 BAIA DO CEDO SMP-V BAIA PERIFORME 68,1 104,8 65,0 50,0 BAIA SETE VOLTAS 71,5 60,0 BAIA TRIUNFO SMJ-II 87,3 70,0 BARREIRO ROXA SMP-IV 73,8 35,0 BARREIRO SMJ-II 60,2 25,0 BARREIRO SMP-III 65,4 15,0 CIGANINHA 39,9 0,0 COJUMATLAN L. 2691 25,6 30,0 CREOLA 80,5 90,0 CREOLA CATARINENSE 97,5 80,0 EXCEL BERMUDAS 98638,2 15,0 IPA-2 72,0 55,0 PIRA COUTO 61,2 50,0 PIRA GRANA 75,5 50,0 PIRA LOPES A/C 49,4 40,0 PIRA LOPES A/R 53,0 20,0 PIRA OURO A/R 73,1 25,0 PIRA PERA A/C 58,4 10,0 PIRA TROPICAL 50,0 20,0 ROXA CHATA SMP-IV 30,5 15,0 TEXAS GRANO 50,0 30,0 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 264 264 TUBARÃO 80,4 40,0 WHITE CREOLE 44,8 35,0 FONTE: FERREIRA (1982). Resolução: a) Estimativa do Coeficiente de Correlação: X = caráter brotamento (em dias); Y = caráter capacidade de armazenamento (em %); X = 76,1 + 68,1 + ... + 44,8 = 1.587,2 Y = 30,0 + 65,0 + ... + 35,0 = 955,0 X2 = (76,1)2 + (68,1)2 + ... + (44,8)2 = 5.791,21 + 4.637,61 + ... + 2.007,04 = 110.220,82 Y2 = (30,0)2 + (65,0)2 + ... + (35,0)2 = 900,0 + 4.225,0 + ... + 1.225,0 = 48.925,0 XY = (79,1 x 30,0) + (68,1 x 65,0) + ... + (44,8 x 35,0) = 2.373,0 + 4.426,5 + ... + 1.568,0 = 67.789,5 N = 25 N Y Y N X X N YX XY r 2 2 2 2 )()( ))(( = 25 )0,955( 0,925.48 25 )2,1587( 82,220.110 25 )0,955)(2,587.1( 5,789.67 22 = 25 0,025.912 0,925.48 25 8,203.519.2 82,220.110 25 0,776.515.1 5,789.67 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 265 265 = 0,481.360,925.4815,768.11082,220.110 04,631.605,789.67 = 0,444.1267,452.9 46,158.7 = 0,000.620.117 46,158.7 692,845.10 46,158.7 0,66 b) Teste “t”: t 2 1 2 N r r = 266,01 22566,0 = 4356,01 2366,0 = 5644,0 7958315,466,0 x = 7512656,0 1652488,3 4,21 t Tabelado (1%) = 2,81 t Tabelado (5%) = 2,07 O valor de r (0,66**) foi significativo no nível de 1% de probabilidade pelo teste “t”, indicando que existe uma correlação positiva entre os caracteres brotamento e capacidade de armazenamento, ou seja, quanto maior o período de brotamento de bulbos de cebola, maior será a capacidade de armazenamento dos mesmos. Podem-se representar graficamente os coeficientes de correlação, bastando apenas colocar os dados sobre dois eixos (diagrama de dispersão). A seguir, apresentar- se-ão, através da FIGURA 9.2, diversos tipos de diagramas de dispersão com seus coeficientes de correlação associados, os quais servirão de modelo para a interpretação gráfica de tais coeficientes. Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 266 266 FIGURA 9.2 – DIVERSOS TIPOS DE DIAGRAMAS DE DISPERSÃO COM SEUS COEFICIENTES DE CORRELAÇÃO ASSOCIADOS 9.2 Coeficiente de Determinação O coeficiente de determinação ( 2R ) é uma medida estatística que representa a porcentagem de variação em Y (variável dependente) que está sendo explicada pela equação de regressão. No caso de dados com repetições, a estimativa do coeficiente de determinação é obtida através da fórmula: sTratamentoSQ xgressãoSQ R 100Re2 onde: Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 267 267 SQ Regressão = soma das SQ Regressão até a regressão de maior grau que apresentou significância estatística pelo teste F na análise de variância; SQ Tratamentos = soma de quadrados de tratamentos da análise de variância. No caso de dados sem repetições, a sua estimativa é obtida através da fórmula: TotalSQ xgressãoSQ R 100Re2 onde: SQ Regressão = soma das SQ Regressão até a regressão de maior grau que apresentou significância estatística pelo teste F na análise de variância; SQ Total = soma de quadrados total da análise de variância. O 2R assume valores entre 0 e 1. Se 2R = 1, a equação de regressão explica 100% da variação de Y (variável dependente) em função da variação de X (variável independente). Se 2R = 0,5, a equação de regressão explica somente 50% da variação de Y em função da variação de X, os outros 50% da variação não é explicado por essa relação. Se 2R = 0, não há uma relação entre as variáveis X e Y. No caso de regressão linear simples, o coeficiente de determinação poderá ser calculado através do quadrado do coeficiente de correlação (r), ou seja, 22 Rr . Considerando os dados do Exemplo 1, tem-se: 22 rR = 266,0 = 0,4356 O valor de 2R (0,4356) explica apenas 43,56% da relação positiva entre o período de brotamento de bulbos de cebola e a sua capacidade de armazenamento, enquanto que o restante da variação (56,44%) não é explicado por essa relação. 9.3 Regressão Linear na Análise de Variância Já foi visto anteriormente, no Capítulo 4, que a análise de variância só tem validade se o pesquisador atender as suas suposições. Uma delas é que os erros de observação devem ser independentes, consequentemente não correlacionados. Quando esta hipótese não se verifica, a análise de variância deve refletir a dependência entre os erros de observação, sob pena de não ser válida. Assim acontece no caso em que os tratamentos são quantitativos (doses crescentes de um fertilizante ou de um fungicida, ou datas de semeadura, por exemplo) com mais de dois níveis, e se justifica a existência de uma correspondência funcional, chamada equação de regressão, que ligue os valores dos tratamentos (X) aos dados analisados (Y). O procedimento de análise de variância é o seguinte: a) Analisam-se os dados experimentais da variável Y de acordo com o delineamento estatístico utilizado; b) Calcula-se a Soma de Quadrados de Regressão Linear através da seguinte fórmula: Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 268 268 2 2 2 )( ))(( Re N X X N YX XY LineargressãoSQ onde: Y = variável dependente; X = variável independente; N = número de observações; c) Calcula-se a Soma de Quadrados de Desvios de Regressão pela diferença entre a Soma de Quadrados de Tratamentos e a Soma de Quadrados de Regressão Linear; d) Obtêm-se os Graus de Liberdade de Regressão Linear e de Desvios de Regressão da seguinte maneira: Regressão Linear = 1 GL Desvios de Regressão = t – 2 GL onde: t = número de tratamentos (variável X); e) Calculam-se os Quadrados Médios de Regressão Linear e de Desvios de Regressão dividindo-se suas Somas de Quadrados pelos seus respectivos Graus de Liberdade; f) A significância estatística da Regressão Linear e dos Desvios de Regressão é dada pelo teste F, sendo que os valores dos F’s calculados são obtidos da seguinte maneira: F Calculado para Regressão Linear = síduoQM LineargressãoQM Re Re F Calculado para Desvios de Regressão = síduoQM gressãodeDesviosQM Re Re g) No caso de ser significativo apenasa Regressão Linear, calcula-se a equação de regressão (Ŷ = a + bX) para se obterem os valores médios esperados de tratamentos. Com estes valores médios esperados e as médias observadas de tratamentos podem-se calcular os desvios, cuja soma algébrica deve ser nula; h) Em caso contrário, ou seja, se os Desvios de Regressão forem significativos indicam a existência de outros tipos de regressão (Regressão Quadrática, Regressão Cúbica, etc.). Neste caso, deve-se fazer o desdobramento dos Graus de Liberdade de Desvios de Regressão nos seus diversos tipos, através do método dos polinômios ortogonais, o qual será visto posteriormente. Exemplo 2: A partir dos dados da TABELA 9.2, pede-se: Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 269 269 a) Fazer a análise da variância; b) Obter o coeficiente de variação; c) Fazer a análise da variância levando-se em conta a regressão linear; d) Obter a equação de regressão linear, acompanhada de tabela de médias e de gráfico; e) Obter o coeficiente de determinação. TABELA 9.2 - DADOS DE ALTURA (EM CENTÍMETROS) DE PLANTAS DE ALFACE (Lactuca sativa L.) EM RELAÇÃO AOS NÍVEIS DE ADUBAÇÃO ORGÂNICA (ESTERCO DE BOI) Tratamentos I II III IV V VI Totais de Tratamentos 0 + 8,07 12,69 6,65 7,68 8,34 8,07 51,50 20 8,17 12,96 8,85 7,61 7,60 10,84 54,03 30 13,80 8,00 9,80 9,56 8,63 10,11 59,90 40 13,27 12,71 9,22 12,10 10,60 12,21 70,11 FONTR: SILVA e FERREIRA (1985). NOTA: (+) kg de esterco de boi/3,6 m 2 . Resolução: a)Análise da Variância: t = 4 r = 6 N = t x r = 4 x 6 = 24 GL Tratamentos = t – 1 = 4 – 1 = 3 GL Resíduo = t (r – 1) Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 270 270 = 4 (6 – 1) = 4 (5) = 20 GL Total = t x r – 1 = 4 x 6 – 1 = 24 – 1 = 23 Y = 8,07 + 8,17 + ... + 12,21 = 235,54 Y2 = (8,07)2 + (8,17)2 + ... + (12,21)2 = 65,1249 + 66,7489 + … + 149,0841 = 2.427,9192 SQ Total N Y Y 2 2 )( 24 54,235 9192,427.2 2 = 2.427,9192 24 0916,479.55 6288,311.29192,427.2 116,2904 SQ Tratamentos N Y r T 22 = 24 54,235 6 11,7090,5903,5450,51 22222 = 24 0916,479.55 6 4121,915.401,588.32409,919.225,652.2 = 24 0916,479.55 6 913,074.14 = 2.345,8188 – 2.311,6288 = 34,19 SQ Resíduo = SQ Total – SQ Tratamentos = 116,2904 – 34,19 = 82,1004 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 271 271 QM Tratamentos = sTratamentoGL sTratamentoSQ = 3 19,34 11,396667 QM Resíduo = síduoGL síduoSQ Re Re = 20 1004,82 4,10502 F Calculado = síduoQM sTratamentoQM Re = 10502,4 396667,11 2,78 F Tabelado (1%) = 4,94 F Tabelado (5%) = 3,10 TABELA 9.3 – ANÁLISE DA VARIÂNCIA DO EFEITO DE NÍVEIS DE ADUBAÇÃO ORGÂNICA (ESTERCO DE BOI) NA ALTURA DE PLANTAS DE ALFACE (Lactuca sativa L.) VIÇOSA – AL. 1985 Causa de Variação GL SQ QM F Adubação Orgânica 3 34,1900 11,396667 2,78 ns Resíduo 20 82,1004 4,105020 Total 23 116,2904 NOTA: (ns) Não significativo no nível de 5% de probabilidade. De acordo com o teste F, não houve diferença significativa, no nível de 5% de probabilidade, entre os níveis de adubação orgânica em relação à altura de plantas de alface. O fato de não ser levado em conta à regressão o resultado obtido pelo teste F estaria em desacordo com a realidade, pois se verifica uma tendência de aumento da altura de plantas de alface com o aumento no nível de adubação orgânica. Portanto, para que seja feita uma análise correta há necessidade do emprego da regressão na análise da variância, pois se trata de tratamentos quantitativos e têm-se mais de dois níveis de adubação orgânica. b) Coeficiente de Variação: Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 272 272 N Y m ˆ = 24 54,235 9,814 síduoQMs Re = 105020,4 = 2,0260849 m sx CV ˆ 100 = 814,9 0260849,2100 x = 814,9 60849,202 20,64% O coeficiente de variação foi 20,64%, indicando uma precisão experimental regular. c) Análise da Variância com Regressão Linear: GL de Regressão Linear = 1 GL de Desvios de Regressão = t – 2 = 4 – 2 = 2 N = t x r = 4 x 6 = 24 )60,40()60,30()60,20(60,0 xxxxX = 0,0 + 120,0 + 180,0 + 240,0 = 540,0 21,12...17,807,8Y 235,54 6)0,40(6)0,30(6)0,20(6)0,0( 22222 xxxxX = )60,600.1()60,900()60,400()60,0( xxxx = )0,600.9()0,400.5()0,400.2()0,0( = 17.400,0 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 273 273 )21,120,40(...)17,80,20()07,80,0( xxxXY = 0,0 + 163,4 + ... + 488,4 = 5.682,0 N X X N YX XY LineargressãoSQ 2 2 2 )( ))(( Re = 24 )00,540( 00,400.17 24 )54,235)(0,540( 0,682.5 2 2 = 24 00,600.291 00,400.17 24 6,191.127 0,682.5 2 = 00,150.1200,400.17 65,299.500,682.5 2 = 00,250.5 35,382 2 = 00,250.5 52,191.146 = 27,846004 SQ Desvios de Regressão = SQ Tratamentos – SQ Regressão Linear = 34,1900 – 27,846004 = 6,343996 QM Regressão Linear = LineargressãoGL LineargressãoSQ Re Re = 1 846004,27 = 27,846004 QM Desvios de Regressão = gressãodeDesviosGL gressãodeDesviosSQ Re Re = 2 343996,6 = 3,171998 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 274 274 F Calculado para Regressão Linear = síduoQM LineargressãoQM Re Re = 105020,4 846004,27 6,78 F Calculado para Desvios de Regressão = síduoQM gressãodeDesviosQM Re Re = 105020,4 171998,3 0,773 F Tabelado (1%) para Regressão Linear = 8,10 F Tabelado (5%) para Regressão Linear = 4,35 F Tabelado (1%) para Desvios de Regressão = 0,005 F Tabelado (5%) para Desvios de Regressão = 0,0254 Agora, a TABELA 9.3 fica da seguinte maneira: TABELA 9.3 – ANÁLISE DA VARIÂNCIA DO EFEITO DE NÍVEIS DE ADUBAÇÃO ORGÂNICA (ESTERCO DE BOI) NA ALTURA DE PLANTAS DE ALFACE (Lactuca sativa L.). VIÇOSA-AL, 1985 Causa de Variação GL SQ QM F (Adubação Orgânica) (3) (34,190000)- - Regressão Linear Desvios de Regressão 1 2 27,846004 6,343996 27,846004 3,171998 6,78 * 0,773 ns Resíduo 20 82,100400 4,105020 Total 23 116,290400 NOTAS: (ns) Não significativo no nível de 5% de probabilidade. (*) Significativo no nível de 5% de probabilidade. De acordo com o teste F, tem-se: Houve diferença significativa, no nível de 5% de probabilidade, para a regressão linear, indicando que quando aumenta o nível de adubação orgânica (esterco de boi) ocorre um incremento na altura de plantas de alface. Não houve diferença significativa, no nível de 5% de probabilidade, para os desvios de regressão, indicando que a relação entre os níveis de adubação orgânica (esterco de boi) e altura de plantas de alface é determinada apenas pela regressão linear. d) Equação de Regressão Linear Acompanhada de Tabela de Médias e de Gráfico: Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 275 275 N X X N YX XY b 2 2 )( ))(( ˆ = 24 )00,540( 00,400.17 24 )54,235)(0,540( 0,682.5 2 = 24 00,600.291 00,400.17 24 6,191.127 0,682.5 = 00,150.1200,400.17 65,299.500,682.5 = 0,250.5 35,382 0,072829 N Y Y = 24 54,235 9,814167 N X X = 24 0,540 = 22,5 XbYa ˆˆ = 9,814167 5,22072829,0 x = 638653,1814167,9 = 8,175514 bXaY ˆ = 8,175514 + 0,072829 X Médias Esperadas: Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 276 276 0,0072829,0175514,80 xm = 8,175514 + 0,0 8,18 0,20072829,0175514,8ˆ 20 xm = 8,175514 + 1,45658 9,63 0,30072829,0175514,8ˆ 30 xm = 8,175514 + 2,18487 10,36 0,40072829,0175514,8ˆ 40 xm = 8,175514 + 2,91316 11,09 Médias Observadas: r Y m 0 0 ˆ = 6 50,51 8,58 r Y m 20 20 ˆ = 6 03,54 9,01 r Y m 30 30 ˆ = 6 90,59 9,98 r Y m 40 40 ˆ = 6 11,70 11,69 TABELA 9.4 – EFEITO DE NÍVEIS DE ADUBAÇÃO ORGÂNICA (ESTERCO DE BOI) NA ALTURA DE PLANTAS DE ALFACE (Lactuva sativa L.). VIÇOSA-AL, 1985 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 277 277 Níveis de Adubação Orgânica Médias (cm) Desvios de Esperada (A) Observada (B) Regressão (A – B) 0 Kg de Esterco de boi/3,6 m 2 8,18 8,58 – 0,40 20 Kg de Esterco de boi/3,6 m 2 9,63 9,01 0,62 30 Kg de Esterco de boi/3,6 m 2 10,36 9,98 0,38 40 Kg de Esterco de boi/3,6 m 2 11,09 11,69 – 0,60 FIGURA 9.3 – EFEITO DE NÍVEIS DE ADUBAÇÃO ORGÂNICA (ESTERCO DE BOI) NA ALTURA DE PLANTAS DE ALFACE (Lactuca sativa L.) VIÇOSA – AL. 1985 Verifica-se que quando aumenta o nível de adubação orgânica (esterco de boi) ocorre um incremento na altura de plantas de alface de forma aproximadamente linear, conforme TABELA 9.4 e FIGURA 9.3. d) Coeficiente de determinação: sTratamentoSQ xgressãoSQ R 100Re2 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 278 278 = 190000,34 100846004,27 x = 1900,34 6004,784.2 81,44% O valor de 2R explica 81,44% do incremento na altura média de plantas de alface em função do aumento do nível de adubação orgânica (esterco de boi) determinado pela equação linear. Diante deste exemplo, fica evidente a importância da regressão na análise de variância. Se a regressão não fosse empregada, a conclusão tirada acerca dos tratamentos não seria condizente com a realidade. 9.4 Análise de Regressão Através de Polinômios Ortogonais O método de regressão usado anteriormente na análise de variância é próprio para o caso de Regressão Linear. Quando, porém, os Desvios de Regressão forem significativos, deve-se, então, utilizar o método dos polinômios ortogonais. Neste método, o procedimento de análise de variância é o seguinte: a) Analisam-se os dados experimentais da variável Y de acordo com o delineamento estatístico utilizado; b) Calculam-se as Somas de Quadrados de Regressão através das seguintes fórmulas: SQ Regressão Linear 1 2 1 )( rK TC SQ Regressão Quadrática 2 2 2 )( rK TC SQ Regressão Cúbica 3 2 3 )( rK TC SQ Regressão de 4º Grau 4 2 4 )( rK TC onde: C = coeficiente para interpolação de polinômios ortogonais, obtido em tabelas (TABELA A-14); T = totais de tratamentos; K = soma de quadrados dos coeficientes, obtido em tabelas (TABELA A-14); r = número de repetições do experimento, para o caso dos experimentos simples, e número de repetições do experimento (r) multiplicado pelo número de tratamentos Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 279 279 do outro grupo (tN), para o caso dos experimentos complexos (fatorial, parcelas subdivididas, etc.); c) Como, geralmente, na pesquisa agropecuária ocorre efeito significativo até a Regressão de 4º Grau e quando existem Graus de Liberdade disponíveis, calcula-se a Soma de Quadrados de Desvios de Regressão pela diferença entre a Soma de Quadrados de Tratamentos e as Somas de Quadrados de Regressão; d) Obtêm-se os Graus de Liberdade das Regressões e de Desvios de Regressão da seguinte maneira: Regressão Linear = 1 GL Regressão Quadrática = 1 GL Regressão Cúbica = 1 GL Regressão de 4º Grau = 1 GL Desvios de Regressão = GL Tratamentos – (GL Regressão Linear + GL Regressão Quadrática + GL Regressão Cúbica + GL Regressão de 4º Grau) e) Calculam-se os Quadrados Médios de Regressão e de Desvios de Regressão dividindo-se suas Somas de Quadrados pelos seus respectivos Graus de Liberdade; f) A significância estatística das Regressões e de Desvios de Regressão é dada pelo teste F, sendo que os valores dos F’s calculados são obtidos dividindo-se seus respectivos Quadrados Médios pelo Quadrado Médio do Resíduo; g) Calcula-se a equação de regressão a partir da regressão de maior grau que apresentou significância estatística pelo teste F. Por exemplo, se fosse a Regressão de 4º Grau que apresentasse significância estatística, a equação de regressão ficaria assim constituída: Y – Y = B1M1P1 + B2M2P2 + B3M3P3 + B4M4P4 onde: Y = estimativa da variável dependente; Y = estimativa da média observada da variável dependente; B = coeficiente angular, obtido através da fórmula: rK CT B onde: C = coeficiente para interpolação de polinômios ortogonais, obtido em tabelas (TABELA A-14); Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 280 280 T = totais de tratamentos; K = soma de quadrados dos coeficientes,obtido em tabelas (TABELA A-14); r = número de repetições do experimento, para o caso dos experimentos simples, e número de repetições multiplicado pelo número de tratamentos do outro grupo que não está em evidência, para o caso dos experimentos complexos (fatorial, parcelas subdivididas, etc.); M = constantes, obtidas em tabela (TABELA A-14); P1 = polinômios ortogonais do 1º grau, obtidos através da fórmula: P1 = x sendo q XX x onde: X = variável independente; X = média da variável independente; q = diferença entre dois níveis sucessivos de X; P2 = polinômios ortogonais do 2º grau, obtidos através da fórmula: 12 122 2 n xP onde: n = número de níveis de X; P3 = polinômios ortogonais do 3º grau, obtidos através da fórmula: x n xP 20 73 23 3 P4 = polinômios ortogonais do 4º grau, obtidos através da fórmula: 560 )9)(1(3 14 133 222 2 4 4 nn x n xP h) Com a equação de regressão obtêm-se os valores médios esperados de tratamentos. Com tais valores médios esperados e com as médias observadas de tratamentos podem-se calcular os desvios, cuja soma algébrica deve ser nula. É preciso ressaltar que este procedimento só é válido quando os níveis de tratamentos são igualmente espaçados. Exemplo 3: A partir dos dados das TABELAS 9.5 e 9.6, pede-se: a) Fazer a análise da variância levando-se em conta a regressão, através da utilização do método dos polinômios ortogonais; Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 281 281 b) Obter a equação de regressão, acompanhada de tabela de médias e de gráfico; c) Obter o coeficiente de determinação. TABELA 9.5 – DADOS DE PRODUÇÃO (em kg/parcela) DE MILHO (Zea mays L.) EM RELAÇÃO AOS NÍVEIS DE ADUBAÇÃO FOSFATADA Tratamentos I II III IV Totais de Tratamentos 0 * 3,38 5,77 4,90 4,54 18,59 25 7,15 9,78 9,99 10,10 37,02 50 10,07 9,73 7,92 9,48 37,20 75 9,55 8,95 10,24 8,66 37,40 100 9,14 10,17 9,75 9,50 38,56 Totais de Blocos 39,29 44,40 42,80 42,28 168,77 FONTE: GOMES (1985). NOTA: (*): kg de P2 O5/ha. TABELA 9.6 – ANÁLISE DA VARIÂNCIA E COEFICIENTE DE VARIAÇÃO DO EFEITO DE NÍVEIS DE ADUBAÇÃO FOSFATADA NA PRODUÇÃO DE MILHO (Zea mays L.) Causa de Variação GL SQ QM F Adubação Fosfatada 4 72,22 18,055 19,84** Blocos 3 2,73 - - Resíduo 12 10,92 0,910 Total 19 85,87 Coeficiente de Variação: % 11,30 FONTE: GOMES (1985). NOTA: (**) Significativo no nível de 1% de probabilidade. Resolução: a) Análise da Variância com Regressão: GL Regressão Linear = 1 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 282 282 GL Regressão Quadrática = 1 GL Regressão Cúbica = 1 GL Regressão de 4º Grau = 1 r = 4 K1 = 10 K2 = 14 K3 = 10 K4 = 70 Totais de Tratamentos (T) Coeficientes C1 C2 C3 C4 18,59 – 2 + 2 – 1 + 1 37,02 – 1 – 1 + 2 – 4 37,20 0 – 2 0 + 6 37,40 + 1 – 1 – 2 – 4 38,56 + 2 + 2 + 1 + 1 1 2 1 )( Re rK TC LineargressãoSQ = 104 )56,382()40,371()20,370()02,371()59,182( 2 x xxxxx = 40 )12,77()40,37()00,0()02,37()18,37( 2 = 40 )32,40( 2 = 40 7024,625.1 = 40,64256 2 2 2 )( Re rK TC QuadráticagressãoSQ Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 283 283 = 144 )56,382()40,371()20,372()02,371()59,182( 2 x xxxxx = 56 )12,77()40,37()40,74()02,37()18,37( 2 = 56 )52,34( 2 = 56 6304,191.1 = 21,279114 3 2 3 )( Re rK TC CúbicagressãoSQ = 104 )56,381()40,372()20,370()02,372()59,181( 2 x xxxxx = 40 )56,38()80,74()00,0()04,74()59,18( 2 = 40 )21,19( 2 = 40 0241,369 = 9,225603 4 2 4 )( º4Re rK TC GraudegressãoSQ = 704 )56,381()40,374()20,376()02,374()59,181( 2 x xxxxx = 280 )56,38()60,149()20,223()08,148()59,18( 2 = 280 )33,17( 2 = 280 3289,300 = 1,072603 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 284 284 LineargressãoGL LineargressãoSQ LineargressãoQM Re Re Re = 1 64256,40 = 40,64256 QuadráticagressãoGL QuadráticagressãoSQ QuadráticagressãoQM Re Re Re = 1 279114,21 = 21,279114 CúbicagressãoGL CúbicagressãoSQ CúbicagressãoQM Re Re Re = 1 225603,9 = 9,225603 GraudegressãoGL GraudegressãoSQ GraudegressãoQM º4Re º4Re º4Re = 1 072603,1 = 1,072603 F Calculado para Regressão Linear = síduoQM LineargressãoQM Re Re = 910,0 64256,40 44,66 F Calculado para Regressão Quadrática = síduoQM QuadráticagressãoQM Re Re = 910,0 279114,21 23,38 F Calculado para a Regressão Cúbica = síduoQM CúbicagressãoQM Re Re = 910,0 225603,9 10,14 F Calculado para Regressão de 4º Grau = síduoQM GraudegressãoQM Re º4Re Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 285 285 = 910,0 072603,1 1,18 F Tabelado (1%) para as Regressões = 9,33 F Tabelado (5%) para as Regressões = 4,75 Agora, a TABELA 9.6 fica da seguinte maneira: TABELA 9.6 – ANÁLISE DA VARIÂNCIA E COEFICIENTE DE VARIAÇÃO DO EFEITO DE NÍVEIS DE ADUBAÇÃO FOSFATADA NA PRODUÇÃO DE MILHO (Zea mays L.). PIRACICABA-SP, 1985 Causa de Variação GL SQ QM F (Adubação Fosfatada) (4) (72,220000) - - Regressão Linear 1 40,642560 40,642560 44,66 ** Regressão Quadrática 1 21,279114 21,279114 23,38 ** Regressão Cúbica Regressão de 4º Grau 1 1 9,225603 1,072603 9,225603 1,072603 10,14 ** 1,18 ns Blocos 3 2,730000 - - Resíduo 12 10,920000 0,910000 Total 19 85,870000 Coeficiente de Variação (%) 11,30 NOTAS: (ns) Não significativono nível de 5% de probabilidade. (**) Significativo no nível de 1% de probabilidade. De acordo com o teste F, tem-se: Houve diferença significativa, no nível de 1% de probabilidade, para as Regressões Linear, Quadrática e Cúbica, indicando que a equação de 3º grau explica o aumento da produção de milho em função dos níveis de adubação fosfatada. Não houve diferença significativa, no nível de 5% de probabilidade, para a Regressão de 4º Grau, indicando que a relação entre níveis de adubação fosfatada e produção de milho é determinada apenas pela equação de 3º grau. b) Equação de Regressão Acompanhada de Tabela de Médias e de Gráfico: N Y Y Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 286 286 = 20 77,168 = 8,4385 1 1 1 rK TC B = 104 )56,382()40,371()20,370()02,371()59,182( x xxxxx = 40 )12,77()40,37()00,0()02,37()18,37( = 40 32,40 = 1,008 2 2 2 rK TC B = 144 )56,382()40,371()20,372()02,371()59,182( x xxxxx = 56 )12,77()40,37()40,74()02,37()18,37( = 56 52,34 = – 0,616428571 3 3 3 rK TC B = 104 )56,381()40,372()20,370()02,372()59,181( x xxxxx = 40 )56,38()80,74()00,0()04,74()59,18( = 40 21,19 = 0,48025 M1 = 1 M2 = 1 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 287 287 M3 = 6 5 = 0,833333333 P1 = x 12 122 2 n xP = 12 1)5( 22 x = 12 1252 x = 12 242 x = x 2 – 2 x n xP 20 73 23 3 = xx 20 7)5(3 23 = xx 20 7)25(33 = xx 20 7753 = xx 20 68 3 = x 3 – 3,4 x Y = Y + B1M1P1 + B2M2P2 + B3M3P3 + B4M4P4 = 8,4385 + [1,008 x 1 (x)] + [– 0,616428571 x 1 (x2 – 2)] + [0,48025 x 0,833333333 (x 3 – 3,4 x) ] = 8,4385 + 1,008 x – 0,616428571 x2 + 1,232857142 + 0,400208333 x 3 – 1,360708333 x Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 288 288 = 9,671357142 – 0,352708333 x – 0,616428571 x2 + 0,400208333 x3 A variável auxiliar x é dada pela equação: q XX x onde, neste caso, tem-se: N X X = 20 )40,100()40,75()40,50()40,25()40,0( xxxxx = 20 0,4000,3000,2000,1000,0 = 20 0,000.1 = 50,0 q = 25 q XX x = 25 0,50X = 0,04 X – 2 Substituindo a variável auxiliar x na equação de regressão, tem-se: Y = 9,671357142 – 0,352708333 (0,04 X – 2) – 0,616428571 (0,04 X – 2 )2 + 0,400208333 (0,04 X – 2 )3 = 9,671357142 – 0,014108333 X + 0,705416666 – 0,616428571 (0,0016 X 2 – 0,16 X + 4) + 0,400208333 (0,000064 X 3 – 0,0096 X2 + 0,48 X – 8) = 9,671357142 – 0,014108333 X + 0,705416666 – 0,000986285 X2 + 0,098628571 X – 2,465714284 + 0,000025613 X3 – Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 289 289 0,003841999 X 2 + 0,192099999 X – 3,201666664 = 4,70939286 + 0,276620237 X – 0,004828284 X2 + 0,000025613 X3 Médias Esperadas: 0mˆ = 4,70939286 + 0,276620237 (0,0) – 0,004828284 (0,0) 2 + 0,000025613 (0,0) 3 = 4,70939286 + 0,0 – 0,0 + 0,0 4,7094 25mˆ = 4,70939286 + 0,276620237 (25,0) – 0,004828284 (25,0) 2 + 0,000025613 (25,0) 3 = 4,70939286 + 6,915505925 – 0,004828284 (625) + 0,000025613 (15.625) = 4,70939286 + 6,915505925 – 3,0176775 + 0,400203125 9,0074 50mˆ = 4,70939286 + 0,276620237 (50,0) – 0,004828284 (50,0) 2 + 0,000025613 (50,0) 3 = 4,70939286 + 13,83101185 – 0,004828284 (2.500) + 0,000025613 (125.000) = 4,70939286 + 13,83101185 – 12,07071 + 3,201625 9,6713 75mˆ = 4,70939286 + 0,276620237 (75,0) – 0,004828284 (75,0) 2 + 0,000025613 (75,0) 3 = 4,70939286 + 20,74651778 – 0,004828284 (5.625) + 0,000025613 (421.875) = 4,70939286 + 20,74651778 – 27,1590975 + 10,80548438 9,1023 100mˆ = 4,70939286 + 0,276620237 (100,0) – 0,004828284 (100,0) 2 + 0,000025613 (100,0) 3 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 290 290 = 4,70939286 + 27,6620237 – 0,004828284 (10.000) + 0,000025613 (1.000.000) = 4,70939286 + 27,6620237 – 48,28284 + 25,613 9,7016 Médias Observadas: r Y m 0 0 ˆ = 4 59,18 4,6475 r Y m 25 25 ˆ = 4 02,37 9,2550 r Y m 50 50 ˆ = 4 20,37 9,3000 r Y m 75 75 ˆ = 4 40,37 9,3500 r Y m 100 100 ˆ = 4 56,38 = 9,6400 TABELA 9.7 – EFEITO DE NÍVEIS DE ADUBAÇÃO FOSFATADA NA PRODUÇÃO DE MILHO (Zea mays L.). PIRACICABA – SP, 1985 Níveis de Adubação Fosfatada Médias (kg/parcela) Esperada (A) Observada (B) Desvios de Regressão (A – B) Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 291 291 O kg de P2 O5/ha 4,7094 4,6475 0,0619 25 kg de P2 O5/ha 9,0074 9,2550 – 0,2476 50 kg de P2 O5/ha 9,6713 9,3000 0,3713 75 kg de P2 O5/ha 9,1023 9,3500 – 0,2477 100 kg de P2 O5/ha 9,7016 9,6400 0,0616 FIGURA 9.4 – EFEITO DE NÍVEIS DE ADUBAÇÃO FOSFATADA NA PRODUÇÃO DE MILHO (Zea mays L.). PIRACICABA – SP, 1985 Recomenda-se o nível de 50 kg de P2 O5/ha como o mais indicado para se ter uma produção de milho economicamente viável, conforme TABELA 9.7 e FIGURA 9.4. c) Coeficiente de determinação: sTratamentoSQ xgressãoSQ R 100Re2 = 2200,72 100147277,71 x = 2200,72 7277,114.7 98,51% O valor de 2R explica 98,51% do incremento na produção de milho em função do aumento do nível de adubação fosfatada determinado pela equação de 3º grau. 9.5 Regressão Polinomial Aplicada a Dados Sem Repetição Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 292 292 Há casos, na pesquisa agropecuária, em que não há possibilidade de repetição para os dados a serem coletados, como por exemplo, dados meteorológicos de uma determinada região. Por outro lado, mesmo quando possível o uso de repetição, às vezes não são utilizadas, por motivos vários. Contudo, tendo-se interesse em analisar os dados e sabendo-se de antemão da impossibilidade de se obter uma estimativa exata do erro experimental, o pesquisador pode utilizar o Quadrado Médio dos Desvios de Regressão como resíduo. Quanto ao procedimento de análise de variância, seguem-se os princípios da análise de regressão através de polinômio ortogonais,com algumas modificações, como será visto no exemplo a seguir: Exemplo 4: A partir dos dados da TABELA 9.8, pede-se: a) Fazer a análise da variância através da utilização da regressão polinomial aplicada a dados sem repetição; b) Obter a equação de regressão, acompanhada de tabela de médias e de gráfico; c) Obter o coeficiente de determinação. TABELA 9.8 – DADOS DE TEMPERATURAS MÁXIMAS MÉDIAS DOS MESES DO ANO EM MACEIÓ–AL (ºC)*, E DOS COEFICIENTES CORRESPONDENTES AOS Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 293 293 COMPONENTES LINEAR, QUADRÁTICO E CÚBICO, ALÉM DOS VALORES DE K E M Meses Temperatura (Y) Coeficiente (C1) Coeficiente (C2) Coeficiente (C3) 1 – Janeiro 30 – 11 55 – 33 2 – Fevereiro 30 – 9 25 3 3 – Março 30 – 7 1 21 4 – Abril 29 – 5 – 17 25 5 – Maio 28 – 3 – 29 19 6 – Junho 27 – 1 – 35 7 7 – Julho 27 1 – 35 – 7 8 – Agosto 27 3 – 29 – 19 9 – Setembro 28 5 – 17 – 25 10 – Outubro 29 7 1 – 21 11 – Novembro 29 9 25 – 3 12 – Dezembro 30 11 55 33 K 572 12.012 5.148 M 2 3 3 2 FONTE: (*) Canal do Tempo. Resolução: a) Análise da Variância com Regressão: GL Total = N – 1 = 12 – 1 = 11 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 294 294 GL Regressão Linear = 1 GL Regressão Quadrática = 1 GL Regressão Cúbica = 1 GL Desvios de Regressão = GL Total – (GL Regressão Linear + GL Regressão Quadrática + GL Regressão Cúbica) = 11 – ( 1 + 1 + 1) = 11 – 3 = 8 SQ Total = N Y Y 2 2 )( = 12 )344( )30(...)30()30( 2 222 = 900 + 900 +...+ 900 – 12 336.118 333333,861.9878.9 = 16,666667 1 2 1 )( Re K YC LineargressãoSQ 572 )3011(...)309()3011( 2 xxx = 572 )330(...)270()330( 2 = 572 )24( 2 572 576 1,006993 2 2 2 )( Re K YC QuadráticagressãoSQ Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 295 295 012.12 )3055(...)3025()3055( 2 xxx = 012.12 )650.1(...)750()650.1( 2 = 012.12 )380( 2 012.12 400.144 12,021312 3 2 3 )( Re K YC CúbicagressãoSQ 148.5 )3033(...)303()3033( 2 xxx = 148.5 )990(...)90()990( 2 148.5 68 2 148.5 624.4 0,898213 SQ Desvios de Regressão = SQ Total – (SQ Regressão Linear + SQ Regressão Quadrática + SQ Regressão Cúbica) = 16,666667 – (1,006993 + 12,021312 + 0,898213) = 16,666667 – 13,926518 = 2,740149 LineargressãoGL LineargressãoSQ LineargressãoQM Re Re Re 1 006993,1 1,006993 QuadráticagressãoGL QuadráticagressãoSQ QuadráticagressãoQM Re Re Re Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 296 296 1 021312,12 12,021312 CúbicagressãoGL CúbicagressãoSQ CúbicagressãoQM Re Re Re 1 898213,0 0,898213 QM Desvios de Regressão = gressãodeDesviosGL gressãodeDesviosSQ Re Re = 8 740149,2 = 0,342519 F Calculado para Regressão Linear = gressãodeDesviosQM LineargressãoQM Re Re 342519,0 006993,1 2,94 F Calculado para Regressão Quadrática = gressãodeDesviosQM QuadráticagressãoQM Re Re 342519,0 021312,12 35,10 F Calculado para Regressão Cúbica = gressãodeDesviosQM CúbicagressãoQM Re Re 342519,0 898213,0 2,62 F Tabelado (1%) para as Regressões Linear, Quadrática e Cúbica = 12,25 F Tabelado (5%) para as Regressões Linear, Quadrática e Cúbica = 5,59 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 297 297 TABELA 9.9 - ANÁLISE DE VARIÂNCIA DE TEMPERATURAS MÁXIMAS MÉDIAS DOS MESES DO ANO DO MUNICÍPIO DE MACEIÓ – AL Causa de Variação GL SQ QM F Regressão Linear 1 1,006993 1,006993 2,94 ns Regressão Quadrática 1 12,021312 12,021312 35,10 ** Regressão Cúbica 1 0,898213 0,898213 2,62 ns Desvios de Regressão (Resíduo) 8 2,740149 0,342519 Total 11 16,666667 NOTAS: (ns) Não significativo no nível de 5% de probabilidade. (**) Significativo no nível de 1% de probabilidade. De acordo com o teste F, tem-se: Não houve diferença significativa, no nível de 5% de probabilidade, para as Regressões Linear e Cúbica. Houve diferença significativa, no nível de 1% de probabilidade, para a Regressão Quadrática, indicando que a equação de 2º grau explica o comportamento da temperaturamáxima média em Maceió – AL em função dos meses do ano. b) Equação de Regressão Acompanhada de Tabela de Médias e de Gráfico: N Y Y = 12 344 = 28,66666667 1 1 1 )( K YC B 572 )3011(...)309()3011( xxx = 572 )330(...)270()330( = 572 24 = – 0,041958041 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 298 298 2 2 2 )( K YC B 012.12 )3055(...)3025()3055( xxx = 012.12 )650.1(...)750()650.1( = 012.12 380 = 0,031635031 M1 = 2 M2 = 3 P1 = x 12 122 2 n xP = 12 1)12( 22 x = 12 11442 x = 12 1432 x = x 2 – 11,91666667 Y = Y + B1M1P1 + B2M2P2 = 28,66666667 + [– 0,041958041 x 2 ( x)] + [0,031635031 x 3 (x 2 – 11,91666667)] = 28,66666667 – 0,083916082 x + 0,094905093 x2 – 1,130952359 = 27,53571431 – 0,083916082 x + 0,094905093 x2 A variável auxiliar x é dada pela equação: q XX x Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 299 299 onde, neste caso, tem-se: N X X = 12 12...21 = 12 78 = 6,5 q = 1 q XX x = 1 5,6X = X – 6,5 Substituindo a variável auxiliar x na equação de regressão, tem-se: Y = 27,53571431 – 0,083916082 (X – 6,5) + 0,094905093 (X – 6,5) 2 = 27,53571431 – 0,083916082 X + 0,545454533 + 0,094905093 (X 2 – 13 X + 42,25) = 27,53571431 – 0,083916082 X + 0,545454533 + 0,094905093 X2 – 1,233766209 X + 4,009740179 = 32,09090902 – 1,317682291 X + 0,094905093 X2 Médias Esperadas: 1mˆ = 32,09090902 – 1,317682291 (1) + 0,094905093 (1) 2 = 32,09090902 – 1,317682291 + 0,094905093 30,868 2mˆ = 32,09090902 – 1,317682291 (2) + 0,094905093 (2) 2 = 32,09090902 – 2,635364582 + 0,379620372 29,835 3mˆ = 32,09090902 – 1,317682291 (3) + 0,094905093 (3) 2 = 32,09090902 – 3,953046873 + 0,854145837 28,992 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 300 300 4mˆ = 32,09090902 – 1,317682291 (4) + 0,094905093 (4) 2 = 32,09090902 – 5,270729164 + 1,518481488 28,339 5mˆ = 32,09090902 – 1,317682291 (5) + 0,094905093 (5) 2 = 32,09090902 – 6,588411455 + 2,372627325 27,875 6mˆ = 32,09090902 – 1,317682291 (6) + 0,094905093 (6) 2 = 32,09090902 – 7,906093746 + 3,416583348 27,601 7mˆ = 32,09090902 – 1,317682291 (7) + 0,094905093 (7) 2 = 32,09090902 – 9,223776037 + 4,650349557 27,517 8mˆ = 32,09090902 – 1,317682291 (8) + 0,094905093 (8) 2 = 32,09090902 – 10,54145833 + 6,073925952 27,623 9mˆ = 32,09090902 – 1,317682291 (9) + 0,094905093 (9) 2 = 32,09090902 – 11,85914062 + 7,687312533 27,919 10mˆ = 32,09090902 – 1,317682291 (10) + 0,094905093 (10) 2 = 32,09090902 – 13,17682291 + 9,4905093 28,405 11mˆ = 32,09090902 – 1,317682291 (11) + 0,094905093 (11) 2 = 32,09090902 – 14,4945052 + 11,48351625 29,080 12mˆ = 32,09090902 – 1,317682291 (12) + 0,094905093 (12) 2 = 32,09090902 – 15,81218749 + 13,66633339 29,945 Médias Observadas: 1m = 30 2m = 30 3m = 30 4m = 29 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 301 301 5m = 28 6m = 27 7m = 27 8m = 27 9m = 28 10m = 29 11m = 29 12m = 30 TABELA 9.10 – EFEITO DE TEMPERATURAS MÁXIMAS MÉDIAS DOS MESES DO ANO NO MUNICÍPIO DE MACEIÓ – AL Meses do Ano no Município de Maceió-AL Médias (°C) Esperada (A) Observada (B) Desvios de Regressão (A – B) 1 – Janeiro 30,868 30,000 0,868 2 – Fevereiro 29,835 30,000 – 0,165 3 – Março 28,992 30,000 – 1,008 4 – Abril 28,339 29,000 – 0,661 5 – Maio 27,875 28,000 – 0,125 6 – Junho 27,601 27,000 0,601 7 – Julho 27,517 27,000 0,517 8 – Agosto 27,623 27,000 0,623 9 – Setembro 27,919 28,000 – 0,081 10 – Outubro 28,405 29,000 – 0,595 11 – Novembro 29,080 29,000 0,080 12 – Dezembro 29,945 30,000 – 0,055 Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 302 302 FIGURA 9.5 – EFEITO DE TEMPERATURAS MÁXIMAS MÉDIAS DOS MESES DO ANO NO MUNICÍPIO DE MACEIÓ – AL Verifica-se que as temperaturas máximas médias no Município de Maceió-AL diminuem de janeiro até julho, onde alcança o seu menor valor, e volta a aumentar até dezembro, conforme TABELA 9.10 e FIGURA 9.5. c) Coeficiente de determinação: TotalSQ xgressãoSQ R 100Re2 = 666667,16 100028305,13 x = 666667,16 8305,302.1 78,17% O valor de 2R explica 78,17% do incremento nas temperaturas máximas médias no Município de Maceió-AL em função dos meses do ano determinado pela equação de regressão do 2º grau. 9.6 Exercícios a) A partir dos dados da TABELA 9.11, pede-se: Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 303 303 a.1) Obter as estimativas dos coeficientes de correlação; a.2) Verificar pelo teste “t” se os valores de r são significativos; a.3) Obter as estimativas dos coeficientes de determinação; a.4) Interprete os resultados obtidos das estimativas dos coeficientes e tire as devidas conclusões. TABELA 9.11 – EFEITO DE NÍVEIS DE ADUBAÇÃO ORGÂNICA (ESTERCO DE BOI) EM ALFACE (Lactuca sativa L.) AVALIADO ATRAVÉS DAS VARIÁVEIS DIÂMETRO DA PLANTA (X), NÚMERO TOTAL DE FOLHAS POR PLANTA (Y) E NÚMERO DE FOLHAS COMERCIÁVEIS POR PLANTA (Z) Níveis de Adubação Orgânica Variáveis X Y Z O kg de Esterco de Boi/3,6 m 2 28,05 26,13 21,04 20 kg de Esterco de Boi/3,6 m 2 26,06 25,49 19,28 30 kg de Esterco de Boi/3,6 m 2 28,11 27,27 22,33 40 kg de Esterco de Boi/3,6 m 2 28,80 29,19 23,49 FONTE: SILVA e FERREIRA (1985). b) A partir dos dados das TABELAS 9.12 e 9.13, pede-se: b.1) Fazer a análise da variância levando-se em conta a regressão, através da utilização do método dos polinômios ortogonais; b.2) Obter a equação de regressão, acompanhada de tabela de médias e de gráfico; b.3) Obter o coeficiente de determinação. TABELA 9.12 - DADOS DE TOTAIS DE PRODUÇÃO DE CANA-DE-AÇÚCAR EM RELAÇÃO AOS NÍVEIS DE ADUBAÇÃO FOSFATADA Níveis de Adubação Fosfatada Totais(TCH) O kg de P2 O5/ha 445,80 50 kg de P2 O5/ha 482,70 100 kg de P2 O5/ha 508,32 150 kg de P2 O5/ha 489,78 200 kg de P2 O5/ha 463,50 FONTE: CAMPOS, 1984. Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 304 304 TABELA 9.13 – ANÁLISE DA VARIÂNCIA DO EFEITO DE NÍVEIS DE ADUBAÇÃO FOSFATADA NA PRODUÇÃO DE CANA-DE-AÇÚCAR Causa de Variação GL SQ QM F Adubação Fosfatada 4 387,8748 96,9687 10,92 ** Blocos 5 735,6497 - - Resíduo 20 177,6581 8,8829 Total 29 1.301,1826 FONTE: CAMPOS, 1984. NOTA: (**) Significativo no nível de 1% de probabilidade. Autor: PAULO VANDERLEI FERREIRA – CECA-UFAL, 2011. Página 305 305
Compartilhar