Buscar

Aula 9 - Regressão

Prévia do material em texto

Na última aula...
✓ Por que não posso parar só na ANAVA?
➢ Pois a ANAVA só mostra que há diferença entre seus tratamentos, mas para saber onde ela está, é preciso
realizar um teste de médias (para fatores qualitativos) ou uma análise de regressão (para fatores quantitativos)
✓ Pra que serve o teste de médias?
➢ Para comparar as médias entre os tratamentos e te dizer onde está a diferença entre eles, mostrando qual foi
melhor e qual foi pior
✓ Como o teste de médias consegue dizer qual tratamento diferiu do outro?
➢ Ele compara a diferença entre as médias dos tratamentos com um parâmetro chamado de diferença mínima
significante (DMS). Valores superiores ao DMS são considerados diferentes. Valores inferiores são
considerados iguais
✓ Como o teste identifica o que é diferente do que é igual?
➢ Através de letras. Mesma letra = igualdade entre os tratamentos. Letras diferentes = diferença entre os
tratamentos.
ANAVA
Pr > Fc = probabilidade de os tratamentos serem iguais entre si
▪ Se a probabilidade deles serem iguais for > 5% (0,05), aceita-se que não existem diferenças entre os 
tratamentos
▪ Se a probabilidade deles serem iguais for < 5% (0,05), aceita-se que existem diferenças entre os 
tratamentos
Probabilidade dos tratamentos serem iguais é de apenas 2,24% (0,0224)
→ Logo, aceita-se que existem diferenças entre os tratamentos
ANAVA
Ok, a análise de 
variância mostrou que 
eu tenho diferença 
entre meus 
tratamentos.
Mas e agora? Como 
saber qual é o melhor 
e qual é o pior? 
Teste de médias
Regressão
Fatores qualitativos
✓ Cultivares
✓ Produtos
✓ Tipos de manejo
Fatores quantitativos
✓ Doses (0,0; 0,1; 0,2; 0,3; 0,4 L ha-1)
✓ Épocas (0; 3; 6; 9; 12 dias após o fungicida)
✓ População (100; 200; 300; 400 mil plantas ha-1)
Análise de regressão
Prof. Msc. Gabriel Bressiani Melo
Exemplo 1
População de plantas x Produtividade
Imagine que você está testando cinco populações de plantas (100,
200, 300, 400 e 500 mil plantas ha-1), ou seja, um fator quantitativo...
Você já executou a ANAVA e observou que houve diferença
significativa entre os tratamentos...
Análise de regressão
População Repetição PROD
100 1 4.782 
100 2 5.087 
100 3 4.871 
100 4 4.877 
Média 4.904 
200 1 4.455 
200 2 4.897 
200 3 4.560 
200 4 4.765 
Média 4.669 
300 1 4.632 
300 2 3.957 
300 3 4.300 
300 4 4.854 
Média 4.436 
400 1 4.721 
400 2 4.859 
400 3 4.911 
400 4 4.393 
Média 4.721 
500 1 4.028 
500 2 4.051 
500 3 4.419 
500 4 4.259 
Média 4.189 
Como se 
comportará a 
produtividade a 
medida que eu 
aumento minha 
população?? Vai 
aumentar ou 
diminuir?
Para obter essas informações você precisa realizar
uma análise de regressão
Qual população 
de plantas vai ser 
mais produtiva, e 
qual vai ser 
menos?
População Repetição PROD
100 1 4.782 
100 2 5.087 
100 3 4.871 
100 4 4.877 
Média 4.904 
200 1 4.455 
200 2 4.897 
200 3 4.560 
200 4 4.765 
Média 4.669 
300 1 4.632 
300 2 3.957 
300 3 4.300 
300 4 4.854 
Média 4.436 
400 1 4.721 
400 2 4.859 
400 3 4.911 
400 4 4.393 
Média 4.721 
500 1 4.028 
500 2 4.051 
500 3 4.419 
500 4 4.259 
Média 4.189 
Quando se está trabalhando com fatores quantitativos (que seguem uma escala de
proporção numérica) é possível saber não apenas qual é o melhor tratamento, mas também
como a variável se comporta a medida que você diminui ou aumenta o nível dos seus
tratamentos.
Se eu fizer um gráfico relacionando as médias obtidas com os níveis dos meus tratamentos,
eu terei um diagrama de dispersão.
Análise de regressão
4904
4669
4436
4721
4189
3900
4200
4500
4800
5100
100 200 300 400 500
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
População de plantas (mil plantas ha-1)
Com o diagrama de dispersão pronto, agora eu ierei testar modelos que expliquem o comportamento dos meus dados.
Existem diversos tipos de modelos de ajuste dos pontos. Entretanto, na agronomia, só se consegue explicar modelos
lineares (em linha reta) ou quadráticos (em curva).
Análise de regressão
População de plantas
+
+
-
-
P
ro
d
u
ti
v
id
a
d
e
Linear
População de plantas
+
+
-
-
P
ro
d
u
ti
v
id
a
d
e
Quadrático
Para saber qual modelo explica melhor às suas médias, é realizada a ANAVA da regressão para testar o ajuste de cada um
dos modelos (linear ou quadrático)
Análise de regressão
FV GL SQ QM Fc
Regressão Linear (RL.) 1 (ΣC1T)² / RK1 SQRL. / GLRL. QMRL. / QMRes.
Regressão Quadrática (RQ.) 1 (ΣC2T)² / RK2 SQRQ. / GLRQ. QMRQ. / QMRes.
Desvío da Regressão (DR.) GLTrat. - (GLRL. + GLRQ.) SQTrat. - (SQRL. + SQRQ.) SQDR. / GLDR. QMDR. / QMRes.
Resíduo (Res.) (Nt - 1) * (Nr - 1) (SQTot. - SQTrat. - SQBloc.) SQRes. / GLRes.
Legenda
Letra Referência
Nt Número de tratamentos
Nr Número de repetições
Após a etapa da ANAVA, é calculado o R², que nada mais é do que o coeficiente de ajuste do modelo, ou seja, o quanto
aquele modelo consegue explicar seus resultados.
Além disso, é calculado a equação do modelo para poder calcular sua linha de tendência.
Também é calculado o ponto de máxima (ponto de maior valor), ou seja, descobrir qual o melhor tratamento
Análise de regressão
Modelos R² a b c Valor de y X máximo
Regressão Linear (RL.) (SQRL. / SQTrat.) - (B1*M1) / q Ӯ + ((B1*M1*( * -1)) / q) y = c + bx -
Regressão Quadrática (RQ.) (SQRL. + SQRQ.) / SQTrat. (B2*M2) / q² ((B2*M2*2*( * -1)) / q²) + ((B1*M1) / q) Ӯ + ((B1*M1*( * -1)) / q) + (B2*M2*(( / q)²-2)) y = c + bx + ax² |b / (2*a)|
Fatores Variáveis Fórmula Letra Referência
B1 RL ΣC1*T / Nr*K1 Nt número de tratamentos
B2 RQ ΣC2*T / Nr*K2 Nr número de repetições
q - X2 - X1 Np número de parcelas
Médio X1 + X2 + X3 + X4 + X5 / Nt ΣTR² somatório dos tratamentos ao quadrado
P1 RL Z Σy somatório do total
P2 RQ Z²- (Nt)² -1) / 12) Σy² somatório das parcelas²
Z RL (X - ) / q ΣB² total dos blocos²
Z² RQ ((X - ) / q))² Ӯ Média de todo o experimento
X1, X2, X3, X... Valores dos níveis do tratamento
Fórmulas Legenda
Modelos R² a b c Valor de y X máximo
Regressão Linear (RL.) (SQRL. / SQTrat.) - (B1*M1) / q Ӯ + ((B1*M1*( * -1)) / q) y = c + bx -
Regressão Quadrática (RQ.) (SQRL. + SQRQ.) / SQTrat. (B2*M2) / q² ((B2*M2*2*( * -1)) / q²) + ((B1*M1) / q) Ӯ + ((B1*M1*( * -1)) / q) + (B2*M2*(( / q)²-2)) y = c + bx + ax² |b / (2*a)|
Fatores Variáveis Fórmula Letra Referência
B1 RL ΣC1*T / Nr*K1 Nt número de tratamentos
B2 RQ ΣC2*T / Nr*K2 Nr número de repetições
q - X2 - X1 Np número de parcelas
Médio X1 + X2 + X3 + X4 + X5 / Nt ΣTR² somatório dos tratamentos ao quadrado
P1 RL Z Σy somatório do total
P2 RQ Z²- (Nt)² -1) / 12) Σy² somatório das parcelas²
Z RL (X - ) / q ΣB² total dos blocos²
Z² RQ ((X - ) / q))² Ӯ Média de todo o experimento
X1, X2, X3, X... Valores dos níveis do tratamento
Fórmulas Legenda
Encontrar o 
melhor 
tratamento
Escolhendo o modelo ideal
Análise de regressão
Quando a regressão linear (b1) for significativa à 5% (0,05), significa que ela 
pode explicar o comportamento das médias
Quando a regressão quadrática (b2) for significativa à 5% (0,05), significa 
que ela pode explicar o comportamento das médias
Quando o desvio da regressão for significativo à 5% (0,05), significa que 
nenhum dos dois modelos consegue explicar o comportamento dos dados
População Repetição PROD
100 1 4.782 
100 2 5.087 
100 3 4.871 
100 4 4.877 
Média 4.904 
200 1 4.455 
200 2 4.897 
200 3 4.560 
200 4 4.765 
Média 4.669 
300 1 4.632 
300 2 3.957 
300 3 4.300 
300 4 4.854 
Média4.436 
400 1 4.721 
400 2 4.859 
400 3 4.911 
400 4 4.393 
Média 4.721 
500 1 4.028 
500 2 4.051 
500 3 4.419 
500 4 4.259 
Média 4.189 
Ambos os modelos são significativos
Análise de regressão
Como os dois modelos forem significativos, para escolher entre um deles, é preciso observar qual deles tem o maior 
R², ou seja, qual se ajusta melhor aos seus dados. Obs.: o R² precisa ser maior que 60%
Como o R² foi muito próximo, o último critério é escolher qual modelo se encaixa melhor nos resultados esperados, ou 
seja, se qual deles vai explicar melhor os resultados encontrados
Linear Quadrática
R² muito próximos
Escolhendo o modelo ideal
População Repetição PROD
100 1 4.782 
100 2 5.087 
100 3 4.871 
100 4 4.877 
Média 4.904 
200 1 4.455 
200 2 4.897 
200 3 4.560 
200 4 4.765 
Média 4.669 
300 1 4.632 
300 2 3.957 
300 3 4.300 
300 4 4.854 
Média 4.436 
400 1 4.721 
400 2 4.859 
400 3 4.911 
400 4 4.393 
Média 4.721 
500 1 4.028 
500 2 4.051 
500 3 4.419 
500 4 4.259 
Média 4.189 
Observando os dados, nota-se uma tendência de diminuição linear da produtividade com o
aumento da população de plantas. Neste caso, o modelo linear se encaixa melhor, ou
seja, explica melhor o comportamento dos dados
Análise de regressão
4904
4669
4436
4721
4189
3900
4200
4500
4800
5100
100 200 300 400 500
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
População de plantas (mil plantas ha-1)
Diagrama de dispersão
Escolhendo o modelo ideal
População Repetição PROD
100 1 4.782 
100 2 5.087 
100 3 4.871 
100 4 4.877 
Média 4.904 
200 1 4.455 
200 2 4.897 
200 3 4.560 
200 4 4.765 
Média 4.669 
300 1 4.632 
300 2 3.957 
300 3 4.300 
300 4 4.854 
Média 4.436 
400 1 4.721 
400 2 4.859 
400 3 4.911 
400 4 4.393 
Média 4.721 
500 1 4.028 
500 2 4.051 
500 3 4.419 
500 4 4.259 
Média 4.189 
Depois de escolhido o modelo e feito os cálculos das equações, basta colocar os valores de X
(seus tratamentos, Ex.: 100, 200, 300...) na equação para encontrar os valores de Y
correspondentes.
Quando fizer isto você terá os valores observados, que foram aqueles que você obteve, e os
valores estimados, aqueles calculados pela equação.
Análise de regressão
4904
4669
4436
4721
4189
4859 4721
4583
4446
4308
3900
4200
4500
4800
5100
100 200 300 400 500
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
População de plantas (mil plantas ha-1)
População Repetição PROD
100 1 4.782 
100 2 5.087 
100 3 4.871 
100 4 4.877 
Média 4.904 
200 1 4.455 
200 2 4.897 
200 3 4.560 
200 4 4.765 
Média 4.669 
300 1 4.632 
300 2 3.957 
300 3 4.300 
300 4 4.854 
Média 4.436 
400 1 4.721 
400 2 4.859 
400 3 4.911 
400 4 4.393 
Média 4.721 
500 1 4.028 
500 2 4.051 
500 3 4.419 
500 4 4.259 
Média 4.189 
Análise de regressão
4904
4669
4436
4721
4189
4859 4721
4583
4446
4308
3900
4200
4500
4800
5100
100 200 300 400 500
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
População de plantas (mil plantas ha-1)
Depois de escolhido o modelo e feito os cálculos das equações, basta colocar os valores de X
(seus tratamentos, Ex.: 100, 200, 300...) na equação para encontrar os valores de Y
correspondentes.
Quando fizer isto você terá os valores observados, que foram aqueles que você obteve, e os
valores estimados, aqueles calculados pela equação.
Agora, é só traçar uma linha (linha de tendência), interligando os pontos dos valores
estimados.
População Repetição PROD
100 1 4.782 
100 2 5.087 
100 3 4.871 
100 4 4.877 
Média 4.904 
200 1 4.455 
200 2 4.897 
200 3 4.560 
200 4 4.765 
Média 4.669 
300 1 4.632 
300 2 3.957 
300 3 4.300 
300 4 4.854 
Média 4.436 
400 1 4.721 
400 2 4.859 
400 3 4.911 
400 4 4.393 
Média 4.721 
500 1 4.028 
500 2 4.051 
500 3 4.419 
500 4 4.259 
Média 4.189 
Análise de regressão
4904
4669
4436
4721
4189
4859 4721
4583
4446
4308
3900
4200
4500
4800
5100
100 200 300 400 500
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
População de plantas (mil plantas ha-1)
Depois de escolhido o modelo e feito os cálculos das equações, basta colocar os valores de X
(seus tratamentos, Ex.: 100, 200, 300...) na equação para encontrar os valores de Y
correspondentes.
Quando fizer isto você terá os valores observados, que foram aqueles que você obteve, e os
valores estimados, aqueles calculados pela equação.
Agora, é só traçar uma linha (linha de tendência), interligando os pontos dos valores
estimados.
Por fim, é só colocar a legenda com a equação e o valor do R²
y = 4997,10 – 1,377x; R² = 61,97%
População Repetição PROD
100 1 4.782 
100 2 5.087 
100 3 4.871 
100 4 4.877 
Média 4.904 
200 1 4.455 
200 2 4.897 
200 3 4.560 
200 4 4.765 
Média 4.669 
300 1 4.632 
300 2 3.957 
300 3 4.300 
300 4 4.854 
Média 4.436 
400 1 4.721 
400 2 4.859 
400 3 4.911 
400 4 4.393 
Média 4.721 
500 1 4.028 
500 2 4.051 
500 3 4.419 
500 4 4.259 
Média 4.189 
Análise de regressão
Tudo pronto!
Agora, observando o gráfico você consegue descrever como se comporta a variável de acordo
com o aumento dos níveis de seus tratamentos...
...ou seja, no caso deste exemplo, você é capaz de dizer que a medida em que se aumenta a
população de plantas, ocorre redução linear na produtividade, sendo a maior produtividade
obtida na população de 100 mil e a menor na população de 500 mil plantas ha-1.
4904
4669
4436
4721
4189
4859 4721
4583
4446
4308
3900
4200
4500
4800
5100
100 200 300 400 500
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
População de plantas (mil plantas ha-1)
y = 4997,10 – 1,377x; R² = 61,97%
Exemplo 2
Doses de um adubo x Produtividade
Agora, Imagine que você está testando cinco doses de um adubo (400,
500, 600, 700 e 800 kg ha-1), ou seja, um fator quantitativo...
Você já executou a ANAVA e observou que houve diferença significativa
entre os tratamentos...
Análise de regressão
Como se 
comportará a 
produtividade a 
medida que eu 
aumento as doses 
do meu adubo?
Para obter essas informações você precisa realizar
uma análise de regressão
Qual dose de 
adubo vai resultar 
em maior 
produtividade?
DOSES Repetição PROD
400 1 4.001 
400 2 4.002 
400 3 3.999 
400 4 3.998 
Média 4.000 
500 1 4.242 
500 2 4.250 
500 3 4.260 
500 4 4.238 
Média 4.248 
600 1 4.520 
600 2 4.530 
600 3 4.510 
600 4 4.502 
Média 4.516 
700 1 4.252 
700 2 4.280 
700 3 4.200 
700 4 4.260 
Média 4.248 
800 1 3.990 
800 2 4.050 
800 3 4.020 
800 4 3.999 
Média 4.015 
DOSES Repetição PROD
400 1 4.001 
400 2 4.002 
400 3 3.999 
400 4 3.998 
Média 4.000 
500 1 4.242 
500 2 4.250 
500 3 4.260 
500 4 4.238 
Média 4.248 
600 1 4.520 
600 2 4.530 
600 3 4.510 
600 4 4.502 
Média 4.516 
700 1 4.252 
700 2 4.280 
700 3 4.200 
700 4 4.260 
Média 4.248 
800 1 3.990 
800 2 4.050 
800 3 4.020 
800 4 3.999 
Média 4.015 
Se eu fizer um gráfico relacionando as médias obtidas com os níveis dos meus tratamentos,
eu terei meu diagrama de dispersão.
Análise de regressão
4000
4248
4516
4248
4015
3800
4000
4200
4400
4600
400 500 600 700 800
P
ro
du
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
Doses adubo (kg ha-1)
Com o diagrama de dispersão pronto, agora eu ierei testar modelos que expliquem o comportamento dos meus dados.
Existem diversos tipos de modelos de ajuste dos pontos. Entretanto, na agronomia, só se consegue explicar modelos
lineares (em linha reta) ou quadráticos (em curva).
Análise de regressão
Doses adubo
+
+
-
-
P
ro
d
u
ti
v
id
a
d
e
Linear
Doses adubo
+
+
-
-
P
ro
d
u
ti
v
id
a
d
e
Quadrático
Para saber qual modelo explica melhor às suas médias, é realizada a ANAVA da regressão para testar o ajuste de cada um
dos modelos (linear ou quadrático)
Análise de regressão
FV GL SQ QM Fc
Regressão Linear (RL.) 1 (ΣC1T)² / RK1 SQRL. / GLRL. QMRL. / QMRes.
Regressão Quadrática (RQ.) 1 (ΣC2T)² / RK2 SQRQ. / GLRQ. QMRQ. / QMRes.
Desvío da Regressão (DR.) GLTrat. - (GLRL. + GLRQ.) SQTrat. - (SQRL. + SQRQ.) SQDR. / GLDR. QMDR. / QMRes.
Resíduo (Res.) (Nt - 1) * (Nr - 1) (SQTot. - SQTrat. - SQBloc.) SQRes. / GLRes.
Legenda
Letra Referência
Nt Número de tratamentos
Nr Número de repetições
Doses adubo Doses adubo
Após a etapa da ANAVA, é calculado o R², que nada mais é do que o coeficiente de ajuste do modelo, ou seja, o quanto
aquele modelo consegue explicar seus resultados.
Além disso, é calculado a equação do modelo para poder calcular sua linha de tendência.
Também é calculado o ponto de máxima (ponto de maior valor), ou seja, descobrir qual o melhor tratamento
Análise de regressão
Modelos R² a b c Valor de y X máximo
Regressão Linear (RL.) (SQRL. / SQTrat.) - (B1*M1) / q Ӯ + ((B1*M1*( * -1)) / q) y = c + bx -
Regressão Quadrática (RQ.) (SQRL. + SQRQ.) / SQTrat. (B2*M2) / q² ((B2*M2*2*( * -1)) / q²) + ((B1*M1) / q) Ӯ + ((B1*M1*( * -1)) / q) + (B2*M2*(( / q)²-2)) y = c + bx + ax² |b / (2*a)|
Fatores Variáveis Fórmula Letra Referência
B1 RL ΣC1*T / Nr*K1 Nt número de tratamentos
B2 RQ ΣC2*T / Nr*K2 Nr número de repetições
q - X2 - X1 Np número de parcelas
Médio X1 + X2 + X3 + X4 + X5 / Nt ΣTR² somatório dos tratamentos ao quadrado
P1 RL Z Σy somatório do total
P2 RQ Z²- (Nt)² -1) / 12) Σy² somatório das parcelas²
Z RL (X - ) / q ΣB² total dos blocos²
Z² RQ ((X - ) / q))² Ӯ Média de todo o experimento
X1, X2, X3, X... Valores dos níveis do tratamento
Fórmulas Legenda
Modelos R² a b c Valor de y X máximo
Regressão Linear (RL.) (SQRL. / SQTrat.) - (B1*M1) / q Ӯ + ((B1*M1*( * -1)) / q) y = c + bx -
Regressão Quadrática (RQ.) (SQRL. + SQRQ.) / SQTrat. (B2*M2) / q² ((B2*M2*2*( * -1)) / q²) + ((B1*M1) / q) Ӯ + ((B1*M1*( * -1)) / q) + (B2*M2*(( / q)²-2)) y = c + bx + ax² |b / (2*a)|
Fatores Variáveis Fórmula Letra Referência
B1 RL ΣC1*T / Nr*K1 Nt número de tratamentos
B2 RQ ΣC2*T / Nr*K2 Nr número de repetições
q - X2 - X1 Np número de parcelas
Médio X1 + X2 + X3 + X4 + X5 / Nt ΣTR² somatório dos tratamentos ao quadrado
P1 RL Z Σy somatório do total
P2 RQ Z²- (Nt)² -1) / 12) Σy² somatório das parcelas²
Z RL (X - ) / q ΣB² total dos blocos²
Z² RQ ((X - ) / q))² Ӯ Média de todo o experimento
X1, X2, X3, X... Valores dos níveis do tratamento
Fórmulas Legenda
Encontrar o 
melhor 
tratamento
DOSES Repetição PROD
400 1 4.001 
400 2 4.002 
400 3 3.999 
400 4 3.998 
Média 4.000 
500 1 4.242 
500 2 4.250 
500 3 4.260 
500 4 4.238 
Média 4.248 
600 1 4.520 
600 2 4.530 
600 3 4.510 
600 4 4.502 
Média 4.516 
700 1 4.252 
700 2 4.280 
700 3 4.200 
700 4 4.260 
Média 4.248 
800 1 3.990 
800 2 4.050 
800 3 4.020 
800 4 3.999 
Média 4.015 
Escolhendo o modelo ideal
Análise de regressão
Quando a regressão linear (b1) for significativa à 5% (0,05), significa que ela 
pode explicar o comportamento das médias
Quando a regressão quadrática (b2) for significativa à 5% (0,05), significa 
que ela pode explicar o comportamento das médias
Quando o desvio da regressão for significativo à 5% (0,05), significa que 
nenhum dos dois modelos consegue explicar o comportamento dos dados
Ambos os modelos são significativos
DOSES Repetição PROD
400 1 4.001 
400 2 4.002 
400 3 3.999 
400 4 3.998 
Média 4.000 
500 1 4.242 
500 2 4.250 
500 3 4.260 
500 4 4.238 
Média 4.248 
600 1 4.520 
600 2 4.530 
600 3 4.510 
600 4 4.502 
Média 4.516 
700 1 4.252 
700 2 4.280 
700 3 4.200 
700 4 4.260 
Média 4.248 
800 1 3.990 
800 2 4.050 
800 3 4.020 
800 4 3.999 
Média 4.015 
Observando os dados, nota-se um comportamento em curva da produtividade em relação as
doses do adubo, portanto o modelo quadrático se encaixa bem, ou seja, consegue
explicar o comportamento dos dados
Análise de regressão
4000
4248
4516
4248
4015
3800
4000
4200
4400
4600
400 500 600 700 800
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
Doses adubo (kg ha-1)
Escolhendo o modelo ideal
Análise de regressão
Agora, basta observar o valor do coeficiente de ajuste (R²) para ter certeza que terá um bom ajuste do modelo ao 
comportamento dos dados. Obs.: o R² precisa ser maior que 60%
Quadrática
Escolhendo o modelo ideal
DOSES Repetição PROD
400 1 4.001 
400 2 4.002 
400 3 3.999 
400 4 3.998 
Média 4.000 
500 1 4.242 
500 2 4.250 
500 3 4.260 
500 4 4.238 
Média 4.248 
600 1 4.520 
600 2 4.530 
600 3 4.510 
600 4 4.502 
Média 4.516 
700 1 4.252 
700 2 4.280 
700 3 4.200 
700 4 4.260 
Média 4.248 
800 1 3.990 
800 2 4.050 
800 3 4.020 
800 4 3.999 
Média 4.015 
Depois de escolhido o modelo e feito os cálculos das equações, basta colocar os valores de X
(seus tratamentos, Ex.: 400, 500, 600...) na equação para encontrar os valores de Y
correspondentes.
Quando fizer isto você terá os valores observados, que foram aqueles que você obteve, e os
valores estimados, aqueles calculados pela equação.
Análise de regressão
4000
4248
4516
4248
4015
3985
4309
4419
4315
3997
3800
4000
4200
4400
4600
400 500 600 700 800
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
Doses adubo (kg ha-1)
DOSES Repetição PROD
400 1 4.001 
400 2 4.002 
400 3 3.999 
400 4 3.998 
Média 4.000 
500 1 4.242 
500 2 4.250 
500 3 4.260 
500 4 4.238 
Média 4.248 
600 1 4.520 
600 2 4.530 
600 3 4.510 
600 4 4.502 
Média 4.516 
700 1 4.252 
700 2 4.280 
700 3 4.200 
700 4 4.260 
Média 4.248 
800 1 3.990 
800 2 4.050 
800 3 4.020 
800 4 3.999 
Média 4.015 
Análise de regressão
Depois de escolhido o modelo e feito os cálculos das equações, basta colocar os valores de X
(seus tratamentos, Ex.: 400, 500, 600...) na equação para encontrar os valores de Y
correspondentes.
Quando fizer isto você terá os valores observados, que foram aqueles que você obteve, e os
valores estimados, aqueles calculados pela equação.
Agora, é só traçar uma linha (linha de tendência), interligando os pontos dos valores
estimados.
4000
4248
4516
4248
4015
3985
4309
4419
4315
3997
3800
4000
4200
4400
4600
400 500 600 700 800
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
Doses adubo (kg ha-1)
DOSES Repetição PROD
400 1 4.001 
400 2 4.002 
400 3 3.999 
400 4 3.998 
Média 4.000 
500 1 4.242 
500 2 4.250 
500 3 4.260 
500 4 4.238 
Média 4.248 
600 1 4.520 
600 2 4.530 
600 3 4.510 
600 4 4.502 
Média 4.516 
700 1 4.252 
700 2 4.280 
700 3 4.200 
700 4 4.260 
Média 4.248 
800 1 3.990 
800 2 4.050 
800 3 4.020 
800 4 3.999 
Média4.015 
Análise de regressão
Depois de escolhido o modelo e feito os cálculos das equações, basta colocar os valores de X
(seus tratamentos, Ex.: 400, 500, 600...) na equação para encontrar os valores de Y
correspondentes.
Quando fizer isto você terá os valores observados, que foram aqueles que você obteve, e os
valores estimados, aqueles calculados pela equação.
Agora, é só traçar uma linha (linha de tendência), interligando os pontos dos valores
estimados.
Agora é preciso colocar a legenda com a equação e o valor do R²
y = 551,58 + 12,861x – 0,0107x²; R² = 89,8%
4000
4248
4516
4248
4015
3985
4309
4419
4315
3997
3800
4000
4200
4400
4600
400 500 600 700 800
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
Doses adubo (kg ha-1)
Análise de regressão
Em uma regressão quadrática, também é possível calcular o ponto de máxima, ou seja, o valor do tratamento que resultou no maior valor da variável
analisada. No caso deste exemplo, é a dose do adubo que resultou na maior produtividade.
Para calcular o ponto de máxima e descobrir qual é a melhor dose, basta usar a fórmula: |b/(2*a)| → b = constante que acompanha o x; a =
constante que acompanha x²
Depois de calculado o ponto de máxima, é possível descobrir qual foi o maior valor de produtividade obtido. Basta substituir o valor do ponto de
máxima no X da equação.
Neste exemplo a equação da regressão foi: y = 551,58 + 12,861x – 0,0107x² → substituindo: y = 551,58 + 12,861*600,98 – 0,0107*600,98² → y =
4416,19
4000
4248
4516
4248
4015
3985
4309
4419
4315
3997
3800
4000
4200
4400
4600
400 500 600 700 800
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
Doses adubo (kg ha-1)
y = 551,58 + 12,861x – 0,0107x²; R² = 89,8%
|12,861/(2*0,0107)|
600,98
4416,19
600,98
Análise de regressão
Tudo pronto!
Agora, observando o gráfico você consegue descrever como se comporta a variável de acordo com o aumento dos níveis de seus
tratamentos...
Você é capaz de dizer que seus dados apresentaram comportamento quadrático (em curva). Sendo que, com o aumento das
doses do adubo, houve acréscimo de produtividade, que se manteve até a dose de 600,98 kg ha-1, resultando na produtividade
máxima de 4416,19 kg ha-1. Após esta dose, acréscimos na quantidade de adubo resultaram em redução na produtividade.
4000
4248
4516
4248
4015
3985
4309
4419
4315
3997
3800
4000
4200
4400
4600
400 500 600 700 800
P
ro
d
u
ti
v
id
a
d
e
 (
k
g
 h
a
-1
)
Doses adubo (kg ha-1)
y = 551,58 + 12,861x – 0,0107x²; R² = 89,8%
4416,19
600,98
Obrigado!!!

Continue navegando