Buscar

parte22 - análise de regressão

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 36 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Biometria Florestal 
 
 
 270 
 
 
 
18 ANÁLISE DE REGRESSÃO 
 
 
 A exemplo do capítulo 17, faz-se uma revisão generalizada da análise de 
regressão, não sendo o intuito esgotar o assunto, mas fornecer subsídios aos estudantes 
para a melhor compreensão da biometria florestal. 
 O estudo detalhado de uma população florestal exige observação e análise 
de uma série de variáveis, que são indicadas por valores quantitativos ou qualitativos. 
No conjunto das variáveis, existem aquelas fáceis de serem medidas e 
outras de difícil obtenção. Entretanto, se as variáveis forem correlatas, pode-se 
determinar, indiretamente, as difíceis a partir das variáveis de fácil medição. 
 Segundo Loetsch et al. (1973), o problema consiste em obter uma expressão 
quantitativa da dependência de uma variável de difícil obtenção Y sobre uma ou mais 
variáveis independentes X, facilmente obtidas. Tal expressão é matematicamente 
chamada de função, ou seja, Y é uma função de X →→→→ (Y = f (X)). 
Segundo Freese (1964), a aplicação mais comum dos métodos de regressão 
visa a atender os seguintes objetivos: 
a) testar hipóteses sobre a relação entre a variável dependente e uma ou 
mais variáveis independentes; 
b) determinar uma função matemática que descreva a relação entre uma 
variável dependente e uma ou mais variáveis independentes. 
 
O autor cita que a escolha das variáveis para um modelo de regressão deve 
ser feita a partir da correlação existente elas. Assim, a variável dependente é 
equacionada como função das variáveis correlatas. A precisão das estimativas do modelo 
depende do grau de associação entre as variáveis. 
 
18.1 Tipos de regressão 
 As regressões podem ser classificadas em lineares e não-lineares. As 
lineares podem ser simples ou múltiplas. 
 
Biometria Florestal 
 
 
 271 
 
18.1.1 Regressão linear 
 A regressão é linear quando os coeficientes da equação apresentam-se na 
forma aditiva ou subtrativa e elevados ao expoente um. 
 
 Y = β0 + β1X ou Y = β0 + β1X1+ β2X2 
 
 A regressão linear pode ser simples quando a variável dependente Y é 
explicada por uma única variável independente X, ou seja: Y= f(X), 
como, por exemplo, Y = β0+ β1X1 
e múltipla quando a variável dependente é explicada por duas ou mais variáveis 
independentes, ou seja, Y = f(X1, X2, X3, ...,Xn); 
como, por exemplo, Y = β0+ β1X1 +β2X2 . 
 
18.1.2 Regressão não-linear 
 Uma regressão é considerada não-linear quando os coeficientes da equação 
encontram-se na forma de produto, fracionária ou elevados a expoentes não-unitários; ou 
seja, os coeficientes NÃO se encontram na forma aditiva ou subtrativa e com potência 
unitária; como exemplificado a seguir: 
Xy o 1.ββ= , 
 
X
oy 1.ββ= , 
 
21
210 ..
XXy βββ= , 
 
211 1
1
0 )exp1( βββ −−−= Xy . 
 
 
 Muitas vezes, uma equação não-linear pode ser transformada em linear por 
processo matemático. Por exemplo, a equação não linear XoY 1.ββ= 
pode ser linearizada, com a logaritimização, ou seja: 
 
XY o .lnlnln 1ββ += . 
Considerando-se ser b0 o estimador de ln β0 e b1 o estimador de ln β1, pode-se escrever: 
 b0 = ln β0 , 
 
Biometria Florestal 
 
 
 272 
 b1 = ln β1, 
 Y = ln Y , 
obtendo-se, com a transformação de variáveis, o modelo linear aditivo: XbbY 10 += . 
Do mesmo modo, a equação 21 210 ..
XXY βββ= pode ser linearizada como 
segue: 
 2211 .ln.lnlnln XXY o βββ ++= 
que resulta em: 
 22110 XbXbby ++= 
 
 No entanto, equações do tipo 2)( 110 XXY ββ += não podem ser linearizadas, 
pois não se pode resolver soma de variáveis na forma exponencial. Essas equações não-
lineares são resolvidas com técnicas de regressão não-linear como o processo interativo. 
Já os modelos lineares ou linearizados, podem ser solucionados pelo método de mínimos 
quadrados. 
 
18.2 Regressão linear simples 
 A regressão linear constitui um recurso estatístico da maior importância na 
biometria, servindo para explicar as relações existentes entre variáveis dendrométricas 
como: diâmetro, altura, volume, área basal, idade, etc. 
 No estudo de regressão, o primeiro passo consiste na escolha do modelo 
que exprima a relação entre as variáveis. 
 A escolha do modelo pode ser feita com base em dois processos principais: 
 a) definir o modelo que se ajusta ao problema pela análise indutiva do 
comportamento das variáveis, da experiência e conhecimento de matemática do 
pesquisador; 
 b) aplicar os dados aos modelos existentes sobre a relação em estudo e 
escolher aquele que apresentar melhor ajuste. 
 Entre os modelos de equações mais comuns, destacam-se os seguintes: 
a) Equação da reta: a linha reta é dada pela equação Y = β0 + β1X e pode assumir 
comportamento diferente de acordo com o sinal dos coeficientes β0 e β1, como mostra a 
Figura 90. 
Biometria Florestal 
 
 
 273 
 
FIGURA 90 – Representação da equação da reta de acordo com o sinal dos coeficientes. 
 
b) Parábola: a parábola é expressa pela equação do segundo grau, e apresenta a 
seguinte forma: 
 Y = β0 + β1X1 + β2X22 . 
 
 Esta equação pode assumir forma diferente de acordo com o sinal dos 
coeficientes β1, β2, como mostra a Figura 91. 
 
FIGURA 91 – Representação gráfica da parábola, com a variação do sinal do coeficiente 
β1 e β2. 
 
c) Hipérbole: a hipérbole é dada pela equação Y = β0 + β1(1/X) e pode assumir as formas 
decrescente ou crescente de acordo com o sinal do coeficiente angular β1, como mostra a 
Figura 92. 
 
FIGURA 92 – Representação gráfica da hipérbole coma variação do sinal do coeficiente 
β1. 
 
Biometria Florestal 
 
 
 274 
d) Equação do terceiro grau: a equação do terceiro grau tem a seguinte forma: Y = β0 + 
β1X + β2X² + β3X³ e assume diferentes formas de acordo com o sinal do coeficiente β1, β2 
e β3. 
 
18.2.1 Modelo linear aditivo 
 O cálculo dos coeficientes (βi) e seus estimadores (bi) é realizado com base 
em um modelo linear aditivo da forma: 
 Yi = µ r + Ei , 
onde: Yi = valores da variável Y; 
 
µ r = média em movimento da variável Y de uma equação matemática qualquer; 
 
Ei = desvios das observações de Y em relação a µ r. 
 
 No caso da reta, o modelo linear aditivo é dado por: 
 
Y i = (β0 + β1X1) + Ei 
 
e pode ser representado, graficamente, pela Figura 93. 
 
 
FIGURA 93 – Distribuição normal dos dados e média em movimento. 
 
 Quando se trabalha com modelo de regressão, verifica-se o conceito de 
média em movimento. 
A média é dita em movimento pois sempre segue exatamente o percurso 
descrito pela equação, isto é, as estimativas estão sempre dentro de um intervalo. 
Considerando-se a Figura 93, na qual aparecem pontos em um eixo 
cartesiano X e Y, observa-se que existe uma tendência definida desses pontos. Sendo 
mínima a soma dos quadrados dos desvios entre os valores observados (Y) e estimados 
Biometria Florestal 
 
 
 275 
(�) representados pela reta, tem-se, para cada Xi, um valor médio jY . Dessa maneira 
verifica-se que a reta passa pelos pontos médios, representando, portanto, a média em 
movimento. 
 
18.2.2 Determinação das equações normais 
 A partir do modelo linear aditivo, tem-se que: 
 
 Yi = µ x + Ei . 
 
 e, portanto, Ei = Yi - µ x . 
 
 Tomando-se o somatório dos desvios, tem-se: 
0)(
11
=−=��
==
X
n
i
I
I
n
i
YE µ . 
 
Como o somatório é nulo, é importante trabalhar com o quadrado dos 
desvios: 
mínimoYE X
n
i
II
n
i
=−=��
==
2
1
2
1
)( µ . 
 
Por esse motivo, o método é chamado de “mínimos quadrados”. 
 
No caso de regressão linearsimples, tem-se que: 
2
110
11
22 )( XYES
n
i
i
n
i
i ββ −−== ��
==
, 
 )222( 1101102121202
11
22 XYYXXYES iii
n
i
n
i
i ββββββ −−+++== ��
==
. 
 
Para que essa expressão seja verdadeira, é necessário que as derivadas 
parciais relativas aos parâmetros β0 e β1 sejam nulas. Assim, a derivada em relação à β0 é 
dada por: 
)(2 110
10
XY
n
i
i
s ββ
β
−−−=
∂
∂
�
=
. 
Biometria Florestal 
 
 
 276 
Dividindo-se por 2 e igualando-se a zero tem-se: 
0)( 110
1
=++−�
=
XY
n
i
i ββ . 
 
A diferencial em relação a β1 resulta: 
 
)(2 110
11
XYX
n
i
ii
s βββ −−−=∂
∂
�
=
. 
 
Também dividindo por 2 e igualando a zero tem-se: 
0)( 110
1
=++−�
=
XYX
n
i
ii ββ . 
 
 As estimativas de β0 e β1, dadas por b0 e b1, são obtidas por: 
 
0)( 110
1
=−−�
=
XbbY
n
i
i e 0)( 110
1
=−−�
=
XbbYX
n
i
ii , 
 
ou seja, 
 
0
1
110
1
=−− ��
==
n
i
n
i
i XbnbY e 0
2
11
1
0
1
=−− ��
==
XbXbYX
n
i
i
n
i
ii , 
 
portanto, 
��
==
+=
n
i
n
i
i XbnbY
1
110
1
 e 211
1
0
1
XbXbYX
n
i
i
n
i
ii += ��
==
. 
 
Uma maneira prática de montar o sistema de equações normais é o 
seguinte: 
a) A partir do modelo geral XY 10 ββ += adiciona-se o sinal de somatório 1 
a n , pois tem-se um conjunto n de observações à frente dos elementos do modelo. 
 ���
===
+=
n
i
n
i
n
i
i XY
1
11
1
0
1
ββ � Primeira equação normal; 
 
Biometria Florestal 
 
 
 277 
b) Multiplica-se os termos da primeira equação por X: 
 1
1
11
1
0
1
XXXYX
n
i
i
n
i
n
i
ii ���
===
+= ββ , ou seja, 
 ���
===
+=
n
i
n
i
i
n
i
ii XXYX
1
2
11
1
0
1
ββ � Segunda equação normal. 
 
18.2.3 Solução do sistema de equações normais 
 
18.2.3.1 Solução por soma de equações e produtos não corrigidos (SQPNC) 
 Considerando-se, por exemplo, o estudo da relação hipsométrica com uma 
equação linear simples, do tipo h = b0 + b1 d, y = h (altura) e X = d (diâmetro). 
Estando o modelo de regressão na forma linear simples,Y i =(β0 + β1X1) + Ei, 
pode-se determinar os coeficientes pelo procedimento de Cramer, com os seguintes 
passos, após a determinação das equações normais (EQNOR), conforme generalizado 
em 18.2.2. 
 
1° Passo: Cálculo do determinante: 
 
 Considerando-se as EQNOR para o modelo acima: 
 
 ΣYi = b0 n + b1 ΣXi , 
 
ΣXi Yi = b0 ΣXi + b1ΣXi². 
e escrevendo-as na notação matricial, tem-se: 
 
��
�
+
+
2
10
1
ii
io
XbXb
Xbnb
 
ii
i
YX
Y
�
�
 . 
 
Pré-multiplicando a matriz dos somatórios(X’X) pelo vetor dos coeficientes (b’), tem-se: 
 
��
�
+
+
2
ii
i
XX
Xn
 x 
1
0
b
b
 = 
ii
i
YX
Y
�
�
, 
 
 (X’X) x (b’) = (X’Y). 
Biometria Florestal 
 
 
 278 
 
O determinante ∆ de (X’X), calculado pela Regra de Sarrus, será o produto 
dos elementos da diagonal principal menos o produto dos elementos da diagonal 
secundária; assim: 
 
∆ = n. Xi² - ΣXi . ΣXi . 
 
2° Passo: Cálculo de b1 
 Para a determinação de b1, faz-se, primeiramente, a substituição da coluna 
correspondente a b1 na matriz X’X pelo vetor X’Y. A seguir calcula-se o determinante da 
nova matriz, o qual é chamado de determinante b1. Assim, tem-se: 
 
��
�
+
+
iii
i
YXX
Yn 
,
 
 
∆ b1 = n . ΣXiYi - ΣYi . ΣXi . 
 
Conhecido o valor de ∆ b1, o valor de b1 será dado por: 
∆
∆
=
1
1
bb , 
ou seja: 
� �
� � �
−
−
= 221 )(.
..
ii
iiii
XXn
XYYXn
b . 
 
3° Passo: Cálculo do b0 
 Segue-se o mesmo procedimento apresentado para b1, substituindo-se 
apenas a coluna de b0 em X’X pelo vetor X’Y. Assim, a nova matriz será: 
��
��
+
+
2
 
 
iii
ii
XYX
XY
. 
 
A seguir, calcula-se o determinante da nova matriz, o qual é chamado de 
determinante b0: 
 
Biometria Florestal 
 
 
 279 
 ∆b0 = ΣXi . ΣXi² - ΣXi . ΣXiYi . 
 . 
Conhecido o valor de ∆ b0, o valor de b0 será dado por: 
∆
∆
=
0
0
bb , 
ou seja, 
� �
� � ��
−
−
= 22
2
0 )(.
.
ii
iiiii
XXn
YXXXX
b . 
 
 
 
18.2.4 Eficiência da regressão linear simples 
 
 Draper e Smith (1966) demonstraram a eficiência de uma regressão linear 
conforme o apresentado na Figura 94. 
 
 
 
FIGURA 94 – Eficiência da regressão linear simples. 
 
Considerando-se a Figura 94, tem-se: 
)()()(
^_^_
iiii YYYYYY −+−=− , 
 
onde: )(
_
YYi − = desvio total; 
 )(
_^
YY i − = desvio do valor ajustado sobre a média; 
 )(
^
YYi − = desvio do valor observado sobre o ajustado. 
 
Biometria Florestal 
 
 
 280 
Como este somatório será zero, usa-se o quadrado obtendo-se a expressão: 
2
^
2
_^
2
_
)()()( iiii YYYYYY −+−=− , 
onde: )(
_
YYi −
2
 = somatório corrigido dos quadrados de Y; 
 )(
_^
YY i − 2 = somatório dos quadrados devido à regressão; 
 )(
^
YYi −
2 
= somatório dos quadrados devido aos resíduos. 
 
 A partir dessas relações, pode-se obter a Análise de Variância (ANOVA), 
constituindo-se esta da decomposição da variabilidade segundo as fontes de variações 
conhecidas. Ela é somente uma igualdade algébrica e não depende das propriedades das 
distribuições de resíduos. 
 A ANOVA pode ser representada e calculada conforme mostra a Tabela 48. 
 
TABELA 48 – Quadro de análise de variância 
F. VARIAÇÃO G.L. S.Q QM F 
Total Corrigido n –1 
 )(
_
YYi −
2
 
 
Regressão(b0/b1) p –1 )(
_^
YY i − 2 
glreg
SQreg
 QMres
QMreg
 
Resíduo n - p Diferença 
glres
SQres
 
 
Onde: n = número de observações; p = número de coeficientes do modelo. 
 
Se ii XbbY 10
^
+= e 
_
1
_
0 XbYb −= , 
 
Substituindo-se 
Σ =− 2
_^
)( YY i 2
_
1
_
1
_
)( YXbXbY i −+−� , 
2
__
1
_
))(( YXXbY i −−−� . 
 
Simplificando, resulta: 
2
_
1 ))((� −− iXXb � multiplicando por –1 resulta � 2
_
1 ))((� +− iXXb , 
 
Biometria Florestal 
 
 
 281 
o que equivale à � 2
_
1 ))(.( � − XXb i . 
 
Sendo: 
� �
� � �
−
−
= 221 )(.
..
ii
iiii
XXn
XYYXn
b = 
� �
� � �
−
−
=
n
X
X
n
XY
YX
b
i
i
ii
ii
2
2
1 )(
.
, 
 
 
Tem-se: 
2
2
2
2
)(
.)(
.
.
�
�
�
�
�
�
�
�
�
�
�
�
�
�
−
	
	
	
	
�
�
�
�
�
�
−
−
� �
� �
� � �
n
X
X
n
X
X
n
XY
YX
i
i
i
i
ii
ii
, 
 
2
2
2
2
2
2
)(
.)(
.
.)(
.
.
�
�
�
�
�
�
�
�
�
�
�
�
�
�
−
	
	
	
	
�
�
�
�
�
�
−
−
	
	
	
	
�
�
�
�
�
�
−
−
� �
� �
� � �
� �
� � �
n
X
X
n
X
X
n
XY
YX
n
X
X
n
XY
YX
i
i
i
i
ii
ii
i
i
ii
ii
, 
 
 
.)( 12
_^
bYY i� =− � � �−
n
XY
YX iiii
.
. 
 
A soma de quadrados do resíduo (SQresíduo) será determinada pela 
diferença entre a soma de quadrados total e da regressão.A variância ( ^2 yxS ) será dada com (n-p) graus de liberdade (gl); tendo, na 
regressão simples, dois coeficientes (bo e b1) o valor de “p” será 2. 
 
 MQresíduo = pn
SQresíduo
pn
n
Y
Y
pn
YY
yxS i
−
=
−
−
=
−
−
=
�
� 22
2
_
^
2
)(
)(
. 
 
Biometria Florestal 
 
 
 282 
 O erro padrão ou desvio padrão ( ^yxS ) é obtido por: 
 
 
 
^
2
^
yxSQMresíduoyxS == , 
 
ou, em percentagem: 
 100.(%)
_
^
^
Y
yxSyxS = , 
onde: =
_
Y média da variável dependente Y. 
 O erro padrão de regressão ( ^yxS ) possibilita ainda a delimitação da 
amplitude de variação em cada lado da linha de regressão, com uma probabilidade de 
68% de que todos os pontos estejam dentro do intervalo de ±1 desvio padrão. 
 
 
18.2.5 Percentagem de variação explicada pela regressão 
 
 A percentagem de variação explicada pelo modelo ajustado é expressa pelo 
coeficiente de determinação r² e mede a “proporção da variação total sobre a média Y 
explicada pela regressão”. 
 O r² é definido por: 
 
 r² = (SQregressão)/(SQtotal) , 
 
 
� �
� � �
−
−
=
n
Y
Y
n
XY
YXb
r
i
i
ii
ii
2
2
1
2
)(
.
.
. 
 
Observação: Em cálculos sucessivos são cometidos erros de arredondamento. Tais 
erros trazem como conseqüência que, freqüentemente, a soma de quadrados da 
regressão resulte maior que a soma de quadrados total. Desta forma, para evitar tal 
Biometria Florestal 
 
 
 283 
absurdo, é necessário trabalhar com maior número de dígitos após a casa decimal. 
Assim, aconselha-se usar no mínimo cinco dígitos. 
 
 
18.3 Exercício 
 Considerar os dados de uma floresta de Pinus elliottii, apresentados na 
Tabela 49, para os quais se deseje ajustar a relação hipsométrica h = b0 + b1.d 
 No modelo tem-se: h = Y e d = X. 
 
 As equações normais são dadas por: 
��
�
+
+
2
10
1 
ii
io
XbXb
Xbnb
 
ii
i
YX
Y
�
�
 , 
 
logo, 
0,026.5.0,260.
0,26. 15.
10
1
bb
bbo
+
+
 
5,019.5
5,264 
. 
 
Os coeficientes do modelo calculados por: 
 
TABELA 49 – Dados de diâmetro e altura de Pinus elliottii 
N 
d (cm) 
X 
h (m) 
Y Y2 X2 XY 
^
Y 
1 10,0 11,0 121,00000 100,00000 110,00000 11,5 
2 13,0 15,0 225,00000 169,00000 195,00000 14,0 
3 15,0 17,0 289,00000 225,00000 255,00000 15,7 
4 20,0 19,0 361,00000 400,00000 380,00000 19,9 
5 21,0 21,0 441,00000 441,00000 441,00000 20,7 
6 25,0 23,0 529,00000 625,00000 575,00000 24,1 
7 28,0 27,0 729,00000 784,00000 756,00000 26,6 
8 22,0 21,0 441,00000 484,00000 462,00000 21,5 
9 19,0 21,0 441,00000 361,00000 399,00000 19,0 
10 9,0 9,0 81,00000 81,00000 81,00000 10,7 
11 16,0 18,0 324,00000 256,00000 288,00000 16,5 
12 13,0 15,0 225,00000 169,00000 195,00000 14,0 
13 25,0 23,0 529,00000 625,00000 575,00000 24,1 
14 9,0 10,0 100,00000 81,00000 90,00000 10,7 
15 15,0 14,5 210,25000 225,00000 217,50000 15,7 
� 260,00000 264,50000 5.046,25000 5.026,00000 5.019,50000 264,5 
 
 
 
Biometria Florestal 
 
 
 284 
Onde: 
^
Y = valores de altura estimados após o cálculo dos coeficientes do modelo de regressão. 
Obs: Os valores correspondentes ao diâmetro e a altura foram registrados na floresta com uma casa 
decimal; motivo pelo qual, foram tabulados com o mesmo número de casas depois da vírgula. Para 
os cálculos, entretanto, foram registradas cinco casas decimais. 
 
a) Determinante principal: 
 ∆ = n. Xi² - ΣXi . ΣXi , 
 ∆ = (15. 5.026,00000) – (260,00000 . 260,00000), 
 ∆ = 75.390,00000 – 67.600,00000, 
 ∆ = 7.790,00000. 
 
b) Coeficiente b1: 
 b1 = (1/∆) . [n . ΣXiYi - ΣXi. ΣYi], 
 b1 = (1 / 7.790,00000) . [(15 . 5.019,50000) – (260,00000 . 264,50000)], 
 b1 = (1 / 7.790,00000) . [75.292,50000 – 68.770,00000], 
 b1 = 0,83729. 
 
c) Coeficiente b0: 
Sendo ∆b0 = ΣXi . ΣXi² - ΣXi . ΣXiYi e o valor de b0 dado por ∆
∆
=
0
0
bb , tem-se: 
ou seja: 
� �
� � ��
−
−
= 22
2
0 )(.
.
ii
iiiii
XXn
YXXXX
b , 
 
 b0 = [(5.026,00000 . 264,50000) – (260,00000 . 5.019,50000)], 
b0 = (1 / 7.790,0) . [1.329.377,00000 – 1.305.070,00000], 
 b0 = 3,12028. 
 
d) Coeficiente de determinação: 
r² = (SQ Regressão)/(SQ Total), 
SQ Regressão = 0,83729 x (5.019,50000 – (260,00000 x 264,50000)/15), 
SQ Regressão = 364,08165. 
 
SQ Total = 5.046,250000 – (264,50000)²/15, 
Biometria Florestal 
 
 
 285 
SQ Total = 382,23333. 
 
r² = 364,08165 = 0,95251. 
 382,23333 
 
e) Análise de variância: 
 
TABELA 50 – Cálculo da ANOVA 
F.Variação G.L. S.Q. Q.M. F 
Regressão 1 364,08165 364,08165 260,75** 
Resíduo 13 18,15168 1,39628 
Total 14 382,23333 
 
f) Erro padrão da estimativa: 
^
2
^
yxSQMresíduoyxS == , 
39625,1
^
=yxS , 
^
yxS = 1,18163 m. 
 
ou em percentagem da média: 
^
yxS (%) = 1,18163 . 100 = ± 6,7%. 
 17,6333 
 
 
18.4 Soma de quadrados e produtos corrigidos (SQPC) 
 
Transformando-se o eixo Y para a média 
_
X , o coeficiente b0 cortará o eixo 
X exatamente em ,
_
Y conforme apresentado na Figura 92. Desse modo, todas as 
observações de X serão defasadas de 
_
X , ou seja (Y – 
_
X ), e (Y – 
_
Y ). 
 
Biometria Florestal 
 
 
 286 
 
FIGURA 92 – Representação gráfica da soma de quadrados e produtos corrigidos. 
 
Considerando ser: 
 
_
X = (X1 + X2 + X3 +.... +Xn) / n = ΣXi/n, 
 
_
Y = (Y1 + Y2 + Y3 + .....+ Yn)/n = ΣYi/n, 
e dividindo-se a equação normal em relação a b0 por n tem-se: 
 
 b0n + b1 ΣXi = ΣYi , 
b0(n/n) + b1 (ΣXi/n) = ΣYi/n , 
b0 + b1
_
X =
_
Y , 
logo, b0 = 
_
Y – b1
_
X . 
 
Considerando-se a matriz: 
��
�
+
+
2
10
1 
ii
io
XbXb
Xbnb
ii
i
YX
Y
�
�
, 
 
o valor de ΣXi² é chamado de soma dos quadrados não corrigidos de X e o somatório 
de (Xi)²/n é a correção para a média de X; a diferença é denominada de soma dos 
quadrados corrigidos de x e simbolizada por 2� ix . 
 De modo similar, ΣXiYi é chamado de soma dos produtos não corrigidos 
de X e Y e [(ΣXi) . (ΣYi)] /n é a correlação para a média de X e Y, e a diferença entre estes 
somatórios produz a soma de quadrados corrigidos dos produtos cruzados de X e Y, 
o qual é grafado por ii yx� . 
 
Biometria Florestal 
 
 
 287 
 
Por meio desse procedimento, ficam eliminadas a primeira linha e coluna 
das equações normais. 
 
 b0n + b1 ΣXi = ΣYi , 
 b0ΣXi + b1ΣXi² = ΣXiYi; 
 
 
sendo rescrita com b1.
2
� ix = ii yx� . 
 
Dessa forma, a grafia com caracteres minúsculos passa a representar a 
soma corrigida para as respectivas média: 
 
 
�
�
= 21
i
ii
x
yx
b , 
 
e o intercepto passa a ser expresso por: b0 = 
_
Y – b1
_
X . 
 
 
18.5 Regressão linear múltipla 
 
 Um modelo de regressão é múltiplo quando a variável dependente é função 
de duas ou mais variáveis independentes: 
 
 Y = f (X1 + X2 + X3 + ...... + Xn) . 
 
18.5.1Modelo linear aditivo 
 O modelo linear aditivo é o mesmo da expressão linear simples, sendo dado 
por: 
 
 Yi = µ r + Ei . 
 
Biometria Florestal 
 
 
 288 
 Considerando-se o modelo µ r = β0 + β1X1 +β2X2, tem-se: 
 Yi = β0 + β1X1 +β2X2 + Ei , 
 Ei = Yi - µ r , 
0)(
11
=−=��
==
r
n
i
i
n
i
i YE µ , 
 
=−=��
==
2
11
2 )( r
n
i
i
n
i
i YE µ mínimo e positivo, 
 
 
2
22110
11
2 )( XXYESn
i
i
n
i
i βββ ++−== ��
==
, 
)222222( 2211220110221102222212120
1
2
1
2 XXXXXYXYYXXYES iii
n
i
i
n
i
i ββββββββββββ +++−−−+++== ��
==
, 
 
)222222 21
1
212
1
201
1
102
1
21
1
1
1
0
2
2
1
2
2
2
1
1
2
1
2
0
11
2
1
2 XXXXXYXYYXXYES
n
i
n
i
n
i
i
n
i
i
n
i
i
n
i
n
i
n
i
n
i
n
i
i
n
i
i �����������
===========
+++−−−+++== ββββββββββββ
.
 
 
 A derivada parcial em relação a β0 é dada por: 
02222
1
22
1
11
11
0
0
=++−=
∂
∂
����
====
n
i
n
i
n
i
i
n
i
s XXY βββ
β
. 
 
Isolando-se a variável dependente e dividindo-se por dois a expressão, tem-
se: 
�����
=====
+++=
n
i
n
i
n
i
i
n
i
n
i
i XXYY
1
22
1
11
11
0
1
0 : ββββ . 
 
 A derivada parcial em relação a β1 resulta: 
����
====
++−=
∂
∂ n
i
n
i
ii
n
i
i
n
i
s XXXXYX
1
212
1
0
1
2
1
11 2222
1
βββ
β
. 
 
Isolando-se a variável dependente e dividindo-se por dois a expressão, tem-
se: 
����
====
++=
n
i
n
i
n
i
i
n
i
i XXXXXY
1
212
2
1
11
1
0
1
1 : ββββ . 
 
 
Biometria Florestal 
 
 
 289 
E a derivada parcial em relação a β2 é dada por: 
 02222
1
211
1
202
1
2
1
22
2
=++−=
∂
∂
����
====
n
i
n
i
n
i
i
n
i
s XXXXYX βββ
β
. 
 
Dividindo-se por dois esta expressão, tem-se: 
 
2
1
22
1
211
1
202
1
2 : ����
====
++=
n
i
n
i
n
i
n
i
i XXXXXY ββββ . 
 
Assim, o sistema de equações normais é dado por: 
 ����
====
+++
n
i
n
i
n
i
n
i
i XXY
1
22
1
11
1
0
1
0 : ββββ , 
����
====
++=
n
i
n
i
n
i
i
n
i
i XXXXXY
1
212
1
2
11
1
01
1
1 : ββββ , 
����
====
++=
n
i
n
i
n
i
n
i
i XXXXXY
1
2
22
1
211
1
202
1
2 : ββββ . 
 
 De maneira análoga ao apresentado na regressão linear simples, pode-se 
obter o sistema de equações normais com o seguinte procedimento: 
a) A partir do modelo geral 22110 XXY βββ ++= adiciona-se o sinal de 
somatório 1 a n, pois tem-se um conjunto n de observações à frente dos elementos 
do modelo: 
 ����
====
++=
n
i
n
i
n
i
n
i
i XXY
1
22
1
11
1
0
1
βββ � Primeira equação normal; 
 
b) Multiplica-se o termo da primeira equação por X1: 
 2
1
121
1
111
1
0
1
1 XXXXXYX
n
i
n
i
n
i
n
i
i ����
====
++= βββ , ou seja, 
 2
1
12
1
2
11
1
10
1
1 XXXXYX
n
i
n
i
n
i
n
i
i ����
====
++= βββ � Segunda equação normal; 
 
 c) Multiplicam-se todos os termos da primeira equação por X2: 
 ����
====
++=
n
i
n
i
n
i
n
i
i XXXXXY
1
2
22
1
211
1
202
1
βββ � Terceira equação normal; 
 
e assim sucessivamente para as “K” variáveis do modelo. 
Biometria Florestal 
 
 
 290 
 
 
18.5.2 Solução do sistema de equações 
 
 A solução de um sistema de equações normais de uma regressão linear 
múltipla pode ser obtida por meio de três alternativas principais, de acordo com a 
facilidade de emprego: 
 a) Sistemas com até três coeficientes em cada equação podem ser 
resolvidos por determinante através da soma de quadrados e produtos não corrigidos; 
 b) Sistemas com até quatro coeficientes em cada equação podem ser 
resolvidos por determinante baixando-se a ordem da matriz pela soma de quadrados e 
produtos corrigidos; 
 c) Sistemas com mais de quatro coeficientes ou qualquer número de 
coeficientes podem ser resolvidos por matriz. 
 
 
18.5.2.1 Solução por soma de quadrados e produtos não corrigidos (SQNPC) 
 
 A solução pela soma de quadrados e produtos não-corrigidos é obtida com o 
emprego da regra de Sarrus, de acordo com os seguintes passos: 
 
a) Matriz principal 
 (X’X) = 2
2212
21
2
11
21
���
���
��
XXXX
XXXX
XXn
 X’Y = 
i
i
i
YX
YX
Y
�
�
�
2
1 ; 
 
b) Determinante da matriz principal: com a regra de Sarrus, o determinante da matriz 
principal é obtido repetindo-se as duas primeiras colunas da matriz principal e 
calculando-se a diferença dos produtos dos elementos das diagonais principais e 
secundárias: 
 n ΣX1 ΣX2 n ΣX1 
∆ = ΣX1 ΣX1² ΣX1X2 ΣX1 ΣX1² 
 ΣX2 ΣX1X2 ΣX2² ΣX2 ΣX1X2 
Biometria Florestal 
 
 
 291 
 
 
∆ = [(n . ΣX1². ΣX2²) + (ΣX1. ΣX1X2 . ΣX2) + (ΣX2 . ΣX1. ΣX1X2)] 
– [(ΣX2. ΣX1². ΣX2) + (ΣX1X2². n) + (ΣX2². ΣX1²)] ; 
 
 
c) Determinante de b0: a matriz do determinante b0 é obtida substituindo-se, na primeira 
coluna da matriz principal (X’X), a coluna correspondente a b0, os termos independentes 
das equações normais (X’Y). Na seqüência, repetem-se as duas primeiras colunas no 
final da matriz, como segue: 
 
 ΣYi ΣX1 ΣX2 ΣYi ΣX1 
∆ b0 = ΣYiX1 ΣX1² ΣX1X2 ΣYiX1 ΣX1² , 
 ΣYiX2 ΣX1X2 ΣX2² ΣYiX2 ΣX1X2 
 
 
∆ b0 = [(ΣYi. ΣX1². ΣX2²) + (ΣX1. ΣX1X2. ΣYiX2) + (ΣX2. ΣYiX1. ΣX1X2)] 
 - [(ΣYiX2. ΣX1². ΣX2) + ((ΣX1X2)² . ΣYi) + (ΣX2². ΣYiX1. ΣX1)]; 
 
d) Determinante de b1: de modo análogo, substitui-se os termos independentes na 
coluna da matriz principal correspondente ao valor de b1 e repete-se as duas primeiras 
colunas da matriz principal: 
 
 n ΣYi ΣX2 n ΣYi 
∆ b1 = ΣX1 ΣYiX1 ΣX1X2 ΣX1 ΣYiX1 , 
 ΣX2 ΣYiX2 ΣX2² ΣX2 ΣYiX2 
 
∆ b1 = [(n. ΣYiX1. ΣX2²) + (ΣYi. ΣX1X2. ΣX2) + (ΣX2. ΣX1. ΣYiX2)] 
 - [(ΣX2. ΣYiX1. ΣX2) + (ΣYiX2.ΣX1X2. n) + (ΣX2². ΣX1. ΣYi)]; 
 
 
Biometria Florestal 
 
 
 292 
e) Determinante de b2: com o mesmo procedimento, substituem-se os termos 
independentes na terceira coluna da matriz principal (coluna correspondente ao b2) e 
repetem-se as duas primeiras colunas da matriz principal no final da mesma, obtendo-se 
a solução para b2, como segue: 
 
 n ΣX1 ΣYi n ΣX1 
∆ b2 = ΣX1 ΣX1² ΣYiX1 ΣX1 ΣX1² , 
 ΣX2 ΣYiX2 ΣYiX2 ΣX2 ΣX1X2 
 
∆ b2 = [(n. ΣX1². ΣYiX2) + (ΣX1. ΣYiX1. ΣX2) + (ΣYi. ΣX1. ΣX1X2)] 
 - [(ΣX2. ΣX1². ΣYi) + (ΣX1X2. ΣYiX1. n) + (ΣYiX2. ΣX1. ΣX1)]; 
 
 
f) Cálculo dos coeficientes b0, b1 e b2: os coeficientes b0, b1 e b2 são obtidos pelo 
cociente do determinante ∆ bi pelo determinante da matriz principal (∆ ), ou seja: 
 
 b0 = (∆b0) / ∆ , 
 b1 = (∆b1) / ∆ , 
 b2 = (∆b2) / ∆ . 
 
 O coeficiente b0 poderá alternativamente ser calculado pela expressão : 
 
−−−−
++−= 3322110 ( XbXbXbYb , 
onde: 
−
Y = média de Y; 
 321 ,,
−−−
XXX = média aritmética de X1, X2, X3, respectivamente. 
 
 A análise da expressão de b0 mostra que o coeficiente angular na regressão linear 
múltipla é expresso pela soma algébrica do produto dos coeficientes pelas respectivas 
médias aritméticas da variável a eles associadas. 
 Eventuais diferenças entre o valor de b0 calculado pela última expressão e o obtido 
pelo cálculo do determinante da matriz de b0 pode ser atribuída à perda de precisão 
decorrente de arredondamento de valores. 
 
Biometria Florestal 
 
 
 293 
18.5.2.2 Solução por soma de quadrados dos produtos corrigidos (SQPC) 
 
 Um modelo de regressão múltipla do tipo Y= b0+ b1X1+ b2X2+b3X3 pode ter 
seuscoeficientes mais facilmente determinados por meio da soma de quadrados dos 
produtos corrigidos – SQPC. 
 O processo consiste em retirar do sistema de equações normais a linha e 
coluna correspondente ao coeficiente b0, como demonstrado a seguir: 
 
 b0 n + b1ΣX1 + b2ΣX2 + b3ΣX3 = ΣY 
 b0ΣX1 + b1ΣX1² + b2ΣX1X2 + b3ΣX1X3 = ΣX1Y 
 b0ΣX2 + b1ΣX1X2 + b2ΣX2² + b3ΣX2X3 = ΣX2Y 
 b0ΣX3 + b1ΣX1X3 + b2ΣX2X3 + b3ΣX3² = ΣX3Y 
 
 A solução do sistema obedecerá aos seguintes passos: 
 a) Determinação das médias das variáveis independentes (X1; X2;X3;.....; Xn) 
e da dependente Y; 
 b) Determinação dos somatórios corrigidos pela média para cada variável 
independente: 
n
X
XXXx
n
i
in
i
i
n
i
i
n
i
i
2
1
2
1
2
11
2
)(
)(
�
��� =
=
−
==
−=−= , 
 
que, para o exemplo, será: 
n
X
Xx
n
i
n
i
n
i
2
1
22
1
2
1
2
2
)(�
�� =
==
−= , 
n
X
Xx
n
i
n
i
n
i
2
1
32
1
3
1
2
3
)(�
�� =
==
−= , 
n
YX
YXyx
n
i
i
n
i
in
i
i
n
i
).(
11
1
1
1
1
1
��
�� ==
==
−= , 
n
YX
YXyx
n
i
i
n
i
in
i
i
n
i
).(
11
2
1
2
1
2
��
�� ==
==
−= , 
 
Biometria Florestal 
 
 
 294 
n
YX
YXyx
n
i
i
n
i
in
i
i
n
i
).(
11
3
1
3
1
3
��
�� ==
==
−= , 
n
XX
XXxx
n
i
i
n
i
in
i
ii
n
i
).(
1
2
1
1
1
21
1
21
��
�� ==
==
−= , 
n
XX
XXxx
n
i
i
n
i
in
i
ii
n
i
).(
1
3
1
1
1
31
1
31
��
�� ==
==
−= , 
n
XX
XXxx
n
i
i
n
i
in
i
ii
n
i
).(
1
3
1
2
1
32
1
32
��
�� ==
==
−= , 
 
e, ainda, para o cálculo da ANOVA, será necessário conhecer: 
 
n
Y
Yy
n
i
in
i
i
n
i
2
1
2
11
2
)(�
�� =
==
−= . 
 
 Dessa forma, com os somatórios corrigidos, o sistema de equações fica 
definido por: 
b1. Σxi² + b2. Σx1x2 + b3. Σx1x3 Σx1y 
b1. Σx1x2 + b2. Σx2² + b3. Σx2x3 Σx2y 
b1. Σx1x3 + b2. Σx2x3 + b3. Σx3² Σx3y 
 
A solução do sistema pode, agora ser feita por Cramer, substituindo-se o vetor dos 
somatórios de “xiy” pela coluna do coeficiente a estimar, seguido do cálculo do 
determinante pela regra de Sarrus, conforme demonstrado anteriormente. 
 
18.6 Análise de variância 
 
 A análise de variância pode ser calculada seguindo-se o esquematizado na 
Tabela 51. 
 
TABELA 51 – Tabela de análise de variância para resolução do sistema por SQPC. 
 
F.V. G.L. S.Q. Q.M. F 
Biometria Florestal 
 
 
 295 
Total corrigido n-1 Σy2 
Regressão 
R(b3; b2; b1/ b0) 
p-1 b1Σx1y + b2Σx2y + b3Σx3y 
regressão
regressão
GL
SQ
 
 
resíduo
regressão
QM
QM
 
Resíduo n-p diferença 
resíduo
resíduoo
GL
SQ
 
 
 Sendo: n = número de observações; p = número de coeficientes na equação. 
 
Observação: A determinação do R², Syx e demais estatísticas seguem o mesmo 
processo apresentado anteriormente, ou seja: 
 
total
regressão
SQ
SQ
R =2 , 
 
resíduoxy QMS = e, 
 
100.%
−
=
Y
S
S xyxy . 
 Considerar os dados de uma floresta de Pinus elliottii apresentados na 
Tabela 50, para os quais se deseje ajustar a relação hipsométrica 3,1
)( 2221
2
0
+
++
=
dbdbb
dh , 
para linearizar o modelo, será necessário passar os coeficientes para o expoente 1, pois 
se encontram com expoente –1. 
22
21
2
)(
3,1
0 dbdbb
dh
++
=− , 
3,1
)(
2
22
210
−
=++
h
ddbdbb , 
2
21
2
0
3,1
dbdbb
h
d
++=
−
. 
 
Assim, na forma linear, as variáveis assumem os valores de: 
y =
3,1
2
−h
d
, 
X1 = d e 
X2 = d² . 
Biometria Florestal 
 
 
 296 
 
TABELA 51 – Valores observados e calculados para ajuste de modelo de regressão 
N d h 3,1
2
−h
d
 
 d2 
 x1 Y Y2 X12 X2 X22 X1X2 X1Y X2Y 
1 10,0 11,0 3,21081 10,30928 100,00000 100,00000 10000,00000 1000,00000 32,10806 321,08065 
2 13,0 15,0 3,51223 12,33577 169,00000 169,00000 28561,00000 2197,00000 45,65900 593,56703 
3 15,0 17,0 3,78566 14,33121 225,00000 225,00000 50625,00000 3375,00000 56,78488 851,77316 
4 20,0 19,0 4,75383 22,59887 400,00000 400,00000 160000,00000 8000,00000 95,07654 1901,53075 
5 21,0 21,0 4,73136 22,38579 441,00000 441,00000 194481,00000 9261,00000 99,35860 2086,53066 
6 25,0 23,0 5,36673 28,80184 625,00000 625,00000 390625,00000 15625,00000 134,16837 3354,20930 
7 28,0 27,0 5,52321 30,50584 784,00000 784,00000 614656,00000 21952,00000 154,64985 4330,19578 
8 22,0 21,0 4,95666 24,56853 484,00000 484,00000 234256,00000 10648,00000 109,04663 2399,02586 
9 19,0 21,0 4,28076 18,32487 361,00000 361,00000 130321,00000 6859,00000 81,33437 1545,35297 
10 9,0 9,0 3,24337 10,51948 81,00000 81,00000 6561,00000 729,00000 29,19037 262,71336 
11 16,0 18,0 3,91527 15,32934 256,00000 256,00000 65536,00000 4096,00000 62,64432 1002,30919 
12 13,0 15,0 3,51223 12,33577 169,00000 169,00000 28561,00000 2197,00000 45,65900 593,56703 
13 25,0 23,0 5,36673 28,80184 625,00000 625,00000 390625,00000 15625,00000 134,16837 3354,20930 
14 9,0 10,0 3,05129 9,31034 81,00000 81,00000 6561,00000 729,00000 27,46157 247,15415 
15 15,0 14,5 4,12861 17,04545 225,00000 225,00000 50625,00000 3375,00000 61,92921 928,93818 
 260,00000 264,50000 
63,33876 277,50422 5026,00000 5026,00000 2361994,00000 105668,00000 1169,23916 23772,15738 
Observação: No cálculo manual devem ser mantidos, no mínimo, cinco dígitos após a vírgula para evitar grandes 
erros de arredondamento. Os valores apresentados nesta tabela foram registrados com menos dígitos por 
motivo de espaço. 
 
 
Biometria Florestal 
 
 
 270 
 
a) Equações normais: 
 
 b0n + b1ΣX1 + b2ΣX2 ΣY 
 b0ΣX1 + b1ΣX1² + b2ΣX1X2 = ΣX1Y 
 b0ΣX2 + b1ΣX1X2 + b2ΣX² ΣX2Y 
 
b) Soma de quadrados e produtos corrigidos e o modelo reduzido: 
 
 b1Σx1² + b2Σx1x2 Σx1y 
 b1Σx1x2 + b2Σx2² Σx2y 
 
 
Onde: 
Σx1² = ΣX1² - (ΣX1)²/n, 
Σx1² =5.026,00000– (260,00000)² / 15, 
Σx1² = 519,33333. 
 
Σx1x2 = ΣX1X2 – ((ΣX1). (ΣX2))/n, 
Σx1x2 = 105.668,00000 – (260,00000 . 5.026,00000) /15 
Σx1x2 = 18.550,66667. 
 
Σx1y = ΣX1Y – ((ΣX1). (ΣY))/n, 
Σx1y = 1.169,23916 – (260,00000 . 63,33876) / 15, 
Σx1y = 71,36732. 
 
Σx2y = ΣX2Y – ((ΣX2) .( ΣY))/n, 
Σx2y = 23.772,15738 – (5.026,00000 . 63,33876) / 15, 
Σx2y = 2.549,45020. 
 
 
 
Biometria Florestal 
 
 
 271 
Σx2² = ΣX2² - (ΣX2)2/n, 
Σx2² = 2.361.994,00000 – (5.026,00000)² / 15, 
Σx2² = 677.948,93333. 
 
Σy² = ΣY² - (ΣY)²/n, 
Σy² = 277,50422 – (63,33876)² / 15, 
Σy² = 10,05099. 
 
Logo, as equações normais reduzidas (SQPC) serão: 
 
 b1. 519,33333 + b2 . 18.550,66667 = 71,36732 
 b1. 18.550,66667 + b2 . 677.948,93333 = 2.549,45020 
 
a) Cálculo do determinante principal: 
∆ = (519,33333 x 677.948,93333) – (18.550,66667x 18.550,66667), 
∆ = 7.954.243,21477. 
 
b) Cálculo do coeficiente b1: 
b1 = 1/∆ x (71,36732 x 677.948,93333) – (18.550,66667 x 2.549,45020), 
b1 = 0,13696. 
 
c) Cálculo do coeficiente b2: 
b2 = 1/∆ x (519,33333 x 2.549,45020) – (71,36732 x 18.550,66667), 
b2 = 0,000012961. 
 
d) Cálculo do coeficiente b0: 
−−−−
++−= 3322110 ( XbXbXbYb , 
b0 = (63,33876 / 15) – { 0,13696 x (260,00000 / 15) + 0,000012961 x ( 5.026,00000)}, 
b0 = 1,84427. 
 
e) Equação ajustada: 
 
h = d² + 1,30 ,(1,84427+ 0,13696.d +0,000012961.d²)² 
Biometria Florestal 
 
 
 272 
 
f) Coeficiente de determinação: 
R² = b1 . Σx1y + b2 Σx2y , 
 Σy² 
R² = (0,13696 x 71,36732) + (0,000012961x 2.549,45020) , 
 10,05099 
R² = 0,97578. 
 
g) Erro padrão: 
 
resíduoxy QMS = , 
�� +−= 22112 .. xbyxbyS xy , 
0)2.549,4502 x 10,0000129671,36732 x 0,13696(05099,10 +−=xyS , 
Sxy = 0,14244. 
100.%
−
=
Y
S
S xyxy , 
 
100.
15
33876,63
14244,0%
−
=xyS , 
=%xyS 3,37 %. 
 
18.7 Critérios para a seleção do melhor modelo 
 
Os critérios para a seleção do melhor modelo de regressão são diversos, 
podendo ser utilizadas diversas estatísticas para esta finalidade. 
Alguns autores usam apenas uma estatística para esse fim, o que pode ser 
perigoso por não definir com certeza a viabilidade do modelo ajustado. 
De forma geral, as seguintes estatísticas básicas, usadas em conjunto, 
possibilitam selecionar eficientemente um modelo. 
 
18.7.1 Critério de precisão 
 
Biometria Florestal 
 
 
 273 
 O coeficiente de determinação para a regressão simples (r²) ou múltipla (R²) 
expressa a quantidade da variação total explicada pela regressão. Dessa forma, 
quando da análise de modelos, seleciona-se aquele que apresente o maior valor de R² 
ou r². 
 Esse coeficiente é sempre crescente à medida que se inclui uma nova 
variável ao modelo de regressão; sendo, portanto, perigoso usá-lo isoladamente como 
critério, principalmente quando o modelo possuir muitos coeficientes. 
 
 R² = SQ Regressão . 
 SQTotal 
 
18.7.2 Erro padrão da estimativa 
 
Esta estatística é uma medida que expressa a dispersão entre os valores 
observados e estimados pela regressão. 
Sendo o Syx uma medida de dispersão, ele deve ser mínimo; logo, na 
comparação entre equações, a melhor, por este critério, será a que apresentar menor 
valor de Syx. 
 
resíduoxy QMS = , ou seja, �� +−= 22112 .. xbyxbyS xy . 
 
 Entretanto, o Syx só pode ser usado como comparador entre equações 
quando as variáveis dependentes possuírem a mesma unidade. 
 Meyer (1938 apud Figueiredo,1982), apresenta, como forma de comparação 
para modelos com variáveis dependentes de unidades diferentes, o erro padrão 
residual em percentagem da média: 
 100.%
−
=
Y
S
S xyxy , 
onde: Syx = erro padrão da estimativa; 
 
−
Y = média aritmética da variável dependente; 
MQ resíduo = quadrado médio do resíduo. 
 
 Outra estatística para esse fim é o índice de Furnival, o qual, quando 
expresso em percentagem, apresenta o mesmo valor calculado para o Syx (%). 
Biometria Florestal 
 
 
 274 
 
 
18.7.3 Interpretação da função ajustada 
 
 Segundo Draper e Smith (1966), na interpretação de uma função, devem ser 
considerados os seguintes aspectos: 
 
– Trata-se de uma aproximação matemática e não uma lei; 
– É válida somente na amplitude dos dados amostrados, devendo ser 
evitadas a extrapolação; 
– É baseada em amostragem e sujeita à variabilidade da amostra; 
– É sujeita ao erro de amostragem, isto é, qualquer estimativa deve ser feita 
considerando-se os intervalos de confiança. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Biometria Florestal 
 
 
 275 
19 LITERATURA 
 
 
 ANDRAE,F. Métodos de medição de madeira na indústria florestal: quantificação do 
volume, peso e sortimentos como vínculo entre produção da floresta e a quantidade 
transformada na indústria. In: Seminário Latino-americano sobre manejo florestal, 2, 
2001, Anais...Santa Maria, UFSM. p.69-80. 
ASSMANN, E. Waldertragskunde. München: BLV, 1961. 49p. 
BITTERLICH,W.; SILVA, J.A. O relascópio: escala métrica e larga. Salzburg: FOB, 23p. 
BRUCE, D.; SCHUMACHER, F. X. Forest mensuration. New York: Mc Graw-Hill, 1950. 
483p. 
DRAPER, N. R.; SMITH, H. Applied regression analysis. New York: J. Wiley,1966. 
407p. 
FIGUEIREDO, D. Utilização da variável diâmetro quadrático médio (dg²) em 
estimativas volumétricas de Eucalyptus grandis Hill Ex- Maiden, na região central do 
Paraná. 1982. 80p. Dissertação (Mestrado em Ciências Florestais)- Universidade Federal 
do Paraná, 1982. 
FINGER, C. A. G. Modelo de planejamento da produção florestal. Espaço Florestal, 
Porto Alegre, v. 1, n.2, p. 13-17, set.1986. In: Seminário de Estudos Florestais do Sul, 2, 
Porto Alegre, 1986. 
FINGER, C. A. G., SCHNEIDER, P. R. Padronização de símbolos florestais. Santa 
Maria: CEPEF/FATEC, 1988. (Série técnica, 5) 
FINGER, C. A. G. Ein Beitrag zur Ertragskunde von Eucalyptus grandis und Eucalyptus 
saligna in Südbrasilien. Wien: Universität für Bodenkultur, 1991. 137p Tese (Doktors der 
Bodenkultur). 
FINGER, C. A. G. Tabelas para o manejo florestal de Eucalyptus grandis e Eucalyptus 
saligna, em primeira e segunda rotações.Santa Maria. CEPEF/FATEC, 1997. 85p. 
FREESE, F. Linear regression method for forest research. U.S. For Res. Paper. 1964. 
138p (FPL17). 
FREESE, F.Metodos estadisticos elementales para tecnicos forestales.México:FAO. 
1970.102p. 
Biometria Florestal 
 
 
 276 
GARCIA,O. Apuentes de mensura forestal – I. Estatística. Instituto de Manejo. Cátedra 
de Mensura Forestal. Santiago do Chile, 64p.1995. 
GOMES, F. P.The use of Mitscherlich’s regression law in the analysis of experiments with 
fertilizers. Biometrics, v.12, p.498-516, dez, 1953. 
HUSCH, B.; MILLER, I. C.; BEERS, T. W. Forest Mensuration . New York: J. Wiley, 
1982. 402p. 
KOZAK, A. A simple method to test parallelism and coincidence for curvilinear, multiple 
linear and multiple curvilinear regressions. IUFRO Congress,p.133-145,1970. 
KRAMER, H.; AKÇA, A. Leitfaden für dendrometrie und Bestandesinvertur. Frankfurt 
a. M. : J. D. Sauerland, 1982. 251p. 
LOETSCH, F.; ZOEHRER, F.; HALLER, K. E. Forest inventory. München: BLV, 1973. 
v.2, 469p. 
MACHADO, S. A. Obtenção de dados dendrométricos como base para o manejo florestal. 
Espaço Florestal, Porto Alegre, v.1, n.2, p 18-23, set. 1986. In: Seminário de Estudos 
Florestais do Sul. Porto Alegre. 1986. 
MERRIL, W. C., FOX, K. A. Estatística Econômica. São Paulo: Atlas, 1977. 738p. 
MEYER, P L. Probabilidade: aplicações à estatística. Rio de Janeiro: Livros Técnicos e 
Científicos, 1977. 391p. 
PATTERSON, H. D. A simple method for an asymptotic regression curve. Biometrics, v.9, 
p.323-329, set.,1956. 
PRODAN, M. Holzmesslehre . Frankfurt a. M.: J.D. Sauerlander’s Verlag, 1965. 644p. 
PRODAN, M. Forest Biometrics. New York: Pergamon, 1968, 447p. 
RAWAT, A. S.; FRANZ, F. Detailed non-linear asymptotic regression studies on tree and 
stand growth with particular reference to forest yield research in Bavaria (Federal Republic 
of Germany) and India. IN: FRIES, J. (Ed.). Growth models for tree and stand simulation, 
1974. p. 180-221. 
RICHARDS, F. J. A flexible growth function for empirical use. J. Agr. Res. v.46, n.7, 
p.627- 638, 1959. 
SAS Institute. The SAS System for Windows – release 8.02. Cary:SAS Institute, 2001. 
Biometria Florestal 
 
 
 277 
SCHNEIDER, P. R. Modelos de equações e tabelas para avaliar o peso de casca de 
Acácia negra, Acacia mearnsii de Wild. 1978. 149p. Dissertação (Mestrado em 
Ciências Florestais) - Universidade Federal do Paraná, 1978. 
SCHNEIDER, P. R.; SILVA, J. A. Teste de equações para predizer a espessura de casca 
e fator K para Acácia negra (Acacia mearnsii de Wild) Rev. Floresta, Curitiba,: v.10, n.2, 
p.5-11, dez. 1979. 
SCHNEIDER, P. R. ANATRO: programa para cálculo de análise de tronco em 
computador PC. Santa Maria: UFSM, 1983. 
SCHNEIDER, P. R Betriebswirtschaftliche und Ertragskundliche Grundlagen der 
Forsteinrichtung in Südbrasilien am Beispiel von Pinus elliottii. Albert LudwigsUniversität Freiburg, 1984. 190p. Tese de doutorado. 
SCHNEIDER, P. R Manejo Florestal I: tópicos para o planejamento da produção 
florestal.Santa Maria: UFSM, 1986. 289 p. (Apostila). 
SCHNEIDER, P. R.; BRENA, D. A.; FINGER, C. A. G. Manual para coleta de 
informações dendrométricas. Santa Maria: CEPEF/FATEC, 1988. 28 p. (Série Técnica, 
4). 
SCHNEIDER, P. R; FINGER, C. A. G.; MENEZES, L. F.; KLEIN, J. E. Fundamentos de 
planejamento da produção para o manejo florestal de Eucalyptus grandis (Hill) 
Maiden e Eucalyptus saligna Smith. Santa Maria: CEPEF/FATEC,1988. 179 p. 
SCHNEIDER, P. R.; BRENA, D. A.;FINGER, C. A. G.; MENEZES, L. F.; NASCIMENTO, 
R.L. Enfoque do regime sustentado do manejo de floresta inequiânea de Araucária 
angustifolia IN: Congresso Florestal Estadual. Nova Prata. Anais... Porto Alegre: Séc. 
Agric., 1988. p.793-825. 
SCHNEIDER, P. R.; OESTEN, G. Tabelas auxiliares para o manejo florestal de Pinus 
elliottii E. e de Araucaria angustifolia (Bert.) O. Ktze. para o Planalto Médio, Rio Grande do 
Sul. Santa Maria: CEPEF/FATEC, 1991. (Série Técnica, 6). 
SILVA, J. A. Biometria e estatística florestal. Santa Maria: UFSM, 1977. 235 p. 
SILVA, J. A.; PAULA NETO, F. Princípios básicos de dendrometria. Recife: UFRPe, 
1979. 185p. 
SPEIDEL, G. Planung im Forstbetrieb. Hamburg: Paul Parey, 1972. 267p. 
SPIEGEL, M. R. Estatística. São Paulo: Mc Graw-Hill do Brasil, 1975. 580p. 
Biometria Florestal 
 
 
 278 
SOUZA, L.H.S. Incremento volumétrico de Nectandra megapotâmica (Spreng.) Mez em 
floresta ombrófila mista. Santa Maria: UFSM, Programa de Pós-graduação em Engenharia 
Florestal.(dissertação de mestrado em Engenharia Florestal). 2006, 76 p. 
STATISTICAL PACKAGE FOR THE SOCIAL SCIENCES. New York: Mc Graw-Hill, 1975. 
217p. 
SPURR, S. H. Forest inventory. New York: Ronald, 1952. 476p. 
STEEL, R. G. D.; TORRIE, J. H. Principles and procedures of statistics. New York: Mc 
Graw-Hill, 1960. 481p. 
STEVENS, W. L. Asymtotic regression. Biometrics . v.9, p. 247-267, set. 1951. 
STERBA, H. Ertragskundliche Hypothesen über den Standort. Wien: Univ. f. 
Bodenkultur, 1974, 132p. 
STERBA, H. Holzmeββββlehre. Wien: Univ. für Bodenkultur. 1986. 169p. 
STERBA, H. Vorlesungsunterlagen zur Forstlichen Ertragslehre (unpublished). Wien: 
Univ. f. Bodenkultur. 1988.150p 
VAN SOEST, J.; AYRAL, P.; SCHOBER, R.; HUMMEL, F.C. Reccommandation sur la 
normalisation des symboles dans les mesures forestieres. In:IUFRO, 1959. Annals.... p.1-
26. 
WAUGH, A. E. Elementos de estatística. Porto Alegre: Globo, s.d. 470p.

Outros materiais